Radeon HD 7900 - játék a számokkal

Egy kis elemzés a HD 7970-ben és a HD 7950-ben dolgozó Tahiti GPU-ról. – írta: gbors, 12 éve

Tesztek

2. Tesztkörnyezet, körülmények, egyebek

Ahogy fentebb utaltam rá, az elemzéshez felhasznált mérések az AnandTech AMD 7950 tesztjéből származnak, ezért a tesztekkel kapcsolatos információk ott mind megtalálhatók.
Miután az elemzés jellege lehetővé teszi, hogy csak %-os eltéréseket közöljek két konfiguráció között, a konkrét fps-értékeket nem vettem át - természetesen ezek is megtalálhatók az eredeti cikkben.

3. Első kísérlet - végre 384 bit!

Úgy gondoljuk, a VGA-k iránt érdeklődő társadalom egy emberként törölte meg verejtékező homlokát, amikor hivatalossá váltak a HD7970 specifikációi - hosszas időhúzás és számtalan felháborodott rant után az AMD végre szakított a 256-bites memóriabusszal, és rátett a cső szélességére egy bőkezű 50%-ot. Első vizsgálatunk azt hivatott demonstrálni, hogy ez az igencsak komoly extra sávszélesség hogy hat a chip viselkedésére - különösen annak tükrében, hogy a legnagyobb fogyasztónak számító ROP-ok száma nem változott. Íme az eredmények:

Hát szó se róla, nagyot változott a helyzet. Míg a Cypress esetében 10% memória-órajel emeléssel akár 5% extra teljesítményt is lehetett nyerni, és a Cayman is 3-4%-kal gyorsítható volt ily módon, a Tahiti esetében már csak 1-2% nyerhető azzal, hogy 1375MHz-en szaladnak a memóriák 1250MHz helyett. Különösen érdekes a Portal 2 eredmény SSAA-val, ahol a változás érdemben mérhetetlen - az SSAA egyáltalán nem kíméli a sávszélességet, viszont minden bizonnyal egyszerre nagyobb adatmennyiségeket mozgat, és ezért kitűnően profitál a 384-bites memóriabuszból.

Ha a fenti eredményeket kivetítjük nagyobb skálára (pl. egy 30%-os emelésre), akkor azt látjuk, hogy a magas gDDR5 órajellel együtt járó magas fogyasztásért cserébe a Cypress tud előrelépni, a Cayman is valamivel jobb lesz, viszont a Tahiti észrevehetően nem gyorsul. Az elméletet tehát sikerült igazolni, a sokkal szélesebb memóriabusz végre megoldotta a Radeon kártyák krónikus sávszélesség-éhségét.

3. Második kísérlet - akkor tuningoljuk a core órajelet!

Ha a memória-órajel tuningolásával kevéssé érünk célt, akkor természetesen a core órajelre érdemes koncentrálni - szerencsére ezen a téren jó hírük van a Tahiti chipeknek. Lássuk, hogy reagálnak a játékok egy mérsékeltebb emelésre:

Tekintetbe véve a memória-tuning eredményeit, 3 játék van, amivel nem lehetünk igazán elégedettek - a METRO, a Dirt 3 és a Batman nem hozza az elvárható gyorsulást. Ennek oka, hogy bár Anandék meglehetősen bivaly processzorral tesztelnek, minimális platform (elsősorban CPU) limitáció szinte mindenhol van - ezen három game esetében pedig kicsit jobban érződik. Egyedül talán a METRO lehet meglepetés - bár nagy VGA-killer a játék, egyes helyeken kissé optimalizálatlan a CPU-használata, ezért a méréshez kiválasztott jelenettől függ, hogy mennyire aknázható ki (vagy inkább mérhető ki) az erősebb VGA hatása.

Érdemes tehát tuningolni a core órajelet, mert a HD7900-asok meghálálják - és bár erős CPU kell alájuk, a tesztben szereplő i7-3960X nem a szükséges minimum követelmény, bármelyik 4 magos Sandy Bridge megfelelő lehet, ha egy kicsit megkergetjük. Gyengébb CPU-k esetén sincs nagy baj, de arra azért kell számítani, hogy a tuningból egyes játékokban kevesebb fog realizálódni.

4. Harmadik kísérlet - HD7970 vs HD7950

Végére maradt a legérdekesebb összevetés - megnézzük, hogy azonos órajelek mellett az enyhén kasztrált Tahiti GPU hogy viselkedik. Itt egy kicsit kellett játszani a forrásadatokkal - a 7970-es órajelei 925/1375, míg a tesztben szereplő XFX 7950-é 900/1375. Ez a különbség nem nagy, de mivel a két GPU-változat között elég kicsi a sebességkülönbség, ennyi is eltorzítaná a következtetéseket. Ezért a HD7950@925/1375 eredmények interpolálással álltak elő - az előző tesztben láttuk, hogy pl. a Battlefield 3-nál a 12.5%-os core órajel emelés 9.8%-kal több fps-t jelentett, ezért a 900MHz helyett 925MHz (+2.78%) 2.2%-kal több fps-t hozna. Így már pontosak lesznek a konklúziók.

Az AMD a Tahiti-t megelőző 3 architektúrában ugyanazt a stratégiát alkalmazta az 50-es chipeknél - letiltott néhányat a shader tömbökből és a hozzájuk csatolt textúrázókból, míg a ROP-okat, a memóriabuszt és a chip többi részét érintetlenül hagyta. A Tahiti chip esetében 4 ALU/TEX blokk került letiltásra a 32-ből, így a HD7950 1792 ALU-val és 112 textúrázóval rendelkezik. Ennél a HD7970-ben 14.3%-kal van több, ami egy, az adott játék igényeihez kiegyensúlyozott felépítés esetén jó közelítéssel 7-8% többletteljesítményt jelent. Ennek tükrében nézzük a következő grafikont:

Ahogy az kitűnően látszik, egy játék sem gyorsul a fenti 7-8%-nál többet, 4 játék kb. ilyen mértékben mutat több fps-t, 4 játék csak jóval kisebb mértékben gyorsul (3-5%), végül a Batman egyáltalán nincs meghatva a több ALU-tól és textúrázótól.

A fentiekből az következik, hogy (nem meglepő módon) a Tahiti GPU az eddigi hagyományokat folytatva az ALU/TEX szekcióban a legkövérebb, és az első kísérletből az is kiderült, hogy a chip legvégén csücsülő memóriabusz is kényelmesen elegendő szélességű. Ezért, szintén a szokásoknak megfelelően, a Tahiti chip legnagyobb gyengéje a ROP-kapacitás. Ezen egyfelől nem csodálkozunk, hiszen a compute-orientált felhasználásban a ROP-ok csak a ballaszt szerepét tölti be - másrészt viszont fenntartjuk azon véleményünket, hogy a manapság elterjedt szörnyen post-process intenzív játékmotorokban a GPU-ból kispórolt 16 ROP jelentős (15-25%-os) teljesítménynövekedést hozna. Aki nem hiszi, járjon utána a Barts chipnek. Csak az AMD tudja, hogy miért "szúrja el" szinte az összes GPU-ját az erőltetetten szűk back-enddel...

Fogyasztói szempontból teljesen más jelentőséggel bírnak a fenti eredmények. Aki játék célból a HD7970 helyett HD7950-et akar venni, annak felesleges a hiányzó ALU/TEX blokkok miatt aggódnia - inkább az lesz a fontos kérdés, hogy melyik GPU milyen órajeleket bír. Ha pedig a leendő HD7900 tulajdonos nem akar tuningolni, akkor azt érdemes megjegyezni, hogy a gyárilag húzott, 900/1250-es órajelen üzemelő HD7950 mindenhol 10%-on belül van a referencia HD7970-hez képest - ez alapján az ár, az abszolút teljesítmény és a fogyasztás háromszögében már könnyű dönteni, melyik az ideális kártya számunkra.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt