Műszaki elemzés - mekkora előrelépés a Polaris 10?

írta: gbors, 8 éve

Bevezető, műszaki adatok

2016. június 29-én az AMD jött, látott és győzött - volna, ha szokás szerint nem barmolják el a fogyasztás / hűtés kérdéskört az RX 480-ban. A kártya 200, ill. 240 USD áron még így is nagyon vonzó - remélhetőleg az egyedi hűtésekkel a fenti problémák a sírba kerülnek, és akkor egy minden tekintetben kifogástalan új ár / teljesítménybajnok lesz a piacon. A kártya ezen aspektusa is megérne egy alapos elemzést, mert az összes olyan szempont szerint nagyot domborít, ami csak eszembe jutott - sajnos erre most idő hiányában nem kerül sor.

Mindenképpen érdemes viszont alaposabban belenézni a műszaki adatok és a teljesítmény viszonylatába - egyrészt azért, mert ezzel egyik tesztoldal sem foglalkozik, másrészt azért, mert ennek a későbbi 14nm-es Radeonokra is komoly kihatása lehet.

Nem lehet 100%-osan biztosra venni, de munkahipotézisként tekintsük úgy, hogy az RX 480 a teljes értékű Polaris 10 chipet tartalmazza, tehát egy Tier3a GPU-ról van szó. Ennek az előző generációs megfelelője a Tonga alapú R9 380X - nézzük, hogy fest egymáshoz képest a két chip:

Sok a hasonlóság - az alapvető egységek terén ALU-ból és textúrázóból tartalmaz többet a 480, 12.5%-kal. Ezen felül az órajelek magasabbak - a core 30.5%-kal, a memória pedig 40.4%-kal. A zöld háttérrrel látható kapacitások ennek megfelelően alakulnak - 30% és 47% közötti előnye van az RX 480-nak. Valamint van egy hatalmas ismeretlen - milyen hatása van az architektúrás újításoknak a sebességre? Mivel ezeket csak úgy lehetne izoláltan vizsgálni, ha a funkcionális egységek száma ugyanannyi lenne, ezért az alábbiakban kicsit szétszedem az RX 480 játékokban nyújtott teljesítményét, és indirekten próbálom legalább felbecsülni, mire is jó a gyakorlatban, és a jelenben az a rengeteg újdonság.

A teljesítmények vizsgálata

Három alapvető számot lesz érdemes figyelnünk az egyes játékokban nyújtott sebesség során:
Minimum előny: mivel a 480 minden funkcionális területen azonos vagy több a 380X-nél, az órajel-növekedéssel biztosan gyorsabb lesz nála - a dominánsabb core órajel 30.5%-os emelésével a memória is tartja a lépést, ezért a minimum-előny 30.5%.
Átlagos előny: a zölddel látható kapacitásokat megetettem a kis modellezőmmel, és azt adta ki, hogy a 480 41%-kal lenne gyorsabb a 380X-nél - akkor, ha ugyanazon az architektúrán lenne a két chip.
Max előny: ideális esetben, ha az adott játék totálisan ALU-limitált, akkor a 480 46.8%-kal gyorsabb - persze ismét azonos architektúra mellett, az újítások ezen felül hozhatnak további FPS-eket.

Nézzük akkor az egyes játékokban nyújtott teljesítményt - mindenhol az RX 480 előnyét fogom szerepeltetni az R9 380X-hez képest. A forrásadatok a hardware.fr-ről származnak, köszönet Damien Triolet-nek az alapos és jól dokumentált munkáért!

Az első grafikon demonstrálja, hogy miért fontos az elemzéseknél a megfelelő dokumentáció. Feltettem rá a szimpla gyári kártyával mért eltéréseket (stock - lila), a garantáltan 1266MHz-en futó kártyával mért eltéréseket (über - piros), valamint a többszörös %-számítás bonyodalmai miatt ezek differenciáját (barna):

Látható, hogy az órajel-dobálás miatt az RX 480 a stock mérésekben csaknem 5%-kal lassabb, mint a garantált 1266MHz-es órajellel. Ilymódon az új kártya átlagos előnye 3%-kal alacsonyabb, mint az azonos architektúra mellett elvárt, és két játék is a minimum alatt teljesít - ez elsőre elég horrornak tűnik. Ezért is fontos a hűtési gondok megoldása, mindenesetre architektúra szempontból innentől az über értékekkel foglalkozunk.

A második grafikonra felkerült a három referenciavonal (kék, zöld, narancs), az über mérések (piros), valamint az az arány, amivel a mérés értéke magasabb a minimum előnynél (barna) - ez utóbbi jelentőségéről majd később. A grafikon:

Szerencsére itt már nem látunk a minimális előny alatt teljesítő játékot (ami arra utalna, hogy bizonyos téren nem javult, hanem romlott az új hardver) - továbbra is van viszont 6db, amely alatta van az azonos arch mellett elvárt szintnek, szemben velük pedig 5 olyan, ami a max szintnél is több előnyt mutat. Mivel a minimum szint feletti előny csak az ALU/TEX teljesítmény előnyéből és/vagy az architektúrás újításokból származhat (a kicsivel nagyobb ugrás a sávszélességben itt már majdnem elhanyagolható), azt kell megvizsgálnunk, hogy melyik játék esetében mi lehet a forrása.
Itt jön képbe a barna számsor - ez pontosan azt mutatja, hogy hány % előnyt jelent kombináltan az ALU/TEX (vélhetően igazából az ALU), ill. az arch extrák. Elég nagy a fluktuáció, 2.7% és 16.6% között mozog - viszont az rögtön leszűrhető belőle, hogy a jelen játékaiban a Polaris architektúra sehol nem hoz drámai előrelépést. Ha azt gondolnánk, hogy 10%-kal jobb a Polaris 10, mint a Tonga, az csak akkor lehetséges, ha a 12.5%-kal több ALU egység hatása elhanyagolható.

Elemzés és konklúzió

Ahogy a fentiekből látható, a Polaris 10 műszakilag egyáltalán nem forradalmi előrelépés a Tongához képest, legalábbis ami a rengeteg DirectX 11-es és a jelenleg elérhető minimális számú DirectX 12-es játékot illeti. Az nVidia GP104-éhez hasonlóan a sebességnövekedés nagy része az órajel emeléséből származik, ezen felül megnőtt az ALU-k száma, és az architektúrában is megpiszkáltak ezt-azt. A GP104 esetében a módosítások 18.6% további FPS-t hoztak, a Polaris 10-nél pedig 9.8%-ot - mivel a GP104 ALU-inak száma nagyobb mértékben nőtt, ez még kb. rendben is lenne, viszont ezzel azt feltételezzük, hogy az architektúrás újítások értéke megegyezik, ez pedig a Polaris 10 számos áttervezett egysége tükrében elég nehezen hihető.

Mivel a GTX 1080-nál az látszik, hogy a meglehetősen kevés architektúrás újítás hozott kb. 4-5% előrelépést, azt kell feltételezzük, hogy az RX 480-ban ennél többet jelentenek a fejlesztések - viszont ez a fajta előrelépés az összes 9.8%-nál nem lehet több, tehát valahol 5-10% közé eshet. Ebből következően a 12.5%-kal megnövelt ALU-szám 0-5% előrelépést hozott, ami nagyon kevés, főleg akkor, ha a memória eddig elhanyagolt kb. további 1%-át idevesszük, mert akkor már csak 0-4%-ról beszélünk. Ez azt jelenti, hogy a ALU-k teljesítményének kihasználását valami visszafogja. Tekintettel arra, hogy a setup és a chip infrastruktúrája dimenzióiban megegyezik a jóval nagyobb Fijivel, és a memória majdnem annyi boostot kapott, mint a számítási teljesítmény, ismételten a szerencsétlen ROP-ok felé mutat a vádló ujj. Ez persze nem meglepő - már a 380 és a 380X összevetésénél is látszott, hogy kevés a backend kapacitás, és ugyanezt mutatta kétszer akkorában a Fury és a Fury X közötti differencia is. Az AMD-nek ez már a sokadik chipje, ahol a jobb jövőbeli teljesítmény érdekében a jelenre alulméretezik a backendet - nem nagyon értem, hogy az eddigi bukták, valamint a kivételnek számító Hawaii és Pitcairn sikere miért nem módosítja ezt az irányt, de úgy tűnik, bizonyos dolgok nem változnak. Azt ugyan nem tudom, hogy ha 64 ROP kerül a chipbe, akkor az mennyivel növeli meg a méretet és a tranzisztorok számát, viszont a sebességbeli hatása 20-30% lenne - ezzel az RX 480 kategóriát ugrana.

A tranzisztor-hatékonyság 20%-os növekedése örvendetes, bár a Tonga ezen a téren katasztrófális volt - a Hawaiihoz képest kb. szinten maradt a Polaris 10, és a DX12-re, valamint a VR-re hangolt szunnyadó újítások tekintetében ez elfogadható.
Az energia-hatékonyság 62%-os javulása a csíkszélesség-váltás miatt kb. az elvárható szinten van, hasonló előrelépést mutatott fel a GP104 is - az más kérdés, hogy a beígért 2.8x-os (180%-os) javulástól ez igencsak messze van. Tekintettel a folyamatban lévő fogyasztási ügyre a 480X kapcsán (várhatóan a jobb kihozatal miatt szükségtelenül magas a chipek feszültsége), itt még nem érdemes végleges ítéletet hirdetni.

Végszóként kijelenthető, hogy a Polaris 10 korrekt előrelépést hozott a legtöbb területen, de a "forradalmi" újítások hatása jelenleg nem láthatók. Az RX 480 varázsa az ár / teljesítményben rejlik, és ezért remélhetőleg népszerű is lesz - a DX12- és a VR-tudás demonstrációjára pedig továbbra is várni kell.