Játékos VGA-k fejlődése az elmúlt 10 évben

Vajon milyen fejlődési pályát járt be a 2007 és 2017 közötti 10 év alatt a VGA-k teljesítménye? – írta: gbors, 6 éve

1. felvonás - GTX 280 vs HD 4870

Alapállás

Mielőtt rátérnénk a 2008-as meccs szereplőire, nézzük meg, milyen szituációba érkeztek.
A DirectX9-es korszakban még az utolsó pillanatokban is folyt a harc – 2006 januárjában az AMD (X1900 XTX), márciusban pedig az nVidia (7900 GTX) jött ki egy frissített és gyorsított VGA-val. A mérleg nyelve kezdett egyre inkább az AMD felé billenni, láthatóan az újabb játékok kedvelték a több pixel shadert. 2006 októberében kijött az X1950 XTX, és erre az nVidia már egy új generációs kártyával válaszolt – a mindenki számára ismert 8800 GTX-szel, ami az első DirectX 10-kompatibilis VGA volt egyben.

Az új jövevény szabályosan lyukat robbantott a piacba, a saját elődjénél 90%-kal, a konkurenciánál 60%-kal volt gyorsabb (és ez a különbség a következő hónapokban egyre növekedett). Az AMD válaszára több, mint fél évet kellett várni – 2007 elején még mentek a legendák a 8800 GTX-et porba alázó teljesítményről, aztán ezek elcsendesedtek, és júniusban kijött a 2900 XT, ami bizony több, mint 20%-kal elmaradt a 8800 GTX-től, ráadásul mindezt több tranzisztorral és nagyobb fogyasztással sikerült hozni. Az AMD állítása szerint az architektúrájuk lényegesen jövőbiztosabb volt, mint az nVidiáé, de ezt anno nemigen hitte el senki, és minden bizonnyal a piaci eredményeken sem mutatkozott meg túlzottan.

Az eggyel korábbi generációhoz hasonlóan a 9000-es és a HD 3000-es széria egy félgeneráció-váltás volt – kisebb, hatékonyabban gyártható GPU-kat vetett be mindkét fél, némileg más konfigurációkkal. Az nVidia G92-ese legendás svájci bicskává vált az idők során, ki tudja, hány kártyában bevetette a cég, és az új architektúrát megelőzően megjelenő 9800 GTX valamivel gyorsabb is volt, mint a 8800 GTX. Az AMD ezzel szemben lefelé skálázott – az RV670-alapú HD 3870 lassabb volt a 2900 XT-nél, így igazából csak az nVidia középkategóriás G94-esével versenyzett. Az optimalizált chipre az AMD épített egy két-GPU-s kártyát (HD 3870X2), viszont a G92 is elég visszafogott volt ahhoz, hogy ilyet lehessen vele csinálni, így az átmeneti performance koronából újabb csúnya pofon lett a 9800GX2 "személyében". Ebben a helyzetben várta mindenki az új generációkat – az nVidia határtalan magabiztossággal, az AMD pedig több jelentős nyakleves után csak szerényen, csendesen mosolyogva.

A GTX 280 és a HD 4870 piaci megjelenése

Engedtessék itt meg egy szubjektív személyes vélemény – az nVidia a GTX 280-nal a VGA-történelem egyik legunszimpatikusabb rajtját hajtotta végre. A fent említett maximális önbizalommal piacra tettek egy kártyát, amely az előző (fél)generációs top (egy GPU-s) kártyának majdnem pontosan a duplájába került, miközben a teljesítménye első ránézésre kevesebb, mint 40%-kal volt jobb. Árnyalja a képet, ha az egyébként relevánsabb AA melletti sebességet nézzük, mert ott már 60% az új kártya előnye, de még így is erősen romló ár / teljesítmény mutatót kapunk, ami egy új VGA-launch esetén a létező legrosszabb hír.

Kicsit több, mint egy héttel később az AMD kiengedte a ketrecből a HD 4870-et. Szerényen, a GTX 280 árának kevesebb, mint 50%-áért adták azt a teljesítményt, ami majdnem pont félúton volt a GTX 260 és a GTX 280 között, olyannyira megközelítve a GTX 280-at, hogy egyes játékokban még előzni is sikerült. A sajtó az állát kapkodta össze a padlóról, az nVidia pedig a rájuk jellemző keménységgel reagált – megvágták a GTX 280 árát 150 dollárral, a GTX 260-ét pedig 100 dollárral. Nézzük, hogyan alakult ki ez a helyzet az előző időszak AMD-szempontból erősen temetői hangulatából!

A legfontosabb változások az architektúrákban és a GPU-k felépítésében

Nem akarok hosszan az architektúrákba belemenni, ezért ez a szakasz csak a legfontosabb, legnagyobb hatású változásokra koncentrál.

GTX 280 vs 8800 GTX:
A GT200 elsősorban az egyes egységek közötti arányokat bolygatta meg. A feldolgozó-csoportok (TPC-k) száma 8-ról 10-re nőtt, és mindegyik TPC az eddigi 2 helyett 3 shader-tömböt (SM) tartalmaz – ez a két változás közel duplájára növelte az ALU-k számát. A textúracímzők és a textúraszűrők aránya az eddigi 1:2-ről 1:1-re változott (igazából ez már a G92-ben megtörtént), ami érdemi kapacitás-növekedést attól függően jelent, hogy adott játékban a kevés címző fájt-e a G80-nak – ez a potenciális probléma most megszűnt.

A ROP-ok a korábbi felezett blending sebesség helyett a GT200-ban teljes sebességgel tudtak színt keverni (érdekesség: a következő utáni generációban az nVidia visszatért a felezett sebességhez). A számuk ezzel együtt 24-ről 32-re nőtt, és hasonlóképpen a memóriabusz is megnőtt 33%-kal. Mivel a kiépítés maradt a crossbar, az 512-bites méret minden bizonnyal számos szívást kihívást hozott magával.

HD 4870 vs HD 2900 XT:
Az RV770 elsősorban a hatékonysági javításokra koncentrált, valamint a számítási kapacitás orbitális mértékű megnövelésére. Az ALU tömbök komolyabb változáson nem estek át, viszont a számuk négyről tízre nőtt, 2.5-szeresére növelve a számítási és a textúrázási kapacitást.
A ROP-ok száma meglepő módon 16 maradt, viszont az AMD rendbe tette az R600 (és az RV670) katasztrofális fixfunkciós egységét, amely az MSAA-minták feldolgozását volt hivatott gyorsítani. A memóriabusz mérete 256-bitre csökkent, viszont a HD 4870 volt az első kártya, amely GDDR5 memóriát használt, ezáltal közel ugyanazt a gyakorlati sebességet érte el, mint amire a brutálisan széles 512-bites busszal lett volna lehetőség (ami egyébként rá sem vért volna a chip kerületére). Végül maga a memóriavezérlő is átalakult – az X1900-as szériában bevezetett rendkívül elegáns és szörnyen pazarló ring bus-t leváltotta egy switched HUB, amit az AMD azóta is használ.

Lássuk a változásokat számokban:

Látható, hogy a GT200-as GPU jelentősen felpumpált számítási kapacitással és textúrázási tudással rendelkezik (ez utóbbi attól is függ, hogy mennyire fájt a G80-nak a kevesebb textúracímző), jelentősen megnőtt a memória-sávszélessége, viszont a pixel-kapacitás kicsit szerényebb mértékben fejlődött, a setup pedig szinte ugyanaz maradt. Mindennek kb. 70% extra sebességet kellett volna hoznia a konyhára.
A HD 4870 ezzel szemben all-int nyomott a számítási kapacitásra – 2.5-szeresére nőtt, magával húzva a textúrázást is. Az egyéb területek számszakilag nemigen változtak, bár a fenti összefoglalóból kiderül, hogy több helyen jelentős okosodás következett be. A sebességnek közel 80%-kal kellene nőnie.

Mérések és fizikai paraméterek:

Nem minden architektúra-váltásnál fognak ennyire megvadulni a grafikonok. :) Jól látható, hogy az előző generáció hátrányait az AMD vagy mérsékelte, vagy előnybe fordította – míg a HD 2900XT több tranzisztorból hozott ki kisebb teljesítményt magasabb fogyasztás mellett, a HD 4870 70%-nyi tranzisztor és 80% fogyasztás mellett 90%-át hozza a GTX 280 sebességének. A chipméret különbsége még ennél is sokkolóbb, de ne feledjük, hogy nem azonos processzen készültek a chipek – reálisabban a már 55 nm-en készülő GT200b-vel lehetne összevetni az RV770-et, úgy az nVidia hátránya "jelentősen" kisebb, a 44%-os szám helyett körülbelül 60%-ot látnánk.

A becsült 71%-os javulás helyett csak 61%-kal gyorsabb a GTX 280, mint az elődje, és ez csak az ideálisnak számító 4xAA eset – AA nélkül 40% körül van az előnye, ami egészen rosszul hangzik. Nyilvánvalóan van valamilyen komoly szűk keresztmetszet a rendszerben – és így utólag már azt is tudjuk, hogy micsoda: gyenge a frontend, nem tudja ellátni munkával a funkcionális egységeket.
Ezzel szemben a Radeon 89%-ot gyorsult, pedig csak 78%-ot kellett volna neki – aláhúzandó a fentebb emlegetett okosításokat. A frontend pedig – az AMD ígéretének megfelelően – bírja a strapát.

A hatékonysági mutatók így festenek:

A fentiek alapján nem meglepő, hogy a teljesítmény / tranzisztor mutatóban a GeForce több, mint 20%-ot romlott, a Radeon pedig 40%-ot javult, a jelentős hátrányt jelentős előnnyé fordítva. A fogyasztásra normált teljesítmény terén az nVidia is előlépett 40%-ot, viszont az AMD közel 2,5-szeres javulása ebben a mutatóban is elég a győzelemhez. A chipméretre vonatkozó mutatók egyik generációban sem jól összevethetők az eltérő gyártási folyamat miatt, de annyi látható, hogy a 8800 GTX a nagyobb csíkszélesség mellett is "mérethatékonyabb", míg a processz-előnnyel bíró HD 4870 utcahosszal jár a konkurencia előtt.

GTX 280 vs HD 4870 - konklúzió

Legegyszerűbb úgy összefoglalni az eseményeket, hogy az első DirectX 10-es generációnál tett AMD-párti jóslatok beváltak – az nVidia architektúrája kifulladt, és gyengén skálázódott felfelé (bár teljesen más okból, mint azt anno sokan gondolták); az AMD megoldása viszont időtállónak bizonyult, és a következő generációban elegendő volt finomításokat végezni a problémás területeken, valamint brutálisan megnövelni a számítási kapacitást.

Egyértelmű a látottak alapján, hogy az nVidiának a következő generációban kezdenie kell valamit a frontenddel (és az sem kizárt, hogy a TPC-k nem bírják el a 3 SM-et) – az AMD oldalán viszont ilyen kényszer nem látszik. Ez a különbség a folytatásban kritikus szerepet fog játszani.

Még egy megjegyzés: az AMD szerintem erősen túllőtt (esetleg alul lőtt) a célon a HD 4800-asok árazásával. Persze roppant népszerű volt a 300 dolláros high-end VGA, de aligha adtak volna el sokkal kevesebbet 50 dollárral magasabb áron, az nVidia pedig aligha árazott volna másképpen. Az azonnali bevételkiesés mellett ez a fagylalt a következő generációban is vissza fog nyalni.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények