Újra kétgeneráció-váltás: GTX960 vs. GTX660

Már senkit nem ér meglepetésként, hogy a VGA-kat (különösen a középkategóriát) nem érdemes minden generációnál lecserélni. – írta: gbors, 9 éve

Bevezető

Egy kis történeti áttekintés

2009-ben a VGA-enthusiast közösség egyöntetű lelkesedéssel várta az új generációs videokártyák megjelenését mind az AMD, mind az nVidia oldalon – ekkor érkezett a kitűnő HD 5870, valamint jelentős késéssel az erényei mellett több problémával is küzdő GTX 480. A 2010-es és a 2011-es év aztán az új megjelenések szempontjából eléggé katyvasznak tűnt – az nVidia a Fermi-architektúrát csiszolgatta tovább, az AMD pedig megjelentetett két olyan chipet is (a Barts-ot és a Caymant), aminek aztán nemigen volt folytatása.

Több év távlatából visszatekintve egyértelmű, hogy mindkét cég a stabilizálódás irányát kereste, és a folytatásból látszik, hogy az nVidia-féle megközelítést vitték tovább mindketten – nevezetesen azt, hogy egy architektúrára két VGA-generációt építenek. Ennek a megközelítésnek fogyasztói (és persze marketing-) szempontból van egy jelentős hátránya: a sokat finomítgatott „régi” architektúrára építő kártyákhoz képest az „új” architektúrára épülő versenyzők már korántsem lesznek olyan erőteljesek.

Ezt a hatást a GTX 600-as szériában az nVidia ügyesen elmismásolta azzal, hogy átpozicionálta a chipeket – míg a Fermi-generációban a 4-es végű chipek képviselték a középkategóriát és a 0-sok a felső-/csúcskategóriát (ld. GF104 és GF100), a Kepler esetében a 6-osok a közép-, a 4-esek a felső- és a 0-sok a csúcskategória (azaz GK106, GK104 és GK110).

Ezért, bár a konkrét termékek tekintetében a középkategória (GTX 460 és GTX 660) azonos árszinten maradt, az eltérő tierbe helyezett chipek (GF104 és GK106) miatt lehetett azzal dobálózni, hogy igen jelentős előrelépés volt a Kepler-architektúra, hiszen a GF104 és a GK104 között több mint kétszeres a sebességkülönbség.

Ez az érv tulajdonképpen működik is a csúcskártyák esetében, de a középkategóriában sokkal fontosabb az ár/teljesítmény – ezért a GTX 460-at és a GTX 680-at nem nagyon hasonlítgatta össze senki. Ráadásként ott van a GTX 560Ti, amit szintén egy 4-es végű Fermi GPU (GF114) hajt, és teljesítményben szépen beékelődik az eredeti középkategóriás Fermi és a középkategóriás Kepler közé.

Egy egyszerű, de hatékony GTX660

Anno a GTX 560Ti miatt fogalmazódott meg bennem a gondolat, hogy a generációnkénti cserének a középkategóriában leáldozott. Készítettem akkor egy tesztet, amelyben a GTX 460-at és a Kepler középkategóriás versenyzőjének tűnő GTX 660Ti-t vetettem össze.

A 660Ti jellemzően 90-100%-os előnye meggyőző volt, viszont közben kiderült, hogy az nVidia a GTX 660-at szánja a valódi középkategóriának. Változott tehát a helyzet, de mégsem lett jelentősen más, mivel a 660 és a 660Ti között 15-20% a differencia, a GTX 660 várhatóan 60-70%-kal a GTX 460 előtt végzett volna a tesztben. Ez egyébként teljes mértékben összhangban van az nVidia marketinges ígéreteivel, és miután a 660 fogyasztása 20-30 W-tal alacsonyabb, az ígért kétszeres teljesítmény/fogyasztás arány is megáll a lábán.

A GTX 700-as széria a Kepler-architektúra további finomításairól szólt (kivéve a 750Ti-t, de arra most nem térünk ki). 2014-ben jelent meg a Maxwell-architektúra első két képviselője, a GTX 980 és a GTX 970, amelyek a GM204-es chipre építve újabb forradalmat hoztak teljesítmény/fogyasztás terén. Ennek alapján különösen érdekesnek tűnt a középkategóriás versenyző, a GM206-os chipet használó GTX 960 – bár nem éppen a megjelenésekor, de végre alkalmam nyílt letesztelni és összevetni a GTX 660-nal.

Referencia-kivitelű GTX 960

A GTX 960 paraméterei

Nyers számok terén nem indult igazán fényesen a középkategóriás Maxwell megítélése: a GM206 GPU szinte minden funkcionális egység terén pont a fele a GM204-nek, így a valamivel alacsonyabb core- órajellel kombinálva a GTX 960 teljesítményét a GTX 980 50%-a alá várhatjuk. Ezzel az nVidia oldalán az utóbbi 8 év második leggyengébb midrange versenyzőjéhez van szerencsénk – a 8600GTS óta ennél mindig magasabbra volt pozicionálva a középkategória.

Hozzávéve, hogy a GK106 relatíve erős volt a GK104-hez képest, a GTX 660 és a GTX 960 összevetése lényegesen kevésbé indul ígéretesen, mint anno a Kepler vs. Fermi-verseny. Nézzük meg, hogy fest a két VGA egymáshoz képest műszaki paraméterek terén:

Megjegyzés: a core-órajel mindkét kártya esetén dinamikus, és a maximális értéke GPU-nként más és más – a táblázatban a garantált órajelet (boost1) tüntettem fel.

Mielőtt a konkrét számmisztikába belemennénk, fontos kiemelni, hogy két olyan fontos változás is volt a Kepler és a Maxwell között az architektúrában, ami miatt a funkcionális egységek direkt összehasonlításával óvatosan kell bánni – ezért a fizikai felépítés mellett felvázoltam egy becsült effektív értékes táblát is, amely majd az összehasonlítás alapját fogja képezni.

Az egyik fontos változás, hogy az CUDA core-ok száma egy SM-en belül 192-ről 128-ra csökkent, miközben megmaradt a 4 feladatütemező. Mivel a 4 ütemező a legrosszabb esetben csak 128 core-t tudott ellátni munkával, a Kepler-chipek ALU-inak kihasználtsága 66% és 100% között bárhol lehetett – ez a Maxwell-lel megszűnt. A GK106 esetében 320 core lóg így a levegőben, egy kis jóindulattal úgy becsültem, hogy ennek átlagosan a fele fogható munkára – így lett a CUDA core-ok effektív száma a GK106-ban 960 helyett 800.

A másik változás szintén a 960 előnyére válik – a Maxwell 2.0-s architektúrában bevezetett (ill. erősen továbbfejlesztett) delta colour compression a sávszélesség hatékonyabb kihasználását hivatott elősegíteni, itt egy 25%-os javulást szavaztam meg a GM206-nak, szintén egy kis jóindulattal.
Végül van még egy korrekció, ami nem architekturális változás következménye – a GTX 660-ban alkalmazott idétlen flexmemória-vezérlés miatt én szeretem a kártyát 1,5 GB-osnak tekinteni.

Szorozzuk akkor meg a fenti erőforrásokat az órajelekkel, és nézzük az így kapott fő funkcionális kapacitásokat. Frontendben, számítási teljesítményben és fillrate-ben igen jelentős a GTX 960 előnye, míg textúrázás és sávszélesség terén minimális hátrányt szenved az újabb versenyző. Hogyan fordul ez le FPS-ekre?

Kellően széles játékmix esetén ezek az anomáliák bizonyos mértékben kiegyenlítődhetnének (mert az egyik játék az ALU-kra épít jobban, a másik nagyon szeret tesszellálni... khmmm... stb.), és a parametrikus modellem által becsült átlagos 38%-os különbség meg is jelenhetne a mérések átlagában. Van azonban egy gond: ahhoz, hogy az igen komoly pixel fill rate előnyt ki lehessen használni, jelentős sávszélességre is szükség van, ebben pedig a GTX 960 nem áll valami fényesen.

Ezért átlagosan valószínűleg messze nem lesz 38% a különbség, valahol inkább 30% körül reális – kivéve persze azokat az eseteket, ahol a játékmotor és/vagy a driver oldalán erős optimalizációk vannak beépítve a sávszélességgel való takarékoskodás érdekében. Fogunk a teszt során ilyet is látni.

Van tehát egy durván 30%-os sebességelőnyünk, valamint egy 15%-kal alacsonyabb elméleti fogyasztásunk – ez teljesítményben/fogyasztásban 50% előrelépés, igen-igen messze az nVidia által becsült újabb duplázástól. Ilyen kiindulással igencsak érdekes, mit fognak hozni a mérések.

Tesztkonfiguráció, játékok, tesztmódszer

A tesztek az alábbi konfiguráción futottak:

Igen, nem tévedés, a processzor nem i7, még csak nem is i5, hanem (döbbent csend) ... egy i3-3220! Miért is követtem el ezt az atrocitást? Egy új i5-ös processzor ára kb. azonos szinten van egy GTX 960-éval – kiindulva abból az alapelvből, hogy játékra a VGA fontosabb, én nem tartom hatékonynak az i5 + GTX 960 kombinációt. Mivel i7-5960X CPU-val épp elég oldal tesztel VGA-kat, szerintem sokkal érdekesebb megfuttatni az árban összeillő párost – a CPU-limit kimutatására pedig remek eszközeim vannak, így a két VGA összevetése sem fog sérülni.

A tesztben használt játékok:
– Unigine Heaven 4 (az összesítésben nem szerepel)
– F1 2013
– Borderlands: The Pre-Sequel
– Sniper Elite V2 (benchmark)
– Crysis 3
– Dying Light
– The Witcher 3

Annak érdekében, hogy a CPU-t még kicsit se kíméljük, a Heaven és a Sniper Elite kivételével mindenhol akciódús jeleneteket mértem – lőttem, csapkodtam, illetve nyomtam a gáz, mint az őrült, és a számos ellenfél sem fogta vissza magát.

A tesztmódszerem nem változott:
– A videokártyák által nyújtott teljesítményt minden esetben a FRAPS mérte.
– Az átlagos FPS-értékek a FRAPS által mért átlag FPS átvételével keletkeztek.
– A minimum FPS-ek („min 2%” vagy „2%-os minimum” néven hivatkozom rájuk) a FRAPS által mért képkocka-renderelési időkből egy statisztikai alapú módszer használatával állnak elő, azt az értéket mutatják, amelynél csak a teljes minta 2%-ában találunk alacsonyabb képrenderelési időket. A módszer előnye a FRAPS által adott minimum FPS-ekhez képest, hogy kiküszöböli az egyszeri FPS-eséseket (pl. egy rosszkor felbukkanó HDD-művelet miatt), ezen felül kimutatja a microstutteringet és a hasonló FPS-fluktuációs problémákat.
– Minden tesztfutam háromszor került lemérésre, és a grafikonokra a három mérés átlaga került. Ha a három mérésből valamelyik feltűnő eltérést mutatott, akkor ott az egész mérést megismételtem.

A teszteket ezúttal 1920 x 1080 és 2560 x 1440-es felbontásban végeztem – bár a nagyobb felbontás nem tipikus célpont a GTX 960 számára (a GTX 660-nak meg főleg nem), érdekes információk szűrhetők le az így kapott eredményekből, ezért szerepelnek mindegyik grafikonon.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények