PhysX: 8800GTS + 8600GT

A mostani tesztemben arra keresem a választ, hogy egy G92-es GPU-val ellátott 8800GTS esetén mennyit gyorsít... – írta: Qru, 16 éve

A mostani tesztemben arra keresem a választ, hogy egy G92-es GPU-val ellátott 8800GTS esetén mennyit gyorsít, ha PPU (Physics Processing Unit) társkártyakén melléteszünk egy 8600GT-t. Mivel manapság elég olcsón beszerezhető már egy ilyen videókártya, gondoltam kipróbálom mennyit is gyorsít a rendszeren. Azt már kimértem, hogy mennyit gyorsul a rendszer különböző játékok alatt, vagyis az fps szám mennyire növekszik a processzor túlhajtásának köszönhetően, de lássuk mennyit nyerünk a PhysX-el.

Elméleti áttekintés:

Az Nvidia februárban jelentette be, hogy felvásárolta a fizikai modellezést végző PhysX szoftvertechnológiát fejlesztő Ageia-át. Innentől kezdve már csak idő kérdése volt, mikor jelenik meg a cég kínálatában ez a lehetőség. Az időt most látták elérkezettnek, mikor az AMD/ATi szépen megszorongatta az Nvidia 9-es sorozatát a HD 4000-es kártyákkal.

Természetesen azzal nem árt tisztában lenni, hogy jelenleg a felhasználási köre elég korlátozott és kérdéses, hogy a jövőben mennyi játék fogja támogatni ezt a típusú fizikai API-t. Azt tudjuk már ma, hogy az AMD/ATi a konkurens Havok fizikai API-ja mellett tette le a voksát, és ugyanezt fogják támogatni az Intel Larrabee projektjének keretei között fejlesztett videokártyák is. Márpedig az Intelnek nagyot kell alkotnia, ha szeretne bekerülni és érdemi profit szeletet kihasítani abból a bizonyos tortából. Ahhoz, hogy eladható, keresett kártyája legyen márpedig nem elég a hardver, megfelelő szoftver környezet is szükséges. Ezért kérdéses, hogy az Nvidia a jövőben mennyire tudja felvenni a harcot - immár - két konkurens gyártóval. Eddig a szerényebb működési tőkével gazdálkodó ATi nem volt nagy ellenfél (és ezen az AMD-vel való egyesülése sem lendített sokat, sőt inkább az AMD veszteségét finanszírozzák az ATi nyereségéből jelenleg) a játékok támogatása terén - kiváló példa erre, hogy a HD 3000-es széria hiába volt olcsóbban gyártható, fejlettebb hardveresen, még sem volt az Nvidia hátrányban egy percig sem egészen az utóbbi időkig - az Nvidia jóval előrébb jár, mint az AMD/ATi. Ez nagyrészt köszönhető a játékfejlesztőkkel fenntartott erős kapcsolatuknak. Viszont az Intel a legtőkeerősebb gyártó jelenleg, ami igen kemény dió lesz az Nvidiának ha talpon akar maradni. Az tény, hogy a mérleg nyelve jelenleg az Nvidia felé billen, hiszen több játék van a zöldek kártyáira optimalizálva, mint a vörösökére. Az Nvidia bejelentése szerint 20 különböző - köztük több húzónevű, mint például az Unreal Tournament 3 és a Ghost Recon 2 - játék és (egyenlőre) néhány grafikus motor fogja támogatni a PhysX API-ját. Ennek a megvalósulása létkérdés lehet a cég jövőjét illetően.

Gyakorlati áttekintés

Maga a fizikai gyorsítás minden 8-as, 9-es és 200-as sorozatú Nvidia kártyával kompatibilis (önmagában is, szoftveresen, ilyenkor a processzor számolja a fizikát, tehát nem egy dedikált hardver). A hardveres társkártyás megoldás előnye, hogy egy „gyengébb” videókártya és egy általában még gyengébb grafikus gyorsító együttes erejét használhatjuk egyszerre. A külön hardveres megoldás estén kétfelé oszlik a számolási feladat, ezzel tehermentesítve az "elsődleges" GPU-t. Ennek lényege, hogy az egyik (értelemszerűen a gyorsabb) videókártya a nagyobb erőforrás igényű textúrázásért és a megjelenítésért felel, míg a másik kizárólag a fizikai számításokat, mozgásokat és ezek interakcióinak modellezését végzi. Mivel a két kártya nem SLI kapcsolatként van összefűzve, így akár (ahogy esetemben is történt) Crossfire-t támogató alaplapban is használható a két Geforce-os felállás. Nyilván erre azért volt szüksége az Nvidiának, hogy maga a technika legyen annyira platfrom független, hogy a piacvezető Intel chipkészletes lapok tulajdonosai (akik általában Geforce kártyát használnak) is kitudják használni a lehetőséget, ezzel is az Nvidiát gazdagítva, illetve az ATi és (leendő) Intles videókártyák piacát szűkítse a saját javára. (Noha itt meg kell jegyeznem, hogy egy AMD/ATi kártya mellett is működésre bírható a PhysX támogatás egy Nvidia társkártya segítségével a megfelelő OS alatt.)

Szoftveres fizikai számítás esetén vagy a processzor vagy mind a kettő számolást egy GPU végzi ilyenkor a GPU-t nagy terhelés éri, hiszen a renderelés és a fizika számítása is egyedül ráhárul. Ilyenkor gyakorlatilag csak emuláljuk a PPU-t. Az erős videókártyák (pl. GTX280) mellé nem érdemes például 8500GT-t társítani, mert csak visszafognák az erősebb grafikus gyorsítót (tesztek szerint GTX280 mellé társított 9600GT sem gyorsít nagyon sokat, mintha csak önmagában dolgozna a „nagyágyú” egy kellően erős processzor társaságában), hiszen akkor a társkártya lesz a szűk keresztmetszet, mert mint tudjuk minden rendszer sebességét a leglassabb elemének sebessége határozza meg. Arra is mód van, hogy a processzor egyik magja végezze a fizikai számításokat, ilyenkor tulajdonképpen a processzor egyik magja lesz maga a PPU. Sajnos ez jelenleg nem elég gyors megoldás egy gyengébb társkártyával elérhető sebességhez mérten sem. Leginkább a Core 2 architektúrájú processzorokat általánosságban sújtó QPB szűkös sávszélessége illetve a VGA-kon általában használtnál (GDDR3) lassabb rendszermemória miatt. Az egy NYÁK-ra integrált multi GPU-s kártyákon is megbontható az SLI kapcsolat (Pl: 9800 GX2, GTX 295) és külön választható, hogy az egyik GPU számolja a fizikát, a másik pedig rendereljen.

A Tesztkonfiguráció főbb alkotórészei:

Gigabyte EP35 DS4 (F3)
Intel Core 2 Quad Q6600 (G0) - 2,4GHz és 3,51GHz
Thermalright Ultra 120A & YS Tech 120mm
SuperTalent T800 2x1GB - 800MHz (4-4-3-8 2T) és 1170MHz (5-5-5-15 2T) - DC
BFG 8800GTS OC 512MB - 675/1674/1950 MHz - 177.83 WHQL + PhysX v2.8.1
ASUS EN8600GT/2DHT/256M – 540/1190/1400 MHz
Samsung SpinPoint P80SD - 8MB Cache
Chieftec GPS 550 AB A - 550W
Hyundai Q90U - 1280x1024 - 60Hz
MS Windows XP Prof. 32bit + SP2

A második grafikus gyorsító választásakor, elsősorban - az ár mellett, és hogy ne a gyengének mondható referencia hűtése legyen - az volt a fő szempont, hogy ne legyen túl erős, hiszen a második "csonka" PCI-E szlot elektromosan csak 4 sávot tud biztosítani a P35-ös alaplapomban (annak ellenére, hogy fizikailag 16 sávos). Eredetileg egy 8500GT lett volna a kiszemelt áldozat, de a minimális árkülönbség, illetve a sokkal könnyebb beszerezhetőség miatt döntöttem a 8600GT mellett. Valószínűleg egy korszerűbb chipkészlet (pl. P45) második kevésbé csonkított PCI-E sávja már elbírna egy 8600GTS-t vagy akár egy teljes értékű PCI-E 2.0-ás második szlotban (pl. X48) akár egy G80-as 8800GTS-t is (bár valószínűleg, ez már túlzás lenne jelenleg). Fórumos tapasztalatok szerint a 8600GT-t 8x PCI-E szlotba rakva sem gyorsul, így kétségtelenül a 4x PCI-E szlot nem korlátozó tényező esetünkben alapórajelen ha csak fizikát számoltatunk vele.
Fontos kiemelni, hogy mivel a két kártya nincs összekötve SLI híddal így nincs sáveloszlás a kártyák között, minden esetben a használt PCI-E szlot natív sávszélességével kezeli az adott videókártyákat alaplapunk. Tehát az én esetemen például a 8800GTS 16 sávot kap, a 8600GT pedig 4-et, holott ha össze lenne kötve (pl két HD 4850 a CF miatt) csak 8 illetve 4 sávot kapnának a kártyák. Ezért nincsen lassulás az elsődleges kártya esetén soha, tehát lassabb nem lesz a rendszerünk semmiféle képen ha hardveres PhysX mellett döntünk. Érdemes megemlíteni, hogy azokon az alaplapokon ahol nincs két PCI-E szlot ott is kivitelezhető a hardveres PhysX gyorsítás. Nem csak az Ageia kártyájával oldaható meg, hiszen forgalomba kerültek PCI szlotos 8500GT és 8600GT kártyák is. Ezek hatásossága fizikai számolásra erősen kérdéses, hiszen a hagyományos PCI interfész sávszélessége már igen szűkös mai szemmel nézve.

Tesztprogramok:

Olyan programokat válogattam össze természetesen, amik kihasználják a PhsyX előnyeit (szerencsére ezek nagy részét az Nvidia össze is gyűjtötte egy csomagba), hogy kiderüljön a hardveres fizikai gyorsítás mennyivel jobb mint a szoftveres. A mostani tesztben a videókártyák nem lesznek tuningolva, csak a processzor. (A vga tuning hatását egy másik tesztben fogom vizsgálni.) Készül egy alapórajeles mérés DES-el, egy alapórajeles mérés DES nélkül (csak C1E + EIST) és egy tuningolt processzor mellett hardveres és szoftveres fizikai modellezés mellett.

-MKZ Benchmark (1280x1024)
-NurienTech Demo (1024x768)
-FluidMark (1280x1024 - MSAA 4x)
-The Great Kulu (1280x1024 – Full High)
-Warmonger (1280x1024 – Full High)
-(FRAPS)

A mérésre a demókba beépített fps számlálót, a két játék esetén pedig a FRAPS-ot (a tizedes jegyű fps-eket kerekítettem) használtam. A játékok tesztelésekor ugyan azt az útvonalat jártam végig minden esetben és próbáltam hasonló játékmenetet reprodukálni.

Teszteredmények:

A DES-es és a normál alapórajeles mérés között alig van különbség, tehát mégsem lassít olyan sokat a processzoron. Ez esetben valószínűleg vegyes limitről van szó, hiszen nagyon alacsony fps számokat kaptam de a PhsyX bekapcsolása feljebb tornássza az minimum fps-ek számát 50%-al (vga limit oldása), de még így is elég alacsony marad a minimum fps. A processzor tuningolása mellet is megjelenik a +50%-os minimum fps növekedés (processzor limit oldása) de még ez is elég kevésnek mondható. Fontos megjegyeznem, hogy a gyorsulás mellett a látvány sokkal szebb lett. Tehát nem csak gyorsulásról (még ha nem is eget rengetővel) de esztétikai növekménnyel is számolhatunk, ami egyáltalán nem elhanyagolható tényező. Sajnos azt kell megállapítanom, hogy alapórajelen hardveres PPU-val is alig élvezhető ez a demó, ilyen értékek mellett játszhatatlan lenne bármilyen játék, ezzel szemben egy kis tuning hatására már egész élvezhető a demó.

Nagyjából ugyan az áll erre a tesztre is, mint az MKZ Benchmark-ra. Sajnos szomorkodásra ad okot, hogy az 524.288-al kevesebb megjelenített pixel ellenére (1280x1024 VS 1024x768) is harmatos eredményeket kaptunk. Érdekes módon a DES-t bekapcsolva nőtt a maximum fps szám, noha az átlag fps szám csökkent. Természetesen itt is vannak kis csúszások, mint ahogy akármilyen tesztprogramot futtatunk a legritkább esetben kapunk két egyforma pontszámot / végeredményt ugyanazon rendszer esetén is, illetve kisebb mérési pontatlanságok is előfordulhatnak (1-2 fps eltérés még úm. hibahatáron belül van).

Ebben a tesztben jött ki először érdemi különbség az alapórajeles sima és DES-es eredmény között. A maximum fps majdnem a duplájára nőtt, míg az átlag fps számunk is szépen megugrott annak hatására, ha kikapcsoltam a DES-t. Ez valószínűleg annak tudható be, hogy közelebb vagyunk a processzor limithez, mint a vga limithez. A többi órajelen az eddigi gyorsulási ütemet mutatja a PhysX illetve a tuning alkalmazása.

Az első olyan tesztelt program ahol kvázi semmi gyorsulást nem hozott a PhysX. A gyorsulás ami látható csakis a processzor húzásának köszönhető. Lehetséges, hogy nem jártam olyan pályarészen, ahol igazán szükség lett volna a fizikai számításokra.

Hogy mégis kellemes szájízzel búcsúzzunk: A Warmonger nevű játék igen szép gyorsulást mutat a PhysX bekapcsolásának hatására. Gyakorlatilag ez a játék full high beállításon hardveres PhysX gyorsítás nélkül játszhatatlanul lassú a rendszeremen. Ha a jövőben is, ekkora gyorsulást hoz a játékoknál ez a megoldás, akkor nagyon elégedettek lehetünk a hardveres fizikázást illetően.

Konklúzió:

Összességében elég vegyes eredményeket mutatnak a tesztek. A PhysX használata előnyös de egy játék kivételével igazából nem hozott eget rengető gyorsulást egyenlőre. Látványban viszont mindenképpen szebben néznek ki a tesztelt programok ha a hardveres fizikai gyorsítást bekapcsoljuk. Arról is szót kell ejteni, hogy ez a technológia még gyerekcipőben jár, nagy fejlődést lehet várni tőle. A DES-el és nélküle mért eredmények esetén a minimum fps különbség nem volt nagyobb mint 1, ami még mérési hibahatáron belül van bőven. Az átlag és a maximum fps-ek terén már valamennyivel nagyobb a különbség de még mindig szinte elhanyagolható. Az, hogy a DES ilyen kevéssé szól bele az fps szám alakulásába, azt jelenti, hogy általánosságban távol vagyunk a processzor limittől és inkább a vga limit a mérvadó.

Az tisztán látható, hogy ez nem olyan nagy jelentőségű dolog (még), hogy egyből átrendezze a vga piacot és az is lehet, hogy sohasem fogja. A legnagyobb jelenlegi hátránya, hogy alig van szoftveres támogatottsága. Ígérnek sok-sok játékot, de ki tudja mi lesz belőle. Lényegében kétféle végkifejlet lehetséges:

- Az egyik, hogy mivel az AMD/ATi és a vga piacra most beszállni készülő Intel is a másik fizikai API-t támogatja az Nvidia talpon maradása lehet a tét. Az Intel ez esetben nyilván elég sokat fog beleölni a dologba, hogy minél nagyobb szeletet vegyen el a jelenleg piacvezető Nvidiától (főleg, hogy kvázi akkor az AMD-vel "stratégiai" partnerek lesznek ezen a téren). Ez esetben az Nvidia nagyon sok további erőforrást fog bele ölni a PhysX projektbe.

- A másik eshetőség pedig, hogy (esetleg versenyen kívül megegyeznek): nem erőltetik ezt a technikai fejlődési irányt. Akkor pedig teljesen elsikkad a dolog. Fejlesztenek annyival erősebb vga-kat, hogy nem lesz szükség a külön hardveres PPU-ra, illetve igen minimális gyorsulás lesz ennek használatával.

Igazából még túl friss ez a technika, így egyértelmű végkövetkeztetést még nem szabad levonni, hogy a szoftveres vagy a hardveres PPU a jobb megoldás hosszútávon. Itt arra gondolok, hogy egy drágább de erősebb videókártyával jár jobban az ember, vagy egy középkategóriással és egy alsó kategóriás összekapcsolásával. Az viszont kétségtelen, hogy jelenleg nem éri meg ebbe túl sok pénzt ölni a szoftveres támogatottság hiánya miatt.

Azóta történt

Előzmények