ForceWare 337.50 - az nVidia válasza a Mantle-re

Az nVidia szerint megtalálták a Mantle API "ellenszerét" a Direct3D keretein belül, és ezt a 337.50-es béta driverben meg is osztották. – írta: gbors, 10 éve

Bevezető, a teszt

Bevezető

Amikor 2013. szeptember végén az AMD bejelentette a Mantle API-t, amelynek a fő küldetése a grafikus hardverekhez való közvetlenebb, "macera-mentesebb" hozzáférés biztosítása (szemben a némileg dinoszaurusz-szerű Direct3D-vel), a legsokatmondóbb az a csend volt, amellyel a bejelentést az egyéb iparági (ellen)érdekeltek kísérték.

A Microsoft és az Intel érdemben semmit nem mondott, az nVidia pedig hirtelen az eddigieknél is jobban elkötelezetté vált az OpenGL irányába, hiszen amit a Mantle tud, azt (szerintük) az OpenGL-lel is meg lehet valósítani. Persze, ez utóbbi kijelentést senki nem vette túlzottan komolyan - ezért a 2013-as év végén, ill. az idei év elején az AMD-n (és legelső partnerén, a DICE-on) volt a világ szeme, hogy konkurensek nélkül mit tudnak kihozni a papíron roppant ígéretes koncepcióból.

Némi csúszkálás után meg is jelent a Battlefield 4 azon verziója, amely a Direct3D helyett a Mantle API-n keresztül beszélget a megfelelő (értsd: Radeon GCN architektúrás) videokártyákkal, és bár a start nem volt zökkenőmentes, viszonylag gyorsan kikristályosodott, hogy mi igaz a rengeteg hype-ból, és mire is lehet első körben jó a Mantle. A kulcsszó: CPU-limit.

Akkor jó nekünk a Mantle, ha a Battlefield 4 választott játékmódjában, ill. a kiválasztott beállításokkal a CPU-nk sebessége visszafogja a videokártyánkat, mert a Direct3D-re építő rendererekben megszokott "domináns egy szál" problémát megszünteti, és a processzorunk erőforrásait lényegesen hatékonyabban tudja kihasználni.

Ennek következtében a közepesen CPU-limites esetekben akár egy kétmodulos AMD CPU-val is olyan sebességet lehet elérni, mint egy négy maggal és hyperthreadinggel felvértezett Intellel - új vásárlások esetén ez mindenképpen megfontolandó. Másrészt olyan esetekben is igen hasznos az új API, amikor még az Intel CPU-k is köhögnek a terhelés alatt (lásd multiplayer játék CrossFire konfiguráción) - itt a CPU árán csökkenteni nem tudunk, viszont a videokártyákat sokkal jobban ki tudja futtatni, és így a több FPS mellett az elektronikus nemiszerv is megnyugtató méretűre duzzad.

Egyszóval, a Mantle bizonyos szituációkban határozott előrelépést hoz - és bár a játékválaszték egyelőre két játékra korlátozódik (a második a Thief reboot, ahol ráadásul a Mantle-nek túl sok jelentősége nincs is), az ígéretek szerint hamarosan jelentősen bővülni fog az új API-t támogató játékok köre. Mindenkinek a vérmérsékletére bízom, mennyire tud hinni a fenti állításban - az viszont biztos, hogy a Mantle jelen pillanatban is tud kézzelfogható előnyökkel szolgálni, míg hátránya igazából nincs.

Mint nemrégiben kiderült, az nVidia reakciója nem merült ki a vérszegény OpenGL-es kommentben. Némileg ellentmondásos módon a 337.50-es béta driverüket úgy jelentették be, hogy ők meg tudják csinálni Direct3D alatt azt, amihez az AMD-nek egy külön API-t kellett kifejlesztenie.

Mint a legtöbb nVidiás marketing-üzenet, ez is roppant mulatságos első hallásra, jobban mögé nézve pedig az derül ki, hogy valamennyi valóságalapja azért van. Az üzenet fő pillére az az évek óta konzisztensen látható előny, amelyet az nVidiás kártyák a CPU-limitált tesztekben mutatnak - ennek mértéke generációról generációra változik, a HD5000-es és a HD6000-es Radeon szériák szinte teljesen elmosták, aztán a HD7000 megint "visszahozta". Ha erre a területre az nVidia kicsit ráfekszik, akkor talán ez az előny tovább növelhető - kérdés, hogy mennyire.

A marketing (természetesen) kicsit sem visszafogott a kérdésben - egy GPU esetén maximum 64%-os, több GPU esetén maximum 71%-os előrelépést ígérnek. Ezek természetesen extrém esetek - viszont az ígért javulás annyira komoly, hogy akár 20-30%-os valós, átlagos előrelépést is takarhat a való világban. Vagy, akár 0%-ot is - ki tudja?

Mivel a CPU-VGA téma mindig is közel állt a szívemhez, nem is volt kérdés, hogy utánajárok, mit hozott a ForceWare 337.50 béta - íme!

A teszt nVidia oldali főszereplője

A teszt megközelítése, konfiguráció és tesztmódszer

Egy ilyen nagy horderejű állítást, mint a maximum 64%-os előrelépés, érdemes óvatosan kezelni, és ennek megfelelő körültekintéssel kitesztelni. Nagy a kísértés, hogy alacsony felbontásban, low beállításokkal készüljenek a tesztek, mert úgy biztosan kijön a differencia a driverek között - azonban egy ilyen tesztből nem feltétlen lehet levonni a megfelelő következtetéseket arra nézve, hogy a játékos, aki normális beállításokkal akar játszani, mit fog tapasztalni. Ezért a tesztet a következő szempontok figyelembevételével állítottam össze:

- Készültek VGA-limites mérések, hogy kiderüljön nem onnan jön-e valamilyen előny (nem beszélve esetleges huncutságokról)
- A CPU-limites mérések a videokártyának megfelelő beállításokkal készültek, viszont alacsonyabb felbontásban - így kijön, hogy az adott beállítások mellett mire képes a CPU
- A CPU-limites szituációkban az előrelépés megítéléséhez beválogattam egy gyorsabb CPU-t a régi driverrel, így biztosítandó, hogy a beállítások ne zavarják meg az eredmény megítélését

Szerencsés módon az alapdriverrel (331.58) végzendő mérések rendelkezésre álltak a megelőző tesztemből, sőt, a feltétlen szükségesnél még többen is voltak, így egy bónusz szemponttal tovább tudtam árnyalni a képet - ld. lentebb a #3-as kombinációt.

A tesztek az alábbi konfiguráción futottak:

Az #1-es, #2-es és #4-es CPU + driver kombináció szerepe egyértelmű, a #3-ast pedig azért tettem bele, mert érdekes azt is megnézni, hogy ahol az i3 az új driverrel nem éri el az i5-öt, ott vajon egy alacsonyabb órajelű négymagossal felveszi-e a versenyt.

A VGA ismét a GTX 660 - a méréseket a fent megfogalmazott elveknek megfelelően nem csak 1920x1080-as felbontásban, hanem 1280x720-ban is elvégeztem. A HD felbontásban készült mérések segítségével a felső kategóriát is ide tudjuk csempészni: 1280x720-ban a GTX 660 annyi FPS-t teljesít, mint egy 60-70%-kal gyorsabb VGA 1920x1080-ban, a full HD felbontásban mért 660-sebesség pedig azzal egyenértékű, mintha egy 60-70%-kal gyorsabb kártyát 2560x1440-ben mérnénk (bővebben ld. A felbontás és az FPS kapcsolata c. cikkemben). Tehát a felbontások "átváltásával" jó képet kapunk arról, hogy az adott CPU-k mellett mit teljesítene egy olyan VGA, ami 60-70%-kal gyorsabb a GTX 660-nál - nVidia oldalon ez a GTX 770.

Játékok

A játékmix adott volt, 5 CPU-limites játék, ill. 2 VGA-orientált:

Anno 2070
Crysis Warhead
Crysis 3
GRID 2
Borderlands 2 (PhysX low)
Borderlands 2 (PhysX high)
Sniper Elite V2
Unigine Valley

Azt gondolom, az első négy játék szereplése nem igényel magyarázatot, mindegyik szereti a komoly CPU-teljesítményt. A Borderlands 2-nél érezhetően számít a CPU, és érdekes módon a GPU által támogatott fizika fokozásakor is, ezért a két teszteset. Végül a Sniper Elite V2 és a Unigine kontrollként került a tesztbe - de hogy ne legyen annyira unalmas a dolog, nem Heavent, hanem a Valley-t használtam, ami azért CPU-ban intenzívebb.

Ahogy az utóbbi pár cikkben, most is mellékeltem illusztrációként videókat a játékokhoz - köszönet illeti a készítőket! :R

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények