üzenetek

hozzászólások


Abu85
(HÁZIGAZDA)
Blog

Az a gond, hogy maga a kérdés lényegtelen, mert nem azonos skálán mozognak.

Az Immortalis tranzisztorokat spórol azzal, hogy nagyon gyengére veszi a regiszterfájlokat, az LDS-t, a konkurens szálak számát, stb. Amíg úgy írod a programot, hogy beleférsz a hardvernek abba a felső limitjébe, amíg van új szál a memóriaelérés átlapolásához, addig nincs nagy baj, de amint nem, onnantól kezdve az ARM dizájnja százszor-ezerszer is lassabb lehet, mert a Navinak ott az adat a regiszterben, míg az Immortalisnak a memóriáig kell mennie érte. És ez önmagában 100-200 büntetőciklus per operáció, miközben még az állapotváltásokat is menedzselni kell, és nincs preempció, ahogy a Navi-nál.

Ezért nem hasonlítja ezt össze senki, mert nagy áldozatot hoznak az ultramobil dizájnok a hatékony működésért. A hatékonyság kvázi addig van meg, amíg nem futsz ki az erőforrásokból, és az ultramobil GPU-k sokkal kevésbé potensek itt.

Ezért hülyeség az Apple IGP-jét a dedikált GPU-khoz mérni, mert a szintetikus tesztprogramok úgy vannak megírva, hogy a határokon belül maradjanak. Egy tényleges alkalmazásban az Apple IGP-je is szenved, mert az Imagination komplexitást áldoz azért, hogy energiahatékony legyen.

[ Szerkesztve ]

üzenetek