üzenetek

hozzászólások


fatpingvin
(őstag)
Blog

"Persze az erőt itt viszonylagosan kell értelmezni, ettől még nem lesz ugyanolyan gyors egy mobiltelefonokba szánt megvalósítás."

ezt nem értem. egyrészt mi írja elő hogy ez csak mobiltelefonokban lehetne használni, másrészt miért ne lehetne lapkaterület és teljesítményfelvétel vonatkozásaban ugyanolyan hatékony vagy akár jobb?


Abu85
(HÁZIGAZDA)
Blog

Ennek a legerősebb építhető konfigurációja kisebb teljesítményű, mint például a Navi 24, ami az AMD-nek a belépő GPU-ja. Erősebbet meg nem tudsz építeni, mert nem skálázódik 16 multiprocesszornál tovább a dizájn. Hova szeretnéd még alkalmazni ultramobilon kívül?

[ Szerkesztve ]


atus72
(senior tag)

sukárkövetés


Duddi
(aktív tag)

Szép és jó dolog a sugárkövetés, és előbb utóbb az is lesz a jövője a 3D környezetek megjelenítésének. De. Minden másra a mostani raszterizációs eljárások a tökéletesek. Egy oprendszer tálcájának ,vagy menüjének nincs ilyenre szüksége, és pont ezért építik az ilyen vegyes architektúrákat.
Szerintem az egész akkor lesz értelmes erejű ha olyan gyorsítókat kezdenek gyártani PCIe portba ami csak sugárkövetést és abból is Path Tacing-et tud csak, és a raszterizálást meghagyják az APU-knak.
Mint régen amikor mindent a processzor számolt és a videokártya még opcionális 3D gyorsító volt.


Geri Bátyó
(őstag)
Blog

Ultramobil szinten van egyáltalán értelme a sugárkövetésnek? Desktop VGA-k vért izzadnak vele százszoros fogyasztási keretből.


fatpingvin
(őstag)
Blog

"lapkaterület és teljesítményfelvétel vonatkozásaban ugyanolyan hatékony vagy akár jobb?"

magyarán hogy nem skálázod sokszáz multiprocesszorra.


Abu85
(HÁZIGAZDA)
Blog

Azért nem skálázhatod, mert nem lehet. Egyszerűen maga az architektúra nem támogat hozzá elég sok konkurens szálat. Ha támogatna, akkor a lapkaterület és teljesítményfelvétel vonatkozásában sokkal rosszabb lenne a dizájn.


fatpingvin
(őstag)
Blog

nem tudom eldönteni hogy nem érted vagy nem akarod érteni amit kérdezek:

a felvetés részemről az volt, hogy azonos skálán vajon hogyan viszonyul egymáshoz pl a navi és az immortalis. ha az utóbbi 16 multiprocesszorig megy, akkor hogy viszonyulna egymáshoz egy 16 MP-s navi egy fullos immortalishoz?


Abu85
(HÁZIGAZDA)
Blog

Az a gond, hogy maga a kérdés lényegtelen, mert nem azonos skálán mozognak.

Az Immortalis tranzisztorokat spórol azzal, hogy nagyon gyengére veszi a regiszterfájlokat, az LDS-t, a konkurens szálak számát, stb. Amíg úgy írod a programot, hogy beleférsz a hardvernek abba a felső limitjébe, amíg van új szál a memóriaelérés átlapolásához, addig nincs nagy baj, de amint nem, onnantól kezdve az ARM dizájnja százszor-ezerszer is lassabb lehet, mert a Navinak ott az adat a regiszterben, míg az Immortalisnak a memóriáig kell mennie érte. És ez önmagában 100-200 büntetőciklus per operáció, miközben még az állapotváltásokat is menedzselni kell, és nincs preempció, ahogy a Navi-nál.

Ezért nem hasonlítja ezt össze senki, mert nagy áldozatot hoznak az ultramobil dizájnok a hatékony működésért. A hatékonyság kvázi addig van meg, amíg nem futsz ki az erőforrásokból, és az ultramobil GPU-k sokkal kevésbé potensek itt.

Ezért hülyeség az Apple IGP-jét a dedikált GPU-khoz mérni, mert a szintetikus tesztprogramok úgy vannak megírva, hogy a határokon belül maradjanak. Egy tényleges alkalmazásban az Apple IGP-je is szenved, mert az Imagination komplexitást áldoz azért, hogy energiahatékony legyen.

[ Szerkesztve ]


fatpingvin
(őstag)
Blog

erre voltam kíváncsi, köszönöm a választ.

üzenetek