üzenetek

hozzászólások


Abu85
(HÁZIGAZDA)
Blog

Nem érted a modul koncepcióját.
A Flex FP feldolgozót szét lehet bontani két darab 128 bites részre. Nem kötelező tehát, hogy egy 256 bitesként üzemeljen. Erre csak akkor van igény, ahol AVX támogatás van a programban. E programok száma még mindig egy kézen mérhető, de korábban már megszokhattuk, hogy lassú szokott lenni az új utasításkészletek terjedése. Igazából túl nagy előnye sincs jelenleg az AVX-nek a fejlesztők oldaláról. A szerverben lehet, de a klienseken nincs.
Szóval csak akkor beszélünk egy FPU-ról, ha AVX program fut. Ha SSEx, akkor az nem képes 256 bites utasításokkal dolgozni, vagyis az FPU-t elfelezik a magok. Ezzel egy 256 bites FPU-val a throughput ugyanannyi lesz, mint két darab 256 bites FPU-val. Ez azért van, mert a 256 bites feldolgozó SSEx kódnál kihasználhatatlan. Az egység fele malmozik, azaz csak 128 bitesként üzemel.
Szóval nem igaz, hogy egy valós FPU van egy modulban. Egy Flex FP egység van benne, ami alkalmazkodik a munkamenethez, és sokszor kétfelé bomlik. Példával élve tehát egy A6 FPU-ja, SSE kódban és egy modullal ugyanolyan throughputra képes, mint két Intel Sandy/Ivy mag. Az igaz, hogy az elméletben egy 256 bites FPU áll szemben két 256 bitessel, csak SSE mellett ebből két-két 128 bites egység lesz. Az AMD-nél szétválasztásból adódóan, míg az Intelnél a kihasználtság hiányától.

üzenetek