üzenetek

hozzászólások


proof88
(addikt)
Blog

De ha az egyik szál az egyik cache-t használja, a másik a másik cache-t, akkor ott nem sok dolgot kell tükrözni a két cache között, max 1-2 dolgot, de az adatok, amikkel dolgoznak, az különbözik. És a cache-memóriánál is nagyban számít, ha nem egyszerre akarja használni 2 mag, hanem csak 1-1 mag külön-külön a kettőt, így legalább nem lassít a memória, hiszen L1 szinten csak ~1ns késleltetésről beszélünk, L2-nél meg pár ns, azért ha az egyik magnak azért kell várni a cache-re, mert a másik mag épp használja vagy használta, de még nem tud adni adatot a cache-memória, akkor az már várakozás... szerintem túl sok szinkronizációra, adminisztrációra nincs szükség a külön cache-ek esetén jelen esetben, más-más adatokon dolgoznak a szálak. És ami még fontos a külön cachenél, hogy úgy nagyobb kapacitás áll rendelkezésre. Mondjuk amit most írok, az is csak feltételezések összessége, úgyhogy... nem tudok rendes választ adni. :D

Egyébként annak idején, még a Pentium4-ek esetén 2x több cache ~10-20% gyorsulást jelentett. Tehát ha azonos magos, azonos órajelű Celeront és Pentiumot összehasonlítunk, mondjuk egy 256 kB L2-es Celeront és egy 1 MB L2-es Pentiumot, akkor itt 4x több a cache, tehát 40-50% plusz sebesség jöhet a Pentium részére, ez általában meg is látszott a teszt eredményeken. Viszont egy idő után, ahogy nő a cache mérete, úgy egyre kevésbé nő a sebesség és ne felejtsük el, hogy nem mindegy a cache-kezelési stratégia sem.

A Tomshardware-en vannak mindenféle chartok, most nézzük a Desktop CPU Chartot, a legutóbbit Intel téren, az E6300 (2MB L2) és az E6320 (4MB L2) érdekes most:
Photoshop CS3 - 159 vs 158 mp;
Sandra 2008 Multimedia Integer - 102636 vs 102710;
uez Floating-ban - kb uaz;
Vantage CPU tesztje - 3280 vs 3409;
UT 3 - 73.40 vs 77.70 fps (itt a legnagyobb a különbség: 5.8%).

De nézzünk tovább, nézzük meg a modernebb, 45 nanométeres 4-magosokat:
Q9300 (6 MB L2) vs Q9450 (12 MB L2), ProHardver!, a kétszer annyi cache előnye:
- audio-video-konvertálás: +5%;
- fotó-videófeldolgozás: +7%;
- 3D-modellezés, render: +7%;
- játékok: +4%.
A játékok részletesebben:
- Crysis: +10%;
- Bioshock: 0%;
- Colin McRae Dirt: +4%;
- Lost Planet EC DX10: +1%;
- World in Conflict: +8.8%.

Ehhez még jön az is, hogy a Q9450-nek 0.5-tel nagyobb a szorzója, azaz 166 MHz-cel magasabb az órajele, ami 6% plusz. És a tesztek cpu-limitált beállítással mentek a játékoknál. Úgy néz ki régebben nagyobb szerepe volt a 2x annyi cache-nek, legalábbis ilyen nagyságban aligha van előnye, hogy 6 vs 12 MB. Mondjuk az biztos, hogy érezhető a különbség 2 vs 4 vs 6 között...

üzenetek