üzenetek

hozzászólások


G@bi90MR
(aktív tag)

Winrarral megnéztem, elenyésző a különbség. 1% se volt. :) Két magra nem jó, jó ez így ahogy van. :D


Ricco_hun
(senior tag)

Akkor kedves Qru kolléga mégis milyen elszabott adatok alapján merészelte megrajzolni azokat a grafikonokat?


grabber
(addikt)
Blog

Hogy lehet megmondani,hogy melyik mag fusson? Már megvan :U

Ennyi többlet teljesítményért nem éri meg bajlódni.Ráadásul nagy számításoknál már 4 mag fut,úgy is :D

[ Szerkesztve ]


cousin333
(addikt)
Blog

Gondolom valami ilyesmit akart kihozni, csak nem sikerült neki:

Amúgy tényleg elég félrevezetőre sikerült...

[ Szerkesztve ]


norbi1992
(tag)
Blog

Úgy , hogy grafikonok a valóságot tükrözik , csak rendkívül megtévesztőek. (először én is benéztem)


TomBoy1986
(veterán)
Blog

Na azt ne tőlem kérdezd :)


Ari18
(őstag)
Blog

Nem is gondoltam rá. Grat csak szerintem annyira minimális a difi h értelmetlen állítani.


dudika10
(veterán)
Blog

Már válaszoltak helyettem. :)

Egyébként mintha valami sajtóanyag grafikonjait nézném. Azokon szokott a +5% 6x akkora oszlop lenni. :DDD


devast
(addikt)

Kicsit szakmaian... nem tudom, hogy őszinte legyek :DDD Mondjuk vakószínűsítem, hogy a szintetikus tesztekben a szálaknak teljesen különálló állapotterük van, míg valós alkalmazásoknál elképzelhető, hogy nem. Röviden: ha 2 szál egyazon cache-t használ, azaz egy állapotterük van, akkor ha külön magon futtatod őket akkor elvileg lassulnia kéne, mivel a változásokat mindkét mag cache-ébe végre kéne hajtani stb. Bár ebbe nem vagyok biztos, hiába van meg arcitektúrák vizsgám meg oprendszerek, nem vágon pontosan mi, miként. Valaki írhatna erről is egy jó cikket :DD


tlac
(nagyúr)

pont én is hasonló dolgon gondolkoztam, hogy ha 2 külön magon fut a program 2 szála, amik kommunikálnak is egymással, akkor ez az alaplapon megy, ami lassít, mintha csak 1 magon belül futna

[ Szerkesztve ]


tibz03
(őstag)

Én azt furcsálltam, hogy az első pár hsz. miért arról szól, hogy "húú, de jó, micsoda gyorsulás" stb., holott nincs szinte semmi gyorsulás, de aztán világossá vált, hogy sokan benézték a grafikont. (Amin így utólag nem is csodálkozok, elég katyvasz. :U )


proof88
(addikt)
Blog

De ha az egyik szál az egyik cache-t használja, a másik a másik cache-t, akkor ott nem sok dolgot kell tükrözni a két cache között, max 1-2 dolgot, de az adatok, amikkel dolgoznak, az különbözik. És a cache-memóriánál is nagyban számít, ha nem egyszerre akarja használni 2 mag, hanem csak 1-1 mag külön-külön a kettőt, így legalább nem lassít a memória, hiszen L1 szinten csak ~1ns késleltetésről beszélünk, L2-nél meg pár ns, azért ha az egyik magnak azért kell várni a cache-re, mert a másik mag épp használja vagy használta, de még nem tud adni adatot a cache-memória, akkor az már várakozás... szerintem túl sok szinkronizációra, adminisztrációra nincs szükség a külön cache-ek esetén jelen esetben, más-más adatokon dolgoznak a szálak. És ami még fontos a külön cachenél, hogy úgy nagyobb kapacitás áll rendelkezésre. Mondjuk amit most írok, az is csak feltételezések összessége, úgyhogy... nem tudok rendes választ adni. :D

Egyébként annak idején, még a Pentium4-ek esetén 2x több cache ~10-20% gyorsulást jelentett. Tehát ha azonos magos, azonos órajelű Celeront és Pentiumot összehasonlítunk, mondjuk egy 256 kB L2-es Celeront és egy 1 MB L2-es Pentiumot, akkor itt 4x több a cache, tehát 40-50% plusz sebesség jöhet a Pentium részére, ez általában meg is látszott a teszt eredményeken. Viszont egy idő után, ahogy nő a cache mérete, úgy egyre kevésbé nő a sebesség és ne felejtsük el, hogy nem mindegy a cache-kezelési stratégia sem.

A Tomshardware-en vannak mindenféle chartok, most nézzük a Desktop CPU Chartot, a legutóbbit Intel téren, az E6300 (2MB L2) és az E6320 (4MB L2) érdekes most:
Photoshop CS3 - 159 vs 158 mp;
Sandra 2008 Multimedia Integer - 102636 vs 102710;
uez Floating-ban - kb uaz;
Vantage CPU tesztje - 3280 vs 3409;
UT 3 - 73.40 vs 77.70 fps (itt a legnagyobb a különbség: 5.8%).

De nézzünk tovább, nézzük meg a modernebb, 45 nanométeres 4-magosokat:
Q9300 (6 MB L2) vs Q9450 (12 MB L2), ProHardver!, a kétszer annyi cache előnye:
- audio-video-konvertálás: +5%;
- fotó-videófeldolgozás: +7%;
- 3D-modellezés, render: +7%;
- játékok: +4%.
A játékok részletesebben:
- Crysis: +10%;
- Bioshock: 0%;
- Colin McRae Dirt: +4%;
- Lost Planet EC DX10: +1%;
- World in Conflict: +8.8%.

Ehhez még jön az is, hogy a Q9450-nek 0.5-tel nagyobb a szorzója, azaz 166 MHz-cel magasabb az órajele, ami 6% plusz. És a tesztek cpu-limitált beállítással mentek a játékoknál. Úgy néz ki régebben nagyobb szerepe volt a 2x annyi cache-nek, legalábbis ilyen nagyságban aligha van előnye, hogy 6 vs 12 MB. Mondjuk az biztos, hogy érezhető a különbség 2 vs 4 vs 6 között...


JanR
(addikt)
Blog

Azta, nem semmi, köszi!


cousin333
(addikt)
Blog

Az L1 cache az tudtommal csak az adott maghoz tartozik, az L2 (AMD-nél az L3) az, ami közös. Különben is, a jól párhuzamosítható dolgoknál szerintem eléggé függetlenül tudnak dolgozni a magok.

[ Szerkesztve ]


proof88
(addikt)
Blog

Hát épp ez az, hogy az L2 közös. De csak 2 magnak közös. 4 magos procinál (ha Intelről beszélünk), az 2 db 2 magos proci egyben, tehát elvileg úgy lehet gyorsulás, ha egyik szál az első kétmagos L2-jét használja, másik szál a másik kétmagos L2-jét... viszont én úgy tudom, hogy az L1 is kétszeres, ha L2 is az... bár nem szoktam megfigyelni, régen így volt.

Amúgy most egyet értesz velem vagy sem? :) Én is azt mondtam, h függetlenül tudnak dolgozni, alig kellhet forgalom arra h ugyanazokat a dolgokat írjuk mindkét helyre... teljesen más adatokkal dolgoznak... de ha közös cache-t használnak, akkor mivel mindketten szeretnének a cache-hez férni, annak lassúsága, elérési ideje miatt lehet lassabb a dolog.


motorhead
(aktív tag)
Blog

Ezek tényleg érdekes eredmények. Szívem szerint azt mondanám, hogy nem ezek a programok amik profitálnak a több cache méretből... De akkor mik? :D

Gyanítom, és korábban tapasztaltam is, hogy inkább a több program egyidejű futtatása alatt érezhető a dupla cache méret. Teszem azt mikor megy mondjuk egy sokcsatornás keverő szoftver, plusz még alatta egy dobszintetizátor, megspékelve mondjuk még egy gitáreffekt programmal. Ezek egyidejűleg ha futnak egy egygépes zenei stúdióban, nos itt lehet már érezni akár a több magot, akár a több cache-t.

Ugyanez lehet grafikai munkánál,mikor megy egy photoshop, és megy egy 3DSMax, plusz még valami külső render plugin, egyidejűleg.Mert ilyen bizony előfordul, hogy egyszerre kell ezeket használni. Itt lehet ugyanaz a jelenség, hogy igenis van jelentősége a cache méretnek.

Kellene egy tesztet nyomni, több program egyidejű futtatásával!


proof88
(addikt)
Blog

Csinálni kéne, jah... :D


gtamate2
(veterán)
Blog

köszönjünk a cikket Qru! :R :R
Örök hálám a proci vétel miatt is :R
ui:jut eszembe, azóta se vettem még procihűtőt :DDD


Geller72
(veterán)

A téma feszegetése jogos, ebből a szempontból tetszett is, más kérdés, hogy én soha nem vettem vissza a magok affinításából. 8x400-on nem is volt kérdés.:DD. Mostanában csináltam egy házi tesztet egy E6300@2800, később 7x425 (2975 Mhz) vs. E8400@3 Ghz. Az everest egyes tesztjeiben alig, egyéb más tesztekben szinte nem, vagy alig volt észrevehető a háromszoros cache. Egyre jobban hiszek annak a stratégiának, hogy a magas órajel sokkal többet nyom a latba, mint a megnövelt cache méret. (L2).

Geller


Anal
(tag)

Grat nem semmi felfedezés lett belőle!

:R :R :R

üzenetek