Hát, ezek mind elég nyilvánvalók. De az a helyzet, hogy a 1-2 kivétellel az semmelyik játék és játékmotor nincs erre felkészítve, és kérdéses, mikor, és melyikeket fogják átírni. Egy játékon belül nem kiegyensúlyozott a teljesítmény-igény a független részfeladatok között [grafika, hang, fizika, stb.], így nem elég egyszerûen azokat párhuzamosan futtatni. (Bár biztos lesznek, akik beérik majd ennyivel.) Arra is gondolj, hogy kétféleképp kell megírni a kódot, single- és dual-core-ra is, mert még jó ideig ezek is párhuzamosan fognak futni.. :p
dez: Az, hogy milyen nehéz többszálú kódot írni, nagyon függ a feladattól. A legtöbb CPU igényes feladat jól párhuzamosítható. Emellett akkor is egyszerû a dolog, ha eleve több független feladatot kell egyidõben futtatni. Ez utóbbi egyre inkább jellemzõ az otthoni használatra.
Természetesen nem. :) Ne isteneítsünk termékeket. Használjuk õket. Arra valók.
Mondjuk ennél a 25%-nál azt is jó lenne tudni, mennyi idõ 1db konvertálás. Mert lehet, hogy a kettõ egyszerre jobban lassítja a P4-et kikapcsolt HT-vel, mint egy Athlont. És akkor nem sokat számít, hogy 25%, csak a saját gyengeségét kompenzálja.
Hát, nem tudom, hol nézted, nagyon rossz helyen, az biztos... :) "Értelmesbõl" régebbit hirtelen nem tudok, de itt van egy újabb. Egy esetet kivéve jobbal lassul a HT-s P4 a több feladattól, mint az Athlon (single és dual-magosak is). (Itt sajnos nincs olyan teszt, hogy mi lenne kikapcsolt HT-vel.)
Ja, egyébként tényleg van nálad 25%-os gyorsulás (HT nélkülis esethez képest)? Szinte hihetetlen.
Azért azzal vitatkozom, hogy egy adott programnak KÖTELEZÕ támogatnia a dupla magot (vagy HT-t), mert nálam pl. ha egyszerre elindítok két mp3 tömörítést, mint a kettõ egy 500 megás wav állomány egy ócska 3 éves programmal, akkor a HT bekapcsolása esetén 16 perc helyett 12 perc alatt lesz kész, ugyanis MAGA A WINDOWS XP oldja meg ebben az esetben a helyzetet, AMI AZT JELENTI, hogy ha maga a program is támogatná, akkor sokkal jobb lenne a helyzet.
Más:
Kikapcsolt HT-nél nálam pl. dvd írás, és mpeg4 konvertálás egyidõben szaggat a doom3, bekapcsolt HT-nél totál semmi sem érezhetõ...
Tehát ha van is 15% lassulás valahol, az lehet, én hálistennek még nem találkoztam vele, de AMI AZ ÉRDEKES, az az, hogy én még nem láttam olyan tesztet, hogy HT-t ÚGY teszteltek volna, hogy több progit futtatnak egyidõben. Pl. 4 giga dvd film betömörítése rar-ba maximális hatékonysággal + mellette 3dmark 2005 futtatás. Sajnos ilyen jellegû tesztet, ami ezt hivatott tesztelni, azaz a HT lényegét még nem láttam, csak olyat, hogy:
1/ HT bekapcsolva Winrar - x mp
2/ HT kikapcsolva Winrar - y mp
Már bocsánat, ez nem HT teszt, ez lóf***...
Mondok egy példát erre a megosztott/nem megosztott cache-re. A cache mérete ugyebár korlátozott, csak egy program-részlet (pl. nagyobb ciklus), vagy az adatok egy része fér bele. Nos, tegyük fel, két olyan program-részlet akar párhuzamosan futni, amikbõl egyszerre csak az egyik fér bele a cache-be. Két külön cache-nél nincs semmi gond. Osztott cache-nél mindkettõbõl kevesebb fog egyszerre elférni -> több hozzáférés a main ramhoz... (Vagy adott esetben L2-L3-hoz.)
Továbbá, ha a két szál adott része egymás adataival is dolgozik, és önmagukban rövidek, jobb a megosztott cache, mert akkor könnyebben és gyorsabban hozzáférhetnek egymás adataihoz.
Tehát, az adott program szempontjából egyátalán nem mindegy, hogy egyedi vagy megosztott a cache.
A saját cache-sel rendelkezõ dual-core megoldás az elsõ esetbe tartozik, a HT a másodikba... Így egy adott program-páros szempotjából az sem mindegy, hogy két core-on futnak, vagy egyen HT-vel.
"Hogy a cache osztott vagy sem, az a kód szempontjából répa."
Ebben nem lenné annyira biztos, de vitatkozz rajta inkább Gabesttel.
"A HT lényege épp az hogy 2 procinak láttatja magát, pont mintha 2 külön proci lenne benne. Az oprencer úgy is kezeli. Az más kérdés hogy mivel nincs 2 proci, nem mindig sikerül a párhuzamos végrehajtás, így a másik szál elég sokszor dekkol, mint az autók a piros lámpánál. Ha zõd lesz az út, majd megy tovább. Ugyanígy a 2. prg szál is."
Köszi, de ezt eddig is tudtam... :)
"Csak sebességbeli eltérés van a HT és a dupla mag között."
Ebben sem lennék olyan biztos. Az "ellentmondásos" tesztek is arra vallanak, hogy ez nem ilyen egyszerû.
Hogy a cache osztott vagy sem, az a kód szempontjából répa. A vinyódon levõ adatok se leszen másmilyenek, akár fat-ra, akár ntfs-re másolod.
A HT lényege épp az hogy 2 procinak láttatja magát, pont mintha 2 külön proci lenne benne. Az oprencer úgy is kezeli. Az más kérdés hogy mivel nincs 2 proci, nem mindig sikerül a párhuzamos végrehajtás, így a másik szál elég sokszor dekkol, mint az autók a piros lámpánál. Ha zõd lesz az út, majd megy tovább. Ugyanígy a 2. prg szál is. Csak sebességbeli eltérés van a HT és a dupla mag között.
Gabest azt akarta mondani (sikerült is, én egyet is értek vele), hogy más elrendezésû kód fut jól HT-vel, két procin/mag+nem_osztott_cache-en/mag+osztott_cache-en. Ezt a tesztek is mutatják. Van, ami HT-n egyenesen lassabb (annál, mint ha ki lenne kapcsolva :) ), két magoson meg gyorsabb. Van példa az ellenkezõjére is (Intelen :) )... Tehát, nem lenne könnyû teljesen kihasználni egy több magos HTT-s procit. Legalábbis, ami a mostani Pentium D-t illeti. (Van egy olyan érzésem, hogy az új Xbox-ban lévõ proci kicsivel jobb konstrukció.)
Meg aztán a különbözõ háttérben futó servicek, viruskergetõk, szoftveres tûzfalak se elõled veszik el a prociidõt. Rengeteg elõnye van még multithreades kód nélkül is.
Nem is arra való. De sztem elég sokan használják a gépüket intenzív multitaskban, arra megváltás lesz, nem kell homokórázni meg gyök2 sebességgel kirajzolódó ablakokat bámulni. Én várom nagyon, mert már most is ki tudnám használni. Természetesen nem hiszem azt hogy ettõl dupla fps-sel fog futni a doom3, de hát van más cél is mint 1 db játék minél gyorsabb futtatása. Mondjuk 2 játék. :))
Az igaz, de ez nem segít, amikor épp proci-limites egy játék.. És ez fõleg nem szolgáltat alapot a 4 magosoknak. Arra kíváncsi leszek, késõbb mennyire és mennyien fognak több-szálú kódokat írni, mivel ez már kimondottan optimizáció témakör (már eleve egy algoritmus többszálúsítása, plusz az sem mindegy, hogyan), és azt sokan nem szeretik. (De elõbb-utóbb persze kénytelenek lesznek...)
Egyrészt most kevés csak, majd lesz több is, másrészt ha több programot futtatsz egyszerre, máris van több szálad. Vagyis far cry alatt is tudsz videot tömöríteni (jogtisztát persze ;-)), és úgy fut mintha a másik progi nem is menne. (Legalábbis majdnem, memória sávszélességbõl, vinyóból nem lesz 2, de a procinak így is jóval többmindenre jut ideje.)
a HTT aztán nagyon sokat fog érni ám a p3 jellegû magban :) nem nagyon értem mit lehetne átvenni a p4bõl, hacsak a "pentium" márkanevet nem .... :D rakás szutyok, ezt mostanra az intel is "beismerte" :)
Persze-persze. Én csak azt mondom, hogy fölösleges hõbörögni bármelyik cég marketingjén és termékein is, mivel mind a mi butításunkat hivatottak elmélyíteni. Ez igaz az AMD-re is. Meg minden másra is.
A különbség fõleg a cache miatt van, két mag két külön cache-sel dolgozik, ami ahogy írtam lehet jó is és lehet rossz is. Erre is külön optimalizálni kell.
Rosszul tudod. Az Xbox 360-ban 3 magos proci van (ami összesen 6 szálat kezel).
A Cell-ben csak egy PPC mag van, de az SPE-k sem csak buta SIMD egységek, hanem kvázi teljes értékû procimagok, saját DMA és MMU egységekkel, SIMD-re optimizálva.
A tapasztalatok szerint legtöbbször nem hogy alig gyorsított valamit a HT (5%), sokszor inkább lassított (akár 15%-ot is)... :) Na persze ez az Inteles rossz megvalósításnak köszönhetõ, mert amúgy jó lenne.
Az xbox-ban és ps3-ban dolgozó központi egység tudtommal csak 1 PPC magot tartalmaz a többi mag csak kiegészítõ ill. vektorprocesszormagok. Valószinûleg túl drága és túl bonyolult lenne konzolba tööb PPC magos proci beépítése. Nem úgy mint IBM szerverekbe-workstationokba. Persze a felhasználási területük is más.
"Hozzátehette volna: "Az egész csak a vevõk hülyítését szolgálta."
Minden termék a vevõk hülyítését szolgálja. Néhányat bekajálunk, néhányat nem. Ez most egy olyan, amit nem.
Nem az a helyes kifejezés hogy hosszú pipeline-jû, de a P4 sokkal alkalmasabb volt a többszálú utasításvégrehajtásra. Alig 30-40% körül volt a végrehajtóegységek kihasználtsága, nagy késleltetés volt a buszon; ez egyáltalán nem jellemzõ a P-Mre, így sokat nem fog érni.
Sztem sokkal inkább az ooo -ra gondoltak az "újítások" nál.
Nem az athlonokra, hanem a Pentium-M-re, ami a P3 továbbfejlesztése. De ezt már vagy 1 éve bejelentette az intel, csak eddig még erõltette a P4-et, mert nyilván minél több pénzt akart kaszálni váltás elõtt (is).
Nincs ellenkezõje. Duál magnál is ugyanúgy fogja futtatni mint ha 1 magos HT-s proci lenne, a különbség csak az hogy amennyiben mindkét szál ugyanazt az egységet igényelné, a HT-nál értelemszerûen várnia kell, dupla magnál meg talál magának egy másik ugyanilyet (már amennyiben egy 3. szál azt épp le nem foglalja).
Nincs külön kód HT-re meg dupla magra. Ha többszálú a programod, akár HT, akár dupla mag (vagy akár mindkettõ), az automatikusan több szálon fog futni.
Mondhatta volna azt is, hogy az új processzor architektúrája az Atholonéra fog hasonlítani. Ennél a pentium3-as dumánál nagyon kilóg a lóláb. A konkurencia termékeit nyilvánosan a szánkra nem vesszük:)
Ahogy valaki okosan megfogalmazta (sajnos mar nem emléxem hol olvastam), a HT különbözõ, de egy helyen lévõ, több mag meg hasonló, de máshol elhelyezkedõ adatok párhuzamos feldolgozásához ideális. HT a több szálat az éppen kihasználatlan végrehajtóegységekre tudja szétosztani, viszont ha azok ugyanazt csinálják, akkor ez nehezen megy, de mivel egy proci egy cache-bõl dolgozik, az a jó neki ha az adatok átfedik egymás vagy legalábbis közel vannak egymáshoz. Több fizikai processzornál meg épp ellenkezõje az igaz, ha ugyanazon az adaton molyolnak, akkor egymás cache-ét teszik tönkre és sokat kell nekik szinkronizálni, viszont ugyanazt a fajta utasítást tisztán n-szer olyan gyorsan tudják lefuttatni.
Nem tudom, honnan veszed ezt, mindenesetre a most bemutatott XBOX 360-ban lévõ 3 PPC magos prociban is van egy hasonló megoldás, így összesen 6 szálat tud futtatni. Na most, a PPC sosem a hosszú pipeline-ról volt híres.
Már bemutatta, sõt azt hiszem, legalábbis OEM-eknek piacra is donta az Intel a dual-core-os prociját. (Nagyon sietett vele, csak összadobta, az Athlon X2 testhosszal elõzi kisebb fogyasztással...)
Tudtommal a HTT-hez hasonló technológiát csak nagyon hosszú pipeline-nal rendelkezõ CPU-ba lehet belerakni-P3 meg még szerencsére nem ilyen volt. Sztem el lehet felejteni a HTT-t, s hamarosan a DualCore-t kiáltja ki az Intel, mint utódot...
azert amennyire lehet (vagy annal egy kicsit kevesbe :)) windows megoldja a feladatot. Nem olyan nagy problema ez.Kesobb pedig vagy kulon egyseg oldja meg hardveresen, vagy tovabbfejlesztik a szoftvert. Egyebkent az hogy az intel vegul a rovidebb futoszalag fele veszi az iranyt az mutatja hogy a technologia amit kifejlesztettek hosszu tavon nem valtotta be a hozzafuzott remenyeket. Kivancsi vagyok a tovabbiakra.
Windóz és az erõforrások maximális kiaknázása .. mint a mesében , ugye?
A HT dupla magnál is nagyon hasznos, ott se kell pazarolni a teljesítményt, ki kell használni az utolsó cseppig, erre jó a HT. Optimalizálni meg nemtom mit kéne, ez nem egy szoftveres dolog. Ha több szálon fut a programod, akár rendes, akár virtuális (HT ) dupla mag van, azt automatikusan kihasználja (Win lekezeli).
"Hozzátehette volna: "Az egész csak a vevõk hülyítését szolgálta."
És mekkora sikerrel. Már várom azokat az elsõ intel fikázókat, akik két linkkel arréb még azt magyarázták, milyen jó is ez, meg h 10 GHZ ig meg sem áll az intel.
"A Pentium 4 igen hosszú futószalagot rejt magában. Ez mindenképpen szükséges volt a magas órajel eléréséhez, de a fogyasztás és a teljesítmény terén nem igazán tette hatékonnyá a processzort."
Hozzátehette volna: "Az egész csak a vevõk hülyítését szolgálta."
Magának a HT-nek önmagában van értelme, mert KI LEHET használni. Tehát eldobni mégsem kéne... ez meg az én privát véleményem :)
Szerintem a Hyper-Threadinget itt és most el is felejthetnék. Hiszen pont a két magos prociknál veszti értelmét az egész. Ha mindkettõre optimalizálni akarják a progikat (dupla mag+HT), hááát... A szoftgyártókon múlik, de sztem túl sok meló és túl kevés megtérülés. Én rárepülnék az SMP-re és csupán arra koncentrálnék. Ez az én privát véleményem.