Gondolhatod, hogy nem én találtam ki, hanem tesztekbõl jött ki. Sajnos nem tettem el az oldalt, ahol pont ezt hasonlították össze, de keresem. 1-2x már belinkeltem. Az volt látható, hogy egy szál futtatása mellett egyforma teljesítményt adó P4-et és K8-at véve, 2 szál futtatása lellett kikapcsolt HT-val sokkal jobban lelassult a P4, mint a K8, utána bekapcsolt HT-val újra egálba kerültek.
"Nézz utánna pontosan mit csinál a HT."
Hát, attól tartok, ez most nem érdekel eléggé ahhoz. :)
"Egyébként valóban gyorsabb a K8, azonban ha több szálat kezdessz futtatni, vagy olyan programot használsz ami direkt HT-re optimalizált, bizony messze lehagyja a K8-at a P4HT. (Pl. WMV enkóder)."
Nonono. A fent említett tesztbõl nem ez jött le, legalábbis általános esetben. Az egy dolog, hogy kimondottan HT-ra optimizált kód gyorsabb lesz. Mint ahogy egyszálas esetben is gyorsabbak a kimondottan P4-re optimizált programok. (Ami néha azt jelenti, hogy akkor sem használja AMD-n a SSE2-t, 3-at, ha jelen van.)
"Ja és nekem Athlon64-em van, mielõtt le Intelfanoznál."
Nem szokásom.
""szted a processzor tervezõk legóznak?" ha azt veszed alapul, hogy a 387-> MMX -> SSE -> SSE2 ma már ugyanaz az egység, akkor azt kell mondjam hogy igen."
(Ezt nem én írtam, célszerû lenne külön válaszolni.)
"Többek közt két ALU van, a CPU hoz képest 2x órajelen."
Nem túl sokat ér a 2 ALU 1db INT, FPU, SSE, MMU, stb. egységgel.
"az SPE egy programozható vektor CPU ami azonban igen ostoba."
Az igaz, hogy egy általános procihoz képest jóval lassabban tudna futtatni egy általános kódot (mivel mindene megvan, ami ehhez kell, csak nem erre van kihegyezve), de tudna, tehát azért nem annyira ostoba. (A PPE-tõl teljesen függetlenül is tudnak programokat futtatni - mellesleg 1-1 saját nagyon gyors belsõ kis ramból is, de a main ramhoz is hozzáférnek.)
"Amire én gondoltam az az, hogy a két HT szál simán el tudna futni 2 SSE egységgel (mivel teljesen más pipeline egységeket használnak) így nagyon jó teljesítményt lehetne velük elérni (a CPU egy-egy szála végezné el az SSEk vezérlését)."
2 SSE nyilván jobb, mint 1, de egy önálló vektor-egység számítási szempontból sokkal hatékonyabb megoldás, mint általános célú magokat feltartani az SSE-zéssel.
Mindenesetre úgy tûnik, az Intel is inkább a több, de "egyszálú" magra megy rá, egyelõre.
Tényleg, össze lehetne hasonlítani, hogy 1db SPE hogy aránylik egy SSE-s P4 maghoz (számítási teljesítményben).
"Nagyon valószínû hogy az Intel nem az én "brilliáns" ötletemet fogja alapul venni a jövõben, de szerintem rá lesznek kényszerítve valami hasonlóra."
A távlati tervekben egy Cellhez hasonló felépítésû architektúra szerepel. Azaz az általános magok mellé õk is vektor-magokat terveznek majd. (Úgy 6-8 év múlva.)