"Igen ítrtad, de én nem erre válaszoltam, hanem erre : "Itt nem az SPE-krõl van szó, hanem a PPE-rõl (CPU mag), abban van a (2?) VMX egység." "
Ott kezdõdött, hogy azt írtad, nem-blokkos adattal nem tud kezdeni semmit az SPE. Pedig tud, csak ilyenkor be kell segítenie a PPE-nek is. Az egy másik dolog, hogy a PPE-ben is van VMX, így õ is tud számolni szépen.
"Egyébként meg az az alap mûködés, hogy a PPE irányít, de ez nem old meg minden problémát."
Hogy érted, hogy a PPE irányít? Az SPE akkor fér hozzá a külsõ ramhoz, amikor akar.
"Viszont nagyobb a késleltetése, hosszabb a futószalagja, sokkal gyengébb az optimalizáló logika, stb. (bõvebben a cikkben). Összességében egy több generációval régebbi proci magasabb órajelen."
Párhuzamosítással közömbösíthetõ a hosszabb késleltetés. Megfelelõ (fordítóra bízható) optimizáció révén az in-order végrehajtás és a gyengébb branch-prediction is, többé-kevésbé, feladattól függõen.
PC-n egy játékban a prociidõ többsége ugyancsak a megjelenítésre megy el, ide sorolva a fizikát is (vertex-adatok kezelése, atpumpálása a GPU-nak, stb.). Itt ezen feladatok jó részét átvállalhatják az SPE-k. Meg a lassan bejövõ fejlettebb AI-t is. Így nagyon sok prociidõ felszabadul!
Gondolj arra, hogy jópár éve, egy 7MHz-es, maiaknál jóval egyszerûbb procival rendelkezõ Amiga500-ra is eléggé összetett játékok is születtek. Az egyszerûbb grafika miatt kevesebb volt az ilyen irányú feladat is... Ehhez képest egy SMT-s 3,2GHz-es proci fergetegesen gyors.
"A memóri másolásokat meg hiába veszi át egy SPE, attól nem lesz gyorsabb (sõt, talán még lassabb is). És nem is a másolásról van szó, hanem kód futtatásról."
Miért lenne lassabb egy SPE másolásban? De nem az a lényeg, hogy esetleg lassabb-e vagy sem, hanem hogy nem a központi PPE-nek kell ezzel sem foglalkoznia.
Egy programban sokszor kellhet memóriát másolni.
"Kevesebb, mint egy közepes x86."
Egy tread esetén talán, 2 (x360-nál 6) esetén már nem biztos.
"Hiába, ha az SPE-dolgozna velük. Át kell tölteni az SPE-re a megfelelõ blokkot, és ez lassú. Ha egy-egy blokkból csak kis részletekre van szükség, akkor a másolgatásra elmegy a teljesítmény nagy része. Ha meg a PPE-re túl komplex vezérlõ logikát raksz, akkor annak a teljesítménye folyik el."
Tévedsz, a PPE apránként is küldhet adatot az SPE-knek, mivel hozzáfér a ramjukhoz.