"azzal, hogy be kell férni a 256KB cache-be kóddal és adattal együtt. Ugyanis a RAM-ot nem lehet direkben elérni."
Én úgy tudom, el lehet (csak az persze jóval lassabb). Ez a belsõ, SPE-nként 256KB local/embedded RAM cache-nek fogható fel (de nem az, mivel ez is címezhetõ, a sima cache-sel ellentétben). Azt is meg lehet tenni, hogy csak a kód van itt, plusz némi átmeneti adattárolás (erre bõven elég 256KB/SPE), és az adatok a fõramból jönnek, és oda mennek. Pl. stream-feldolgozás nagyon jól mehet így.
Egyébként, ha benchmark még nem is volt, párszor már demonstrálták (real-time), és abból elég jól látszott a brutális teljesítmény.