Ha rajtam múlna, én elhagynám az L1 és L3 cache-t, ha egyszer már megvannak az adatok egy példányban, minek többször tárolni õket.
Inkább lenne egy egyesített memória cache elérés vezérlõ, és az L1 cache helyett meg árnyék regisztereket használnék.
Leredukálnám a magméretet 1-2 millió tranzisztorra, mindent leegyszerûsítenék, és aszinkron áramköröket használnék fel, amivel ilyen kis magméret mellett, elérhetõ lenne a több tíz Ghz-vel egyenértékû sebesség.
Több magot tennék a prociba, mondjuk kb 64 et, egy multiplikált memória vezérlõn lógnának.
Üresjáratban nem igen fogyasztana, kb tized wattokat.
Meghajtva sem fogyasztanának 10-20 watnál többet, mivel aszinkron áramkörök vannak benne. Lehet hogy egy ciklus alatt valamivel kevesebb mûveletet hajtana végre mint a több millió tranzisztoros óriások, de az egyszerû felépítés és kis magméret miatt idõegység alatt több teljes ciklust válik lehetõvé. Akár tízszer-húszszor több mûvelet is.
Volt ez az IBM kísérlet a GeSi csipekkel, ahol egy egyszerû mûvelet végrehajtó áramkört felhúztak 300 Ghz-re , közel nulla fok közelében meg 500 ra.
Amíg ilyen brutális nagyok és komplexek a magok, az órajelet nem igen lehet majd emelni. Lásd Geforce GTX 200 as chipekknél a nagy magméret milyen hátrányos a sebességre, és a fogyasztásra. Üresjáratban mindent le kell kapcsolni a teljes áramkörben hogy kibírható legyen a fogyasztása, és ne keljen kéményt szerelni a pc-re.