SG.hu Fórum - Opteron és Cell chipek az IBM új szuperszámítógépében

Cikk olvasása: Opteron és Cell chipek az IBM új szuperszámítógépében

Fórum / Hardware hírek fóruma

Ebbe a fórumba csak regisztrált és bejelentkezett fórumozók írhatnak!

Bejelentkezés

fade2black 2007. nov. 14. 11:03 | válasz | #67
á hagyd ezt már többedszerre játszák le, sõt DEZ már máshol is sokat beszlgetett erröl.

Én egyébként a summa 512ram miatt kritizálom a PS3at, sok sikert igy az 1080ps játékok texturáihoz.

btw ezt érdemes megnézni nem gyenge és azért sejteti 512ram is sokmindenre elég: http://hardwired.hu/dl.php?id=5293&dl=1

Válasz 'item' üzenetére (#66)
item 2006. dec. 18. 19:48 | válasz | #66
Srácok srácok, nyugalom! Egy jót derültem ezeken a kommenteken! Féreértés ne essék nem a szakmai hozzáértéseteken,hanem az egymás gyõzködésén! Amúgy szeretem olvasni a kommentjeiteket mert az átlag usernél több infóval rendelkeztek a hasonló témákban. PEACE...
dez 2006. szept. 27. 16:31 | válasz | #65
Nono, éppenhogy többmindenrõl beszéltünk, közte a nagyrészt in-orderességrõl, illetve az egyszerûbb branch-predictionrõl, de másról is, és elhangzott olyan is, hogy erõs butítás, stb. Egyszóval nem lehetett tudni, hogy a szóban forgó részben mikre gondolsz, 2 dologra vagy több dologra.

Válasz 'BiroAndras' üzenetére (#64)
BiroAndras 2006. szept. 26. 10:50 | válasz | #64
Elég alaposan átbeszéltük már a témát, szóval pontosan tudhattad, hogy mire gondolok. Ne csak olyat idézz, amikor épp nem részleteztem.

Válasz 'dez' üzenetére (#63)
dez 2006. szept. 25. 16:20 | válasz | #63
Nézd, ezt írtad: "Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)." Korábban meg ilyesmiket írtál, hogy 'nagyon erõsen lebutított mag, amiben nincs branch prediction (pedig van), stb.'. Nem pedig azt, hogy fejlett, de nagyrészt in-order mag, egyszerûsített branch predictionnel. Ebbõl nem derül ki, hágy kidobott fícsörre gondolsz, de arra mutat, jópárra. Szóval te magyarázkodsz. Én meg magyarázok. Nem ugyanaz. :)

Válasz 'BiroAndras' üzenetére (#62)
BiroAndras 2006. szept. 25. 11:56 | válasz | #62
Hiába magyarázkodsz, soha nem volt szó annál a kettõnél több "kidobott fícsörrõl".

Válasz 'dez' üzenetére (#61)
dez 2006. szept. 22. 16:04 | válasz | #61
Nem is tudom, ki hamisítja itt is a történelmet... Nem, nem 2 fícsörrõl volt szó, csak utólag "pontosítottad" erre, amikor már leírtam, mit is tud.
Eredetileg ezt írtad:
"Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)."
Ez alapvetõen úgy értelmezhetõ, hogy annyi minden ki van dobva, hogy ami marad, az egy 386-szerû proci.

Válasz 'BiroAndras' üzenetére (#60)
BiroAndras 2006. szept. 22. 15:17 | válasz | #60
Volt szó 2 (azaz kettõ) darab fícsörrõl. Mint azt magad is kifejtetted többször is, ennél jóval több dologban különbözik egy mai proci egy 386-ostól. Ezért is írtam, hogy "ebbõl a szempontból". Szóval, ez azt jelenti, hogy a két említett fícsör kidobása (egyszerûsítése) nagy visszalépés a régebbi procik irányába. Nem is konkrétan az az érdekes, hogy 386 vagy P1 vagy mi, hanem hogy jelentõs visszalépés. És a másik fontos dolog, hogy nincs szó a többi fícsörrõl, csak errõl a kettõrõl.

Válasz 'dez' üzenetére (#59)
dez 2006. szept. 21. 18:47 | válasz | #59
Kértelek, hogy magyarázd meg, mirõl is beszéltél. Ezt válaszoltad:

"pontosan a "kidobott fícsörök"-rõl (pontosabban az out-of-order és a branch prediction logika drasztikus egyszerûsítésérõl) van szó"

És korábban meg ezt írtad:

"Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)."

Hogy máshogy lehet ezt értelmezni, mint hogy a '"kidobott fícsörök" (pontosabban az out-of-order és a branch prediction logika drasztikus egyszerûsítése)' miatt szerinted "egy 386-oshoz hasonlít tudásban".

Az az óvodás, ahogy ki akarod magyarázni magad egy egyértelmû tévedésbõl. Ahelyett, hogy egyszerûen elismernéd, hogy oké, tévedtél.

Válasz 'BiroAndras' üzenetére (#58)
BiroAndras 2006. szept. 21. 17:04 | válasz | #58
"Minden másról??? Nem, csak arról, hogy az out-of-order és a branch prediction logika drasztikus egyszerûsíte miatt még messze nem lesz tudásban egy 386-oshoz hasonló a PPE."

Még mindíg nem fogod fel, hogy nem ezt mondtam? Komolyan, kezd ez az egész két óvodás vitájára hasonlítani.

"Ez nem igaz, csak próbálod magad kimenteni."

???

Válasz 'dez' üzenetére (#56)
dez 2006. szept. 20. 20:27 | válasz | #57
Hogy ne lenne?

Válasz 'BiroAndras' üzenetére (#55)
dez 2006. szept. 20. 20:27 | válasz | #56
Minden másról??? Nem, csak arról, hogy az out-of-order és a branch prediction logika drasztikus egyszerûsíte miatt még messze nem lesz tudásban egy 386-oshoz hasonló a PPE.

"Nem derült ki a környezetébõl sem, ezért reagáltam egyáltalán. És egyébként azt sem mondtam, hogy tudásban azonos lenne a PPE egy 386-tal, tehát még így is hülyeséget mondtál. Ha egy picikét pontosabban idéztél volna (vagy legalább elfogadtad volna a pontosításomat), akkor nem vitatkoznák itt már megint teljesen értelmetlenül."

Ez nem igaz, csak próbálod magad kimenteni.

Válasz 'BiroAndras' üzenetére (#54)
BiroAndras 2006. szept. 20. 16:42 | válasz | #55
Látod, megint beszélsz mindenfélérõl, aminek semmi köze a témához.

Válasz 'dez' üzenetére (#52)
BiroAndras 2006. szept. 20. 16:40 | válasz | #54
"Na, akkor azt magyarázd még meg, hogy milyen szempontból is, ha nem bizonyos kidobott fícsörök szempontjából?"

De pontosan a "kidobott fícsörök"-rõl (pontosabban az out-of-order és a branch prediction logika drasztikus egyszerûsítésérõl) van szó. Te beszélsz itten össze-vissza minden másról.

"Kár, hogy abból a mondatból nem derül ki, hogy teljesítményre vagy tudásra vonatkozik-e. A környezetébõl viszont igen..."

Nem derült ki a környezetébõl sem, ezért reagáltam egyáltalán. És egyébként azt sem mondtam, hogy tudásban azonos lenne a PPE egy 386-tal, tehát még így is hülyeséget mondtál. Ha egy picikét pontosabban idéztél volna (vagy legalább elfogadtad volna a pontosításomat), akkor nem vitatkoznák itt már megint teljesen értelmetlenül.

Válasz 'dez' üzenetére (#51)
dez 2006. szept. 19. 19:34 | válasz | #53
Mármint a fejlett SIMD egyég és L2 a magon[/-ban] már a PPE-ben van.
Ja, a 386-ban még L1 cache sem volt. Meg pipeline-ok sem... :D

Válasz 'dez' üzenetére (#52)
dez 2006. szept. 19. 19:10 | válasz | #52
Miért fájna? Csak egyszerûen nem igaz, ennyi az egész.

Tehát, kimondhatjuk, hogy olyan dolgok, mint superscalar architektúra, FPU + fejlett SIMD egyéség + L2 a magon, számodra a "tökéletesen lényegtelen" kategória? Hm.

És még az sem igaz, hogy P1, mivel tudtommal a P1-ben nincs a VMX-nek megfelelõ fejlett SIMD egyég (~SSE3, csak sokkal több regiszterrel), és mintha 64 bites sem lenne... (Az SMT-t félretéve, hiszen az azon kívüli dolgokról beszélünk.)

Válasz 'BiroAndras' üzenetére (#50)
dez 2006. szept. 19. 18:29 | válasz | #51
"Ismétlem : Ebbõl a szempontból, nem úgy általában."

-- Na, akkor azt magyarázd még meg, hogy milyen szempontból is, ha nem bizonyos kidobott fícsörök szempontjából?

"Valahol igen, de én konkrétan az idézett mondatra reagáltam."

-- Á, ez lenne az "ellentámadás"...!? :D Kár, hogy abból a mondatból nem derül ki, hogy teljesítményre vagy tudásra vonatkozik-e. A környezetébõl viszont igen...

Válasz 'BiroAndras' üzenetére (#49)
BiroAndras 2006. szept. 19. 08:38 | válasz | #50
Ja, és ha neked a 386 fáj, felõlem lehet pentium 1 is. Tökéletesen lényegtelen.

Válasz 'BiroAndras' üzenetére (#49)
BiroAndras 2006. szept. 19. 08:37 | válasz | #49
"Az is baromság, kedves BiroAndras, hogy a Cell PPE-je egy 386-oshoz hasonlít tudásban."

Ismétlem : Ebbõl a szempontból, nem úgy általában.

De Már kb. 10x annyit foglalkoztunk ezzel, mint amennyit az egész ér.

"És ha kicsit visszanézel, láthatod, hogy én nem teljesítményrõl beszéltem. Lévén a "386, csak nagy órajelen" is szerepelt valahol"

Valahol igen, de én konkrétan az idézett mondatra reagáltam.

Válasz 'dez' üzenetére (#48)
dez 2006. szept. 16. 16:36 | válasz | #48
Az is baromság, kedves BiroAndras, hogy a Cell PPE-je egy 386-oshoz hasonlít tudásban. Lásd alább. Esetleg azt mondhatnád, hogy bizonyos dolgokban a Pentium 1-hez, bizonyos dolgokban meg a Pentium Prohoz hasonlít. Viszont egy sor dologban jóval fejlettebb azoknál is.

És ha kicsit visszanézel, láthatod, hogy én nem teljesítményrõl beszéltem. Lévén a "386, csak nagy órajelen" is szerepelt valahol, aminek még lehetne nagy a teljesítménye, ha elég magas az az órajel.

Válasz 'BiroAndras' üzenetére (#47)
BiroAndras 2006. szept. 15. 18:42 | válasz | #47
"Ezt, hogy "Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)." hogy lehet másképp érteni, mint úgy, hogy a kidobott fícsörök miatt egy 386-oshoz hasonlít tudásban?"

1. Tudásban, nem teljesítményben.
2. Ebbõl a szempontból, nem úgy általában.

Te ezzel szemben ezt írtad : Egy szóval sem mondtam, hogy pl. egy csúcs-Opteronnal is felveszi a versenyt a Cell PPE-je általános mûveletvégzésben. De egy 386-nál, amit te mondtál, sokkal de sokkal jobb.

Itt egyértelmûen teljesítményrõl beszélsz, ami baromság.

Válasz 'dez' üzenetére (#26)
dez 2006. szept. 14. 21:31 | válasz | #46
Igen, az elõbb én is rátaláltam, csak máshol. Hát, azért kicsit húzós magánembereknek.

Így azért kérdéses, hogy tényleg lesz-e full Linux (hivatalosan) a PS3-hoz, hisz úgy "túl olcsón" juthat bárki bármire használható szép (mat.szám.) teljesítményhez. De majd meglátjuk.

Persze, a hatásfok csökken, de 2db-nál még nem, de pár darabnál sem feltétlenül.

16 ezer procira szétosztani valamit már nagyon nem könnyû, de ha sikerül, akkor elég jó teljesítmény jöhet ki. Ne felejtsük el, hogy itt nem 1-1 core-os procikról van szó, aminek az idejébõl szépen elvesz az adatok fogadása/küldése. Hanem az adatok lokális ramba töltésérõl a PPE gondolsokhat. Onnan/oda meg kvázi megszakítás nélkül dolgozhatnak az SPE-k.

Válasz 'shabba' üzenetére (#44)
shabba 2006. szept. 14. 20:47 | válasz | #45
Pontosabban ezek a speckói:

Cell Accelerator Board (CAB

Válasz 'shabba' üzenetére (#44)
shabba 2006. szept. 14. 20:42 | válasz | #44
Egy korábbi cikkbõl kiindulva, szerintem egy 2 celles lap kerülhet annyiba.

Cell processzoros gyorsítókártyát jelentett be a Mercury Computer Systems

Ezen a bõvítõ kártyán egyetlen cell van, hasonló sw körítés, hasonló 512mb xdr ram, viszont kisebb 2.4Ghz-es frekin és 8000 dolcsit kérnek érte. Szóval nem lennék meglepve ha az IBM 19 rongyot kérne egyetlen blade kártyáért. A 7 kártyás keret pedig jóval száz ezer fölött lenne.

A hatásfok azért biztos csökken a cpu-k számával. Az SG cikkben említett 16 ezer cell és 16 ezer opteron procis konfig esetén biztos hogy ez még fokozottabban igaz. A 32 ezer proci aggregált peak teljesítményét biztos hogy nem fogja hozni egy komlex rendszer.

Válasz 'dez' üzenetére (#43)
dez 2006. szept. 14. 20:08 | válasz | #43
Végre, már ideje volt. De most mi kerül majd 19e dollárba? Egy 2 Celles lap? Vagy egy blade keret?

Egyébként nem tudom, miért ír ilyeneket a HWSW (állandóan), hogy "Ezek összesített elméleti csúcsteljesítménye meghaladja a 3,2 teraflopsot (64 biten 300 gigaflopsot), igaz ezt teljes egészében szinte képtelenség a valóságban kiaknázni, egy ilyen klaszter estetében 50 százalékos hatékonyság már jónak számít.", amikor az IBM már bizonyította, hogy jópár feladatban, köztük a Linpackban normális keretek közötti optimizációval 75-92%-os kihasználás érhetõ el.

Válasz 'shabba' üzenetére (#42)
shabba 2006. szept. 14. 18:31 | válasz | #42
Cell-alapú blade szervereket hoz forgalomba az IBM
dez 2006. szept. 14. 15:42 | válasz | #41
Ezt, hogy "Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)." hogy lehet másképp érteni, mint úgy, hogy a kidobott fícsörök miatt egy 386-oshoz hasonlít tudásban?

Válasz 'BiroAndras' üzenetére (#38)
dez 2006. szept. 14. 15:40 | válasz | #40
"De full in-order. A branch prediction az amit nem vettek ki teljesen."

Mondom, hogy nem full in-order. Lásd:
"In order to improve performance from its in-order pipeline, the PPE utilizes delayed-execution pipelines and allows limited out-of-order execution of load instructions. This allows the PPE to get some of the advantages of out-of-order execution without any significant increase in complexity."

Válasz 'BiroAndras' üzenetére (#37)
BiroAndras 2006. szept. 14. 13:22 | válasz | #39
"Nos, mint már szó volt róla (de a túl sok szó között nagyon elvész a lényeg), az in-orderrõl annyi mondható el negatívumként, hogy némileg kevésbé hatékony, mint az out-of-order (hozzátéve, hogy a PPE sem full in-order), és jóval nagyobb hangsúly helyezõdik a fordító optimizálási képességére (a run-time "optimizálás" nagy része ide van áthelyezve, azzal sok-sok tranyót megspórolva) - utóbbi jósága sokban ellensúlyozza az elsõt."

Nos, mint már szó volt róla, nem ilyen egyszerû a helyzet, de nincs kedvem megint újrakezdeni az egészet.

Válasz 'dez' üzenetére (#36)
BiroAndras 2006. szept. 14. 13:20 | válasz | #38
"Ezt írtad (arra reagálva, hogy a PPE HW SMT-s):
"Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi. Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban).""

Tehát azt írtam, hogy EBBÕL A SZEMPONTBÓL. És egyébként se értem, hogy minek lovagolsz ezen, már rég megbeszéltük.

"Tehát, bár HW SMT-s, de egyéb szempontból egy 386-hoz hasonlít tudásban."

Olvasási, vagy szövegértési problémáid vannak. Az "egyéb szempontból", és az "ebbõl a szempontból" közt óriási különbség van.

Válasz 'dez' üzenetére (#34)
BiroAndras 2006. szept. 14. 13:13 | válasz | #37
"De, pontosan azt mondtad, hogy a PPE egy magas órajelû 386-nak felel meg, miért tagadod?"

Azért tagadom mert nem ezt írtam. Egyébként is az elõbb órajelrõl nem beszéltél, idézem : de egy 386-nál, amit te mondtál, sokkal de sokkal jobb.

"És nem visszalépés, csak más filozófia."

Visszalépés abból a szempontból, hogy régebben már volt ilyen megoldás. Ez önmagában nem jelenti szükségképp azt hogy rosszabb. A Core2 is visszalépés a P4-hez képest a P3 felé, de sikerült csak a rossz megoldásoktól megszabadulni.
Viszont a cell-nél a visszalépés azt is jelenti, hogy az azóta felhalmozott tapasztalatot ki lehet dobni a technológiával együtt, és újra kell tanulni sokmindent. Ennyi hátránya biztosan van, és az még nem biztos, hogy a régi-új filozófia beválik.

"Mint már írtam neked, pl. az Itanium is in-orderes."

Mint már írtam neked, az Itanium nem sikerült túl jól, így nem lehet ebbõl következtetést levonni.

"Ráadásul a PPE nem full in-order, hanem egyfajta hibrid!"

De full in-order. A branch prediction az amit nem vettek ki teljesen.

Válasz 'dez' üzenetére (#30)
dez 2006. szept. 13. 21:55 | válasz | #36
És ugye az a "többi kidobott fícsör" is az in-order rendszer miatt vált fölöslegessé.

Nos, mint már szó volt róla (de a túl sok szó között nagyon elvész a lényeg), az in-orderrõl annyi mondható el negatívumként, hogy némileg kevésbé hatékony, mint az out-of-order (hozzátéve, hogy a PPE sem full in-order), és jóval nagyobb hangsúly helyezõdik a fordító optimizálási képességére (a run-time "optimizálás" nagy része ide van áthelyezve, azzal sok-sok tranyót megspórolva) - utóbbi jósága sokban ellensúlyozza az elsõt.

Válasz 'dez' üzenetére (#34)
dez 2006. szept. 13. 21:46 | válasz | #35
Ja, és nem beszélve ilyenekrõl, hogy a 386-osnak csak csak pár (16-32 bites), meghatározott utasításokban használható regisztere volt, miközben a PPE-nek (mint a többi PowerPC procinak) 32db (itt 64 bites) általánosan használható, 128db SIMD regisztere, és jópár speciális regisztere van (és mindebbõl 2 set, szálanként egy); nagy rugalmasságot adó címzésmódok és kondiciónális végrehajtás; és még jópár ilyesmi.

Te vagy messze nem értesz ehhez annyira, mint megjátszod, vagy néha nagyon nem vagy magadnál.

(Most majd jön a magyarázat, hogy te nem is úgy gondoltad... )

Válasz 'dez' üzenetére (#34)
dez 2006. szept. 13. 21:28 | válasz | #34
Ezt írtad (arra reagálva, hogy a PPE HW SMT-s):
"Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi. Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)."

Tehát, bár HW SMT-s, de egyéb szempontból egy 386-hoz hasonlít tudásban. Nos, ez egy jó nagy butaság. Kezdve ott, hogy a 386 még csak superscalar sem volt. Továbbá csak 32 bites volt, nem 64, nem volt benne FPU, MMU, SIMD egység, L2 cache, nuku branch prediction, stb. stb. Kicsit túlértékelted azt, hogy nem out-of-orderes, hanem in-order, némi out-of-order beütéssel...

Válasz 'BiroAndras' üzenetére (#28)
dez 2006. szept. 13. 21:10 | válasz | #33
A Cell valóban, de a PPE (Power Processing Element, norm. CPU mag) miért lenne az?

Válasz '[Jakuza]' üzenetére (#32)
[Jakuza] 2006. szept. 13. 20:00 | válasz | #32
Olvasni tud e meltosagosuram ?
Bizony bonyolultabb programozas szempontjabol.

Válasz 'dez' üzenetére (#31)
dez 2006. szept. 13. 19:12 | válasz | #31
Túl bonyolult a PPE? :P

Válasz '[Jakuza]' üzenetére (#29)
dez 2006. szept. 13. 19:11 | válasz | #30
De, pontosan azt mondtad, hogy a PPE egy magas órajelû 386-nak felel meg, miért tagadod?

És nem visszalépés, csak más filozófia. Mint már írtam neked, pl. az Itanium is in-orderes. Ráadásul a PPE nem full in-order, hanem egyfajta hibrid! De ezt is írtam már. (De mindek...?)

Válasz 'BiroAndras' üzenetére (#28)
[Jakuza] 2006. szept. 13. 11:02 | válasz | #29
Pontosan.
Raadasul programozhatosag (tul bonyolult) szempontjabol is visszalepes.

Válasz 'BiroAndras' üzenetére (#28)
BiroAndras 2006. szept. 13. 10:58 | válasz | #28
"De egy 386-nál, amit te mondtál, sokkal de sokkal jobb."

Értsd már meg, hogy nem errõl beszéltem. Arról van csak szó, hogy a PPE az utasítás végrehajtás menete szempontjából nagy visszalépés a mai procikhoz képest.

Válasz 'dez' üzenetére (#26)
dez 2006. szept. 11. 20:31 | válasz | #27
PPE-hez: persze nem árt, ha a sûrûbben hozzáfért adatok nagy része befér a cache-ekbe, vagy szekvenciálisan olvashatók a ramból, mert itt jóval nagyobb a latency, mint A64-nél. (De a sávszélesség is.)

Válasz 'dez' üzenetére (#26)
dez 2006. szept. 11. 19:22 | válasz | #26
Egy szóval sem mondtam, hogy pl. egy csúcs-Opteronnal is felveszi a versenyt a Cell PPE-je általános mûveletvégzésben. De egy 386-nál, amit te mondtál, sokkal de sokkal jobb. Kb. egy 2GHz-es (3000+) A64-nek felel meg szerintem. (Egy jó fordító használatával.)

(Az SPE-k sem csak a SIMD kódot ismerik, hanem a teljes PPC utasításkészletet, csak nem az órajelüknek megfelelõ teljesítménnyel hajtják azokat végre.)

Nem tudom, egy szuperszámítógépnél mekkora szükség van általános mûveletvégzésre a matematikai számítások mellett, de ha van, akkor azért arra jól jönnek az Opteronok. Továbbá, szuperszámítógéprõl van szó, nagyon sok adat áramlik a procik között, ennek szervezésére és lebonyolítására is jól jön a segítség.

Válasz 'BiroAndras' üzenetére (#25)
BiroAndras 2006. szept. 11. 16:07 | válasz | #25
"Nem érted? Na ne mondd, tudod te azt"

Az irónia nevû izérõl hallottál már?
De vehetjük úgy is, hogy a kérdés neked szól. Te bizonygatod, hogy olyan jó a cell önmagában is. Akkor magyarázd meg, hogy az IBM miért bízik kevésbbé a saját procijában.

Válasz 'dez' üzenetére (#23)
dez 2006. szept. 07. 16:14 | válasz | #24
Nos ha 16 GFLOPS-t veszünk a Double Precision LinPack esetén (PPE-t is beleszámolva, mert miért hagynák parlagon a bõvített VMX-ét), 16 x 16000 = 256000. És ehhez jön a 16000 Opteron teljesítménye. Így az elsõ hely simán megvan.

A HWSW elméleti maximum FLOPS adata hibás [jellemzõ, a PS3-at és a Cellt mindig lehúzzák], pontosabban egy korai, 2.4GHz-es példányra vonatkozik. 3.2GHz-en kb. 240 GFLOPS. (25,6 [SPE] x 8 + 35 [PPE])

Nos azért talán nem teljesen mellékes, hogy 16000 Cell S.P. maximuma 3840000 GFLOPS, azaz 3.84 PFLOPS. Jól fog az még jönni sok számításnál. :P

Válasz 'shabba' üzenetére (#22)
dez 2006. szept. 07. 15:32 | válasz | #23
Nem érted? Na ne mondd, tudod te azt, hiszen állandóan kántálod: a Cell általános feladatvégrehajtási (nem mat. számítási) teljesítménye kisebb, mint egy Opteroné, és a nagy mennyiséû adathoz (ami nem fér a fél mega L2-be) való totál random hozzáférés nagy latency-vel jár (bár a sávszél elég jó, szekvenciális olvasás esetén nincs probléma).

Hozzáteszem, a Cellbõl késõbb lesz több változat is, több PPE-vel és/vagy több SPE-vel.

Válasz 'BiroAndras' üzenetére (#21)
shabba 2006. szept. 07. 13:27 | válasz | #22
Hmm ebben a cikkben az szerepel 16 ezer opteron és 16 ezer cell lesz a rendszerben.

http://www.hwsw.hu/hirek/32021/ibm_szuperszamitogep_roadrunner_los_alamos_national_laboratory_cell_playstation_3.html

Itt pedig a LinPack benchmark top 500-as tesztjérõl azt írja a FAQ, hogy nem a single és double precision a lényeg, hisz egyes rendszereknél a singe precision már alapban 64 bitet jelent. A benchmark tesztnek 64 bit vagy a fölötti pontosságon kell lefutnia, 32 bites pontosságról nem igazán írnak.

http://netlib2.cs.utk.edu/utk/people/JackDongarra/faq-linpack.html

Márpedig az 1 pflops-ot ez a rendszer csak 32 bites pontosság mellett fogja teljesíteni, kiindulva az IBM által prezentált LinPack mérési adatokból. Az meg mérés szempontjából nem lesz hiteles eredmény a top500-ba. 64 bit pontosság mellett nem hisz hogy le fogja gyûrni BlueGene-t.
BiroAndras 2006. szept. 07. 10:03 | válasz | #21
Csak azt nem értem, hogy ha ilyen durva a cell, akkor minek csomagolnak mellé 1-1 opteront.

Válasz 'dez' üzenetére (#20)
dez 2006. szept. 07. 04:00 | válasz | #20
Ja tényleg, valamit el is felejtettem: az alábbi számok csak az SPE-ken alapultak, pedig a PPE (normal CPU mag bõvített VMX egységgel) még több FLOPS-ot tud, mint 1db SPE, szal azt is hozzá lehetne adni.
BCS CORPS 2006. szept. 06. 21:47 | válasz | #19
cell meg core2 meg hasonló inteles procik ég és föld a kettõ

IBM-Toshiba-Sony nem véletlen hogy ezek + még néhány cég anno villámgyorsan összefogtak hogy végre legyen már egy sokkal értelmesebb felépítésü proci is
dez 2006. szept. 06. 21:35 | válasz | #18
Nos DP-ben 1kx1k 9.46, 2kx2k 11.05, viszont SP-ben 4kx4k 155.5.

Még hozzátenném, ezek 3.2GHz-en értendõk, 90nm-en. Egy rosszul szellõzõ PS3-ben is mennek ennyit, valamivel jobb hûtéssel simán mennek 4GHz-en (~5GHz volt a csúcs). Jövõre meg már 65nm-en készülnek...

Válasz 'mir' üzenetére (#10)
dez 2006. szept. 06. 21:22 | válasz | #17
Bizony, fontos szempont a Cell brutális sávszéle is, hogy a parallel architektúrák támogatása. Itt visszájára fordul a kritikusok vesszõparipája: "a FLOPS nem minden". :)

Apropó FLOPS, sajnos sokan nem fogják fel, hogy az S is hozzá tartozik a mértékegységhez, az jelzi az idõegységet. Mint a km/h-nál a h.

Még egy megjegyzés a cikkhez: a Cell eleve nem csak a PS3-ba készült, már a kezdetekkor terveztek más alkalmazást is.

Válasz 'BlackRose' üzenetére (#14)
dez 2006. szept. 06. 21:16 | válasz | #16
Várjuk meg, mikor épít 4-core Core2-esekbõl szuperszámítógépet az Intel. (És mennyiért.)

Válasz 'shabba' üzenetére (#13)
dez 2006. szept. 06. 21:14 | válasz | #15
Magam is ezt az oldalt akartam linkelni.

Megjegyzések:
Double prec. Linpack 1kx1k-ben tényleg csak ~30%-kal gyorsabb, mint egy 3.6-os P4. (2kx2k-ban valamivel gyorsabb. Single-ben meg 6x-os, de ezt írtad.)

De ne csak ezt az egy adatot nézzük! Alább több alkalmazásnál akár 1db SPE is 2x gyorsabb, mint egy P4... 8 SPE így 16x-os teljesítményt hoz.

Bizonyos dolgokban meg 35x gyorsabb.

Kb. 2 éve írtam egyszer az IBM-nek (valamilyen Celles infó emailre), és rákérdeztem erre a Single Precision dologra, tehát hogy ez elég-e tudományos célokra. Azt válaszolták, hogy a legtöbb esetben elegendõ.

Válasz 'shabba' üzenetére (#12)
BlackRose 2006. szept. 06. 17:58 | válasz | #14
Nem gondolod, hogy az USA nukleáris program elõnyben részesedik a játékkonzolokhoz képest, meg ehhez adnám még hogy a Cell-t az IBM gyártja, tehát nem kell neki várnia, hogy legyen elég a piacon. A hír szerint egyébként 2007-ben lesz kész. Akkor az 1 PFLOPS azt hiszem elég komoly lesz (szerintem a jelenlegi BlueGene marad még egy évig a csúcs és az még csak picit több mint 1/4 PFLOPS. Különben sem lehet egy ilyen rendszert a Core 2-hez hasonlítani, igaz, hogy a Core 2 fogyasztása már nem olyan magas mint a NetBurst volt, de azért még mindég több mint a Cell, ugyanakkor a Core 2 nem lett Massive Paralell architektúrákra tervezve, míg a Cell igen és sokkal könyebben (olvasd) olcsóbban skálázható. Szóval senkinek sem fog az eszébe jutni, hogy Core 2-bõl szuperszámítógépet építsen (persze lesz esetleg cluster rendzser belõlle, de az nem fogja meg sem közelíteni a PFLOPS-ot).

Aztán a cikkben ki kellene javítani a dolgokat, mert "petaflopos" nem létezik, nem flop hanem FLOPS, vagyis FLoating point Operations Per Second.

Válasz 'shabba' üzenetére (#13)
shabba 2006. szept. 06. 16:40 | válasz | #13
Ahogy az oldalon is szerepel a SP max peak teljesítménye a cellnek 230 GFLOPS, DP-nél ez már lecsökken 21 GFLOPS-ra. És mire szélesebb körben hozzáférhetõ lesz a Cell, úgy hogy elég számú fölös kapacitás legyen a konzolos eladásokon felül egy ilyen project beindításához az még odébb lesz. Aztán utána még meg is kell építeni a rendszert. Mire elkészül szerintem lesz vagy 2010 addigra meg már az akkori eredményekhez mérten kell nézni ezt az 1 PFLOPS-ot.

Mire jõvõre elérhetõk lesznek jobban a Cell procik, addigra már az Intel is 4 coreos Core2-eseket fog gyártani. Double precisionban azok már biztos le fogják nyomni a Cell-t és SP-ben is egyre jobban a nyakára fog mászni, bár ott soká lesz még mire utolérik.

Válasz 'shabba' üzenetére (#12)
shabba 2006. szept. 06. 16:29 | válasz | #12
Ha beírod gugliba a linpack+cell mágikus szavakat akkor elsõnek egy ibm-es tesztet dob ki:

http://www-128.ibm.com/developerworks/power/library/pa-cellperf/

Kár hogy az összehasonlításban az Intelnek csak a régi NetBurst architectúrájú procija szerepel, kíváncsi lennék egy Core2-es WoodCresttel mit produkálna.

Mindesetre ebbõl is látszik hogy single precisionban a cell nagyon jó közel 6x gyorsabb mint P4-es. Viszont double precision esetén az elõny minimálisra csökken úgy ~35%-os. Ezt szerintem az új Core2-es architechtúra lazán behozta, fõleg azonos 3.2Ghz-es sebességen összevetve.

Persze szépek ezek a single precision eredmények a Cell-tõl de tudományos számításoknál nem hiszem hogy ilyennel szoktak számolni, ott azért a standard a double precision floating point.

Válasz 'mir' üzenetére (#9)
mir 2006. szept. 06. 15:40 | válasz | #11
s/terrabyte/terraflops/
mir 2006. szept. 06. 15:40 | válasz | #10
ahhoz az ,,osszedobnak'' reszhez csak annyit szolnek hozza, hogy a top100-ba bekerulo szuperszamitogepek messze a legdragabb reszegysege az interconnect, majd ezutan kovetkeznek a szerverek amikbe beleteszik a ramot, ezutan jon a RAM, majd _legvegul_ a processzorok. Raadasul az a 2 terrabyte messze all a valosagtol, ha akar a LinPack futtatasa eseten elerik a 100 GFLOPSt mar baromi joljarnak, de szerintem joval lentebb lesz az.

Válasz 'roliika' üzenetére (#7)
mir 2006. szept. 06. 15:37 | válasz | #9
raadasul a 256 is mindossze az elmeleti korlat, a gyakorlat ennel joval rosszabb lesz, raadasul nem minden muveletre jon ossze a 256 sem (es mint mondtad nem is single precession :) )

Válasz 'shabba' üzenetére (#5)
roliika 2006. szept. 06. 14:33 | válasz | #8
Izé...27, de jó lenne ha ezen a fórumon is lehetne a hsz-eket módosítani...
roliika 2006. szept. 06. 14:32 | válasz | #7
És így "csak" kicsit több mint 500 proci kéne. 25 db 20 procis szervert összedobnak és kész is...na jó, 22.
roliika 2006. szept. 06. 14:27 | válasz | #6
Én úgy tudom,hogy 2Tera Flop körül van, nem?

Válasz 'BiroAndras' üzenetére (#4)
shabba 2006. szept. 06. 14:27 | válasz | #5
Szerintem egy szuperszámítógépen nem single precisionnal fognak számolni, fõleg nem nukleáris kutatásoknál. Akkor pedig a 256 gflops máris nem annyi.

Válasz 'BiroAndras' üzenetére (#4)
BiroAndras 2006. szept. 06. 13:54 | válasz | #4
A cell nyers teljesítménye 256gflpos. Ez alapján kb. 4000 darab kell. Ennél sokszor több procis gépek is vannak.

Válasz 'turul16' üzenetére (#3)
turul16 2006. szept. 06. 13:33 | válasz | #3
Csak a lényeg hiányzik a hirböl :)
Hány Cell ill. Opteron kell az 1 petaFlops hoz ?
Cat 2006. szept. 06. 11:24 | válasz | #2
floating point operations per second, azaz a másodpercenkénti lebegõpontos számítások mennyisége.

Egy csúcs pc kb. 10 GFLOPS

Válasz 'Duncan Idaho' üzenetére (#1)
Duncan Idaho 2006. szept. 06. 11:12 | válasz | #1
Valaki segítene mit is jelent a "flop" ?
Köszi