"Meg hardveres videogyorsitas sincs, a drm kezelo mag meg masolgatja az adatokat a framebuffer-bol a videoramba. Ez kb. egy pci-os lfb-s videokartyaval felszerelt PIII-as szintjere butitja a ps3-at."
Nem egészen, mivel a PCI 133 MB/s, itt viszont ~25 GB/s játszik.
Plusz attól, hogy a grafika nem túl gyors, kisebb programokat teljesen jól el lehet futtatni.
"(mivel az spe-kre meg nincsennek programok)"
Nemsokára lesz mindenféle.
"Ez sokmindenre jo, de otthoni hasznalatra csak annyira mint egy wii a hozza valo operaval."
Ez enyhe túlzás.
"Jo lenne ha reszletezned. A gf8800-as mukodese hasonlo csak tobb, de lassabb mag van benne."
Sajnos ez egy akkora tévedés, hogy nem is tudom, hol kezdjem magyarázni, miért nem így van. Láthatóan mindkettõt nagyon-nagyon felületesen ismered.
"Es a kulso memoriacimzes tamogatasa miatt meg c++-os kod is elfut rajta"
Na persze, ahogy azt pistike elképzeli. Beszélj egy CUDA programozóval.
"mig a cell spe-kben erre nincs eleg kozvetlenul cimezheto memoria."
256KB/SPE épp elég kisebb programokhoz+adatokhoz. (Ezt mikrokontrolleresként tudnod kellene.) A többit meg lehet DMA-zni viszonylag nagy sávszéllel.
"A cell spe-k alapvetoen gyors skalar magok"
Nem skalar.
"memoriakezelo egyseg nelkul, par kilobyte-os cimterrel."
Az a pár az 256KB.
"A gyenge pontjuk a cimezheto memoria kis merete, ami miatt hasznalhatosagban csak a dsp chipekkel tudnak versenyezni, egy gpgpu-val mar nem."
Ez is tévedés. Mit gondolsz, az IBM miért Cellekbõl (plusz kiegészítésnek Opteronokból) építi a köv. világelsõ szuperszámítógépét, a Roadrunnert, nem G80-akból vagy R600-asokból?
"A dma-s ram kezeles olyan mint amikor egy videokartya a rendszer rambol probal texturazni. Mukodik, de nagyon lassu."
Nem olyan nagyon lassú (hacsak nem quadwordonként akarnak olvasni), mivel itt egy ~25 GB/s-es elérésrõl beszélünk, nem a töredékérõl.
"Ezzel szemben a 256Kb nagyon keves."
256 kilobit tényleg nagyon kevés - 256KB azért nem annyira.
"Ennel joval tobb belso memoria jut egy gf8800-as regiszter terere is, es mindkettonek 1 orajel az eleresi ideje."
Nem tudom, mirõl beszélsz, a G80-ban éppenhogy túlságosan is kevés a belsõ buffer, ez hátrányt jelent számára az R600-zal szemben. Pedig még abban sincs éppenséggel 2MB (8*256KB).
"A gf8800-as egyszeruen egy jobban hasznalhato architektura"
Attól függ, mire akarják használni õket. Ezt kellene legalább megértened.
"es jobb szoftvertamogatassal rendelkezik mint a ps3 mivel a microsoft (dx10) es az nvidia (gpgpu) is ott all mogotte."
A Cell mögött meg az IBM, a Sony, a Toshiba, számos más cég, egyetemek, egyes katonai szervezetek, és az opensource közösség egy része is.
"es ajandek tudomanyos celu fejlesztoi keszletet is ad hozza az nvidia)"
Az IBM is sokmindent ad a Cellhez, ingyen.
"A forditoprogramok nem boldogulnak veluk, mert nincs ilyen architekturara optimalizalt fordito."
Dehogynincs. Még a GCC-hez is van SPE támogatás, az IBM készít két saját C-fordítót is (egy egyszerûbbet és egy szuperszámítógépre optimizáltat), és egy-két cég készít tudományos felhasználást igencsak segítõ fejlesztõi környezezet, amivel komoly programozói tudás nélkül is ki lehet használni a chipet, pl. egy matematikusnak vagy egy fizikusnak.
"Ha valaki assembly-ben all neki, akkor boldogul, bar a scatter-gather memoriamodelles algoritmusok itt nem hasznalhatoak, mivel csak block io van a dma egysegben. Az utobbi idokben a gpu-k es az x86-osok miatt az osszes haszalhato nem vektoros algoritmus random memoria i/o-ra alapoz, mert az osszes mai gep ilyen. (kiveve a dsp-ket es regi vektoros szuperszamitogepeket, amik mara kihaltak) Ha nincs ra algoritmus, nincs ra rendes fordito, akkor baromi nehez barmit is kihozni."
Csakhogy ez nem egészen így van.
"A sony elfelejtett egy akkora szovtverkonyvtarat adni a cell-hez ajandekba mint amilyen a microsoft directx."
DirectX? Most mirõl beszélünk, játékokról, vagy tudományos+egyéb felhasználásról? Ha utóbbiról, nézd meg az IBM kínálatát, ha játékokról, akkor meg lásd a Sony fejlesztõ-csomagját.
"Minden programozo talalhatja fel a sajat algoritmusait, mint regen a c64-es assembly-s idokben. Oke hogy gyors lesz, de tobb evvel tovabb tart megirni. Megeri?"
1. csak bizonyos esetekben van erre szükség, és 2. adott esetben megéri.
"Nem. Tobbnyire DSP-ket es mikrovezerloket szoktam programozni, tehat ismerem a problemakat."
Valóban? Hát itt azért nem egészen egyszerû DSP-krõl és mikrokontrollerekrõl van szó.
Meg nem tudom, hogy programozol, de érdekes, hogy ehhez képest mennyire lebecsülöd azt a 256KB-ot.
Én egyébként ugyanezzel foglalkozom többnyire, kb. 10 éve, elõtte (és néha mellette) C és 68k asm játszott be nem amatõr szinten.
"Sajnos a cell meg az intel itaniumoknal is agyhalottabb architektura. Azok is gyors cpu-k lennenek, csak nincs hozzajuk szoftver es uzleti logikahoz teljesen alkalmatlanok. A cell pont ilyen."
Ez így nem igaz. Egész más okból nem sikeres az Itanium (amellett persze, hogy tényleg nincs rá szoftver).
Mellesleg a G80 sem alkalmas üzleti logikára.
"A jatekok meg jo ideje rengeteg uzleti logikahoz hasonlo feladatot vegeznek, azaz sok felteteles elagaz van a programokban, meg a v2-nel jobb shader-ekben is."
Sokat, de nem annyit, amennyivel ne boldogulna el a PPE (vagy akár egy SPE, ha megfelelõen kicsi az adatmennyiség).
"(pl. tudasbazis alapu mesterseges intelligencia, ray tracing alapu arnyekolas, dinamikusan szamolt texturak vagy eppen fizika, stb.)"
Ray-tracing? Na nézzük: egy eredetileg GF7800-asra írt ray-tracert átírtak Cellre - kapásból 2x gyorsabban futott rajta, optimizálva meg 5x gyorsabban... (Dokumentálta a program készítõje, keresd meg, ha érdekel.) Pedig FLOPS alapján a másiknak kellett volna gyorsabbnak lennie...
"Ha az adatok es a program befernek 256Kb-ba, akkor a cell spe gyors. E folott olyan sebessegeket hoz, mint amikor egy rendszer elkezd swap-elni."
Jaj, ne beszélj már ilyen ökörségeket.
"Csak itt nem diszkre hanem rendszer ram-ba swap-el."
Aha, mindössze 1000x-es a különbség.
"Egyik sem tul gyors, es mivel az spe-ben nincs hardveres virtualis memoria kezeles"
De, tudomásom szerint van!
"Egyebkent en adatokat es algoritmusokat irok, a valasz pedig az hogy baromsag... Dez, szerintem erdemes lenne annyit tanulnod, hogy legalabb ervelni tudj."
LOL, te téves adatokat írsz, mégpedig túl sokat.
"Ma mar kaphatoak 8 magos rendszerek (2x4 mag)."
Aha, csak épp túl drága átlagfelhasználásra, és igen lassan és nagy késleltetéssel éri el az egyik proci a másikat és a memóriát. teszt
"Tehat kb. 1 generaciora vagyunk attol, hogy egy pc nyers eroben is lenyomja cell-t."
LOL, egy 8 procis szerver most is lenyomhatja, legalábbis elvileg. Csak ugye mennyiért is...?
Plusz 1-2 év múlva a Cellbõl is lesz gyorsabb, nagyobb, jobb.
"Viszont mig a pc-n az osszes eddig megirt algoritmus gyorsul, addig cell eseten arra az egy egyedulallo hardverre kell optimalizalni mindent."
Bla-bla. A többmagosítástól nem gyorsulnak az egymagos kódok, mégpedig abból van a legtöbb.
Ha a többszálas alkalmazásokat nézzük, a Cell esetén több PPE+SPE esetén lineárisabb a gyorsulás üteme, és meredekebb is.
"Mig pc-n, xbox360-on csak ujra kell forditani a tobbszalu kodot es maris gyorsabb lesz, addig ps3-on minden ujra kell irni."
Ez így nem igaz. Sokszor csak némileg kell átírni v. kiegészíteni, és Cellen jóval gyorsabb még így is, fele SPE kihasználtsággal (fejlesztõ írta).
"Meg az nvidia mernokei is megoldottak, hogy a c++-os kod modositas nelkul fusson egy gf8800-ason"
Ezt honnan szeded?
"mig a cell spe-kbe egyszeruen nem lehet beletenni annyi kodot es adatot mert nincs hova. Abban a pillanatban hogy elkezd swap-elni, lassu lesz."
Ha okosan van megoldva, akkor nem különösebben. (Persze bizonyos esetekben igen.) Fõleg, hogy dual-bufferesen párhuzamosan mehet tovább a számolás a pakolás alatt!
"Kb. annyira mint amikor egy x86-os ps2-ot probal emulalni."
Ez aztán az értelmes összehasonlítás...
"A masik gond, hogy az spe-k osztoznak a cpu-val a memoria buszon"
Úgysem kell az PPE-nek 25 GB/s.
"ami csak egy sima ddr3-as dual channel megoldasnak felel meg."
Nem éppen. Az XDR memóriavezérlõ és memóriák sokkal intelligensebben kezelik a hozzáféréseket, és a késleltetés is alacsonyabb. Plusz ezt a sávszélt hozó DDR3 még kurva drága.
"Ha keves a belso gyors ram, lassu a memoriabusz es sokan versenyeznek erte (idealis esetben minden 6-odik orajelre ferhet csak hozza egy spe a fo ramhoz, rossz esetben csak minden 10-edikre), akkor hiaba gyors az spe, nincs eleg adata amit feldolgozhatna."
1. Közben is dolgozhat.
2. Egymásnak is továbbadhatják az adatokat további feldolgozásra, ~200 GB/s sávszéllel.
"Meg jo, hogy az nvidia gf8800-as sorozat mar altalanos cpu-kat kapott, amik akar a linux-ot is futtathatjak, bar memoriavedelem nelkul."
Ez egy hülyeség.
" "Olyan szempontból, hogy számítási teljesítménye megeggyezik a konzollal.Azt meg nem tudom, hogy pc-n milyen hw egyezik meg a ps3 tudásával. Valahogy csak össze tudják õket mérni, ha már pc-n írják rá a játékokat is." "
Ezt nem én írtam, légyszi ne keverd a válaszokat.
"A pc-n irt jatekok csak a fo magot hasznaljak ki, es a gf7900-es videokartyat. Ez egy dx9-es kartyaju PIII-asnak felel meg."
Na ja, egy egyszerû újrafordításnál.
"A cell-t kihasznalo jatekokat assembly-ben vagy ansi c-ben lehet csak megirni"
Ezt honnan szedted? Lásd fentebb, amit a Cellhez való fordítókról írtam.
"es olyan programozok kellenek ra mint akik annak idejen c64-es meg amiga-s demokat irtak. Mara nem sok ilyen koder maradt"
Jelen! :)
"es a jatekkeszito cegeknek meg nem eri meg rendesen megfizetni oket."
A multiplatformosoknak, akik egyszerû újrafordításdiban gondolkodnak...
"(pl. engem sem fizetnek meg elegge a jelenlegi cegemnel)"
Amiket összeírsz itt, ezen valahogy nem csodálkozom.