PlayStation 3 bemutató az E3-on
Jelentkezz be a hozzászóláshoz.
-- Ha nem mondod... 😛 Nos már írtam: azért lesz lassabb, mert a legolcsóbb X2-nek sokkal alacsonyabb az órajele, mint a nála olcsóbb simának. És az X2 nem is annyira húzható, mint a sima.
"Akkor is kell valamibõl mindezt fizetni. Ráadásul így kimaradnak az elsõ körbõl, és még hátrányba is kerülhetnek a konkurenciához képest. Meg lehet csinálni, de kell hozzá egy nagy kiadó, aki hajlandó fizetni, egy neves fejlesztõcég, akiben a kiadó megbízik, és kell egy ütõs játékcím, ami garantálja az eladásokat. És még ha minden együtt van, akkor is garantált, hogy 2008 elõtt nem lesz kész."
-- Ez nem olyan biztos. Több cég már a legelsõ dokumentációk megjelenésekor alaposan rászállt a témára, mára már sokat tudnak, sõt készülnek a játékok.
Nem is mondtam ilyet. Megfelelõen optimalizált kóddal valamennyire ellensúlyozni lehet, de nem teljesen.
Ami nagyobb gáz, hogy debug kódnál nincs optimalizáció, így az lassabb lesz, és nehezíti a hibakeresést.
"Az out-of-order rendszer mûködésébõl adódóan sokkal kifinomultabb és összetettebb branch predictiont igényel. Az in-order meg nem."
Ebben nem vagyok olyan biztos. A branch prediction inkább a hosszú futószalag, és a memória késleltetés ellensúlyozására való.
"Ugyancsak több pipeline lépcsõfokot igényel az out-of-order rendszer, hiszen végrehajtás elõtt át kell rendezni a sorrendet. Ezzel szemben az in-order rendszerhez rövid pileline kell."
A magas órajelhez is hoszabb futószalag kell, márpedig a cell magas órajelen fog futni. Konkrétumot nem találtam, de az olvasottak alapján én viszonylag hosszúra tippelnék.
"Az out-of-order rendszer és a hozzá tartozó bonyolult branch prediction (és a hosszabb pipeline egyéb elemei) sok tranzisztort igényel. Így nem csoda, hogy egy in-order rendszerû mag sokkal kisebb lehet."
Természetesen. Pont az volt a cell-ben az ötlet, hogy az adott mennyiségû tranzisztorbõl bonyolult logika és nagy cache helyett sok egyszerû magot csináltak. Kétségtelen elõnyei vannak ennek a megoldásnak, és valószínûleg ez a filozófia a jövõ, de vannak hátrányai, és a cell még elég kezdetleges megvalósítás. ráadásul teljesen új programozási stílus kell hozzá, a mi jelenleg szintén hátrány.
"A Pentium(1) is in-order volt, és az Itanium is az."
Az Itanium nem is lett sikeres. Egyébként az Itanium egy órajel alatt 6 utasítást hajt végre, a cell PPE-je csak kettõt (szálanként 1-et).
"Tehát, attól, hogy a PPE egy kicsi in-order mag, még lehet nagy teljesítményû, fõleg hogy 3.2GHz-en megy."
Névleges teljesítményben lehet jó, de a kihasználása nehezebb.
"Adódik a kérdés, miért álltak át x86-on out-of-order rendszerre?"
Mert rengeteg tranzisztorjuk volt, amivel kvázi nem tudtak mit kezdeni. A megoldás az volt, hogy realtime kód optimalizálást, és automatikus párhuzamosítást építettek a procikba.
"Nehezebb igazán optimális kódot generáló compilert készíteni hozzá."
Pont hogy könnyebb, mert sokmindent megcsinál a proci.
"Minden proci-típushoz/-generációhoz külön meg kell írni az ide vonatkozó részt."
Pont hogy nem. Éppen ellenkezõleg, jobban tûtik a compilerek bénázását.
"Akkor bemutatom neked Mike Actont, aki a High Moon Studios egyik vezetõ programozója, akinek egy kissé más a véleménye"
Elolvastam. Gyakorlatilag ugyanazt mondja mint én, minden szempontból.
Ha érted, akkor miért teszel úgy, mintha nem értenéd? Miért nem arra válaszolsz, amit írok?
"A GFLOPS-t reklámozták, és megfelelõen optimális esetben ki is lehet hozni. Ez tény."
A gyakorlatban messze nem lesznek optimális feltételek. Legalábbis játékoknál. Mert hogy a cell-t egyébként multimádiás chip-nek is tervezték különféle készülékekbe (erre tökéletesen alkalmas).
"Továbbá az általános teljesítménye sem olyan rossz, mint hiszed."
Hogy pontosan mennyire jó vagy rosz, az majd a gyakorlatban kiderül. Ami biztos, hogy a 256gflops-nak csak kis töredéke ez a teljesítmény.
"Mert egy felesleges és értelmetlen mondatodat visszautasítottam?"
Egyáltalán nem felesleges, és egyáltalán nem értelmetlen. Másrészt "visszautasítani" lehet értelmes, civilizált módon is. Sõt, akár lehet rá válaszolni is akár. Igazából egy érvet visszautasítani eleve illetlenség, mégha szerinted hülyeség is. Sõt, azt a látszatot kelti, mintha nem tudnál rá mit mondani, így eleve vesztes pozícióba kerülsz.
""Nem hülyék, csak olcsó konzol chip-et kellet építeniük."
Ez jó nagy tévedés."
Megint jó alaposan indokoltad a válaszod. Áruld el nekem, hogy miért is nem olcsó? Az ár/teljesítmény aránya elméletben legalábbis messze jobb bármilyen más procinál.
A gyártási költség nagyjából a tranzisztorszámtól, és a csíkszélességtõl függ, ami alapján kb. egy modern x86 procival van egy szinten. A tervezési költséget nem tudom, de a tervezett példányszámhoz képest nem lehet sok.
Igaz, hogy más konzolokhoz képest a PS3 drága, de ebben az árban benne van egy BR lejátszó, egy erõs CPU, és egy jó GPU.
Ha a cell-t nem konzolba tervezték volna, hanem szuperszámítógépekbe, akkor minimum 3x ennyi tranzisztorból állna, és nem lennének kihagyva belõle fontos fícsörök.
"FLOPS-ban nagyon is igaz, mást nem állított senki. Amúgy sávszélességben is eléggé odaver."
Igen, csakhogy ez mindenkinek úgy jön le, hogy akkor ennyi a valós teljesítménye is. Régebben még te is errõl beszéltél. Valójában meg egy proci teljesítménye sokminden mástól is függ, amiben a cell messze nem olyan jó.
"Mondja egy ellenérdekelt, PC-s játékfejlesztõ cég munkatársa..."
Te teljesen nem vagy normális??? Nem mondtam volna, hogy fejlesztünk konzolra is? De egyébként is veled ellentétben én nem érzelmi alapon szoktam ítélkezni.
"Hol van egy 4-magos x86 FLOPS-ban még a Celltõl"
Nagyonis közel.
"Nem beszélve a szûkös sávszélességrõl?"
Nem lesz szûkös, mert nem egy memória vezérlõ lesz, hanem több.
"A Physix meg elbújhat a Cell mellett."
Mint már mondtam én inkább a GPU-kben bízom ,azok meg elgéé jók ilyen téren.
De a Physix is állítólag csak a PCI busz minimális sávszélessége miatt lassú. A következõ PCI-E-s verzió nyílván sokkal erõsebb lesz.
"Egy belevaló PS3-as játék sokszorosan visszahozza. Befektetés - nyereség."
Csak az a gond, hogy ugyanazt a nyereséget kevesebb munkával is lehet hozni. Másrészt a befektetéshez nem elég a jövõbeli nyereség, hanem itt és most kell pénz.
Emellett te szoktad mindíg vásolni a külöbnözõ cégeket, hogy visszatartják a fejlesztéseket, és csak fokozatosan adják ki, mindíg újra pénzt kérve érte.
Most miért nem jut ez eszedbe? Ha most csinálnak egy olyan játékot, ami a PS3 minden képességéte teljesen kihasználja, akkor mit fognak eladni a következõ 5-10 évben?
"Egyelõre 1db fejlesztõ. Mindjárt én is írok egyet, kicsit más a véleménye."
Nem egyrõl van szó. Nem figyelsz? Tele van a net a különbözõ fejlesztõk panaszaival. És itt a cégnél is gyakorlatilag mindenki egyetért ezzel.
"Ez akkor van, ha kissé idióta a fõnök, és nem képes felmérni a végeredmény nagyságát, és az ahhoz szükséges befektetést."
Pontosan arról van szó, hogy képes felmérni, hogy a nagy befektetés hiába térül meg esetleg, ha a cég közben csõdbe megy. És nem lehet a kiadónak azt mondani, hogy halassza el a kiadást fél-egy évvel, mert újraírjuk az egész játékot. Nem fogja megtenni, és nem is teheti, mert akkor õ megy csõdbe.
"Nyilván más is számít. Pl. hogy mekkora bevételre lehet számítani egy ütõs játékkal... A PS3 egy kicsit más pálya, mint a PC, ne felejtsd el."
Nagy befektetéssel nagy nyereséghez lehet jutni. De ha kis befektetéssel is elérhetõ ugyanez, akkor szerinted mit választanak?
És ha a nagy fejlesztést el lehet adni 3-4 lépcsõben, akkor összesen jóval több a bevétel.
""Mondj valami olyat, amit nem lehet megcsinálni egy X2-vel és egy extra GPU-val."
-- Nos ez is max. csak fele teljesítmény GFLOPS-ban, ráadásul kötöttebb és nehézkesebb is. És a másik, amit szintén mindig elfelejtesz: PS3-nál default adott, PC-nél egyeseknek van kategória."
Látod, megint nem válaszolál rendesen.
Egybként is, a CPU-GPU páros együtt rugalmasabb, mint a cell. A nyers teljesítmény meg önmagában nem minden.
A választás így néz ki:
- Van a cell, ami nagyon erõs, de soká tart kiismerni.
- Van az x86, amit jól ismerek, de csak pár év múlva éri utól a cell-t.
Nagyjából ugyanazt lehet elérni mindkettõvel, csak az x86-on kevesebb erõfeszítés kell hozzá. Tehát a cell mellet nem szól komoly érv. A leginkább még az szól mellette, hogy a PS3 marketing kampányát meg lehet lovagolni. De ez nem a cell érdeme, ugyanez lenne, ha a PS3-ban egy X2 és egy Physx-szerûség lenne.
"Relatíve szabadon felhasználható FLOPS-ban?"
Megint magaddal vitázol. A múltkor pont arról beszéltél, hogy milyen nagy teljesítménye van a programozható shader-eknek.
"Nagyot fogsz majd nézni, ha meglátod, mi az igazi "fizika"..."
Láttam. A mellettem ülõ srác csinálja.
"Nem, te nem csak azt mondtad, hanem azt, hogy alig valamire lehet azt használni."
Nem ezt mondtam.
"Ez nem így van, kevesed a dolgokat."
Szerintem nem én.
"Nem arról beszéltem, hogy milyen nehéz vagy könnyû"
Én beszéltem róla, és te vitatkoztál velem.
""De azzal már nincs szívás, így simán használhatják."
-- Csak úgy, mint PS3-on."
PS3-ra mindent meg kell írni. Lehet, hogy fizikai motor van gyárilag, de ott az messze nem elég.
"De itt nem fognak itt megállni, mert egy GPU nem-grafikai felhasználásánál még mindig sokkal könnyebben használható a Cell, és ott áll a kihasználandó erõ mindenki gépében."
A következõ generációs GPU-k sokkal könnyebben programozhatók lesznek, és a teljesítményük folyamatosan növekedni fog. Nem kell sok, hogy utólérjék és lekörözzék a cell-t. És mint már sokszor mondtam, a cell teljesítményét meg kell tanulni kihasználni, míg PC-n a GPU csak kisegítõ szerepet tölt be, sokkal kevesebb kódot kell rá optimalizálni.
"Azok nem is fognak pénzt keresni a PS3-mal... Mások meg fognak."
Azok fognak, akik folyamatosan fejlesztenek, és nem vágnak bele túl nagy feladatokba.
Ugyebar az is mar kiderult, hogy a kezdeti 6 millios kezdeti kiadas lecsokkent Kutaragi bejelenteben 2 milliora.
Azutan megjelent a hir miszerint meg lehet annyi sem lesz belole, mert nem tudnak a BDhez eleg mennyisegu keklezer dioda.
Sot azota mar az is kiderult, hogy a Sony partnerei meg sem kezdtek a tomegtermelest, mikozben 2 honapnal alig van tobb a rajt kezdeteig.
Ha belegondolunk, hogy raadasul a kisebb PS3 legalabb a 30%-a lesz a legyartott mennyisegnek, alig lesz teljeserteku peldany a piacon a rajtnal.
"HA" egyaltalan lesz rajtnal barmi is.
Azt mar tudjuk, hogy huzonev nem nagyon lesz ,mert a jatekok sem igazan fognak elkeszulni a rajtig.
Ha igy folytatodik, mire igazan elkezd terjedni a PS3 mar a 4-8magos PC-k lesznek elterjedve. 😛
S meg raadasul nem csak a PC okoz fejtorest a PS3nak, hanem az Xbox360 is.
Araban is olcsobb es elerhetosegeben is konnyebben hozzaferheto.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Nem is errõl volt szó.
Nem teljesen nyílvánvaló, hogy mirõl beszélek? Értelem szerûen nem arról az esetrõl, amit meg lehet oldani. Hogy te közben mirõl beszéltél, arra már rég nem emlékszem, de nem is érdekes, mert én arról az esetról bezsélek (szeritnem elsõre is ezt írtam), amikor nem lehet elõre tudni, hogy milyen adatra lesz szükség. Tipikusan ilyen probléma a gráfban keresés (pl. A* algoritmus).
"Dehogy nehéz megérteni."
Akkor miért válaszolsz állandóan egy teljesen más állításra, mint amit én írtam?
"Csak arról van szó, hogy egy bizonyos szám fölött /játékelem ez önmagában nem tesz hozzá már a játékmenethez. Csak mégrészletesebbek lesznek."
Látod, már megint teljesen másról beszélsz.
"Rosszul gondolod"
Érdekes, a tervezõk is azt mondták, hogy kompromisszumokat kötöttek.
"Egyszer talán, de pár évig még nem"
Dehogynem. Egy kétmagos x86 proci általános feladatoknál megeszi reggelire a cell-t. Számítási feladatoknál megy egy jobb GPU elég (jobb-e vagy rosszabb, mitn a cell, az majd a gyakorlatban kiderül).
"a GF6800-as programozható shadereivel elérhetõ számítási teljesítmény 63 GFLOPS."
"Ráadásul egy GPU sokkal kötöttebb, és nehézkesebben használható, mint a Cell."
A múltkor még te gyõzködtél, hogy nem sokkal nehezebb programozni, mint egy x86-ot. De mint pl. fizikára nem is kell programozni, mert készen meg lehet venni a motort.
"Tehát feljesztési idõben is problémás."
Nem, mert még ha saját kódot írnak, akkor is csak a fizikát kell átírni, nem az egész játékot.
"A Cell sem olcsó holmi."
Akkor meg pláne nem éri meg.
"Ne hülyéskedj már, miért ne lehetne azt mondani, hogy néhány régi játék játékmenet szempontból volt olyan komplex, mint egy mai átlagos ilyen-olyan típusú játék?"
Mint már mondtam, lehet ezt mondani, de nem ez a lényeg.
Másrészt azt is mondtam, hogy nem a játékmenetrõl beszélek, mert manapság nem az a fõ cél a fejlesztésnél. De ha arról beszélünk, ahhoz nem kell teljesítmény, így nem kell cell sem.
Nekem az a bajom, hogy a cell multimédiás teljesítményén kívül mindenben nagyon korlátozott erõforrásokkal rendelkezik (az ár és hõtermelés miatt). Pl. HD felbontásnál csak a textúrák megeszik a memória nagy részét.
És mivel a csúcsszuper grafikával reklámozták a PS3-at, azt muszály produkálni is. Szóval attól félek, hogy egyszerûen nem marad erõforrás magára a játékra.
Meg lehet nézni pl. a GTA-t, aminél a játékélményre koncentráltak. Bár jól sikerült, azért látszik rajta, hogy milyen gondokkal küszködtek a fejlesztõk. Például a többi autót csak akkor kezeli, ha látod õket, és nincsennek túl messze. És a San Andreasban a kocsikat vezetõ AI-knak olyan kevés erõforrás jut, hogy állandóan egymásnak mennek. És PS2-n állítólag sokkal kisebb a látótávolság is, mint PC-n. Igaz, a PS2 már öreg, de hasonló korlátok a PS3-nál is vannak. A memóriája pl. már most kicsi egy PC-hez képest.
"PS3-ra sok egyedi fejlesztés lesz, ami szinte a 0-ról írnak meg."
Az nem lesz hamar készen.
"De ha x360-on is lesz valami, az sem baj, oda is párhuzamosítani kell sokmindent."
A mostani játékokon látszik, hogy portoltak, messze nem használják ki a lehetõségeket.
Egyébként megérkezett az x360 devkit, szóval nemsokára lesznek gyakorlati tapasztalatok.
"PS3-on OpenGL alapú lesz, így a driver sem lehet nagyon más, mint a szokásos. De akárhogy is lesz, a poligonokkal lesz meló."
Akkor is kérdés, hogy a szinkronizáció többlet költségét ellensúlyozza-e a párhuzamosítás.
Miért lenne lassabb? Az X2 az két teljes értékû x86 mag egyben. Minden egymagos procinak van kétmagos változata (persze jóval drágább). Persze csak ha AMD-rõl beszélünk, de szerintem ma aki játsazni akar nem Intel-t vesz. A Core 2 meg már lesz olyan jó (vagy jobb), mint az AMD procik.
"Azok engedhetik meg maguknak, akiknek a fõnökeik komoly PS3-as projektekben göondolkodnak, és tisztában vannak ennek velejáróival."
Akkor is kell valamibõl mindezt fizetni. Ráadásul így kimaradnak az elsõ körbõl, és még hátrányba is kerülhetnek a konkurenciához képest. Meg lehet csinálni, de kell hozzá egy nagy kiadó, aki hajlandó fizetni, egy neves fejlesztõcég, akiben a kiadó megbízik, és kell egy ütõs játékcím, ami garantálja az eladásokat. És még ha minden együtt van, akkor is garantált, hogy 2008 elõtt nem lesz kész. Addigra pedig PC-n már terjedni fognak a két magot és valamilyen fizikai gyorsítót használó játékok.
Mi ez a mondat ?
"Cellre optimizált kóddal sokkal nagyobb számítási teljesítmény érhetõ el vele"
Hat ez megint a kozrohely.
A programozasarol volt szo. Nem arrol, hogy optimalizalassal, egy program gyorsabban futtathato e vagy sem.Raadasul meg dilettantizmusra vall, mert minden programozo tudja, hogy minden geppel jobb sebesseg erheto el optimalizalas utan.
De ettol nem konnyebb a programozo elete.
Le is irta a lenyegi fejlesztes a lenyeg, nem a halandzsa amiben le van irva, hogy az elmeleti sebesseg ennyi meg annyi Gflops.
Mint ahogy sosem fogjak elerni ezeket a szamokat a PS3-nal a gatlo tenyezok miatt.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Tehát Carmack vagy hülyeséget beszélt (elõfordult már vele), vagy úgy kell értelmezni, ahogy a #450-ben írtam. Másképp nincs értelme! BiroAndras is beszélt errõl, és az az Acton is. Tehát hogy ha szokásos ütemû, szokásos "szívás-mennyiségû" fejlesztésrõl van szó, akkor nincs idõ mindent úgy csinálni, hogy a Cellnek jó legyen, így rosszul lesz kihasználva. Fõleg ha 3-felé fejlesztenek, mint Carmackék.
Actonék viszont csak PS3-ra fejlesztenek (legalábbis õ és a csapata), alapoktól a Cellre tervezve, azt alaposan kiismerve. Nem csoda, ha így sokkal jobb eredményeket érnek el, nem gondolod?
Nincs benne semmi ha nem fektetnek bele ezt meg azt (nem kell meseket gyartanod, hogy megint a sajat nem letezo igazadat valosagosnak allitsad be), viszont az benne van, hogy a teljes programozasra koncentral az ember, akkor a PS3 "significantly slower", azaz jelentosebben lassabb.Tehat nem kis mertekben, vagy csak eppenhogy, hanem nagy kulonbseggel.
A masik fele, igen en hiszek inkabb egy csucsprogramozonak, aki mindket oldal, azaz a konzol es PC programozasban erdekel, mint olyannak, aki egy "www.cellperformance.com" reklamoldalt csinal favorizalasra es csak egy oldalon erdekelt, es csak a pre-renderelesnel latott PC-t. Mikozben a masik fel egy komoly szakmai oldalon "http://www.next-gen.biz" nyilatkozza a velemenyet.
Raadasul nem azonos kaliber a ket nev.
Apropo render, ha olyan egyszeru a programozas a PS3 dev-kiten , akkor miert nem csinaljak ezt a reszt is vele ?
Minek hozza egy PC, a PS3 jatekokhoz ?
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
És te is az egyik elkötelezettje vagy, ha jól látom, így csak az egyiknek hiszel.
Én meg inkább a másiknak, bár nem annyira.
Nincs értelme a további vitának. De legalább mindkét oldalt meg kell hallgatni.
Ezzel egyébként csak azt mondta, hogy HA nem fektetnek be a teljesítmény kiaknázásába, akkor kisebb teljesítménnyel számolhatnak, mint egy high-end pc. Ez igaz. DE az ellentéte is igaz: ha rászánják, amit rá kell, akkor kicsit más lesz a helyzet.
És még egy fontos dolog: Carmackéknál kicsit bonyolultabb a helyzet, lévén párhuzamosan fejlesztenek több platformra. Mike Acton is kifejti, a PS3-at akkor lehet a legjobban kiaknázni, ha az alapoktól kezdve kimondottan rá fejlesztenek valamit.
Az a kérdés, megéri-e a ráfordítás? Egyesek szerint nem, mások szerint igen. Igazán ütõs PS3 játékokat az utóbbiak fognak csinálni... És sokat fognak vele keresni.
A masik fele Carmack nem csak a PCben erdekelt, hanem a konzoloknal is ugyanis fejlesztenek X360-ra.
A te altalad belinkelt muki, meg csak Cellre.
Azert ez is elarul valamit.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
"A processzorok elméleti és a valós teljesítménye közötti különbség egyre nagyobb. Egy átlagos XBOX-nál nagy adagokban kapod a teoretikus teljesítményt. A PlayStation 2 mindig is zavaros volt a processzorkavalkádjával, de az új generációk, a Cell vagy az X360 esetében minden sokkal, de sokkal rosszabb. Emlegethetik ezeket a hihetetlen magas giga és tera flops, akármilyen értékeket, de a valóságban, ha a lényegi fejlesztésre koncentrálsz, sokkal, de sokkal lassabbak, mint egy modern, felsõkategóriás PC."
http://www.next-gen.biz/index.php?option=com_content&task=view&id=2164&Itemid=2
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
A.
Azt írta(d), szerinted, az ismet tulajdonságai (in-order, gyengébb branch prediction, kis méret) alapján a Cell PPE-je egy 386 v. 486-osnak felel meg, csak magasabb órajelen, de vélhetõen hosszú pipeline-okkal (ami miatt az effektív sebesség nem arányos az órajellel).
Én nem értettem egyet, de nem fejtettem ki bõvebben. Most megteszem.
1. Az in-order mûködési mód nem szinonímája a gyenge teljesítménynek! Csak annyit jelent, hogy nincs automatikus run-time reordering (a utasításvégrehajtási sorrend cserélgetése, az optimálisabban végrehajtható sorrend érdekében). De ez nem olyan nagy baj, ezt a fajta optimizácóit a compiler is közel ugyanolyan hatékonyan elvégezheti.
2. Az out-of-order rendszer mûködésébõl adódóan sokkal kifinomultabb és összetettebb branch predictiont igényel. Az in-order meg nem. Tehát nem kisprórolták az összetett branch predictiont, hanem egyszerûen nem volt rá szükség.
3. Ugyancsak több pipeline lépcsõfokot igényel az out-of-order rendszer, hiszen végrehajtás elõtt át kell rendezni a sorrendet. Ezzel szemben az in-order rendszerhez rövid pileline kell.
4. Az out-of-order rendszer és a hozzá tartozó bonyolult branch prediction (és a hosszabb pipeline egyéb elemei) sok tranzisztort igényel. Így nem csoda, hogy egy in-order rendszerû mag sokkal kisebb lehet.
5. A kisebb mag által sokkal kisebb a fogyasztás is.
6. A Pentium(1) is in-order volt, és az Itanium is az.
Egyszóval arról van szó, hogy egy optimizálási eljárás itt a compilerre (v. asm programozóra) van bízva, és ezáltal sokkal egyszerûbb lehet a mag.
Tehát, attól, hogy a PPE egy kicsi in-order mag, még lehet nagy teljesítményû, fõleg hogy 3.2GHz-en megy. A compileren múlik, és vannak is hozzá jó compilerek.
(Adódik a kérdés, miért álltak át x86-on out-of-order rendszerre?
- Nehezebb igazán optimális kódot generáló compilert készíteni hozzá.
- Minden proci-típushoz/-generációhoz külön meg kell írni az ide vonatkozó részt.
- Márpedig x86 vonalon gyorsan cserélõdnek a procik.
- Amúgy sem akarták, hogy a compilereken múljon a teljesítmény.
- Továbbá maguk a tervezõk ismeri igazán a procijuk pontos belsõ felépítését (fõleg ha titok), õk tudják a legoptimálisabbra tervezni a reorderinget.)
B.
Azt is írta(d), egy PS3-mal most dolgozni kezdõ fejlesztõ azt mondta neked, a Cell "szar", és 'minden fejlesztõ ezt gondolja'. Akkor bemutatom neked Mike Actont, aki a High Moon Studios egyik vezetõ programozója, akinek egy kissé más a véleménye, és az õ szavára kicsit jobban adok (de halkan megjegyzem, amúgy is nagyjából azt gondolja, amit én). Itt olvashatsz vele egy interjút. Egy külön website-ot is létrehozott, ami a Cellel foglalkozik: www.cellperformance.com
De ez nem változtat azon, hogy még mindig könnyeb használni. Ez is tény, ez ellen meg neked nem kell erõlködni. 😊
Hat ahogy nezem neked nincs inkabb fogalmad a mai VGA teljesitmenyerol.
Es mieg mindig nincs igazad ezzel, hogy a Cell gyorsabb, akarhogyan erolkodsz.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
<...>
TerraFLOPS: 1.1
http://www.theinquirer.net/default.aspx?article=28954
Igaz mas meresek szerint csak 553.8 Gigaflops"
Nos kérlek az nem "más mérések szerint" annyi, hanem a felsõ az összteljesítmény (ha minden igaz), a másik meg a shaderteljesítmény!
Két különbözõ fogalom...
És nem "terra", hanem tera.
Nincs raadasul az Nvidianal nem is azt adtam meg, a te 53 Gflopsos eredmenyedhez kepest.
Ja es ettol meg nem fog letezni 7600as 9600Xt teljesitmeny sem. 😛PPPPp
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
A másiknál meg már megbeszéltük, hogy volt a történet, aljas dolog ilyeneket állandóan felhozni.
Nos akkor mire alapozod azt a szemét kijelentésedet, hogy én nem tudom mirõl beszélek, amikor te összteljesítmény-számot bobsz be shaderteljesítmény-számmal szemben?
Igazad volt vagy nem volt igazad a GPUk teljesitmenyerol amikor azt allitottad, hogy sehol nincsenek a Cellhez kepest ?
Na ez a baromsag, hogy vegre felfogd.
Ez kb olyan amikor ragtad a gittet, hogy a 7600as kartya azonos teljestmenyu mint egy 9600Xt, amikor meg arrol se volt fogalmad, hogy sima 7600 nincs is.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Igaz, ha nem tudod attol meg helytelen az allitasod, hogy ellenkezel Andrissal, amikor azt sem tudod mirol beszelsz.
Kar vitatkoznod vele ebben a kerdesben mert nincs igazad, hanem neki volt.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Az nem tetszik, hogy 356 Gflops a Pixel Shader teljesitmenye a 7900XTnek 550 MHzen nem 400 ?
Oreg a te allitasod a marhasag, hogy a Cell nagyobb teljesitmenyu, nem az hogy nem pontos adatot irtam le.
Kar erolkodnod, a Celles allitasod egy baromsag, aztan beszelhetsz amit akarsz.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Én csak egyszerûen nem voltam naprakész az adatban, de nem kevertem a gizikét a gõzekével, mint te.
És akkor most már olvasd is el az Nvidiás doksikat: feketén-fehéren leírják, hogy nagyon kötött ez a környezet, és nehéz vele általános célú számításokat végezni, ilyen programot írni. Ezért a Cell még mindig optimálisabb ilyen feladatra.
G70
Pixel Shader
((4way x 2 Unità + 2 scalari) x 2 FPop) + 7 normalizazioni = 27 FPop/ciclo; 27 FPop x 24 Shader x 430MHz = 278.6GFLOPS
Vertex Shader
(4way+1scalar) x 2 FP operations(MADD) = 10 FP Op/ciclo; 10 FPop x 8 VS x 430MHz = 34.4GFLOPS
G70@550Mhz
Pixel Shader
27 FPop x 24 PS x 550MHz = 356.4GFLOPS
Vertex Shader
10 FPop x 8 VS x 550MHz = 44GFLOPS
Csak idezet toled:
""Egy jobb GPU flops-ban veri a cell-t."
-- Relatíve szabadon felhasználható FLOPS-ban? Nagy tévedés, nézz utána. "
Kar ragodnod ezen a kerdesen, ha marhasagokat mondasz, aztan masra akarod kenni, hogy neked van igazad.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Ha még a G70 200 GFLOPS-át írtad volna be, annak még értelme is lett volna.
De én legalább tudom, mirõl van szó, te meg itt jöttél az összteljesítménnyel.
Utana a latod a 200 folotti adatokat is egy ev elteltevel a 7es szerianal ?
Pontosan a te altalad emlitett NVIDIA GPU Pixel Shader GFLOPS-nal.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
Ajánlom figyelmedbe a 7. oldalon lévõ táblázatot. Címe: "NVIDIA GPU Pixel Shader GFLOPS".
Érted már, hogy itt nem az egész GPU teljesítményérõl van szó, hanem a programozható shader egységekérõl, amiken fizikát számoló shader fragment programokat futtatnak, a szokásos grafikai effektek helyett.
Végre egyszer elismerhetnéd, hogy totál tévesen kötöttél belém. <#rolleyes>#rolleyes>
GPU Physics
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
• GPUs are fast…
– 3 GHz Pentium4: 6 GFLOPS, 6 GB/sec peak
– GeForceFX 6800: 53 GFLOPs, 34 GB/sec peak"
Forrás: http://www.gpgpu.org/s2005/FullCourseNotes.pdf
Engine Clock: 650MHz
Memory Clock: 1550MHz
Memory Size/Type: 512MB GDDR3
Process: 90nm
Piplines: 16
Pixel Shaders: 48 (3/pipeline)
ALUs: 48 (1/Pixel Shader) (Expected-Could be wrong.)
Vertex Shaders: >8 Vertex Shaders (10?)
TMUs: 16
ROPs: 16
Dual Crossfire Compatible
3DMark05 Score: 11692
Pixel shader ops/sec.: 166 Billion
TerraFLOPS: 1.1
http://www.theinquirer.net/default.aspx?article=28954
Igaz mas meresek szerint csak 553.8 Gigaflops, mig a 7900GTX 400 korul van.
Az XTX850 PE is tud 200 Gflopsot.
Dez: Inkompatibilitas definicioja jatekoknal: amikor fut,de csak pl. 1 fps-sel,vagy össze-vissza akadozva,irányíthatatlanul 2. K8-nál alapból mindig 200MHz az FSB. Csak tuning által lesz magasabb.
-- Az egy másik kompromisszum, ne keverjük már össze-vissza a dolgokat.
"Tényleg nem érted, vagy csak nem akarod érteni?"
-- Értem, amit mondasz, csak nem értek vele egyet, fel tudod ezt fogni?
"Azért nem tetszik neki, mert a gyakorlatban messze nem olyan erõs, mint amilyennek reklámozták, és ráadásul nehéz programozni."
-- A GFLOPS-t reklámozták, és megfelelõen optimális esetben ki is lehet hozni. Ez tény. Továbbá az általános teljesítménye sem olyan rossz, mint hiszed. (Lásd errõl köv. hosszászólásom.) Az tény, hogy nehezebb programozni, de valamit valamiért.
"Ezt most komolyan nem értem. Kifogytál az értelmes válaszokból?"
-- Mert egy felesleges és értelmetlen mondatodat visszautasítottam?
"Nem hülyék, csak olcsó konzol chip-et kellet építeniük."
-- Ez jó nagy tévedés.
"És nincs vele akkora gond, csak éppen az messze nem igaz, hogy 20-30-szoros teljesítménye lenne egy PC-hez képest."
-- FLOPS-ban nagyon is igaz, mást nem állított senki. Amúgy sávszélességben is eléggé odaver.
"Viszont meg kell tanulni programiozni, ami idõbe telik. Ezek miatt a PS3-as játékok nem fogják úgy megelõzn a PC-seket, mint ahogy azt sokan várják."
-- Mondja egy ellenérdekelt, PC-s játékfejlesztõ cég munkatársa...
"Mire elkezdik rendesen kihasználni a cell-t, addigra elterjednek a 4 magos x86 procik, amik már bõven versenyképesek lesznek (pláne fizikai gyorsítóval támogatva)."
-- Zöldség, már bocs. Hol van egy 4-magos x86 FLOPS-ban még a Celltõl, nem beszélve a szûkös sávszélességrõl? A Physix meg elbújhat a Cell mellett.
"Nem lustaság, hanem idõ és pénz."
-- Egy belevaló PS3-as játék sokszorosan visszahozza. Befektetés - nyereség.
"A fejlesztõk reakcióit látva én ebben nem hiszek."
-- Egyelõre 1db fejlesztõ. Mindjárt én is írok egyet, kicsit más a véleménye.
"Nem érted. Úgy csinálsz, mintha még sose dolgoztál volna határidõre.
Nekem is ugyanaz a munkám és a hobbim, mégis egész másképp állok hozzá. Kísérletezni otthon szeretek, veszélytelenül, határidõk nélkül. A munkát gyorsan és biztonságosan kell elvégezni. Ráadásul nem én választom meg, hogy mit és mikorra kell csinálni."
-- Ez akkor van, ha kissé idióta a fõnök, és nem képes felmérni a végeredmény nagyságát, és az ahhoz szükséges befektetést. Találkoztam ilyenekkel, gyorsan le is léptem. Jobb helyeken nem diktatúra van (legalábbis a fõ fejlesztõk felé), hanem én mondom meg, mihez mennyi idõ kell, vagy a fõnök eleve tisztában van vele. (Köv. hozzászólásomban mutatok egy céget, ahol kicsit értelmesebben állnak hozzá.)
"Mintha valami kompromisszumokról beszéltél volna az elõbb. Itt pontosan errõl van szó. Ha én játékot akarok fejleszteni, nem feltétlen a nyers teljesítmény a legfontosabb szempont."
-- Nyilván más is számít. Pl. hogy mekkora bevételre lehet számítani egy ütõs játékkal... A PS3 egy kicsit más pálya, mint a PC, ne felejtsd el.
"Mondj valami olyat, amit nem lehet megcsinálni egy X2-vel és egy extra GPU-val."
-- Nos ez is max. csak fele teljesítmény GFLOPS-ban, ráadásul kötöttebb és nehézkesebb is. És a másik, amit szintén mindig elfelejtesz: PS3-nál default adott, PC-nél egyeseknek van kategória.
"Egy jobb GPU flops-ban veri a cell-t."
-- Relatíve szabadon felhasználható FLOPS-ban? Nagy tévedés, nézz utána. A GF 6800 tud elméletileg (és itt igazán elméletileg, mert sok a kötöttség, pl. nincsenek regiszterek, stb. stb., lásd gpgpu.org) 63 GFLOPS-t. A Cell 200-nál is többet.
"Másrészt egész jó fizikát lehet csinálni már egy átlagos egymagos CPU telejsítményének kis részével is. Szeritnem egy GPU teljesítménye bõven elég egyelõre. Még azzal se tudnánk mit kezdeni jelenleg."
-- Nagyot fogsz majd nézni, ha meglátod, mi az igazi "fizika"... 😊
"Látod, errõl beszéltem, amikor azt mondtam, hogy a flops önmagában nem sokat ér."
-- Nem, te nem csak azt mondtad, hanem azt, hogy alig valamire lehet azt használni. Pedig lehetni lehet sokmindenre.
"Most hirtelen nehéz lett programozni a GPU-kat? Eddig pont az ellenkezõjérõl akartál meggyõzni."
-- Ez nem így van, kevesed a dolgokat. Nem arról beszéltem, hogy milyen nehéz vagy könnyû, hanem hogy sokmindenre használható. Az egy másik kérdés, mennyire nehezen és hatékonyan. Ugye érted a különbséget?
"De azzal már nincs szívás, így simán használhatják."
-- Csak úgy, mint PS3-on. De itt nem fognak itt megállni, mert egy GPU nem-grafikai felhasználásánál még mindig sokkal könnyebben használható a Cell, és ott áll a kihasználandó erõ mindenki gépében.
"A kettõ általában üti egymást."
-- Azok nem is fognak pénzt keresni a PS3-mal... Mások meg fognak.
-- De kicsit félreértettél, mert én sem csak a játék belsõ történetére gondoltam, hanem bizonyos mértékig a megvalósításra is.
"Vannak átmenetek is. Ma már elvárják, elég komoly elvárások vannak ezen a téren az átlag játékkal szemben is. Nézz meg egy idén kiadott RTS-t."
-- Oké, nyilván, de ez még ma is inkább a feelinghez tesz hozzá, a szép grafikával együtt. Annyira nem realisztikus, hogy bármit megtehess, épp ellenkezõleg.
"Ezt jól megaszondtad."
-- Szerintem teljesen érthetõ.