Te mar megint mirol beszelsz ? Az nem tetszik, hogy 356 Gflops a Pixel Shader teljesitmenye a 7900XTnek 550 MHzen nem 400 ? Oreg a te allitasod a marhasag, hogy a Cell nagyobb teljesitmenyu, nem az hogy nem pontos adatot irtam le. Kar erolkodnod, a Celles allitasod egy baromsag, aztan beszelhetsz amit akarsz.
Nem az volt az igazi nagy marhaság, amikor jöttél itt az összteljesítménnyel, holott a shaderek teljesítményérõl volt szó???
Én csak egyszerûen nem voltam naprakész az adatban, de nem kevertem a gizikét a gõzekével, mint te.
És akkor most már olvasd is el az Nvidiás doksikat: feketén-fehéren leírják, hogy nagyon kötött ez a környezet, és nehéz vele általános célú számításokat végezni, ilyen programot írni. Ezért a Cell még mindig optimálisabb ilyen feladatra.
Nem tehetek róla, hogy a gpgpu.com-on (Nvidia site ez is) lévõ doksik jó részében (amit eddig néztem) még csak a 6800-as ide vonatkozó adata található.
De én legalább tudom, mirõl van szó, te meg itt jöttél az összteljesítménnyel.
Mar ne haragudj te elolvasod a szamokat is vagy csak a kepeket nezed ? NV40 alias Gf6800 53 Gflops Utana a latod a 200 folotti adatokat is egy ev elteltevel a 7es szerianal ? Pontosan a te altalad emlitett NVIDIA GPU Pixel Shader GFLOPS-nal.
Az mondjuk szép teljesítmény, hogy a 6800-as (NV40) 53 GFLOPS-ához képest a G70 már 200 GFLOPS (gy.k. a pixel shader teljesítménye). De továbbra is igaz (az nvidiás doksikban is le van írva!), hogy ez erõsen kötött környezet, és nehezen megvalósíthatók így az általános számítási feladatok. Így nehezebb vele a munka, mint akár a Cellel.
És? Már jópár hasonlót olvastam már Nvidiáéktól (lásd pl. link), egy évre visszamenõleg. Talán neked is el kellene olvasnod.
Ajánlom figyelmedbe a 7. oldalon lévõ táblázatot. Címe: "NVIDIA GPU Pixel Shader GFLOPS".
Érted már, hogy itt nem az egész GPU teljesítményérõl van szó, hanem a programozható shader egységekérõl, amiken fizikát számoló shader fragment programokat futtatnak, a szokásos grafikai effektek helyett.
Végre egyszer elismerhetnéd, hogy totál tévesen kötöttél belém.
Ez kérdés akart lenni? Mert akkor válaszolok: nem az egész GPU összteljesítményrõl van szó, minden fixfunkciós egységet is beleértve, hanem mint többször világosan le volt írva, a programozható shader egységek kvázi általános számításokra rendelkezésre álló teljesítményérõl.
http://www.theinquirer.net/default.aspx?article=28954 Igaz mas meresek szerint csak 553.8 Gigaflops, mig a 7900GTX 400 korul van. Az XTX850 PE is tud 200 Gflopsot.
Na akkor ide jön még egy hozzászólás, amit említettem, de most egy kis dolgom van.
"A kompromisszum az, hogy nem használják ki az új cucc minden képességét elsõre." -- Az egy másik kompromisszum, ne keverjük már össze-vissza a dolgokat.
"Tényleg nem érted, vagy csak nem akarod érteni?" -- Értem, amit mondasz, csak nem értek vele egyet, fel tudod ezt fogni?
"Azért nem tetszik neki, mert a gyakorlatban messze nem olyan erõs, mint amilyennek reklámozták, és ráadásul nehéz programozni." -- A GFLOPS-t reklámozták, és megfelelõen optimális esetben ki is lehet hozni. Ez tény. Továbbá az általános teljesítménye sem olyan rossz, mint hiszed. (Lásd errõl köv. hosszászólásom.) Az tény, hogy nehezebb programozni, de valamit valamiért.
"Ezt most komolyan nem értem. Kifogytál az értelmes válaszokból?" -- Mert egy felesleges és értelmetlen mondatodat visszautasítottam?
"Nem hülyék, csak olcsó konzol chip-et kellet építeniük." -- Ez jó nagy tévedés.
"És nincs vele akkora gond, csak éppen az messze nem igaz, hogy 20-30-szoros teljesítménye lenne egy PC-hez képest." -- FLOPS-ban nagyon is igaz, mást nem állított senki. Amúgy sávszélességben is eléggé odaver.
"Viszont meg kell tanulni programiozni, ami idõbe telik. Ezek miatt a PS3-as játékok nem fogják úgy megelõzn a PC-seket, mint ahogy azt sokan várják." -- Mondja egy ellenérdekelt, PC-s játékfejlesztõ cég munkatársa...
"Mire elkezdik rendesen kihasználni a cell-t, addigra elterjednek a 4 magos x86 procik, amik már bõven versenyképesek lesznek (pláne fizikai gyorsítóval támogatva)." -- Zöldség, már bocs. Hol van egy 4-magos x86 FLOPS-ban még a Celltõl, nem beszélve a szûkös sávszélességrõl? A Physix meg elbújhat a Cell mellett.
"Nem lustaság, hanem idõ és pénz." -- Egy belevaló PS3-as játék sokszorosan visszahozza. Befektetés - nyereség.
"A fejlesztõk reakcióit látva én ebben nem hiszek." -- Egyelõre 1db fejlesztõ. Mindjárt én is írok egyet, kicsit más a véleménye.
"Nem érted. Úgy csinálsz, mintha még sose dolgoztál volna határidõre. Nekem is ugyanaz a munkám és a hobbim, mégis egész másképp állok hozzá. Kísérletezni otthon szeretek, veszélytelenül, határidõk nélkül. A munkát gyorsan és biztonságosan kell elvégezni. Ráadásul nem én választom meg, hogy mit és mikorra kell csinálni." -- Ez akkor van, ha kissé idióta a fõnök, és nem képes felmérni a végeredmény nagyságát, és az ahhoz szükséges befektetést. Találkoztam ilyenekkel, gyorsan le is léptem. Jobb helyeken nem diktatúra van (legalábbis a fõ fejlesztõk felé), hanem én mondom meg, mihez mennyi idõ kell, vagy a fõnök eleve tisztában van vele. (Köv. hozzászólásomban mutatok egy céget, ahol kicsit értelmesebben állnak hozzá.)
"Mintha valami kompromisszumokról beszéltél volna az elõbb. Itt pontosan errõl van szó. Ha én játékot akarok fejleszteni, nem feltétlen a nyers teljesítmény a legfontosabb szempont." -- Nyilván más is számít. Pl. hogy mekkora bevételre lehet számítani egy ütõs játékkal... A PS3 egy kicsit más pálya, mint a PC, ne felejtsd el.
"Mondj valami olyat, amit nem lehet megcsinálni egy X2-vel és egy extra GPU-val." -- Nos ez is max. csak fele teljesítmény GFLOPS-ban, ráadásul kötöttebb és nehézkesebb is. És a másik, amit szintén mindig elfelejtesz: PS3-nál default adott, PC-nél egyeseknek van kategória.
"Egy jobb GPU flops-ban veri a cell-t." -- Relatíve szabadon felhasználható FLOPS-ban? Nagy tévedés, nézz utána. A GF 6800 tud elméletileg (és itt igazán elméletileg, mert sok a kötöttség, pl. nincsenek regiszterek, stb. stb., lásd gpgpu.org) 63 GFLOPS-t. A Cell 200-nál is többet.
"Másrészt egész jó fizikát lehet csinálni már egy átlagos egymagos CPU telejsítményének kis részével is. Szeritnem egy GPU teljesítménye bõven elég egyelõre. Még azzal se tudnánk mit kezdeni jelenleg." -- Nagyot fogsz majd nézni, ha meglátod, mi az igazi "fizika"... :)
"Látod, errõl beszéltem, amikor azt mondtam, hogy a flops önmagában nem sokat ér." -- Nem, te nem csak azt mondtad, hanem azt, hogy alig valamire lehet azt használni. Pedig lehetni lehet sokmindenre.
"Most hirtelen nehéz lett programozni a GPU-kat? Eddig pont az ellenkezõjérõl akartál meggyõzni." -- Ez nem így van, kevesed a dolgokat. Nem arról beszéltem, hogy milyen nehéz vagy könnyû, hanem hogy sokmindenre használható. Az egy másik kérdés, mennyire nehezen és hatékonyan. Ugye érted a különbséget?
"De azzal már nincs szívás, így simán használhatják." -- Csak úgy, mint PS3-on. De itt nem fognak itt megállni, mert egy GPU nem-grafikai felhasználásánál még mindig sokkal könnyebben használható a Cell, és ott áll a kihasználandó erõ mindenki gépében.
"A kettõ általában üti egymást." -- Azok nem is fognak pénzt keresni a PS3-mal... Mások meg fognak.
"De ne errõl beszélj, mert nem ezzel vitatkozom." -- De kicsit félreértettél, mert én sem csak a játék belsõ történetére gondoltam, hanem bizonyos mértékig a megvalósításra is.
"Vannak átmenetek is. Ma már elvárják, elég komoly elvárások vannak ezen a téren az átlag játékkal szemben is. Nézz meg egy idén kiadott RTS-t." -- Oké, nyilván, de ez még ma is inkább a feelinghez tesz hozzá, a szép grafikával együtt. Annyira nem realisztikus, hogy bármit megtehess, épp ellenkezõleg.
"Ezt jól megaszondtad." -- Szerintem teljesen érthetõ.
"Amikor full random adat elérésre van szükség." -- De ezt már tovább osztottuk két felé: amikor össze kell szedni az adatokat (össze-vissza mindenhonnan), és utána feldolgozni, ill. amikor összeszedés közben dõl el a köv. hozzáférés helye. De ha az utóbbi esetre gondoltál konkrétan, akkor is rossz helyen tetted, mert itt az elsõrõl volt szó.
"Nem errõl beszélek. Miért olyan nehéz megérteni? A nagyobb poligonszám csak azért érdekes, mert lehetõvé tesz egy csomó új fícsört. Néha komolyan azt hiszem, hogy szándékosan érted félre amit írok." -- Dehogy nehéz megérteni. Csak arról van szó, hogy egy bizonyos szám fölött /játékelem ez önmagában nem tesz hozzá már a játékmenethez. Csak mégrészletesebbek lesznek.
"Nem errõl van szó. A cell alapötlete jó, csak az ár és a hõtermelés leszorítása érdekében túl sok kompromisszumot kötöttek szerintem." -- Rosszul gondolod, vélhetõen a korábban leírt tévedéseidre alapozva, amiket külön fogok késõbb elemezni.
"Egy 2-4 magos x86 plusz egy GPU-szerû segédprocival kiegésszítve sokkal hatékonyabb lehetne." -- Egyszer talán, de pár évig még nem: a GF6800-as programozható shadereivel elérhetõ számítási teljesítmény 63 GFLOPS. Hol van ez a Cell 200 feletti GFLOPS-ához képest? Ráadásul egy GPU sokkal kötöttebb, és nehézkesebben használható, mint a Cell. Tehát feljesztési idõben is problémás.
"Persze ma még sokkal drágább is lenne." -- A Cell sem olcsó holmi.
"Megemlíteni lehet, csak félrevezetõ, ha az átlaggal hasonlítod a kivételt." -- Ne hülyéskedj már, miért ne lehetne azt mondani, hogy néhány régi játék játékmenet szempontból volt olyan komplex, mint egy mai átlagos ilyen-olyan típusú játék?
"Nemtom, engem nem zavar." -- Lassú a szemed. :)
"Egyébként a render FPS és a gamelogic FPS független egymástól. Nálunk a gamelogic fixen 10 FPS-sel megy." -- Az fps-t, mint mértékegység kisbetûvel szokás írni. Mégpedig azért, hogy meg lehessen különböztetni a nagybetûs FPS-tõl, ami a First Person Shooter rövidítése. Remélem nem FPS-t csináltok, mert ahhoz kevés lenne a gamelogicnak is a 10fps.
"Ez csak akkor igaz, ha lehet õket párhuzamosan végrehajtani." -- Nyilván, de sokmindent lehet.
"Pont arról van szó, hogy idõbe telik átírni mindent." -- PS3-ra sok egyedi fejlesztés lesz, ami szinte a 0-ról írnak meg. De ha x360-on is lesz valami, az sem baj, oda is párhuzamosítani kell sokmindent.
"konzolon a GPU driver egész másképp néz ki szerintem. A többi meg minimális CPU-t igényel." -- PS3-on OpenGL alapú lesz, így a driver sem lehet nagyon más, mint a szokásos. De akárhogy is lesz, a poligonokkal lesz meló.
"Nem ez a lényeg. Arról van szó, hogy X2-n ugyanúgy futnak az egyszálú játékok, mint az egymagosakon. Tehát a fejlesztõknek nem kell sietniük annyira a fejlesztéssel. Konzolon többszálúsítás nélkül nincs életképes játék." -- Rendben, de te nem azt írtad, hogy nem olyan nagy gond, ha egy egyszálú játékot futtatunk egy dual-core procin, hanem egyenesen azt, hogy nem lesz lassabb, ami így nem mindig igaz.
"Kevesen engedhetik meg maguknak, hogy leáljanak a játék fejlesztéssel fél-egy évre, hogy egy teljesen új motort fejlesszenek (akik megpróbálták, többnyire belebuktak). A megoldás a folyamatos fejlesztés (refaktoring), ami viszont tovább tart." -- Azok engedhetik meg maguknak, akiknek a fõnökeik komoly PS3-as projektekben göondolkodnak, és tisztában vannak ennek velejáróival.
A kompromisszum az, hogy nem használják ki az új cucc minden képességét elsõre.
"Nem. A Cell olyan, amilyen. A srácnak meg vagy lesz kedve igazán kihasználni, vagy nem. Ennyi."
Tényleg nem érted, vagy csak nem akarod érteni? Azért nem tetszik neki, mert a gyakorlatban messze nem olyan erõs, mint amilyennek reklámozták, és ráadásul nehéz programozni.
"Az ilyen felesleges hatásvadász szövegeket inkább hagyjuk, ha lehet..."
Ezt most komolyan nem értem. Kifogytál az értelmes válaszokból?
"Lásd amit a kompromisszumokról írtam. Ja, és szerintem az IBM és a Sony mérnökei sem teljesen hülyék..."
Nem hülyék, csak olcsó konzol chip-et kellet építeniük. És nincs vele akkora gond, csak éppen az messze nem igaz, hogy 20-30-szoros teljesítménye lenne egy PC-hez képest. Viszont meg kell tanulni programiozni, ami idõbe telik. Ezek miatt a PS3-as játékok nem fogják úgy megelõzn a PC-seket, mint ahogy azt sokan várják. Mire elkezdik rendesen kihasználni a cell-t, addigra elterjednek a 4 magos x86 procik, amik már bõven versenyképesek lesznek (pláne fizikai gyorsítóval támogatva).
"Ha valaki nem akar mindent "lustán" a PPE-re bízni, akkor nem lesz gond."
Nem lustaság, hanem idõ és pénz.
"Nem csak magát a hw-t kiismerni tartott ennyi ideig, hanem lassan erõsödött fel az igény és a hajlandóság az ilyen szokásostól eltérõ rendszerek kihasználására."
Pontosan.
"A PS3 esetén nem kell az egészet az elejétõl eljátszani."
A fejlesztõk reakcióit látva én ebben nem hiszek.
"Valakinek a munkája egyben a hobbija..."
Nem érted. Úgy csinálsz, mintha még sose dolgoztál volna határidõre. Nekem is ugyanaz a munkám és a hobbim, mégis egész másképp állok hozzá. Kísérletezni otthon szeretek, veszélytelenül, határidõk nélkül. A munkát gyorsan és biztonságosan kell elvégezni. Ráadásul nem én választom meg, hogy mit és mikorra kell csinálni.
""ismerõs hardver legyen a keze alatt (és minél több teljesítmény persze)." Ilyen ma nem létezik (elérhetõ áron), a Cell szintjén."
Mintha valami kompromisszumokról beszéltél volna az elõbb. Itt pontosan errõl van szó. Ha én játékot akarok fejleszteni, nem feltétlen a nyers teljesítmény a legfontosabb szempont.
""A kettõ akkor békíthetõ össze, ha az új platform valami olyat tud, amire jó játékot lehet írni. A cell ilyet igazából nem kínál szerintem." -- Nagyon kevés a fantáziád..."
Mondj valami olyat, amit nem lehet megcsinálni egy X2-vel és egy extra GPU-val.
"Az utóbbiak jóval kisebb teljesítményt nyújtanak -> egyszerûbb fizika."
Egy jobb GPU flops-ban veri a cell-t. Másrészt egész jó fizikát lehet csinálni már egy átlagos egymagos CPU telejsítményének kis részével is. Szeritnem egy GPU teljesítménye bõven elég egyelõre. Még azzal se tudnánk mit kezdeni jelenleg.
"És egy GPU, bár már sokmindenre használható (mint már beszéltünk róla), de mindenképp jóval kötöttebb, még jóval nehezebb kihaszálni ilyesmire."
Látod, errõl beszéltem, amikor azt mondtam, hogy a flops önmagában nem sokat ér.
"Tehát a Cellnél még jóval több "szívás" van vele, így kevesen fognak nekiállni."
Most hirtelen nehéz lett programozni a GPU-kat? Eddig pont az ellenkezõjérõl akartál meggyõzni.
"Inkább csak a kész fizikai csomagot fogják használni."
De azzal már nincs szívás, így simán használhatják.
"Beszéljünk inkább azokról, akiket a kihívás is érdekel, és a profit is..."
"Én viszont a lényegi játékmenet összetettségérõl beszéltem, és hogy ahhoz önmagában nem kell olyan sok kakaó."
De ne errõl beszélj, mert nem ezzel vitatkozom.
"Egy város kvázi-élethû szimulációja már minden szempontból nagyon komplex dolog. De a legtöbb játékban nincs erre szükség."
Vannak átmenetek is. Ma már elvárják, elég komoly elvárások vannak ezen a téren az átlag játékkal szemben is. Nézz meg egy idén kiadott RTS-t.
"Nem egészen. Egyrészt nem ugyanolyan, de nem is annyival egyszerûbbet (adott kivételes esetben, a legtöbb játék persze viszonylag egyszerû volt, bár néha elég cseles technikai megoldásokkal ekkor is, éppen a kis teljesítmény miatt), másrészt nem minden szempontból."
""De én pontosan errõl az esetrõl beszélek." -- Melyikrõl is?"
Amikor full random adat elérésre van szükség.
"A poligonszámot én nem sorolnám a komplexitásba."
Nem errõl beszélek. Miért olyan nehéz megérteni? A nagyobb poligonszám csak azért érdekes, mert lehetõvé tesz egy csomó új fícsört. Néha komolyan azt hiszem, hogy szándékosan érted félre amit írok.
"Természetesen nem mindenre, de azért nem olyan kevés az, ha okosan használják. Nyilván jobb lenne 1GB közös ram 50GB/s-sel, "0" késleltetéssel, de az ma még elérhetetlen."
Nem errõl van szó. A cell alapötlete jó, csak az ár és a hõtermelés leszorítása érdekében túl sok kompromisszumot kötöttek szerintem. Volt már ilyenre sok példa. Egy 2-4 magos x86 plusz egy GPU-szerû segédprocival kiegésszítve sokkal hatékonyabb lehetne. Persze ma még sokkal drágább is lenne.
"No és miért ne lehetne megemlíteni pár régi kivételt a mai átlaghoz képest?"
Megemlíteni lehet, csak félrevezetõ, ha az átlaggal hasonlítod a kivételt.
"Engem bárhol zavar a 20-30fps. Az egyszerûen nem folyamatos, hanem darabos, így nem természetes, rossz a szemnek."
Nemtom, engem nem zavar. Egyébként a render FPS és a gamelogic FPS független egymástól. Nálunk a gamelogic fixen 10 FPS-sel megy.
"Nos, ha több feladatod van, amiket így is-úgy is végre kell hajtanod, akkor mindegy, hogy gyorsan és egymás után, vagy egyenként kicsit lassabban, de párhuzamosan hajtódnak végre."
Ez csak akkor igaz, ha lehet õket párhuzamosan végrehajtani.
"Miért ne lenne több szál? Oké, a motorok ma még egyszálasak (de mint szó volt róla ezen ideje változtani, pc-n is)"
Pont arról van szó, hogy idõbe telik átírni mindent.
"de van ott még más feladat is bõven (GPU driver, hangeffektek, stb.)."
konzolon a GPU driver egész másképp néz ki szerintem. A többi meg minimális CPU-t igényel.
"Na de hát most írom, hogy az olcsóbb X2-k magonkénti órajele kevesebb, mint egy nálánál olcsóbb csúcs-egymagosé!"
Nem ez a lényeg. Arról van szó, hogy X2-n ugyanúgy futnak az egyszálú játékok, mint az egymagosakon. Tehát a fejlesztõknek nem kell sietniük annyira a fejlesztéssel. Konzolon többszálúsítás nélkül nincs életképes játék.
"Egy igazán jó programozó hamar megtanulja ezeket."
Nem csak igazán jók vannak. A többség csak jó, vagy közepes. És nem csak megtanulni kell, hanem a meglevõ kódot átírni, és párhuzamosan játékot is fejleszteni. Kevesen engedhetik meg maguknak, hogy leáljanak a játék fejlesztéssel fél-egy évre, hogy egy teljesen új motort fejlesszenek (akik megpróbálták, többnyire belebuktak). A megoldás a folyamatos fejlesztés (refaktoring), ami viszont tovább tart.
"De itt az XP-rõl volt szó. Arra írtad, hogy a 64 bitesre is van elég driver, pedig nincs."
A cikk címében is szerepelt a 6GHz, és a cikkben az szerepelt, hogy a jelenlegi 4-5GHz feljebb is tornászható. Hamarosan a Cellt is 65nm-en gyártják majd. A Power6 egy szerver-chip, természetes, hogy sokkal nagyobb. (Vélhetõen nem kevés L2-L3 is van benne, stb.)
"Nos, ha hobbiról van szó, akkor a különlegesség jó, ha viszont határidõre elvégzendõ munkáról, akkor az embre sokkal jobban szereti a jól ismert dolgokat." -- Nyilván, csak épp ma még mincsenek (ésszerû áron) 10GHz-es, vagy sokmagos procik. Ezért kompromisszumokat kell kötni.
"Hát érdekesen nézne ki egy mai 3D motor shader-ek nélkül." -- Azokat általában utólag is beépítheti egy másik programozó, az adott projekt grafikusaival együttmûködve, igénytõl függõen...
"Az optimalizáláshoz mindíg alaposan ismerni kell a hardvert." -- Oké, ez igaz, de azért a DX sokat segít ebben a kérdésben. (Hogy milyen hatékonyan, az már más kérdés.)
"Tehát még mindíg azt mondod, hogy a cell az tökéletes, tehát ha neki nem jött be, akkor õ a hülye." -- Nem. A Cell olyan, amilyen. A srácnak meg vagy lesz kedve igazán kihasználni, vagy nem. Ennyi.
"Az nem jutott eszedbe, hogy õ már látta, sõt programoztta a cell-t, te meg nem? Nem lehet, hogy esetleg õ jobban tudja?" -- Az ilyen felesleges hatásvadász szövegeket inkább hagyjuk, ha lehet...
"Nem csak a "szívás" a lényeg, hanem az objektív korlátok." -- Lásd amit a kompromisszumokról írtam. Ja, és szerintem az IBM és a Sony mérnökei sem teljesen hülyék... Ha valaki nem akar mindent "lustán" a PPE-re bízni, akkor nem lesz gond.
"A "szívás" meg azt jelenti, hogy csak soká (évek múlva) fogják tudni jól kihasználni." -- Bizonyára sokan, de nem feltétlenül vonatkozik ez mindenkire.
"A PS2-t is sokan szídták. De aztán belejöttek."
"Mennyi idõ alatt? Még a legutolsó játékok is jobban kihasználták, mint az eggyel korábbi generáció. Tehát évekig tartott kiismerni. A cell meg még egzotikusabb cuccos." -- Nem csak magát a hw-t kiismerni tartott ennyi ideig, hanem lassan erõsödött fel az igény és a hajlandóság az ilyen szokásostól eltérõ rendszerek kihasználására. A PS3 esetén nem kell az egészet az elejétõl eljátszani. És most a segítség is sokkal több.
"Megint csak arról van szó, hogy hobbi, vagy munka." -- Valakinek a munkája egyben a hobbija...
"ismerõs hardver legyen a keze alatt (és minél több teljesítmény persze)." -- Ilyen ma nem létezik (elérhetõ áron), a Cell szintjén.
"A kettõ akkor békíthetõ össze, ha az új platform valami olyat tud, amire jó játékot lehet írni. A cell ilyet igazából nem kínál szerintem." -- Nagyon kevés a fantáziád...
"A teljesítménye leginkább fizikára használható ki jelenleg, amit viszont már PC-n is meg lehet valósítani. Jön már a dualcore CPU, a GPU-s fizika, és a Physix chip is." -- Az utóbbiak jóval kisebb teljesítményt nyújtanak -> egyszerûbb fizika. (Fõleg a Physix esetén, amit egy X1600 is keresztben lenyel állítólag.)
"Egy modern GPU is tud annyi gflop-ot, mint a cell (persze a gflop önmagában kevés)." -- Nem hiszem. És egy GPU, bár már sokmindenre használható (mint már beszéltünk róla), de mindenképp jóval kötöttebb, még jóval nehezebb kihaszálni ilyesmire. Tehát a Cellnél még jóval több "szívás" van vele, így kevesen fognak nekiállni. Inkább csak a kész fizikai csomagot fogják használni.
"Igaz, a cell olcsóbb, de a fejlesztõ szempontjából ez nem olyan fontos, fõleg ha csak a kihívás érdekli, nem a profit." -- Beszéljünk inkább azokról, akiket a kihívás is érdekel, és a profit is...
"Ezek közül a Mercenary-t ismerem. A játékmenete valóban nagyon komplex volt, de nem errõl beszéltem. Sajnos manapság nem a játékmenetre gyúrnak, hanem grafikára." -- Én viszont a lényegi játékmenet összetettségérõl beszéltem, és hogy ahhoz önmagában nem kell olyan sok kakaó. Nem hogy egy PPE, egy 6502-es is sokmindenre elég volt. Most az, hogy a játékban részt vevõ elemek hány poligonból állnak, és más efféle egy másik része a dolognak. És itt jött az, hogy utóbbiak kezelésébe az SPE-k is nagyban besegítenek.
"A komplexitás a megvalósítás részleteiben van. A világot realisztikussá és élõvé tenni iszonyat sok munka." -- Nyilván. Egy város kvázi-élethû szimulációja már minden szempontból nagyon komplex dolog. De a legtöbb játékban nincs erre szükség.
"De hogy tisztázzuk : arról akarsz meggyõzni, hogy régen kevesebb ember, kevesebb idõ alatt, nagyságrenddekkel gyengébb gépekre ugyanolyan komplex játékokat készített?" -- Nem egészen. Egyrészt nem ugyanolyan, de nem is annyival egyszerûbbet (adott kivételes esetben, a legtöbb játék persze viszonylag egyszerû volt, bár néha elég cseles technikai megoldásokkal ekkor is, éppen a kis teljesítmény miatt), másrészt nem minden szempontból.
"De én pontosan errõl az esetrõl beszélek." -- Melyikrõl is?
"Pontosan errõl beszélek. Régen nem volt, ma van -> nagyobb komplexitás." -- A poligonszámot én nem sorolnám a komplexitásba. Esetleg ha minden poligonnak jelentõsége van a játékban, a játékmenet szempontjából, de ilyen nem nagyon van.
"Te említetted a Z80-at." -- ZX80/81-et. Ezek gépek voltak, valami pár k-s rammal.
"Erre mondtam, hogy akkoriban sokkal kevesebb adattal dolgoztak, így nem meglepõ, hogy elboldogult kevés memóriával is. Érdekes, hogy mennyit idézik BG mondását, miszerint 640K legyen elég mindenkinek. Ehhez képest most arról akarsz meggyõzni, hogy 256K elég mindenre." -- Természetesen nem mindenre, de azért nem olyan kevés az, ha okosan használják. Nyilván jobb lenne 1GB közös ram 50GB/s-sel, "0" késleltetéssel, de az ma még elérhetetlen.
"Értelmes összehasonlítást csak akkor kapsz, ha az átlagot az átlaggal hasonlítod, vagy a kivételt a kivétellel." -- No és miért ne lehetne megemlíteni pár régi kivételt a mai átlaghoz képest?
"Ez rád is vonatkozik." -- Én igyekszem figyelni.
"FPS-nél vagy szimulátornál lehet kevés. Bár engem nem zavar annyira. Viszont RTS-nél bõven elég ennyi." -- Engem bárhol zavar a 20-30fps. Az egyszerûen nem folyamatos, hanem darabos, így nem természetes, rossz a szemnek.
"Ezt mondom én is. Adott a SIMD környezet és adott a nem SIMD feladat. Az eredmény kihasználatlan gflops-ok tömege." -- Ha mindenáron egy SPE-vel akarjuk csinálni. (Bár ha más dolga úgysincs, akkor mindegy.) És nem egy PPE szál.
"Nos ezzel csupán átlagosan tudod csökkenteni a késleltetés hatását. Az adott feladat, ami vár a memóriára nem lesz gyorsabb." -- Ilyen nyilvánvalóságokat minek írsz le, amikor éppen ebbõl indultunk ki? Nos, ha több feladatod van, amiket így is-úgy is végre kell hajtanod, akkor mindegy, hogy gyorsan és egymás után, vagy egyenként kicsit lassabban, de párhuzamosan hajtódnak végre.
"Egyébként pont az in-order mûködés miatt nincs meg az a párhuzamosítás ami máshol ezt megoldaná. Más szálak végrehajtása szintén segít, de csak ha vannak." -- Ezzel meg mit akarsz mondani? Itt alapvetõen több szálról van szó. Miért ne lenne több szál? Oké, a motorok ma még egyszálasak (de mint szó volt róla ezen ideje változtani, pc-n is), de van ott még más feladat is bõven (GPU driver, hangeffektek, stb.).
"Nem ez a lényeg, hanem hogy aki X2-t vesz, annak nem fognak gyengébben futni az 1 szálú játékok. Tehát a 2 mag kihasználása nem égetõ kényszer, hanem egy lehetõség." -- Na de hát most írom, hogy az olcsóbb X2-k magonkénti órajele kevesebb, mint egy nálánál olcsóbb csúcs-egymagosé! (Ha a túlhúzást is beszámítjuk, akkor is igaz, mert egy dual-core általában nem húzható annyira, mint az egymagos társa.)
"Az is csinálja persze, de nem varázsló. Csak abból tud dolgozni, amit a programozó odaad neki. Ha a cache-gyilkos kódot írsz, azzal nem tud mit kezdeni. Nem tudja helyetted eldönteni, hogy a float-tal double-lal, vagy int-tel lesz gyorsabb az algoritmusod. Meg még csomó ilyen apróság van, ami nagyon tudja befolyásolni a futás sebességét. De még a magasabb szintû algoritmusok és adatszerkezetek is számíthatnak." -- Épp ezért írtam, hogy ilyen dologra azért oda kell figyelni.
"PC-n is célszerû lineárisan olvasni a memóriát, de a konzolokon ez sokkal fontosabb. Emiatt pl. a lineáris keresés néha gyorsabb lehet a binárisnál. A konzol CPU-k speciális felépítése miatt sokkal több ilyen dologra kell figyelni, és sokkal többet számítanak. Ezek megtanulása idõbe telik. És akkor még nem is beszéltünk az SPE-krõl, amiket alapvetõen másképp kell programozni." -- Egy igazán jó programozó hamar megtanulja ezeket.
"Persze, hiszen még ki se jött a Vista. De már fél éve volt (béta) driver rengeteg hardverhez." -- De itt az XP-rõl volt szó. Arra írtad, hogy a 64 bitesre is van elég driver, pedig nincs.
"Nyílván ami a rendszerbe belepiszkál (pl Daemon Tools). De ezek nem a 32-64 bittõl függenek. És nyílván lesz majd áj verziójuk. Sajnos nem volt idõm komolyabban tesztelni a kompatibilitást, de az a pár progi, amit elindítottam gond nélkül ment. Az MS eddig nagyon komolyan vette a kompatibilitást, úgyhogy nem aggódom." -- Én jópár programról hallottam, ami nem ment rendesen. Úgyhogy pár dolog mégiscsak megváltozhatott. És a hírek szerint a 32 és 64 bites Vista között is lesz pár alapvetõ különbség.
Jól néz ki. De csak 4-5GHz, és még nincs is a piacon. Ez a technológia már biztosan nem lesz a cell-ben. És a magas órjelet csak 65nm-en tudták elérni, a cell meg még 90nm-en készül. És 750 millió tranzisztor van benne, míg a teljes cell csak 230 millió, és ennek is csak kis része a PPE.
"PC-kocka != hülye. Itt inkább programozási stílusról, izlésrõl van szó. Van, aki kedveli a különlegességet."
Nos, ha hobbiról van szó, akkor a különlegesség jó, ha viszont határidõre elvégzendõ munkáról, akkor az embre sokkal jobban szereti a jól ismert dolgokat.
"Talán ha shaderprogramokat is írt."
Hát érdekesen nézne ki egy mai 3D motor shader-ek nélkül.
"Ettõl eltekintve nem kellett túl sokat foglalkoznia a GPU-val"
Az optimalizáláshoz mindíg alaposan ismerni kell a hardvert.
"Remélhetõleg a munkája minõségében nem mutatkozik meg a hozzáállása. De szerintem ilyen hozzáállással nem fogja tökéletesen kihasználni a HW-t."
Tehát még mindíg azt mondod, hogy a cell az tökéletes, tehát ha neki nem jött be, akkor õ a hülye. Az nem jutott eszedbe, hogy õ már látta, sõt programoztta a cell-t, te meg nem? Nem lehet, hogy esetleg õ jobban tudja?
"Nem úgy általában nem csinál jó kódot, csak talán nem lesz kedve túl sokat "szívni" a Cellel."
Nem csak a "szívás" a lényeg, hanem az objektív korlátok. A "szívás" meg azt jelenti, hogy csak soká (évek múlva) fogják tudni jól kihasználni.
"A PS2-t is sokan szídták. De aztán belejöttek."
Mennyi idõ alatt? Még a legutolsó játékok is jobban kihasználták, mint az eggyel korábbi generáció. Tehát évekig tartott kiismerni. A cell meg még egzotikusabb cuccos.
"Van, aki szereti a kihívásokat (amiknek viszont meg van az eredménye), és van, aki nem."
Megint csak arról van szó, hogy hobbi, vagy munka. Az ember otthon elszöszöl mindenfélével, és nem érdekes, hogy meddig tart, vagy sikerül-e egyáltalán. Viszont ha munkáról van szó, akkor nem te döntöd el, hogy mit csinálsz, és még határidõ is van (általában szûk). A másik meg hogy lehet cél a PS3 programozása, és akkor annál izgalmasabb, minél egzotikusabb a hardver, és lehet cél a játékfejlesztés, amikor meg azt szeretné az ember, hogy egyszerûen programozható, ismerõs hardver legyen a keze alatt (és minél több teljesítmény persze). A kettõ akkor békíthetõ össze, ha az új platform valami olyat tud, amire jó játékot lehet írni. A cell ilyet igazából nem kínál szerintem. A teljesítménye leginkább fizikára használható ki jelenleg, amit viszont már PC-n is meg lehet valósítani. Jön már a dualcore CPU, a GPU-s fizika, és a Physix chip is. Egy modern GPU is tud annyi gflop-ot, mint a cell (persze a gflop önmagában kevés). Igaz, a cell olcsóbb, de a fejlesztõ szempontjából ez nem olyan fontos, fõleg ha csak a kihívás érdekli, nem a profit.
"Már csak néhány névre emlékszem. C64: Mercenary, Elite, stb., Amiga: Virus, stb."
Ezek közül a Mercenary-t ismerem. A játékmenete valóban nagyon komplex volt, de nem errõl beszéltem. Sajnos manapság nem a játékmenetre gyúrnak, hanem grafikára. A komplexitás a megvalósítás részleteiben van. A világot realisztikussá és élõvé tenni iszonyat sok munka.
De hogy tisztázzuk : arról akarsz meggyõzni, hogy régen kevesebb ember, kevesebb idõ alatt, nagyságrenddekkel gyengébb gépekre ugyanolyan komplex játékokat készített?
Elvben válaszoltam erre is, de úgy tûnik nem ment el.
"Nos ez a korábban taglalt 3. eset lenne, de itt az 1. esetrõl beszéltünk."
De én pontosan errõl az esetrõl beszélek.
"Ez már "újgenerációs" dolog, hiszen régen eleve nem lehetett annyi poligon, amennyi ehhez kell."
Pontosan errõl beszélek. Régen nem volt, ma van -> nagyobb komplexitás.
"Kissé keverednek itt a dolgok, itt nem a régi játékokról volt szó, hanem a SPE-krõl."
Te említetted a Z80-at. Erre mondtam, hogy akkoriban sokkal kevesebb adattal dolgoztak, így nem meglepõ, hogy elboldogult kevés memóriával is. Érdekes, hogy mennyit idézik BG mondását, miszerint 640K legyen elég mindenkinek. Ehhez képest most arról akarsz meggyõzni, hogy 256K elég mindenre.
"Ejj, te nem, én viszont igen, lévén arról beszéltem, hogy voltak kivételek."
Értelmes összehasonlítást csak akkor kapsz, ha az átlagot az átlaggal hasonlítod, vagy a kivételt a kivétellel.
"Tudod, néha a másik ember is mond valamit, és ha értelmesen akarsz beszélgetni, akkor oda kell figyelni, mit is mond."
Ez rád is vonatkozik.
"20-30fps kevés. Elég tré lenne egy olyan játék, ami sosem megy többet ennyinél."
FPS-nél vagy szimulátornál lehet kevés. Bár engem nem zavar annyira. Viszont RTS-nél bõven elég ennyi.
De mindegy, pár százmillió mûvelet is túl nagy terhelés lenne egy fejlett x86-nak is, mivel más dolga is van.
"Nem túl optimális egy-egy adattal dolgozni SIMD környezetben, ebben nincs semmi meglepõ."
Ezt mondom én is. Adott a SIMD környezet és adott a nem SIMD feladat. Az eredmény kihasználatlan gflops-ok tömege.
"Dehogynem. Már írtam: párhuzamosan több feladat végzése. Ilyenkor nem holt idõ a késleltetés miatti várakozás."
Nos ezzel csupán átlagosan tudod csökkenteni a késleltetés hatását. Az adott feladat, ami vár a memóriára nem lesz gyorsabb. Egyébként pont az in-order mûködés miatt nincs meg az a párhuzamosítás ami máshol ezt megoldaná. Más szálak végrehajtása szintén segít, de csak ha vannak.
Nem ez a lényeg, hanem hogy aki X2-t vesz, annak nem fognak gyengébben futni az 1 szálú játékok. Tehát a 2 mag kihasználása nem égetõ kényszer, hanem egy lehetõség.
"A komplikáltabb optimizációt eddig is a compiler csinálta."
Az is csinálja persze, de nem varázsló. Csak abból tud dolgozni, amit a programozó odaad neki. Ha a cache-gyilkos kódot írsz, azzal nem tud mit kezdeni. Nem tudja helyetted eldönteni, hogy a float-tal double-lal, vagy int-tel lesz gyorsabb az algoritmusod. Meg még csomó ilyen apróság van, ami nagyon tudja befolyásolni a futás sebességét. De még a magasabb szintû algoritmusok és adatszerkezetek is számíthatnak. PC-n is célszerû lineárisan olvasni a memóriát, de a konzolokon ez sokkal fontosabb. Emiatt pl. a lineáris keresés néha gyorsabb lehet a binárisnál. A konzol CPU-k speciális felépítése miatt sokkal több ilyen dologra kell figyelni, és sokkal többet számítanak. Ezek megtanulása idõbe telik. És akkor még nem is beszéltünk az SPE-krõl, amiket alapvetõen másképp kell programozni.
Talán ezt az in-order dolgot is el tudja intézni, amiennyire lehet. Esetleg valamennyire oda kell figyelni. Ezeken kívül kb. ugyanazok az elvek érvényesek, mint eddig: minnél több regiszter használata, stb.
"Hát, én nem egészen ezt hallottam eddig: nem mindenhez van driver"
Persze, hiszen még ki se jött a Vista. De már fél éve volt (béta) driver rengeteg hardverhez.
"és pár dolog nem fut rendesen."
Nyílván ami a rendszerbe belepiszkál (pl Daemon Tools). De ezek nem a 32-64 bittõl függenek. És nyílván lesz majd áj verziójuk. Sajnos nem volt idõm komolyabban tesztelni a kompatibilitást, de az a pár progi, amit elindítottam gond nélkül ment. Az MS eddig nagyon komolyan vette a kompatibilitást, úgyhogy nem aggódom.
"Tehát, aki nem ért egyet veled (más nem tudsz róla), az mindenképpen csak hülye lehet." PC-kocka != hülye. Itt inkább programozási stílusról, izlésrõl van szó. Van, aki kedveli a különlegességet.
"Egyébként, ha nem figyeltél volna, 3D-t programozott, amibe erõsen beletartozik a GPU programozása is, ami meg jobban hasonlít a cell-re, mint az x86-okra." Talán ha shaderprogramokat is írt. Ettõl eltekintve nem kellett túl sokat foglalkoznia a GPU-val, hanem a DirectX API-ját kellett használnia, a mélyebb dolgokat DirectX és a GPU-driver intézi...
"Nos, az ileltõ cég maga a Sony. És nem nem igazán akarják kirúgni." Remélhetõleg a munkája minõségében nem mutatkozik meg a hozzáállása. De szerintem ilyen hozzáállással nem fogja tökéletesen kihasználni a HW-t. De az is lehet, hogy csak nektek panaszkodott, azért nem utálja ennyire.
"Hát, nálunk olyan 3D motort csinált, ami lealázta a konkurenciát." Látom, nem értetted, amit írtam. Nem úgy általában nem csinál jó kódot, csak talán nem lesz kedve túl sokat "szívni" a Cellel.
"Ja, így már értem. Mi akadályoz meg téged, hogy a helyében legyél? Ha olyan jó vagy, akkor ez nem okozhat gondot." Nem lehet 1 lépésben oda kerülni, és nincs kedvem újramászni a létrát. Az utóbbi években amúgy is távol sodródtam a játékprogramozástól. De kacsingatok visszafelé.
"Egyébként mint mondtam nem csak õ van rossz véleménnyel a PS3-ról és az XBox-ról, hanem az összes programozónk, akivel beszéltem. De hasonló panaszokat hallottam azoktól a fejlesztõktõl is, akik már dolgoznak rajtuk." Elhiszem, hogy panaszkodnak, nyilván egyszerûbb lenne a dolguk egy 10GHz-es egyszerû CPU-val. A PS2-t is sokan szídták. De aztán belejöttek. Van, aki szereti a kihívásokat (amiknek viszont meg van az eredménye), és van, aki nem.
"Igen, csakhogy ez nem egy egyszerû folyamat. PC-n egy mag se lassabb, mint a régebbiek, így ha ki nek is használják, legalább visszaesés nincs." Ez akkor igaz, ha nem számít az ár: a legdrágább (leggyorsabb) egymagos is olcsóbb, mint a legolcsóbb (magonként leglassabb) kétmagos... (Ugyanabból a családból.)
"És használhatók a megszokott programozási technikák, és optimalizációk, csaupán a többszálúsításra kell figyelni." A komplikáltabb optimizációt eddig is a compiler csinálta. Talán ezt az in-order dolgot is el tudja intézni, amiennyire lehet. Esetleg valamennyire oda kell figyelni. Ezeken kívül kb. ugyanazok az elvek érvényesek, mint eddig: minnél több regiszter használata, stb.
"A 32 és 64 bites verzió közt nincs más különbség. Tehát akinek 64 bites procija van, annak értelmetlen 32 biteset használni. Ugyanúgy fut rajta minden 32 bites app, és driver is ugyanúgy van rá." Hát, én nem egészen ezt hallottam eddig: nem mindenhez van driver (ezt el is hiszem), és pár dolog nem fut rendesen. De ha nem így van, az jó.
"Az elég ütõs lenne. Tudsze errõl valami pontosabbat?" PPC 970GX, >3GHz, kisebb hõtermelés (90nm?).
"Nos, lehet, hogy a srác jól programozik pc-n, de úgy tûnik, tipikus pc-kocka, akinek minden, ami más, mint a megszokott egyszerû felállás, alapból "szar"."
Tehát, aki nem ért egyet veled (más nem tudsz róla), az mindenképpen csak hülye lehet. Egyébként, ha nem figyeltél volna, 3D-t programozott, amibe erõsen beletartozik a GPU programozása is, ami meg jobban hasonlít a cell-re, mint az x86-okra.
"Az illetõ cég helyében én két lábbal rúgnám ki, ha meghallanám, hogy így áll hozzá..."
Nos, az ileltõ cég maga a Sony. És nem nem igazán akarják kirúgni.
"Mivel vélhetõen úgysem fog igazán jó kódot csinálni."
Hát, nálunk olyan 3D motort csinált, ami lealázta a konkurenciát.
"Az ilyet amúgy is utálom, mert nekem kellene a helyében lennem.
Ja, így már értem. Mi akadályoz meg téged, hogy a helyében legyél? Ha olyan jó vagy, akkor ez nem okozhat gondot.
Egyébként mint mondtam nem csak õ van rossz véleménnyel a PS3-ról és az XBox-ról, hanem az összes programozónk, akivel beszéltem. De hasonló panaszokat hallottam azoktól a fejlesztõktõl is, akik már dolgoznak rajtuk.
"Te magad is írtad máshol, hogy jópár más feladat is van még azon kívül, és ezek szépen futhatnak külön szálakon."
Igen, de ezek jó része az SPE-ken fog futni. De tényleg van olyan, ami mehet itt.
"De amúgy is a többszálúsítás a jövõ, nem csak itt, pc-n is erre kell ráállni game-motor téren is."
Igen, csakhogy ez nem egy egyszerû folyamat. PC-n egy mag se lassabb, mint a régebbiek, így ha ki nek is használják, legalább visszaesés nincs. És használhatók a megszokott programozási technikák, és optimalizációk, csaupán a többszálúsításra kell figyelni.
"Azért talán van, ugyanis a RISC azon alapul, hogy egyszerûbbek az utasítások, így nincs szükség annyi lépésre a dekódoláshoz."
"Igen, szerintem is default 64 bitesnek kellett volna lennie a Vistának, és csak mint special edition jöhetett volna inkább a 32 bites verzió."
A 32 és 64 bites verzió közt nincs más különbség. Tehát akinek 64 bites procija van, annak értelmetlen 32 biteset használni. Ugyanúgy fut rajta minden 32 bites app, és driver is ugyanúgy van rá.
"Viszont ez nem lett volna azért annyira zökkenõmentes, mivel a 64 bites XP-n is jópár 32 bites program nem futott rendesen"
Elvben nem lassulnak észrevehetõen a 32 bites progik. Sõt akár gyorsulhatnak is a jobb memóriakezelés, meg egyebek miatt.
"Pedig egy ideje éppen ilyesmit is gyárt az IBM, saját szervereibe."
Az elég ütõs lenne. Tudsze errõl valami pontosabbat?
Nos, lehet, hogy a srác jól programozik pc-n, de úgy tûnik, tipikus pc-kocka, akinek minden, ami más, mint a megszokott egyszerû felállás, alapból "szar". Az ilyen minek megy PS3-kódernek? Az illetõ cég helyében én két lábbal rúgnám ki, ha meghallanám, hogy így áll hozzá... Mivel vélhetõen úgysem fog igazán jó kódot csinálni. Az ilyet amúgy is utálom, mert nekem kellene a helyében lennem. :)
"Ahhoz meg több szálon kéne futni, nem?" Igen, de nem feltétlenül a game-motor magjának. Te magad is írtad máshol, hogy jópár más feladat is van még azon kívül, és ezek szépen futhatnak külön szálakon. De amúgy is a többszálúsítás a jövõ, nem csak itt, pc-n is erre kell ráállni game-motor téren is.
"Ilyet sose mondtam. Azt mondtam, hogy a tervezési filozófia hasonló lehetett." Lehetett távoli hasonlóság, de az IBM okosabb, mint az Intel, több alap-kutatást végez, jobban tudhatta, hogy az úgy nem nagyon fog menni. Amúgy sem arra törekedtek, hogy már korábban is minnél magasabb legyen az órajel, miközben a teljesítmény semmivel sem nagyobb (nem akartak ezzel senkit félrevezetni), csak hogy jópár évvel késõbb érje - talán - utól magát a dolog.
"Nem vagyok benne biztos, hogy ennek a megkülönböztetésnem van még értelme, de mindegy." Azért talán van, ugyanis a RISC azon alapul, hogy egyszerûbbek az utasítások, így nincs szükség annyi lépésre a dekódoláshoz. Persze itt már van SIMD is, ami ebbe kicsit belezavar.
"Nem reklamálok, csak mondom, hogy miért nem terjedt el a 64-bitres win. A Vista esetén ilyen körülmény nem áll fent. A júzer szempontjából nincs hátránya a 64-bitnek, elõnye viszont van (pl. már ma is gyakran kevés a 2GB címtartomány), és egyre több lesz idõvel." Igen, szerintem is default 64 bitesnek kellett volna lennie a Vistának, és csak mint special edition jöhetett volna inkább a 32 bites verzió. Viszont ez nem lett volna azért annyira zökkenõmentes, mivel a 64 bites XP-n is jópár 32 bites program nem futott rendesen (a driverek mellett, amikbõl viszont Vistán amúgy is új kell - ha csak ezekkel lett volna gond, egyszerûbb lenne a helyzet).
"Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi."
Az nem, de azok felett amúgy is egyre inkább eljár az idõ, és amellett van más feladat is, ami mehet külön szál(ak)on.
"Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban)." Ezt túlzásnak érzem.
"Volt arról szó, hogy a 3.2Ghz-et nem tudják tartani a PS3-nál." Az csak rémhír volt, és amúgy is a hûtéssel kapcsolatos, nem azzal, mit bír a chip.
"Egyébként a G5-tel nem lehet egy az egyben összehasonlítani, mert nem konkrétan abból lett butítva. Szóval a relatív frekvencia nem feltétlen tükrözi a teljesítmény viszonyokat. Nyílván, ha egy G5 mag képes lenne 3-4GHz-re akkor gyártanának olyat." Pedig egy ideje éppen ilyesmit is gyárt az IBM, saját szervereibe. Úgy tûnik, eleve nem is akarták odaadni az Apple-nek. A számát most nem tudom.
"Hát nem igazán. Pont az a lényeg, hogy nem tudom elõre, hogy honnan fog kelleni az adat. Ez a számolás közben derül ki." Nos ez a korábban taglalt 3. eset lenne, de itt az 1. esetrõl beszéltünk.
"Akkor nem érted amit mondok. Nem a poligonszám érdekes. Az fõként a rendert lassítja. A lényeg az, hogy a gamelogic 2D-ben nagyságrenddel egyszerûbb lehet, mint 3D-ben." Én is épp errõl beszélek. Olyan játékokról, ahol már szintén nem csak a megjelenítés volt 3D-s.
"Ehhez jön még hozzá, hogy ha már szép 3D a környezet, akkor már elvárják, hogy viselkedjen is valósághûen (pl. a szélben mozogjanak a fák, lobogjanak a zászlók, meg csillió ilyen CPU és RAM zabáló apróság)." Ez már "újgenerációs" dolog, hiszen régen eleve nem lehetett annyi poligon, amennyi ehhez kell.
"Na persze, sokkal kisebb térképen, sokkal kevesebb extra adattal. Emlékeim szerint a legtöbb RTS-nek nem volt túl jó útkeresõje." Kissé keverednek itt a dolgok, itt nem a régi játékokról volt szó, hanem a SPE-krõl. :)
"Mert nem kivételekrõl beszélünk. Én legalábbis nem." Ejj, te nem, én viszont igen, lévén arról beszéltem, hogy voltak kivételek. Tudod, néha a másik ember is mond valamit, és ha értelmesen akarsz beszélgetni, akkor oda kell figyelni, mit is mond. :)
"Sok millió != 100 millió. És nem 60 FPS, csak 20-30. Tehát pár száz millió mûveletrõl van szó." 20-30fps kevés. Elég tré lenne egy olyan játék, ami sosem megy többet ennyinél. De mindegy, pár százmillió mûvelet is túl nagy terhelés lenne egy fejlett x86-nak is, mivel más dolga is van.
"Azért nem egészen." Jó esetben igen.
"Persze csak akkor ugye a max. teljesítmény nem 256GFlops, hanem jóval kevesebb." Nem túl optimális egy-egy adattal dolgozni SIMD környezetben, ebben nincs semmi meglepõ.
"Hogy közömbösíthetõ? Eddig nem igazán sikerült senkinek." Dehogynem. Már írtam: párhuzamosan több feladat végzése. Ilyenkor nem holt idõ a késleltetés miatti várakozás. (Ez pl. a gpgpu-s doksikban is szépen le van írva, ha nem hiszed.)
Volt itt valamelyik nap egy srác, aki pár hónapja ment el tõlünk a Sony-hoz Angliába. PS3-ra fejleszt. Én sajnos nem tudtam vele errõl beszélni, de a többiek azt mondták, hogy szerinte se igazán jó (konkrétan a "szar" kifejezés hangzott el). És hogy mennyire tud õ programozni (eltekintve attól, hogy a Sony felvette)? Nos, õ írta a 3D motorunk nagy részét, ami nagyon jó.
Az X360-ról meg egy egész elõadás volt, amire sajnos nem tudtam elmenni, de majd menézem videóról, ha lesz idõm. Pár érdekességet emséltek róla a többiek. Pl.: A float mûveletek gyorsak, de az összehasonlítás rettenetesen lassú. Az int-eknél meg a mûveletek lassúak és az összehasonlítás gyors. Az int<->float konverzió pedig gyors, kivéve, ha azonnal felhasználod az eredményt, mert akkor nagyon lassú. Izgalmas lesz erre optimalizálni.
"és te talán nem is hinnéd, hogy egy akkori, a maiaknál több nagyságrenddel kisebb teljesítményû gép is elboldogult velük."
Már hogy ne hinném, amikor saját szememmel láttam? Mondtam, hogy C16-on kezdtem programozni. Láttam, hogy mit ki lehetett hozni azokból a gépekbõl. De ugyanígy láttam azt is, hogy mennyivel egyszerûbb volt minden akkor.
"Még 1x: nem hiszem, hogy pont az IBM másolta volna az Intelt."
Ilyet sose mondtam. Azt mondtam, hogy a tervezési filozófia hasonló lehetett.
"Továbbá egész más architektúra, az egyik alapvetõen CISC, a másik meg RISC."
Nem vagyok benne biztos, hogy ennek a megkülönböztetésnem van még értelme, de mindegy.
"A MS-nál reklamálj..."
Nem reklamálok, csak mondom, hogy miért nem terjedt el a 64-bitres win. A Vista esetén ilyen körülmény nem áll fent. A júzer szempontjából nincs hátránya a 64-bitnek, elõnye viszont van (pl. már ma is gyakran kevés a 2GB címtartomány), és egyre több lesz idõvel.
"Meg be is tettek a HW SMT érdekében. Úgy gondolták, az fontosabb."
Hát bizonyos esetekben esetleg lehet jobb, de általában nem az. Egy tipikus egy szálon futó gamelogic kód szerintem semmi hasznát nem veszi. Annál inkább kéne neki a többi kidobot fícsör (ebbõl a szempontból egy 386-oshoz hasonlít tudásban).
"Nem. A leggyorsabb G5 2GHz körül megy. A Cell meg 4GHz-en is képes üzemelni, a PS3-ban speciel 3.2GHz-en megy."
Volt arról szó, hogy a 3.2Ghz-et nem tudják tartani a PS3-nál. Egyébként a G5-tel nem lehet egy az egyben összehasonlítani, mert nem konkrétan abból lett butítva. Szóval a relatív frekvencia nem feltétlen tükrözi a teljesítmény viszonyokat. Nyílván, ha egy G5 mag képes lenne 3-4GHz-re akkor gyártanának olyat.
"Megteheted, hogy a PPE-vel összeszeded az adatokat sok helyrõl egy helyre"
Hát nem igazán. Pont az a lényeg, hogy nem tudom elõre, hogy honnan fog kelleni az adat. Ez a számolás közben derül ki.
""Ismétlem : nem a grafikáról beszélek, hanem a 3D környezetrõl." Ha nem lett volna egyértelmû: én is."
Akkor nem érted amit mondok. Nem a poligonszám érdekes. Az fõként a rendert lassítja. A lényeg az, hogy a gamelogic 2D-ben nagyságrenddel egyszerûbb lehet, mint 3D-ben. Ehhez jön még hozzá, hogy ha már szép 3D a környezet, akkor már elvárják, hogy viselkedjen is valósághûen (pl. a szélben mozogjanak a fák, lobogjanak a zászlók, meg csillió ilyen CPU és RAM zabáló apróság).
"Olyan nagyon sokat nem hiszem. Ez olyasmi, mint egy fillezõ algoritmus - nos egy ZX80 is elboldogult az ilyesmivel a párkás ramjával."
Na persze, sokkal kisebb térképen, sokkal kevesebb extra adattal. Emlékeim szerint a legtöbb RTS-nek nem volt túl jó útkeresõje. A körökre osztott játékoknál meg ugye nem kell magyaráznom, hogy mennyivel egyszerûbb a dolog.
"Ha a kivételekrõl beszélünk, akkor miért lenne az átlag a lényeg?"
Mert nem kivételekrõl beszélünk. Én legalábbis nem.
"Aha, persze. Egy gyors x86 CPU sem boldogulna ennyivel: mondjuk 100 millió * 60 (fps) = 6 milliárd mûvelet..."
Sok millió != 100 millió. És nem 60 FPS, csak 20-30. Tehát pár száz millió mûveletrõl van szó.
"A késleltetést meg közömbösíti a párhuzamos feladatvégzés."
Azért nem egészen.
"Na, akkor most egy SPE nem lesz fullosan kihasználva, nem nagy dolog."
Persze csak akkor ugye a max. teljesítmény nem 256GFlops, hanem jóval kevesebb.
""Nem a sávszélesség a lényeg, hanem a késleltetés." Ami közömbösíthetõ."
Hogy közömbösíthetõ? Eddig nem igazán sikerült senkinek.
Ehh, nyilván én sem azt mondtam, hogy egy súlycsoportban voltak komplexitásban, hanem azt, hogy voltak az átlagnál összetettebb játékok (nem csilivili grafikában), és te talán nem is hinnéd, hogy egy akkori, a maiaknál több nagyságrenddel kisebb teljesítményû gép is elboldogult velük.
"A cell-nél meg az integrált RAM eszik sok tranyót." Tévedés: kb. az 1/8-át. Nem pedig a felét, vagy még többet, mint x86-nál a L2-L3.
"A cell PPE-je a G5-nél is sokkal egyszerûbb." Bizonyos dolgokban egyszerûbb, más dolgokban összetettebb. Ez HW SMT-s, a G5 nem.
"Ennyire nem vagyok járatos a témában, de logikusnak tûnik, hogy az egyszerûbb felépítés azt jelenti, hogy az utasításokat jobban szét kell bontani, vagyis hosszabb a futószalag. És ne felejtsd el, hogy a cell-t is a akkoiban kezdték tervezni, amikor a P4 kijött, és akkor még mindenki azt hitte, hogy 2000-re 10Ghz-es procik lesznek." Még 1x: nem hiszem, hogy pont az IBM másolta volna az Intelt. Továbbá egész más architektúra, az egyik alapvetõen CISC, a másik meg RISC.
"Konkréten nem tudom milyen hosszú, de azt írták, hogy az, és gondolom nem nehéz két kicsi számot összehasonlítani. Tudsz konkrét számokat?" Nem, és most nincs is idõm utánanézegetni.
"Értelmetlen lenne 64 bites procin 32 bites OS-t használni, amikor a 64-bitesnek gyakorlatilag csak elõnye van. A 64 bites XP egy évet késett, és addigra már mindenki kiábrándult belõle, és a Vistát várta, eézrt nem terjedt el." A MS-nál reklamálj...
"Nem túlzás, jelentõs mennyiségû logikát szedtek ki belõle." Meg be is tettek a HW SMT érdekében. Úgy gondolták, az fontosabb.
"Az órajelet meg mintha épp csökkentették volna, nem?" Nem. A leggyorsabb G5 2GHz körül megy. A Cell meg 4GHz-en is képes üzemelni, a PS3-ban speciel 3.2GHz-en megy.
"PPE<->SPE" Megteheted, hogy a PPE-vel összeszeded az adatokat sok helyrõl egy helyre (elhanyagolható idõ alatt), és azt - ugyancsak egy pillanat alatt - beolvastatod blokkosan egy SPE-vel.
"Ismétlem : nem a grafikáról beszélek, hanem a 3D környezetrõl." Ha nem lett volna egyértelmû: én is.
"Sajnos nem. Még maga a térkép talán, de a keresés maga is jó sok memóriát igényel." Olyan nagyon sokat nem hiszem. Ez olyasmi, mint egy fillezõ algoritmus - nos egy ZX80 is elboldogult az ilyesmivel a párkás ramjával.
"Lényeg : Régi átlag játék sokkal AI-ja egyszerûbb (vagy nincs is), mint mai átlag játék." Ha a kivételekrõl beszélünk, akkor miért lenne az átlag a lényeg?
"Ahányszor még megpróbálod kimagyarázni, hogy de mégsem úgy van." Inkább te próbálsz bemagyarázni dolgokat... :P
"Igen." Aha, persze. Egy gyors x86 CPU sem boldogulna ennyivel: mondjuk 100 millió * 60 (fps) = 6 milliárd mûvelet...
"Nem kell millió ahhoz, hogy 256K RAM elfogyjon. A gráf pontjai általában 1 Byte-nál jóval nagyobbak. Nálunk pl. most épp 44Byte (igaz, ennek fele csak a számolások gyorsítása miatt van tárolva)." Mindegy, akkor majd csinálja a PPE. Ez x86-on is az idõ kis részét teszi ki, itt sem lehet gond. (A késleltetést meg közömbösíti a párhuzamos feladatvégzés.)
"Az, hogy "nem sok adattal egyszerre" máris azt jelenti, hogy a téynleges teljesítmény töredéke az elméleti maximumnak." Na, akkor most egy SPE nem lesz fullosan kihasználva, nem nagy dolog.
"Nem a sávszélesség a lényeg, hanem a késleltetés." Ami közömbösíthetõ.
"A Windowsos exe-k mindig is sokkal többet foglaltak, még ha ugyanazt is csinálták."
Ismétlem : "Persze ez sokmindentõl függ, de azért a pár száz KB a 10MB-vel nincs egy súlycsoportban."
De ha ez nem gyõz meg, nézd meg a fejlesztési idõket, és költségeket. Akik régebben vannak a cégnél, azok is azt mondják, hogy akár 3-4 évvel ezelõtt is kb. egy nagyságrenddel kevésbbé komplexek voltak a játékok (nem játékmenetben, hanem kódban).
"Messze nem csak ettõl. Pentiumok esetén a tranyók nagy része a L2-L3 cache-ban foglal helyet."
A cell-nél meg az integrált RAM eszik sok tranyót.
"Továbbá, a G5 is jóval kevesebb tranzisztorral beéri"
A cell PPE-je a G5-nél is sokkal egyszerûbb.
"Persze, majd biztos a P4-rõl másolták..."
Ennyire nem vagyok járatos a témában, de logikusnak tûnik, hogy az egyszerûbb felépítés azt jelenti, hogy az utasításokat jobban szét kell bontani, vagyis hosszabb a futószalag. És ne felejtsd el, hogy a cell-t is a akkoiban kezdték tervezni, amikor a P4 kijött, és akkor még mindenki azt hitte, hogy 2000-re 10Ghz-es procik lesznek.
"Nem olyan hosszú az a futószalag."
Konkréten nem tudom milyen hosszú, de azt írták, hogy az, és gondolom nem nehéz két kicsi számot összehasonlítani. Tudsz konkrét számokat?
"Mellesleg mi az, hogy "nem nagyon"? Aki 32 bites OS-t futtat (98%), az egyátalán nem."
Na, ezt jelenti a nem nagyon.
"Nem igazán, abból is lesz 32 bites és 64 bites, és a többség továbbra is a 32 biteset fogja használni."
Értelmetlen lenne 64 bites procin 32 bites OS-t használni, amikor a 64-bitesnek gyakorlatilag csak elõnye van. A 64 bites XP egy évet késett, és addigra már mindenki kiábrándult belõle, és a Vistát várta, eézrt nem terjedt el.
"Szerintem az "erõsen" az túlzás. És ne feledd az órajelemelést sem."
Nem túlzás, jelentõs mennyiségû logikát szedtek ki belõle. Az órajelet meg mintha épp csökkentették volna, nem?
"Te olvasol is néha, vagy csak hányod a szavakat?"
Ezt én is kérdezhetném tõled.
"Ismétlem: én is 3D-rõl beszéltem, csak nem csillió poligonnal."
Ismétlem : nem a grafikáról beszélek, hanem a 3D környezetrõl.
"Egy ilyen négyzetrácsos tábla beférhet akár 1-2 SPE ramjába is."
Sajnos nem. Még maga a térkép talán, de a keresés maga is jó sok memóriát igényel.
"Igen, a legtöbb régi játékban nem volt AI, de mint írtam, voltak kivételek."
Lényeg : Régi átlag játék sokkal AI-ja egyszerûbb (vagy nincs is), mint mai átlag játék.
"Hányszor fogjuk ezt is még újraiterálni?"
Ahányszor még megpróbálod kimagyarázni, hogy de mégsem úgy van.
"Sokmilliónyi? (Frémenként!?)"
Igen.
"És amúgy mihez kell milliós elemszámú gráf?"
Nem kell millió ahhoz, hogy 256K RAM elfogyjon. A gráf pontjai általában 1 Byte-nál jóval nagyobbak. Nálunk pl. most épp 44Byte (igaz, ennek fele csak a számolások gyorsítása miatt van tárolva).
"Mást is egy ciklus alatt csinál, csak annyi, hogy nem sok adattal egyszerre."
Az, hogy "nem sok adattal egyszerre" máris azt jelenti, hogy a téynleges teljesítmény töredéke az elméleti maximumnak.
"Aha, hát persze, ha nem 50GB/s a hozzáférés, csak 25GB/s, akkor összedõl a világ..."
"Ettõl lesz sokkal egyszerûbb. Nézd meg a tranzisztorszámokat."
Messze nem csak ettõl. Pentiumok esetén a tranyók nagy része a L2-L3 cache-ban foglal helyet. Továbbá, a G5 is jóval kevesebb tranzisztorral beéri, mint akár a Pentium cache nélkül számolva. Ebben nem kis szerepe van az x86 arch. elavultságának, és ennek kompenzálására kifejlesztett dolgoknak.
"Plusz még ehhez jön a hosszú futószalag, ami már a P4-ek esetén egyszer csõdöt mondott (a cell-t kb. akkor kezdték tervezni, amikor a p4 kijött)." Persze, majd biztos a P4-rõl másolták... :P Nem olyan hosszú az a futószalag.
"Az A64 is 64 bites, csak eddig nem nagyon használták ki" És? Ki mondta, hogy nem? Mellesleg mi az, hogy "nem nagyon"? Aki 32 bites OS-t futtat (98%), az egyátalán nem.
"(majd a Vista ebben is segít)." Nem igazán, abból is lesz 32 bites és 64 bites, és a többség továbbra is a 32 biteset fogja használni.
"A többi meg jó dolog, csak nem biztos, hogy elegek. Ezt mérések nélkül nehéz eldönteni (az egyszerûbb felépítésrõl van tapasztalat, hiszen a régi procik olyanok voltak)." Csak épp ne hasonlítsd 1:1-ben a régebbi x86-osokhoz. (Fõleg hogy azokban HW-SMT sem volt soha.)
"A cell PPE-je nem G5, hanem egy erõsen butított változata." Szerintem az "erõsen" az túlzás. És ne feledd az órajelemelést sem.
"Tehát ennyit veszítessz a másolgatással." Milyen másolgatással?
" "Hát ez az, hogy 10-20 MHz-bõl is sokat ki lehet hozni." Sokat, de messze nem annyit, mint 3GHz-bõl. Nem tudom mit kell ezen magyarázni." Ezen? Semmit. Éppen azt mondom, hogy a 3GHz milyen sok is, ha nincs elhasználva mindenféle kiegészítõ mûveletre.
"Nem a poligonok számáról van szó, hanem arról, hogy egy 3D vektoros világot kezelni sokkal bonyolultabb, mint egy 2D négyzetrácsosat. Pl. megállapítani, hogy mire klikkelt a júzer." Te olvasol is néha, vagy csak hányod a szavakat? Ismétlem: én is 3D-rõl beszéltem, csak nem csillió poligonnal.
"Hanem?" Amit írtam, már elõbb is, meg fentebb is.
"Más algoritmusoknál probléma a méret. Pl. itt is lehet négyzetrácsa leképezni, és azon keresni (RTS-eknél gyakori)." Egy ilyen négyzetrácsos tábla beférhet akár 1-2 SPE ramjába is.
"Csak nézd meg a régebbi játékokat. A régi RTS-ekben pl. nem volt AI, hanem az ellenfélnek a pályaépítõk rakták le az épületeit, és állították be a gyártást, és a kész egységeket egyszerûen ellened küldte a gép. A mostani játékunkban viszont az AI maga épít fel mindent, gyûjt erõforrást, kitalálja, hogy mit kell gyártani, az egységekbõl csapatokat képez, megkeresi a védelmed gyenge pontjait, stb." Igen, a legtöbb régi játékban nem volt AI, de mint írtam, voltak kivételek. Hányszor fogjuk ezt is még újraiterálni?
" "Egy játék esetén hol kell sokmilliónyi hozzáférés ilyenekben?" Útkeresés, AI." Sokmilliónyi? (Frémenként!?)
"Nem, mert nem tudható elõre, hogy a gráf melyik pontja kell majd legközelebb. Mondjuk valamilyen szinten megoldható, ha nem túl nagy a gráf (pl. valamilyen módszerrel szektorokra bontjuk)." Nalátod. És amúgy mihez kell milliós elemszámú gráf?
"De akkor is ott van még az a probléma, hogy az SPE-k teljesítménye SIMD utasításokra van megadva, más jellegû feladatoknál lényegesen lassabbak." Mást is egy ciklus alatt csinál, csak annyi, hogy nem sok adattal egyszerre.
"Ha lassabb, akkor már rég rossz." Aha, hát persze, ha nem 50GB/s a hozzáférés, csak 25GB/s, akkor összedõl a világ... :P
Még a komplexitásról : Érdemes megnézni pl. az exe méret különbségeket. Persze ez sokmindentõl függ, de azért a pár száz KB a 10MB-vel nincs egy súlycsoportban.
"Egyrészt nem olyan sokkal egyszerûbb, csak mert in-order, és nem olyan kifinomult a branch-prediction."
Ettõl lesz sokkal egyszerûbb. Nézd meg a tranzisztorszámokat. Plusz még ehhez jön a hosszú futószalag, ami már a P4-ek esetén egyszer csõdöt mondott (a cell-t kb. akkor kezdték tervezni, amikor a p4 kijött).
"Viszont több általánosan használható regiszter van, mint akár AMD64-ben, HW SMP-s, 64 bites, stb."
Az A64 is 64 bites, csak eddig nem nagyon használták ki (majd a Vista ebben is segít). A többi meg jó dolog, csak nem biztos, hogy elegek. Ezt mérések nélkül nehéz eldönteni (az egyszerûbb felépítésrõl van tapasztalat, hiszen a régi procik olyanok voltak).
"Meg figyu: tudod, mennyivel gyorsabb az új Core Duo-s Mac a dual-G5-ös PowerMac-eknél? Átlagosan 1,5-2x... Akkor ehhez most add hozzá, hogy azok még a korábbi fejlesztésû 2GHz körüli G5-ök voltak."
A cell PPE-je nem G5, hanem egy erõsen butított változata.
"Hát ez az, hogy 10-20 MHz-bõl is sokat ki lehet hozni."
Sokat, de messze nem annyit, mint 3GHz-bõl. Nem tudom mit kell ezen magyarázni.
"Én is 3D-rõl beszélek. Az, hogy sokkal több a poligon, nem feltétlenül növeli annyival a komplexitást, csak a proci (és a GPU) terhelését."
Nem a poligonok számáról van szó, hanem arról, hogy egy 3D vektoros világot kezelni sokkal bonyolultabb, mint egy 2D négyzetrácsosat. Pl. megállapítani, hogy mire klikkelt a júzer.
"Én sem ilyen egyszerû táblás játékokról beszélek."
Hanem?
"Ha távolságokat mérnek, akkor oly mindegy, hogy egy nagyobb vagy egy kisebb poligont metsz a próbált iránysugár."
Más algoritmusoknál probléma a méret. Pl. itt is lehet négyzetrácsa leképezni, és azon keresni (RTS-eknél gyakori).
"Azért buta a többség, mert lusták (ohh, bocs, nincs elég idejük) jobbat csinálni. De ebbõl nem következik, hogy régebben még butábbak voltak."
Csak nézd meg a régebbi játékokat. A régi RTS-ekben pl. nem volt AI, hanem az ellenfélnek a pályaépítõk rakták le az épületeit, és állították be a gyártást, és a kész egységeket egyszerûen ellened küldte a gép. A mostani játékunkban viszont az AI maga épít fel mindent, gyûjt erõforrást, kitalálja, hogy mit kell gyártani, az egységekbõl csapatokat képez, megkeresi a védelmed gyenge pontjait, stb.
"Egy játék esetén hol kell sokmilliónyi hozzáférés ilyenekben?"
Útkeresés, AI.
"Szerintem ott létrehozhatók pártíz KB-os adatmezõk, amik szépen elférnek egy SPE local ramjában."
Nem, mert nem tudható elõre, hogy a gráf melyik pontja kell majd legközelebb. Mondjuk valamilyen szinten megoldható, ha nem túl nagy a gráf (pl. valamilyen módszerrel szektorokra bontjuk). De akkor is ott van még az a probléma, hogy az SPE-k teljesítménye SIMD utasításokra van megadva, más jellegû feladatoknál lényegesen lassabbak.
"Ja, arról még nem is beszéltünk, hogy valószínûleg egy SPE láthatja a többi ramját is, csak az azokhoz való hozzáférés lassabb"
"Nem hülyeség. A feladattól függõen nagyon sokat számíthat a sokkal egyszerûbb felépítés."
Egyrészt nem olyan sokkal egyszerûbb, csak mert in-order, és nem olyan kifinomult a branch-prediction. Viszont több általánosan használható regiszter van, mint akár AMD64-ben, HW SMP-s, 64 bites, stb.
Meg figyu: tudod, mennyivel gyorsabb az új Core Duo-s Mac a dual-G5-ös PowerMac-eknél? Átlagosan 1,5-2x... Akkor ehhez most add hozzá, hogy azok még a korábbi fejlesztésû 2GHz körüli G5-ök voltak.
" "Más feladatnál a CPU is gyengébb, mert ott is SIMD-bõl jön a FLOPS nagy része." Ezért nem a flops-ot nézzük."
Értelemszerûen más számítási feladatról beszélek, mivel (továbbra is) FLOPS-ról beszéltem. Csak olyanról, amihez nem passzol a SIMD, hanem az FPU-t kell használni. Apropó, a Power procik FPU-ja is elég erõs.
Tehát, SIMD SIMD-el eléggé összehasonlítható. (Mellesleg az SPE nem csak egy SIMD egység, hanem egy vektorprocimag, szóval más utasítások is vannak.)
" "Más dolgokban sem teljesen pontosak." Pl.?"
Most nem fogom itt kielemezni az egészet.
"Egyébként mintha lett volna egy cikk nemrég, ami arról szólt, hogy a wiki legalább olyan megbízható, mint az Encyclopaedia Britannica."
" "Aha, csak épp "lassan" is megvan egytízezred mp alatt." Az rettenetesen lassú. Az adattal végzett mûvelet nanosec nagyságrendû."
Igen, és 100000 x 10^-9 = 0,0001. A 100000 mûvelet van meg egytízezred mp alatt.
"A cikkben leírják szépen, hogy mi a probléma. Nagyon sokat számítanak ám ezek a dolgok az ilyen típusú feladatoknál."
(Gondolom, a másik topikban általad linkelt cikkrõl beszélsz.) Nos, igen, leírják, és jól el is túlozzák.
"Igen, de az a plusz teljesítmény nagyrészt elveszik."
Dehogy veszik el a nagy része, ne beszélj már zöldségeket.
"Megint személyeskedsz érvelés helyett."
Hol van itt személyeskedés? Úgy véled, minden játékot ismertél talán, és sértés azt mondani, hogy nem?
"Nem lehettek oylan összetett játékok, mivel nem volt elég erõforrás hozzá"
Önigazoló érv... Hát ez az, hogy 10-20 MHz-bõl is sokat ki lehet hozni.
"és egyébként is a komplexitás jelentõs része a 3D világból adódik. Az AI munkáját is drasztikusan megnehezíti a komplexebb környezet."
Én is 3D-rõl beszélek. Az, hogy sokkal több a poligon, nem feltétlenül növeli annyival a komplexitást, csak a proci (és a GPU) terhelését.
"És ott van még pl. az útkeresés. Négyzetrácsos térképen azonos (1 négyzetnyi) méretû egységekkel, nagyságrendekkel egyszerûbb, mint 3D poligonos világban különféle méretû egységekkel. Ráadásul itt a jármûvek ív mentén kanyarodnak, és ki is kell hogy kerüljék egymást."
Én sem ilyen egyszerû táblás játékokról beszélek. Mellesleg az útkeresés ma sem "mm-es" pontosságú. Bár attól függ, hogy csinálják. Ha távolságokat mérnek, akkor oly mindegy, hogy egy nagyobb vagy egy kisebb poligont metsz a próbált iránysugár.
Mellesleg komolyabb géphez több poligon, és ezzel némileg több ilyen távolságmérési (vagy egyéb) lépés dukál, ez nem csoda. De itt az intelligencia intelligensségérõl van szó.
"Attól is függ, hogy melyik játék (pl. nézd meg a Black&White-ot). A többség sajnos tényleg elég buta (de régen még butábbak voltak)."
Azért buta a többség, mert lusták (ohh, bocs, nincs elég idejük) jobbat csinálni. De ebbõl nem következik, hogy régebben még butábbak voltak.
"És messze nem biztos, hogy kevés ilyen lesz. Pl. a gráf algoritmusok gyakran ilyenek (AI, útkeresés)."
Egy játék esetén hol kell sokmilliónyi hozzáférés ilyenekben? Szerintem ott létrehozhatók pártíz KB-os adatmezõk, amik szépen elférnek egy SPE local ramjában. (Ja, arról még nem is beszéltünk, hogy valószínûleg egy SPE láthatja a többi ramját is, csak az azokhoz való hozzáférés lassabb - de még mindig épp elég gyors -, mint a sajátjához.)
"Ez nem igaz. Csak arról van szó, hogy egy 3.2GHz-es PPE nem ér fel egy 3.2GHz-es x86-tal, de az hülyeség, hogy egy átlagos, mondjuk 2GHz-es x86-nál is sokkal gyengébb."
Nem hülyeség. A feladattól függõen nagyon sokat számíthat a sokkal egyszerûbb felépítés.
"Más feladatnál a CPU is gyengébb, mert ott is SIMD-bõl jön a FLOPS nagy része."
Ezért nem a flops-ot nézzük.
"Más dolgokban sem teljesen pontosak."
Pl.?
"Talán nem kellene mindenben és kizárólag a wikire hagyatkozni."
Hol hagyatkozom kizárólag arra? Egyébként mintha lett volna egy cikk nemrég, ami arról szólt, hogy a wiki legalább olyan megbízható, mint az Encyclopaedia Britannica.
"Aha, csak épp "lassan" is megvan egytízezred mp alatt."
Az rettenetesen lassú. Az adattal végzett mûvelet nanosec nagyságrendû.
"Ne túlozz. Már-már úgy akarod beállítani, mintha L1-L2 sem lenne benne."
A cikkben leírják szépen, hogy mi a probléma. Nagyon sokat számítanak ám ezek a dolgok az ilyen típusú feladatoknál.
"PC-n az ideje nagy része másra megy el."
Igen, de az a plusz teljesítmény nagyrészt elveszik.
"Az általad leírt játékoknál régebben is voltak már "intelligensebbek", legfeljebb nem ismerted õket."
Megint személyeskedsz érvelés helyett. Nem lehettek oylan összetett játékok, mivel nem volt elég erõforrás hozzá, és egyébként is a komplexitás jelentõs része a 3D világból adódik. Az AI munkáját is drasztikusan megnehezíti a komplexebb környezet. És ott van még pl. az útkeresés. Négyzetrácsos térképen azonos (1 négyzetnyi) méretû egységekkel, nagyságrendekkel egyszerûbb, mint 3D poligonos világban különféle méretû egységekkel. Ráadásul itt a jármûvek ív mentén kanyarodnak, és ki is kell hogy kerüljék egymást.
"A mai játékok "intelligenciája" sem igazán nyûgöz le, és ami azt illeti, még nagyon is elõreprogramozottak a lépések"
Attól is függ, hogy melyik játék (pl. nézd meg a Black&White-ot). A többség sajnos tényleg elég buta (de régen még butábbak voltak).
"Ez a kvázi véletlenszerû hozzáférés esete, azaz a fennmaradó kicsi halmaza a feladatoknak, amibõl speciális feladatoknál kell olyan sokat csinálni, hogy az gondot okozzon."
Pontosan errõl beszélek. És messze nem biztos, hogy kevés ilyen lesz. Pl. a gráf algoritmusok gyakran ilyenek (AI, útkeresés).
"Ami szintén sokkal egyengébb, mint egy átlag x86 CPU."
Ez nem igaz. Csak arról van szó, hogy egy 3.2GHz-es PPE nem ér fel egy 3.2GHz-es x86-tal, de az hülyeség, hogy egy átlagos, mondjuk 2GHz-es x86-nál is sokkal gyengébb.
"Elméletben, és csak SIMD mûveleteknél. Más jellegû feladatoknál sokkal egyengébb."
Más feladatnál a CPU is gyengébb, mert ott is SIMD-bõl jön a FLOPS nagy része.
"Simán elírták, elõfordul. Ez nem változtat semmin."
Más dolgokban sem teljesen pontosak. Talán nem kellene mindenben és kizárólag a wikire hagyatkozni.
Aha, csak épp "lassan" is megvan egytízezred mp alatt.
"A sokkal gyengébb CPU miatt pont az arányok borulnak. Ami egy A64 3000+-on 10%, az a PPE-n könnyen lehet akár 100% is (de 30-50 biztosan)."
Ne túlozz. Már-már úgy akarod beállítani, mintha L1-L2 sem lenne benne.
"De gond, mert PC-n is az a gond, hogy nem jut neki elég teljesítmény. Ha a cell-en sem jut több, akkor gamelogic szinten nem lesznek jobbak a játékok."
PC-n az ideje nagy része másra megy el.
"Nagyságrendekkel összetettebbek."
Az általad leírt játékoknál régebben is voltak már "intelligensebbek", legfeljebb nem ismerted õket. A mai játékok "intelligenciája" sem igazán nyûgöz le, és ami azt illeti, még nagyon is elõreprogramozottak a lépések, csak már nem olyan banálisan egyszerûen, mint korábban a legtöbb esetben. Ennel jóval intelligensebbek is lehetnek majd.
"Az SPE nem fér hozzá a PPE lokális memóriájához, így abban nem tud hatékonyan másolni." + "Erre mondtam, hogy az ilyen másolgatásos feladatok egyébként sem a PPE-n futnak, így az SPE besegítése a PPE-nek itt nem játszik."
A PPE-nek nem lokális memóriája van, hanem a szokásos L1-L2. Ahhoz tényleg nem fér hozzá az SPE, de attól még tud másolgatni a main memóriában, illetve a main és a vram között, így be tud segíteni a PPE-nek.
"De itt max. 1 tucat byte-ról van szó egy lépésben, és az azon végzett mûvelet dönti el, hogy melyik adat kell legközelebb. GOndolj pl. nagy gráfban keresésre (arra sincs semmi garancia, hogy a szomszédok egymáshoz közel vannak a memóriában)."
Ez a kvázi véletlenszerû hozzáférés esete, azaz a fennmaradó kicsi halmaza a feladatoknak, amibõl speciális feladatoknál kell olyan sokat csinálni, hogy az gondot okozzon.
" "És ugye közben a 2. threadben más feladat is futhat a PPE-n." Hiába, mert itt az SPE idejével van a gond."
Az SPE idejével?? A PPE ide való besegítésére fordított idejérõl volt szó, tehát a PPE idejérõl. (Mellesleg a PPE értesülése arró, hogy az SPE adatot vár, egy db bájt kiolvasása az SPE belsõ gyors ramjából.)
"Azt is nézd meg, mihez képest: max. sávszél itt 2-300 GB/s."
Pont arról van szó, hogy a gyakorlatban ez könnyen a töredékére csökkenhet, ami már összemérhetõ a PC-k sávszélességével. Abból jön ki ez a nagy szám, hogy az összes mag kommunikációját összeadják. Az egész cell-re az a jellemzõ, hogy alapvetõen erõsnek lett szánva, de a költségek csökkentése miatt sok helyen erõs kompromisszumokra kényszerültek, amik a teljesítményt is visszafoják. Szóval nagyon jó lesz ez bizonyos típusú feladatokra, de messze nem az a csodaszer, aminek reklámozták.
"Hát úgy, hogy kiolvassa a memóriából azt a párszáz, párezer kis adatcsomagot, és átadja valamelyik SPE-nek (egy tízezred mp alatt)."
Az lassú.
""Emiatt nem biztos, hogy sokkal több marad a gamelogic-nak, mint PC-n." Ez egy igen elhamarkodott következtetés, lásd arányok."
A sokkal gyengébb CPU miatt pont az arányok borulnak. Ami egy A64 3000+-on 10%, az a PPE-n könnyen lehet akár 100% is (de 30-50 biztosan).
"Oké, de mivel közben alig kell mással foglalkoznia a PPE-nek (más csinálja párhuzamosan), ez nem feltétlenül gond."
De gond, mert PC-n is az a gond, hogy nem jut neki elég teljesítmény. Ha a cell-en sem jut több, akkor gamelogic szinten nem lesznek jobbak a játékok.
"Kicsit besegíthet a PPE, de a számítások nagy része mehet az SPE-ken."
Errõl nem vagyok meggyõzõdve, de elképzelhetõ.
"Na de hát ez az, hogy sok 3D grafikával kapcsolatos mûveletet (amit PC-n a CPU csinál) átvehet 1-2 SPE, így a PPE-nek több ideje marad."
Gamelogic szinten is rengeteg dolog kapcsolódik a 3D környezethez. Ezek egy része biztosan gyorsítható az SPE-kkel, de nem olyan egyszerûen, és nem mind.
"Melyik játékban van ma "igazi" AI? Szerintem ma is eléggé behatároltak és elõreprogramozottak, csak már kicsit összetettebb vezérlésûek."
Nagyságrendekkel összetettebbek. A valódi AI attól függ, hogy mit nevezel annak. A játékban szt szokás, ami nem szkriptelt, hanem programozott. Régen a stratégiai játékokban az AI nem épített, hanem megkapta a bázist, aztán a legyártott egységeket ellened küldte egyesével. Ma már az AI önállóan építi fel a bázist, optimális helyet keresve az épületeknek. Eldönti, hogy mit kell építeni, és milyen egységet gyáratni. Összeállítja a megfelelõ csapatot, és azzal támad. Képes megkeresni a te bázisod gyenge pontját, és gonosz módon ott támad. De még a játékstílusodhoz is alkalmazkodik valamennyire.
"Nem értem, milyen plusz másolgatásra gondolsz."
Az SPE nem fér hozzá a PPE lokális memóriájához, így abban nem tud hatékonyan másolni.
"Ki beszél itt a PPE-rõl és gamelogicról? Az SPE-k másolgatásban való részvételérõl van szó."
Erre mondtam, hogy az ilyen másolgatásos feladatok egyébként sem a PPE-n futnak, így az SPE besegítése a PPE-nek itt nem játszik.
"Ha párszáz, vagy párezer quadwordrõl van szó, nem hiszem, hogy különösebb problémát jelent."
De itt max. 1 tucat byte-ról van szó egy lépésben, és az azon végzett mûvelet dönti el, hogy melyik adat kell legközelebb. GOndolj pl. nagy gráfban keresésre (arra sincs semmi garancia, hogy a szomszédok egymáshoz közel vannak a memóriában).
"És ugye közben a 2. threadben más feladat is futhat a PPE-n."