Ha jobban ertesz hozza, mint az erre specializalodo szakemberek, lass neki :)
"Mivel a robotok is szembesültek ezzel a problémával, kijelenthetõ, hogy minden vizuális lénynek meg kell küzdenie az érzékcsalódásokkal"
jaj de idegesítõ.. azért, mert nem tudunk olyan robotot csinálni, amelyiket nem csapnak be az érzékcsalódások, attól még szerintem hülyeség ilyet kijelenteni.. mármint ilyen konkrétan fogalmazni..
mellesleg nem lehet, hogy ott van a probléma, hogy a saját vizuális rendszerünket vesszük alapul? vagy, hogy annyira mégsincs jó fantáziánk, hogy meg tudjunk alkotni egy, a mienktõl fejletteb rendszert?
Egyébként mi az új abban hogy nem 100%-os hatékonysággal dolgoznak az ilyen szoftverek ? Kamerás tûzérzékelõ, rendszámtábla-felismerõ, OCR, hangfelismerõ, mind szokott hibázik mint a geci.
a cikk távlatokban arról szól, hogy a tanulni képes adaptív rendszerek bizonyos esetekben eleve tévedésre vannak ítélve, az emberi látás is ezért csapható be, sõt az emberi gondolkodás is ezért téved néha . Ebben a gondolatban nem sok új van, max nehezen fogadjuk el; az MI kutatása révén kezdjük felfogni hogy miképp mûködünk mi magunk (mert ezt tudjuk legkevésbé) miáltal a saját létünk miszticizmusát rombolja lefele ez az irányzat ...
Az asztalos kép alá baromság van írva. Megnéztem a "szakember honlapján", ott az angol szöveg mást ír. Valszeg a cikkíró nem tájékozódott onnan és megpróbált magától rájönni mi a kép lényege. Az angol szöveg szerint amit látni kell(ene), hogy zöld asztal függõlegesen olyan hosszú mint a piros vízszintesen és fordítva. Ezt szemlélteti a sárga meg a kék vonal.
De mivel a téglalap alakú asztallapok ebben a perspektívában trapézok, a vízszintes szélesség nem egyértelmû, hogy hol mérendõ.
Na õket is megbuktatnám matekból Az asztalos képen sem az asztal belmérete (ez a függõleges vonal a mellé rakott képeken), sem pedig a szélessége (vízszintes vonal) nem stimmel. Az eredeti ábrán ugyanis ezekkel térszöget zár be a megfigyelõ. A hiteles akkor lenne, ha ezeket felülnézetben, a az asztal lapjának síkja szerint (itt feltételezem, hogy az alappal párhuzamos a síkja), felülnézetben mutatnák meg a két asztalt. Így viszont nem csak a program, de az elméletük is hibás lehet. Persze, ez még nem jelenti azt hogy a programjuk teljesen használhatatlan...
mi ezeket a képeket csakazért látjuk formában torzultnak, mert a térszög mint információ kiveszik belõle, mindkét szem ugyanazt az információt kapja meg. Az agy igenis mér szöget, a két szem által bezárt szöget, és a két szem látómezejében a fókuszponttól való távolságokat. Ebbõl már lazán felépít egy 3D térképet, másodpercenként kb. 25x.
üdv.
igy van, az emberi agy "szamolokapacitasa" boven tudna hozni a mai szuperszamitogepek szintjet is, csak egyszeruen nem igy vagyunk beallitva. mondjuk azert ez felveti annak a kerdeset hogyha ennyi neuron ilyen bonyolult osszekapcsolasa kell ahhoz hogy kapjuk egy intelligens embert, akkor hagy tranzisztor (vagy akarmi mas) kell ahhoz hogy egy ugyanolyan "ertelmes" gepet kapjunk ami meg + azzal a szamitasi kapacitassal is rendelkezik amivel egy szamitogeptol elvarunk?? :)
Hát persze. Megint egy félreértett tudományos eredmény. Ezzel az erõvel bármilyen nagyon vacak képfeldolgozó rendszer folyamatosan téveszt, amiben semmi érdekes nincs.
Gondolom, az eredeti kutatásnak sem ez a tézise (lusta vagyok utánaolvasni), csak a fenti cikk állítja be ezt ilyesformán, mintha valamiféle újabb emberi képességre tettek volna szert a robotok. Frászt. Az emberi érzékcsalódások a mi képfeldolgozó rendszerünk hibái. Az ember esetében valóban érdekesek, mert egyrészt bebizonyítják, hogy az emberi látás is csak egy hardver-szoftver együttes, amit, bár nagyon kifinomult rendszer, de meg lehet téveszteni. A látásunk nem adja vissza tökéletesen, ami "ott kint van", és néhány filozófiai irányzat véleményével ellenben bebizonyítják, hogy nincs primer tapasztalatunk a fizikai valóságról.
A másik, amiért nagyon fontosak, hogy információkat lehet nyerni arról, hogy hogyan mûködhet az emberi látás (egyfajta black-box tesztelés). A tudományos eredmény inkább valami olyasmi lehet itt, hogy ez a konkrét agyi modell *hasonlóan* téved, mint az ember, ez pedig azt bizonyítja (bár nagyon gyengén), hogy ez a konkrét neurális modell legalábbis nem teljesen rossz. Ebbõl már lehet tudományos cikket írni, abból, hogy egy robot téveszt, nem. Sajnos újságcikkekkel úgy tûnik, fordítva van.
Mindig az az érdekes egyébként, hogy *miben* téveszt egy látórendszer. Ha az emberi látásnak arra lett volna szüksége az evolúció során, hogy pontosan tudjon szögeket méricskéni a síkban, százmilliárd neuronunk röhögve megoldaná, mert ezt a képfeldolgozási feladat nagyon könnyû. Viszont amit a mi agyunk tud (és ezért téveszt), hogy 3D-ben lássa a tárgyat néhány egy ilyen gyenge renderkép alapján is, így pl. le tudjuk venni a barackot a fáról, na ezt még ma sem tudjuk az emberi agy által produkált minõségben megoldani. Szóval a látásunk tojik a szögmérésre, helyette viszont nem téveszt olyan sokkal nehezebb feladatokban, amik sokkal lényegesebbek számára.
Böszmeség az egész. Józan parasztiból kiindulva, ha a photoshop ugyanazt a hexa kódot adja ki az egyik képpontra mint a látszólag másikra, akkor a robot se fogja különbözõnek feldolgozni, sõt, mivel nincs agya ami félreveszesse, ha puszta színskálával dolgozik, eleve máshogy fogja vizuálisan érzékelni ezeket a dolgokat mint ahogy az emberi agy, szóval ennyit a színbeli eltérésekrõl. A formára meg hadd ne mondjak semmit robotokról lévén szó ... ahhoz hogy akármi is tudja érzékelni a teret, alap hogy 2 vizuális érzékszerv kell ami különbözõ pontokból perspektivikusan, a 2 perspektívát összedolgozva lát 3D-ben. Az emberi agy nekünk elvégzi a többit, és néha ezért keresztbe is tesz nekünk, ami a következõ példához vezet: Mi képesek vagyunk egy képen is felismerni egy 3D objektumot, de szerintem erre a robotok nem valószínû hogy mostanában képesek lesznek, tehát õket egy 3D-s objektumot ábrázoló képpel nem lehet átverni, a valós szögben fogják látni. Tehát a cikkben szereplõ elsõ képen is kapásból fel tudják ismerni hogy a 2 egymást metszõ egyenes tökéletesen merõleges egymásra.
Nagyon állatok ezek az illúziók a honlapon! :))
Bazz... :DDDDDDD Eddig eszembe sem jutott végiggondolni mit jelent a nevük, de ezekt unán valahányszor szembesülök majd velük minimum megmosolygom õket. :)))
Nahát... ezek szerint, ha a képfeldolgozó szoftver nem úgy mûködik, ahogy terveztük, akkor nem a koncepció hibás, csak érzékcsalódik :) Micsoda hülyeség.
A Londoni Egyetemi Kollégium meg nagyon érdekes fordítás. Javaslom akkor a Birodalmi Kollégium elnevezést is meghonosítani egy másik londoni egyetemre, amitõl már csak egy lépés a Birodalmi Lépegetõ, illetve a Bütyökhíd Egyetem (Cambridge) illetve az Ökörgázló Egyetem (Oxford).