3 éves gyerekre hasonlít a mesterséges intelligencia

3 éves gyerekre hasonlít a mesterséges intelligencia

2019. december 5. 09:24, Csütörtök
Reálisan nézve vegyes az összkép a technológia megítélésében.

A Seeing AI nevű ingyenes szoftver megkönnyítheti a vakok mindennapjait, hiszen lehetővé teszi a számukra a környezet feltérképezését. Az alkalmazást a Microsoft kutatói fejlesztették ki és mesterséges intelligencia használatával ismer fel a kamerán keresztül objektumokat, majd hanggal tájékoztatja a vakokat arról, hogy mik vagy kik vannak a környezetükben. Felolvassa az étlapot és a recepteket, leírja a nyaralási fotókat és az illetőre rámosolygó embereket is jelzi. Ebből az okból a Seeing AI-t a Microsoft úgy is nevezte, mint "beszélő kamerát vakoknak". A jelenleg angol, francia, spanyol, holland, japán és német nyelven elérhető programért Saqib Shaikh, a Microsoft főfejlesztője felel. A szakember 7 évesen veszítette el a látását. A redmondi konszernnél részt vett a Bing és a Cortana fejlesztésében, most pedig azzal foglalkozik, hogy a mesterséges intelligencia miként könnyítheti meg a vizuális korlátozásokkal élő emberek életét.

"Hatalmas előrelépést értünk el a mesterséges intelligencia kutatásának területén, de még sok évre vagyunk attól, hogy a számítógépek körbenéznek és mindent megértenek, amit látnak. Én vak vagyok, ezért szívesen megyek a feleségemmel és a barátaimmal sétálni. Olyankor mindig arról beszélgetünk, hogy mit látnak. Elmondják, ha valami izgalmasat fedeznek fel vagy rákérdezek, ha nem tudok azonosítani egy zajt. Azt kívánom, hogy egy mesterséges intelligencia mindezt egy napon képes legyen átvenni, éppúgy, mint egy személyi asszisztens. Nagyon nehéz a jövőbe látni, ezért csak vadul tudok spekulálni. Nem tudom, hogy 2, 3, 4 vagy 5 évig tart-e majd ez a folyamat, ugyanis annyi minden történik ezen a területen. Minden évben van egyrészt számos előrelépés, másrészt rendkívül nagy kihívások is akadnak. Még mindig nagyon nehéz például egy mesterséges intelligencia számára azt felismerni, hogy az emberek pontosan mit csinálnak egy bizonyos helyzetben" - ecsetelte Saqib Shaikh.


A fejlesztő hozzátette, hogy amiben a mesterséges intelligencia már most is nagyon jó, az a világosan meghatározott feladatok elvégzésének átvétele az emberektől. A technológia ezt az elmúlt években tanulta meg. A képeket és a beszédet egyre jobban ismeri fel, a mesterséges intelligencia ezeken a területeken a legfejlettebb. E technikának köszönhetően tud például a Seeing AI képeket felismerni. Ugyanakkor a mesterséges intelligenciát úgy kell elképzelni, mint egy 3 éves gyereket. Az ember megmutat számos fotót és közli, hogy ez egy autó, ez egy fa, ez egy kutya. Eleinte a gyerek is csak olyan dolgokat ismer fel, amelyeket már korábban látott. Később ezeket a dolgokat kezdi mondatokban leírni. A gyerekhez hasonlóan - idővel - a mesterséges intelligencia is egyre jobb lesz. Tudósok emellett azon dolgoznak, hogy a képzési módszerek egyre jobbak legyenek.

"Számos funkció még nagyon kísérleti. Ennek ellenére a felhasználóknak meg akarjuk adni a lehetőséget arra, hogy a lehető leghamarabb használhassák az új fejlesztésű Microsoft-technológiákat. Profitálunk abból, hogy az emberek elmondják, hogy mit gondolnak az egyes funkciókról. Az alkalmazást az ügyfeleinkkel közösen fejlesztjük. Néhányuk számára a szoftvernek nem kell tökéletesnek lennie. Sokkal fontosabb az, hogy hasznos segítő legyen" - közölte a szakember.

Saqib Shaikh végül leszögezte, hogy a mesterséges intelligenciában nagyon sok lehetőséget látnak arra, hogy a Seeing AI segítségével javítsanak elsősorban a látásromlással küzdő emberek életén. De a kollégáik készítenek eszközöket a nagyothallóknak is, hogy a feliratokat valós időben lehessen megmutatni. Emellett vannak olyan megoldások, mint például az Eye Gaze, amelynél szemmozgásokkal lehet a Windows operációs rendszert futtató PC-t vezérelni.

Kapcsolódó linkek

Listázás a fórumban 
Adatvédelmi beállítások