Beszédszoftver robotoknak és számítógépeknek

Beszédszoftver robotoknak és számítógépeknek

2010. szeptember 23. 11:50, Csütörtök
Az Astromobile európai uniós projekt célja egy olyan robot megalkotása, amely megérti a kapott parancsokat, felszolgálja az ebédet és még egy beszélgetésre is fogékony. Az ehhez szükséges kommunikációs programot a simon listens egyesület fejlesztette ki.

A szoftvert stílusosan Simonnak nevezték el. "Simon nem más, mint egy egér- és billentyűalternatíva. Eredetileg meg akartuk könnyíteni a fogyatékossággal rendelkező gyerekek számítógép-használatát. Az alkalmazással e-maileket diktálhatnak, szörfölhetnek az interneten vagy akár a Skype segítségével telefonálhatnak is" - tért ki az előzményekre Franz Stieger, a simon listens vezetője és projektfelelőse. A szakember hozzátette: a legnagyobb problémát a magas hibaarány jelenti, ráadásul nem mindegy az sem, hogy egy program hány szót ismer.

Az orvosi felhasználás, például egy diagnózis elkészítéséhez elég, ha az adatbázis 1000 szót tartalmaz. A Simon esetében nem ez volt a fő szempont, hiszen az idén júliusban indított Assistive SmarT RObotic platform for indoor environments: MOBILity and interaction (Astromobile) projektben a hangsúlyt a robotok önálló navigációs képességére és az emberekkel való intelligens kapcsolattartására helyezték. Utóbbi pedig elsősorban a verbális kommunikáción alapul.

Az Astromobile keretében kifejlesztett robotokat segítségre szorulók és nyugdíjasok házi ápolóiként alkalmaznák. A célok között szerepel, hogy az egységek alkalmasak legyenek ellenőrzési-felügyeleti feladatok végrehajtására és rendelkezzenek memóriafunkcióval, amelyben eltárolható, hogy az adott személynek mikor kell beszednie a gyógyszereit, kit és mikor kell felhívnia stb. Míg az olasz Scuola Superiore Sant'Anna Egyetem feladata a robot önálló mozgásának kutatása, a simon listens a beszédfelismeréssel foglalkozik. A távlati cél annak elérése, hogy a robotokkal a jövőben akár beszélgetni is lehessen. Stieger ugyanakkor elismerte, egyelőre kérdéses, hogy a Simon erre alkalmas lesz-e.


Maga a szoftver két részből áll: a Simon nevű kliensből, amely végrehajtja a kapott parancsokat és a Simond nevű szerverből. A kliens-szerver architektúrának köszönhetően a program elvileg okostelefononon át is használható és így a robot akár egy mobilról is irányítható lesz. A kutató kijelentette: Simonnak világosan meghatározott felhasználási területe van. Az alapvető feladat a kommunikációs és információs igények kielégítése. A parancsokat azonban főleg számok helyettesítik. Az alkalmazás jelenleg már együtt tud működni a különböző levelezőszoftverekkel, a Media Portal nevű nyílt forráskódú multimédiás programmal, a Skype VoIP-szolgáltatással és a Firefoxszal, ezen belül is a Mouseless Browsing kiegészítővel. Minden további alkalmazáshoz külön modult kell készíteni.

A Mouseless Browsing használatakor minden honlap hivatkozása egy külön számot kap, a szöveges adatok bevitelét egy virtuális billentyűzet könnyíti meg. A számvezérlés az Asztalon is alkalmazható, ekkor a felületet kilenc részre osztja fel a Simon és mindegyik részre rá lehet nagyítani, valamint további kilenc részt foglal magában. A megoldás előnye, hogy gyakorlatilag minden elterjedt nyelvvel használható, de akár egy saját nyelvi modell is készíthető hozzá. Az interfész úgy is kialakítható, hogy akár köhögéssel vagy nevetéssel is irányítható legyen. A program három beszédmodellt tartalmaz. Az első a statisztikai, amelyben a legalapvetőbb parancsok végrehajtására képes, míg a második már tanítható, a harmadik pedig az első kettő ötvözete, kiegészítve a beszédfogyatékossággal rendelkezők számára kialakított tanítómóddal.

A Simon további előnye, hogy akár a fényviszonyok, a fűtés és az ablakok vezérlésére is használható, hiszen a meglévő rendszerekkel ötvözhető és így akár nyugdíjas vagy szociális otthonokban is beválhat a személyzet tehermentesítésére. De a szakembereknek még nagyon sokat kell dolgozniuk, amíg ezt a szintet elérik. Stieger szerint minden egyes enber szavait többször is rögzítik, hogy így növeljék a szoftver felismerési arányát. A tapasztalatok azt mutatták, hogy egy szót legalább ötször kell elmondania a kísérletben részt vevőnek ahhoz, hogy a szoftver jó eredményt érjen el. A munka rendkívül időigényes, egy órányi felvétel feldolgozása akár 3-4 hetet is igénybe vehet.

Ha figyelembe vesszük, hogy mennyi munka van az alkalmazásban és később mekkora lehetőségek nyílnak majd meg a használók előtt, akkor szinte hihetetlennek tűnik, hogy a Simon szabadon elérhető mindenki számára, lévén nyílt forráskódú program. A szoftver egyaránt használható Windows XP és Windows Vista operációs rendszereken, különböző Linux disztribúciókon, valamint már készül a Windows 7-kompatibilis változata. Az alkalmazás gyakorlatilag a jelenleg kapható számítógépek és notebookok 90 százalékán futtatható, ugyanakkor még közel sem tökéletes.

Listázás a fórumban 
Adatvédelmi beállítások