Új beszéd­technológiai szervezet alakult

Új beszéd­technológiai szervezet alakult

2021. július 27. 17:19, Kedd
A szövetség elsősorban az új szabványok kidolgozására összpontosít.

A Linux Alapítvány, a Microsoft, a Deutsche Telekom és a Schwarz Csoport (Kaufland, Lidl) megalapították az Open Voice Network nevű szervezetet, amelynek az elsődleges feladata a beszédtechnológiákhoz kapcsolódó új szabványok kidolgozása lesz. A kezdeményezés megpróbálja a vonatkozó fejlesztésekkel kapcsolatos bizalmat erősíteni. A beszédet egyre gyakrabban alkalmazzák az okoshangszórókon keresztül az autók fedélzeti szoftverein át az okostelefonoknál és az otthoni elektronikai készülékekben. Ahhoz, hogy az emberek megbízzanak ezekben a megoldásokban, szükség van a nyílt szabványokra.

Jon Stine, az Open Voice Network ügyvezető igazgatója hangsúlyozta, hogy a gyors növekedés mind a beszédasszisztensek elérhetőségét, mind az elfogadottságát szükségessé teszi és rendkívül fontos, hogy bizonyos szabványok közösen legyenek kifejlesztve. A céljuk olyan nyílt szabványok megalkotása, amelyek segítik a mesterséges intelligencián alapuló beszédasszisztens-rendszerek bevezetését és elterjedését. Erre már csak azért is szükség van, mert egyre több eszköz és alkalmazás tartalmaz beszédaktiválási és navigációs funkciókat.

Mike Dolan, a Linux Alapítvány alelnöke kiemelte, hogy az új hálózat proaktív válasz a mesterséges intelligencián alapuló beszédtechnológiákon belül a számítógéppel generált álló- és mozgóképekre (deepfake-anyagok). A szakember hozzátette, hogy a beszéd elsődleges interfész lesz a digitális világhoz és az össze fogja kötni a felhasználókat több milliárd honlappal, intelligens környezetekkel és mesterséges intelligencia programokkal.

Rolf Schumann, a Schwarz Csoport digitális ügyekért felelős vezetője rámutatott, hogy a beszéd megváltoztatja a márkák és a fogyasztók közötti viszonyt és annak módját is, hogy az emberek miként lépnek kapcsolatba a digitális eszközökkel, például hogyan a bevásárláskor hogyan használjuk az okosotthon-készülékeinket. A hang ugyanakkor sokkal több információt ad ki rólunk, mint egy ujjlenyomat és adatokat tartalmazhat például a felhasználó érzelmi állapotáról vagy mentális egészségéről. Ezért rendkívül fontos az adatvédelmi szabványok bevezetése, hogy megvédhető legyen az emberek magánszférája.

Ali Dalloul, a Microsoft Azure ügyvezető igazgatója azt taglalta, hogy a beszéd emberi és gyorsan elsődleges interakciós interfésszé fog válni a felhasználók és az otthonaikban, illetve a munkahelyeiken lévő eszközeik és szolgáltatásaik között. Minél több készülék és szolgáltatás lesz nyílt, s tud majd biztonságosan kommunikálni egymással, annál értékesebbek lesznek a fogyasztók és a vállalatok számára az olyan területeken, mint az ügyfélszolgálatok és a kereskedelem.

A beszédasszisztensek elsősorban az olyan technológiáktól függenek, mint az automatikus beszédfelismerés (ASR), a természetes beszédfeldolgozás (NLP), a fejlett párbeszéd-menedzsment (ADM) és a gépi tanulás (ML). Az Open Voice Network eleinte a következő területekre összpontosít majd: a felhasználókban választási lehetőségeket kínáló és bizalmat ébresztő nyílt szabványok fejlesztése; többletérték kínálása; továbbá együttműködés a legfontosabb szabályozási és egyéb kérdésekben, például az adatvédelem területén a különböző ágazati szervezetekkel.

Kapcsolódó linkek

Listázás a fórumban