2012. december 17. 13:08, Hétfő
Bernd Möbius, a Saar-vidéki Egyetem fonetikai és fonológiai professzora azt kutatja, hogy miként lehetne természetesebbé, emberibbé tenni a mesterséges beszédet.
A szakember olyan öntanuló matematikai modellt
fejlesztett ki, amely lehetővé teszi, hogy minden eddiginél természetesebb gépi beszédet lehessen kialakítani. A kutatás során kiemelten foglalkozott azzal a jelenséggel, amikor az emberek hang alapján próbálnak meg elképzelni vagy azonosítani egy személyt. Ez gyakori dolog; egy fiatal nő idősebbnek tűnhet, egy erőteljes hangú férfi lehet, hogy a valóságban nem testes, hanem vékony. Az emberi hang beindítja a fantáziánkat. Möbius közölte, hogy egy természetes hang meghallása az agyban érzelmi és asszociációs területeket aktivál, a klasszikus számítógépes beszédnél viszont erről szó sincs. Amennyiben mesterséges hangot hallunk, akkor ezek a területek inaktívak maradnak.
Az emberi fül annyira precíz műszer, hogy pontosan tudjuk: emberi vagy gépi hangot hallunk. A professzor éppen ezért az emberi hang karakterisztikáját is kutatja, a beszédet a legapróbb részletekig vizsgálja. A kifejlesztett matematikai beszédszintetizáló modell független az eredeti beszélő hangjától, így elvileg bármely hanggal kapcsolatban használható. Mindebben nagy lehetőségek rejlenek. Amennyiben valaki elveszíti a beszédképességét, később olyan mesterséges beszédre tehetne szert, amely teljesen úgy hangzik, mint az ő korábbi természetes hangja. Ehhez csak arra lenne szükség, hogy az illető korábban rögzítse a hangját egy stúdióban, majd megőrizzék a felvételt. Viszonylag kevés beszéd felvétele már megoldást jelentene, a többit a rendszer elvégezné.
Még sok időnek kell eltelnie azonban addig, míg elkészülnek az első kiforrott megoldások. Mindenesetre az első tesztek biztatóak és a professzor igyekszik tökéletesíteni a jelenlegi algoritmust és az azon alapuló rendszert.