A cikk (és a német eredeti is) tipikus példája annak, mennyire félretájékoztató tud lenni egy ilyen írás. A koktél-parti probléma lineáris változatait 1992 óta meg tudjuk oldani. Más néven vak forrásszétválasztásnak vagy a független komponens analízis (ICA) lineáris formájú alapfeladatának is hívják. Bár a cikk nem írja le, mibõl is áll a csoport újítása, valószínûleg szó nincs arról, hogy a fenti kutatócsoport "oldotta volna meg" a problémát. Talán csináltak egy jó szoftvercsomagot a célra, vagy megoldottak valami újabb részproblémát a kérdéskörben (amivel egyébként kutatók ezrei foglalkoznak évtizedek óta). Próbáltam megtalálni a kutatók honlapján a vonatkozó cikket, de csak a sajtóhírt találtam: valószínûleg csak a marketingjük jó.
A feladatnak egyébként általában nincs köze a beszédfelismeréshez. Ha huszonöt különbözõ zajforrás lenne adva egy szobában, a szétválasztásuk akkor is megoldható volna a jelek statisztikai elemzésével. Az emberi beszéd nehezebb feladat tud lenni, mert nem feltétlen független forrásokból érkezik a jel, és nem feltétlen áll rendelkezésre annyi mikrofon, ahány beszélõ van.
A cikk nekem is sántít, ugyanis az emberi fülrõl ír. Ez pedig pont ellenkezõ azzal a megállapítással amit még mindig nem tudnak pontosan megmagyarázni a tudósok, miszerint nem értik hogyan tud a fül, az emberi agy pl. egy komolyzenei koncerten csak egy-egy hangszerre koncentrálni, adott hangszer hangját kiszürni. Na mondjuk az általában nem bábeli hangzavar, lehet hogy ez a különbség?
off Az OS2/Warp valóban bírta(ja) ezeket a képességeket és, ha van türelmed felolvasni a kért szavakat, azután már elég jól lehet diktálni neki. Úgy emlékszem hogy ezt már az Win NT-be is beépítették, de azt nem próbáltam. Szerintem most nem a diktálás a fõ irányvonal, hanem a hang vezérlés, ami egy picit más terület, bár úgy látszik még elég ingoványos.
on
Nálam inkább az elõbbi, legalábbis nem beszélek hozzá másképp viszont eleinte nálam is akadtak hibák, de most már szinte semmi probléma. Azt viszont nem kéne elfelejteni, hogy a Vista és a hangfelismerõ rendszer is még béta. Viszont hamarosan jön az RC1, amit bárki letölthet, hasonlóan a Júniusban kiadott beta2-höz.
Nálam ugyan nincs fenn, és ezért végül is akár befoghatnám a számat is.;)
De tíz évvel ezelött win3.1/win95 alá szintén volt már ilyen szoftver, (szal az sem igaz amit a M$ szövegel az egyik lentebbi linken)ami már szintén képes volt a felhasználó hangjához kiejtéséhez alkalmazkodni.
Követelmények: CPU 486-75MHz, 8MB RAM, 40MB HDD(na ez utóbbit egy kicsit húzósnak érzem;)))
Hát nálam viszonylag jól mûködik, az elsõ használatok idején voltak problémák, de most már egyre jobb, gyakorlatilag hiba nélkül mûkszik. Ja és egy Celeron 2.4 + 768 MB RAM, kb 3 éves gépen van fent. Egyébként nálad fent van a Vista?
" probléma tehát matematikai úton megoldható volt" -> akkor algoritmus is készíthetõ rá
Na de ti mintha emberek lennétek... Nem PC-k. Amikor koncentráltok, agysejtek milliói állnak be a feladatra. És nem tudatosan igazgatjátok el õket... Csak akarnotok kell, és megvalósul, fogalmatok sincs, hogy hogyan... Ezzel ellentétben egy PC-nél aprólékosan ki kell dolgozni az algoritmusokat, programokat.
Igen, ez az a resz amit nem ertettem, ugyanis nekem legalabbis sohasem volt ilyen problemam, mert ha jol figyeltem, sima ugy volt arra az 1-2 hangra koncentralni, foleg ha meg latod is a szemelyt, mert tudod, hogy az o hangja, mialatt mozog a szaja...
"Gondot jelent, hogy ha két hasonló orgánumú ember van egy helyen, nagyon nehéz megkülönböztetni a hangjukat" baromság. ha az ember koncentrál, akkor bármikor tud figyelni egy hangra még akkor is ha sokan beszélnek egyszerre a közelben. persze fontos, hogy megfelelõ legyen a távolság, és tényleg figyeljen, ne csak úgy hébe-hóba, mert akkor valóban elveszti a fonalat.
"...sikerült egy társasági összejövetelen egy személy beszédét izolálniuk" Fa*a, már csak 6 milliárd emberé van hátra :)
"A program képes arra..." "A módszer azonban közel sem tökéletes, nem készült hozzá ugyanis algoritmus.." ha nincs algoritmus akkor a program hogy készült? Egy hangelemzõben addig randomozták a szûrõt míg sikerült?