SG.hu Fórum - Új hangfelismerõ szoftver

Cikk olvasása: Új hangfelismerõ szoftver

Fórum / Informatikai hírek fóruma

Ebbe a fórumba csak regisztrált és bejelentkezett fórumozók írhatnak!

Bejelentkezés

kukacos 2006. aug. 28. 09:40 | válasz | #20
A cikk (és a német eredeti is) tipikus példája annak, mennyire félretájékoztató tud lenni egy ilyen írás. A koktél-parti probléma lineáris változatait 1992 óta meg tudjuk oldani. Más néven vak forrásszétválasztásnak vagy a független komponens analízis (ICA) lineáris formájú alapfeladatának is hívják. Bár a cikk nem írja le, mibõl is áll a csoport újítása, valószínûleg szó nincs arról, hogy a fenti kutatócsoport "oldotta volna meg" a problémát. Talán csináltak egy jó szoftvercsomagot a célra, vagy megoldottak valami újabb részproblémát a kérdéskörben (amivel egyébként kutatók ezrei foglalkoznak évtizedek óta). Próbáltam megtalálni a kutatók honlapján a vonatkozó cikket, de csak a sajtóhírt találtam: valószínûleg csak a marketingjük jó.

A feladatnak egyébként általában nincs köze a beszédfelismeréshez. Ha huszonöt különbözõ zajforrás lenne adva egy szobában, a szétválasztásuk akkor is megoldható volna a jelek statisztikai elemzésével. Az emberi beszéd nehezebb feladat tud lenni, mert nem feltétlen független forrásokból érkezik a jel, és nem feltétlen áll rendelkezésre annyi mikrofon, ahány beszélõ van.
ttt ttt 2006. aug. 28. 08:32 | válasz | #19
A cikk nekem is sántít, ugyanis az emberi fülrõl ír. Ez pedig pont ellenkezõ azzal a megállapítással amit még mindig nem tudnak pontosan megmagyarázni a tudósok, miszerint nem értik hogyan tud a fül, az emberi agy pl. egy komolyzenei koncerten csak egy-egy hangszerre koncentrálni, adott hangszer hangját kiszürni.
Na mondjuk az általában nem bábeli hangzavar, lehet hogy ez a különbség?

off
Az OS2/Warp valóban bírta(ja) ezeket a képességeket és, ha van türelmed felolvasni a kért szavakat, azután már elég jól lehet diktálni neki. Úgy emlékszem hogy ezt már az Win NT-be is beépítették, de azt nem próbáltam. Szerintem most nem a diktálás a fõ irányvonal, hanem a hang vezérlés, ami egy picit más terület, bár úgy látszik még elég ingoványos.

on
moonman 2006. aug. 27. 15:57 | válasz | #18
Nálam inkább az elõbbi, legalábbis nem beszélek hozzá másképp viszont eleinte nálam is akadtak hibák, de most már szinte semmi probléma.
Azt viszont nem kéne elfelejteni, hogy a Vista és a hangfelismerõ rendszer is még béta. Viszont hamarosan jön az RC1, amit bárki letölthet, hasonlóan a Júniusban kiadott beta2-höz.

Válasz 'dez' üzenetére (#15)
NEXUS6 2006. aug. 27. 15:56 | válasz | #17
Nálam ugyan nincs fenn, és ezért végül is akár befoghatnám a számat is.;)

De tíz évvel ezelött win3.1/win95 alá szintén volt már ilyen szoftver, (szal az sem igaz amit a M$ szövegel az egyik lentebbi linken)ami már szintén képes volt a felhasználó hangjához kiejtéséhez alkalmazkodni.

Követelmények: CPU 486-75MHz, 8MB RAM, 40MB HDD(na ez utóbbit egy kicsit húzósnak érzem;)))

Válasz 'saitek' üzenetére (#13)
dez 2006. aug. 27. 15:48 | válasz | #16
Végén mindenki furán darabosan fog beszélni, mert ezt szokja meg Vistázás közben. De jó.
dez 2006. aug. 27. 15:47 | válasz | #15
Talán megtanulja a hangodat? Vagy te alkalmazkodsz egyre jobban hozzá...?

Válasz 'saitek' üzenetére (#13)
dez 2006. aug. 27. 15:45 | válasz | #14
Na ja, néha jól mûködik. Ez a legidegesítõbb, amikor valami egyszer mûködik, másszor látható ok nélkül hülyeségeket csinál.

Válasz 'moonman' üzenetére (#10)
saitek 2006. aug. 27. 15:25 | válasz | #13
Hát nálam viszonylag jól mûködik, az elsõ használatok idején voltak problémák, de most már egyre jobb, gyakorlatilag hiba nélkül mûkszik.
Ja és egy Celeron 2.4 + 768 MB RAM, kb 3 éves gépen van fent.
Egyébként nálad fent van a Vista?

Válasz 'NEXUS6' üzenetére (#12)
NEXUS6 2006. aug. 27. 15:19 | válasz | #12
Hát pont 10 évvel az OS/2 Warp után már ideje volt egy ilyen "forradalmi" dolognak.

Az a különbség, hogy az egy sima 486-oson 16MB RAM-mal mûködött szarul, ennek meg hasonló megbízhatatlansághoz egy core 2 duo kell 1GB RAM-mal.

LOL

Válasz 'moonman' üzenetére (#11)
moonman 2006. aug. 27. 15:05 | válasz | #11
Lesz hangfelismerés a Vista-ban

Válasz 'NEXUS6' üzenetére (#9)
moonman 2006. aug. 27. 14:57 | válasz | #10
És ennek egy teljesebb verziója:

Video 2 - aki még nem látta

Válasz 'NEXUS6' üzenetére (#9)
NEXUS6 2006. aug. 27. 14:48 | válasz | #9
De lehet hogy azért még így is jobban mûxik mint az új Viszlát/Offisz hangfelismerõ képessége;)))

Video;) - aki még nem látta
Sundance 2006. aug. 27. 07:47 | válasz | #8
Algoritmus nem készült?
A program ami fut mégis nem egy "algoritmus" ?????

A kedves "cikkíró" izé fordító nem értette mit fordít?
dez 2006. aug. 27. 03:08 | válasz | #7
Sorry, csak most olvastam el a cikket, azt hittem, arról van szó, hogy a program számára jelent gondot.

Válasz 'dez' üzenetére (#5)
PíszLávJuniti 2006. aug. 27. 02:58 | válasz | #6
" probléma tehát matematikai úton megoldható volt" -> akkor algoritmus is készíthetõ rá
dez 2006. aug. 27. 02:53 | válasz | #5
Na de ti mintha emberek lennétek... Nem PC-k. Amikor koncentráltok, agysejtek milliói állnak be a feladatra. És nem tudatosan igazgatjátok el õket... Csak akarnotok kell, és megvalósul, fogalmatok sincs, hogy hogyan... Ezzel ellentétben egy PC-nél aprólékosan ki kell dolgozni az algoritmusokat, programokat.
Extraboy 2006. aug. 26. 23:20 | válasz | #4
Igen, ez az a resz amit nem ertettem, ugyanis nekem legalabbis sohasem volt ilyen problemam, mert ha jol figyeltem, sima ugy volt arra az 1-2 hangra koncentralni, foleg ha meg latod is a szemelyt, mert tudod, hogy az o hangja, mialatt mozog a szaja...

Válasz 'metaljesus' üzenetére (#3)
metaljesus 2006. aug. 26. 20:37 | válasz | #3
"Gondot jelent, hogy ha két hasonló orgánumú ember van egy helyen, nagyon nehéz megkülönböztetni a hangjukat"
baromság. ha az ember koncentrál, akkor bármikor tud figyelni egy hangra még akkor is ha sokan beszélnek egyszerre a közelben. persze fontos, hogy megfelelõ legyen a távolság, és tényleg figyeljen, ne csak úgy hébe-hóba, mert akkor valóban elveszti a fonalat.
tproli 2006. aug. 26. 19:14 | válasz | #2
"...sikerült egy társasági összejövetelen egy személy beszédét izolálniuk"
Fa*a, már csak 6 milliárd emberé van hátra :)
Warpcore 2006. aug. 26. 19:06 | válasz | #1
"A program képes arra..."
"A módszer azonban közel sem tökéletes, nem készült hozzá ugyanis algoritmus.."
ha nincs algoritmus akkor a program hogy készült?
Egy hangelemzõben addig randomozták a szûrõt míg sikerült?