2003. május 4. 16:46, Vasárnap
Egy átlagos énekest is profivá varázsoló számítógépes rendszernek köszönhetően, lassan már a karaoke sem lesz olyan, mint régen.
"Végső célunk, egy olyan számítógépes rendszer megvalósítása volt, ami a gyenge énekhangot mondhatni professzionálissá, vagy a szintézissel készültet emberibbé teszi" - mondta Mark J.T. Smith professzor, a Purdue Egyetem számítástechnikai karának vezetője.
A cél eléréséhez a Georgia Tech diplomás hallgatójával, Matthew Lee-vel összefogva számítógépes hanganalízis és hangszintézis modelleket alkottak. Ezek a modellek, vagy nevezhetjük algoritmusoknak, alkotóelemeire bontják az emberi énekhangot, melyek így akár egyenként is módosíthatóak, hogy egy képzettebb énekhangot kapjanak az eredeti hangon előadva.
A stúdiók már jó ideje alkalmaznak hasonló technológiákat, azonban azok viszonylag durvák az új szoftver adta lehetőségekhez mérten, állítja Lee. Képesek ugyan kiemelni például a basszust vagy a szopránt, illetve megváltoztatni a hajlításokat, viszont nem modellezik újra a hangot. "Sokkal finomabb befolyásolást érhetünk el" - mondta Lee, aki április végén mutatta be kutatásait, Nashville-ben, a country zene fővárosában.
A rendszer egy speciális technikával bontja le az eredeti hangot. Ezután egy matematikai eljárás, a gyors Fourier transzformáció segítségével újjáépíti azt, ami lehetővé teszi a rendszernek a hang gyors újra szintetizálását. Smith, aki a jelfeldolgozás területére szakosodott, a nyolcvanas évek közepén kezdett el az alapul szolgáló "szinuszos modellen" dolgozni az eljárás úttörője, E. Bryan George közreműködésével. A modell teszi lehetővé az énekhang alkotóelemekre, vagy szinuszhullám szegmensekre történő bontását. Jóval később Lee-vel kifejlesztettek egy módszert a szinuszhullám szegmensek paramétereinek módosítására, amivel javítható az ének minősége.
A szoftver képes az énekhang mind a fél tucat erős frekvenciájának megváltoztatására. A frekvenciák közötti egyensúly adja a különbséget az énekesek között. Smith elismerte hogy szoftvere még további finomításokra szorul, első lépésben arra tanítja programját, hogy az képes legyen reprodukálni a jó country és Broadway énekhangokat, mivel ezeknél a műfajoknál a "minőség nem annyira körvonalazható” mint egy opera esetében.
"Bár sikereket értünk el az adatbázisunkban szereplő énekhangok minőségének javításával, még kell némi idő, hogy minden hangtípust megbízhatóan kezelni tudjunk. Sok kihívással kell szembenézni egy ilyen rendszer fejlesztése során" - mondta Smith.
Nem könnyű azt sem elérni, hogy az eredeti hang ne változzon drámaian az ének minőségének javítása során.
Lee és Smith a karaoke terén nyíló lehetőségeket sem hagyják ki a számításból. A technológiailag továbbfejlesztett hang Lee szerint szinte már zavarba ejtő. "Annyira furcsa visszahallani magam olyan hangokat kiénekelve, melyekről tudom, hogy soha nem lennék rá képes" - mondta Le, aki szerint a kereskedelemben való megjelenés még néhány évet váratni fog magára, egyrészt a fejlesztések miatt, másrészt a csapat még nem talált ipari együttműködőre.