Videó készíthető egy képből és szövegből

Videó készíthető egy képből és szövegből

2022. szeptember 22. 15:43, Csütörtök
A fejlesztés egy izraeli vállalkozáshoz köthető.

A mesterséges intelligenciára szakosodott D-ID izraeli cég egy új platformot indított. A Creative Reality Studio segítségével a felhasználók egy felöltött vagy előre elkészített képből és a hozzá tartozó beírt vagy hanganyagként elérhető szövegből videót generálhatnak. Összesen 119 nyelv, illetve különböző női és férfi hangok, valamint kifejezések (például dühös, boldog, szomorú, izgatott, barátságos) közül lehet választani. Ezután e paraméterek segítségével egy videó készül. A D-ID szerint a folyamat csak feleannyi ideig tart, mint a videó időtartama. A kezdeti tesztek azonban azt mutatták, hogy ez hosszabb ideig is eltarthat.

Természetesen a megoldás veszélyeket is rejt magában. A sértő szavakat tartalmazó deepfake videók megakadályozására a Microsoft szövegmoderáló szoftverét használják. Képfelismerő szoftverekkel kiküszöbölik, hogy hírességekről készült képeket töltsenek fel. A D-ID felhasználási feltételei tiltják a politikai tartalmú videók készítését. Amennyiben valaki a szabályokat megsérti, annak a felhasználónak letiltják a fiókját. A platform 14 napig ingyenesen tesztelhető. A tesztidőszak alatt legfeljebb 5 perc videoanyag készíthető, ezt követően a használat havonta 49 dollárba kerül.

A fejlesztéssel a D-ID azokat a vállalatokat célozza meg, amelyek ilyen módon szeretnének belső kommunikációra szolgáló tanfolyamokat vagy videókat készíteni. De az influenszerek is felfedezték maguknak a platformot. Gil Perry, a D-ID alapítója közölte, hogy azon is gondolkodnak, hogyan lehetne a szoftverrel avatárokat létrehozni. A társaság hozzáférhetővé tette a Deep Nostalgia nevű eszközt, amely a MyHeritage oldalon érhető el és régi fotókat kelt életre.

Kapcsolódó linkek

Listázás a fórumban 
Adatvédelmi beállítások