Kivehetetlen vízjelet készített az MI-által generált képekhez a Google

2023. augusztus 29. 15:19, Kedd

A képeken nem lehet látni, de szoftverrel könnyen felismerhető, és a szerkesztésbe sem zavar bele.

A Google DeepMind csapata úgy véli, hogy a generatív MI-eszközök akkor lesznek nagyszerűek, ha olyan eszközöket is létrehoznak, amelyek felismerik, hogy mit hozott létre az MI. "Rengeteg nyilvánvaló, nagy horderejű oka van ennek." - mondja Demis Hassabis, a Google DeepMind vezérigazgatója. "Minden alkalommal amikor erről és más rendszerekről beszélünk, felmerül a mélyhamisítás, a deepfake kérdése." Mivel 2024-ben sok országban választás lesz, Hassabis szerint egyre fontosabbá válik a mesterséges intelligenciával készült dolgokat azonosító és felismerő rendszerek kiépítése. Hassabis és csapata az elmúlt években egy ilyen eszközön dolgozott, és a Google ma tette közzé nyilvánosan. A SynthID nevet viseli, és lényegében arra szolgál, hogy az MI által generált képeket vízjelekkel lássa el, mégpedig úgy, hogy az az emberi szem számára észrevehetetlen, de egy erre a célra kifejlesztett felismerő eszközzel könnyen azonosítható legyen.

A vízjel a kép pixeleibe van beágyazva, de Hassabis szerint nem változtatja meg észrevehetően magát a képet. "Nem változtatja meg a képet, a kép minőségét vagy a kép élményét" - mondja. "De ellenáll a különböző átalakításoknak - vágás, méretváltoztatás, azaz minden olyan dolog, amivel a normál, hagyományos, egyszerű vízjelet próbáljuk meg megkerülni." Hassabis szerint a SynthID mögöttes modelljeinek fejlődésével a vízjel az emberek számára még kevésbé lesz érzékelhető, de a DeepMind eszközeivel még könnyebben felismerhető lesz.

Hassabis és a Google DeepMind egyelőre nem közölt ennél több műszaki részletet. "Minél többet árulunk el a működéséről, annál könnyebb lesz kijátszani a hackereknek és a rosszindulatú szervezeteknek" - mondja Hassabis. A SynthID először a Google saját eszközeinél kerül bevezetésre, a Vertex AI platformon és az Imagen képgenerátornál. A valós tesztek után Hassabis reményei szerint egyre javul majd, és a Google több helyen tudja majd használni és többet tud majd megosztani a működéséről.

Hassabis reményei szerint a SynthID végül az egész internetre kiterjedő szabvány lehet. Az alapötleteket akár más médiumokban, például videóban és szövegben is lehet használni. Ha a Google már bizonyította a technológia működését, "a kérdés a méretnövelés, a megosztás más partnerekkel, majd a civil társadalommal folytatott vita arról, hogy hová akarunk eljutni. Ez egy bétateszt, egy új dolog első próbálkozása, és nem a deepfake probléma megoldása." Hassabis szerint a SynthID-t Chrome-bővítményként lehet majd kínálni, vagy akár a böngészőbe beépítve, hogy az egész weben azonosítani tudja a generált képeket. De még kérdéses, hogy az eszköznek proaktívan kell megjelölnie minden generált anyagot, vagy várnia kell valamilyen lekérdezésre a felhasználótól? És hogyan jelöljék az MI-származást, például egy hatalmas piros háromszöggel vagy valami finomabbal?

A SynthID a Google Cloud Next konferenciáján mutatkozik be, amelyen a vállalat a Google Cloud és Workspace termékek új funkcióiról tájékoztatja üzleti ügyfeleit. Thomas Kurian, a Google Cloud vezérigazgatója szerint a Vertex AI platform használata robbanásszerűen növekszik: "A modellek egyre kifinomultabbak, és nagyon megugrott a modelleket használók száma". Kurian szerint az ügyfelek határozottan aggódnak a hamisítványok miatt, de ennél sokkal hétköznapibb MI-felismerési igényeik is vannak. "Sok ügyfelünk van, akik ezeket az eszközöket reklámszövegek mellé szánt képek készítésére használják" - mondja példaként - "és az eredeti képet akarják ellenőrizni. A kiskereskedelem egy másik nagy kérdés: egyes webshopok mesterséges intelligencia eszközöket használnak arra, hogy leírásokat generáljanak a hatalmas termékkatalógusukba, és biztosítaniuk kell, hogy a feltöltött termékfotók ne keveredjenek össze generált képekkel. Lehet, hogy ez nem olyan hírértékű felhasználás, mint a hamis Trump-fotók vagy a pufidzsekis pápa, de a mesterséges intelligencia már most is megjelenik a mindennapi üzleti életben.

Bármilyen mesterséges intelligencia-felismerő eszköz bevezetése garantáltan fegyverkezési verseny kezdetét jelenti. Sok esetben ez egy vesztes verseny: az OpenAI már lemondott egy olyan eszköz létrehozásáról, amely azonosítaná a saját ChatGPT chatbotja által írt szövegeket. Ha a SynthID beválik, az csak arra ösztönzi majd a hackereket és a fejlesztőket, hogy kreatív módszereket találjanak a rendszer megkerülésére, ami a Google DeepMindot a rendszer fejlesztésére kényszeríti, és így körbe-körbe járnak majd. Hassabis szerint csapata készen áll erre. "Valószínűleg frissítenünk kell majd, mint egy vírusirtót vagy valami hasonlót. Mindig résen kell lennünk egy új típusú támadással és új típusú átalakítással szemben. Korai lenne a skálázásról és a civil társadalmi vitákról gondolkodni, amíg nem bizonyítottuk be, hogy a technológia működik."

Kapcsolódó cikkek

Listázás a fórumban