Minden termékébe integrálja a ChatGPT-t az Apple

Minden termékébe integrálja a ChatGPT-t az Apple

2024. június 10. 22:27, Hétfő
Az Apple megállapodást kötött az OpenAI-val, a startup mesterséges intelligenciája fog válaszolni az iOS-ben, a macOS-ben és Sirit kérdezve is, továbbá szöveget és képeket generál az alkalmazások számára.

Az Apple bemutatta az „Apple Intelligence”-t, az iOS 18, iPadOS 18, macOS Sequoia számára készült új MI-alapú funkciók sorát. Ez többek között e-mail összefoglalókat készít, képeket és emojikat generál, és lehetővé teszi Siri számára, hogy a nevünkben lépéseket tegyen. Mindezt az eszközön és a felhőben történő feldolgozás kombinációjával érik el, az Apple szerint az adatvédelemre összpontosítva. Az Apple Intelligence funkciók még idén széles körben elérhetővé válnak, a fejlesztők már nyáron megkezdhetik a tesztelését.

A bejelentések a WWDC élő közvetítésében és a sajtó részvételével egyidejűleg tartott eseményen hangzottak el az Apple kaliforniai Cupertinóban található campusán. Tim Cook, az Apple vezérigazgatója bevezetőjében elmondta, hogy a vállalat már évek óta alkalmazza a gépi tanulást, de a nagyméretű nyelvi modellek (LLM) bevezetése új lehetőségeket kínál az Apple-termékek képességeinek emelésére. Hangsúlyozta, hogy az Apple megközelítésében egyszerre van szükség a személyre szabásra és az adatvédelemre.

A tavalyi WWDC-n az Apple teljesen elkerülte az „MI” kifejezés használatát, helyette inkább a „gépi tanulás” kifejezést használta, mivel el akarta elkerülni a hype-ot, miközben MI alkalmazásait hasznos módon integrálta az alkalmazásokba. Idén az Apple egy új módszert talált ki, hogy nagyrészt elkerülje az „MI” rövidítést, és létrehozta az „Apple Intelligence” kifejezést, amely a gépi tanulás, az LLM és a képgeneráló technológiák széles csoportjára utal. Az „MI” kifejezés csak egyszer jelent meg a keynote-on: a prezentáció vége felé Craig Federighi, az Apple vezetője annyit mondott, hogy „Ez az MI a többieknél”.

Az Apple ernyője alatt számos olyan funkció van, amelyekhez iPhone 15 Pro, iPhone 15 Pro Max, M1 vagy újabb verziójú iPad vagy M1 vagy újabb verziójú Mac szükséges olyan készüléken, ahol a Siri amerikai angolra van állítva. A funkciók közé tartozik az értesítések priorizálása a zavaró tényezők minimalizálása érdekében, az íróeszközök, amelyek képesek összefoglalni a szöveget, megváltoztatni a hangnemet vagy szerkesztési javaslatokat tenni, valamint a névjegyek személyre szabott képek generálásának lehetősége. A rendszer a Siri segítségével olyan feladatokat is el tud végezni a felhasználó nevében, mint például egy adott személy által megosztott fájlok lekérése vagy egy családtag által küldött podcast lejátszása.

Az Apple közlése szerint az Apple Intelligence bevezetése során az adatvédelem kiemelt fontosságú. Egyes MI-funkciók esetében az eszközön történő feldolgozás azt jelenti, hogy a személyes adatok nem kerülnek továbbításra vagy adatközpontokban történő feldolgozásra. Az olyan összetett kérésekhez, amelyeket nem lehet helyben futtatni egy kisméretű LLM-en, az Apple kifejlesztette a „privát felhőalapú számítást”, amely csak a releváns adatokat küldi a szerverekre. Az Apple azt állítja, hogy ez a folyamat átlátható, és szakértők ellenőrizhetik a szerverkódot, hogy biztosítsák az adatvédelmet.


Az Apple Intelligence keretében Siri teljesen megújul: új logót és képernyő dizájnt kap, új képességet kap az árnyaltabb kérések megértésére, valamint arra, hogy a rendszer állapotára vonatkozó kérdésekre válaszoljon, vagy a felhasználó nevében lépéseket tegyen. A felhasználók hang- vagy szövegbevitellel kommunikálhatnak a Sirivel, és a Siri képes fenntartani a kontextust a kérések között. Siri a ChatGPT-hez fog fordulni a hangalapú kérdések megválaszolásához. Ehhez előtte Siri egy felugró ablakban engedélyt kér, azaz megkérdezi, hogy el akarod-e küldeni a kérdésedet a chatbotnak. A válasz egy ablakban érkezik vissza, amely jelzi, hogy az információ külső forrásból származik. A Siri ugyanígy kezeli a keresőmotorokat (nevezetesen a Google-t), így érdekes lesz, hogy a Siri pontosan hogyan húzza meg a határt a ChatGPT és egy keresőmotor között. Az Apple példájában a "segíts megtervezni egy 5 fogásos étkezést” kérés hangzik el bizonyos összetevőkre vonatkozó korlátozások mellett. Egy ilyen ultraspecifikus inputot egy hagyományos keresőmotorral nem lehet megtenni.

A Siri képes fényképeket is küldeni a ChatGPT-nek, és a szokásos generatív MI összefoglaló funkciókat is megkapja. Craig Federighi, a cég szoftvermérnöke elmondta, hogy „dokumentumokkal, prezentációkkal vagy PDF-ekkel kapcsolatos kérdéseket is feltehetsz”. Az összes rendszerszintű eszköz is megkapja a ChatGPT-t, mint beviteli lehetőséget. Vannak lehetőségek a lektorálásra, át tudja írni a szöveget „barátságos”, „professzionális” vagy „tömör” stílusban, és képes összefoglalót, listát vagy táblázatot készíteni. A demóban az Apple egy szöveges felszólítással nyit meg egy dokumentumot, és a generált szöveg a megnyitott alkalmazásba - jelen esetben a Pagesbe - kerül. A ChatGPT képes képeket is generálni és beszúrni. A ChatGPT-hozzáférés ingyenes, fiók létrehozása nélkül, de a fizető ügyfelek csatlakoztathatják a fiókjukat és hozzáférhetnek a prémium funkciókhoz.


Az újratervezett Siri képes a képernyőn megjelenő információkhoz kapcsolódó műveleteket végrehajtani, például egy üzenetekkel folytatott beszélgetésből származó címet hozzáadni egy névjegykártyához. Az Apple szerint az új Siri több száz új műveletet képes végrehajtani mind az Apple, mind a harmadik féltől származó alkalmazásokban, például megtalálni egy barát által az Üzenetekben vagy a Mailben küldött könyvajánlásokat, vagy konkrét fényképeket küldeni egy kérésben említett kontaktnak. Az iOS 18, az iPad OS 18 és a macOS Sequoia rendszereken „még idén” használhatók lesznek a ChatGPT funkciói, és az Apple "a jövőben más MI-modellek támogatását is integrálhatja”. Az Apple a Google-lel is tárgyalásban áll, így jó eséllyel annak chatbotja lesz a következő.

Az Apple Intelligence funkciókat számos helyre integrálták, többek között a Mail alkalmazásba, lehetővé téve a hosszú e-mailek egy koppintással történő összefoglalását és az e-mailek fontosság szerinti rangsorolását. A Jegyzetek és a Telefon alkalmazásokban a felhasználók hangfelvételeket rögzíthetnek és átírhatnak, majd mesterséges intelligencia által generált összefoglalót kapnak a szövegről. És van egy új Fókusz mód, melynél csak az azonnali figyelmet igénylő, rangsorolt értesítések jelennek meg.


Ami a szórakoztatóbb dolgokat illeti, az Apple bemutatta a Genmoji nevű új funkciót is, amely lehetővé teszi a felhasználók számára, hogy személyre szabott emojikat hozzanak létre egy leírás beírásával. A rendszer a felhasználó beírása alapján egy egyéni Genmojit generál további opciókkal együtt. Alternatívaként a felhasználók a barátok és családtagok Genmoji ábrázolásait is létrehozhatják fotóik felhasználásával. Az Apple szerint a generált Genmojik zökkenőmentesen integrálódnak az üzenetekbe, és matricaként megoszthatók, vagy a hagyományos emojikhoz hasonlóan reakcióként használhatók.


Bemutatkozott az Image Playground is - egy egyelőre még nem ismert MI-modell által működtetett képszintetizáló alkalmazás -, amely írásbeli utasítások alapján generál képeket. A funkció három stílusban teszi lehetővé a képalkotást: Animáció, illusztráció vagy vázlat. Az Image Playground integrálódik az olyan alkalmazásokba, mint az Üzenetek, és önálló alkalmazásként is elérhető. A felhasználók különböző kategóriák különböző fogalmai közül választhatnak, leírásokat adhatnak meg a képek meghatározásához, személyes fotókönyvtárukból felvehetnek egyéneket, és kiválaszthatják a kívánt stílust. Az Üzeneteken belül használva az Image Playground az aktuális beszélgetéshez kapcsolódó koncepciókat javasol, hogy a képalkotás relevánsabbá váljon.

Listázás a fórumban 
Adatvédelmi beállítások