SG Fórum - Ai alkotások Stable Diffusion, GPT

Fórum / Tudomány, technika és gazdaság

_Atti_ 2023. ápr. 17. 23:05 | válasz | #95
Jó kérdés amit feltettél szerintem mert megmutatja azt az oldalát ennek a gépgenerálási metódusnak amit a nagy ámulásban nehéz kicsit észrevenni, hogy ezeknek az AI-knak más 'fogalmaik' vannak mint nekünk.

Mi persze az ő fogalmaikat nevesítjük a mi fogalmainkhoz de van köztük egy rés amit a tanítási módszerek fejlesztésével és még több adattal igyekeznek rövidebbre húzni, de szerintem mindig létezni fog.

Amiben tényleg szuper az 'AI' képgenerálás hogy teljesen új képet hoz létre. Amikor rajzol egy híres figurát egy híres épület előtt, olyankor nem 'összefotosoppolja' azokat megkeresett képdarabokból, hanem tényleg nulláról varázsolja elő egy x*z méretű zajfelhőből.

(Sajnos ebből van a baj mert még egy photoshoppolt kép lebukhat a források felfedésével, addig egy generativ kép tényleg az első eredeti. Na persze ha hihetőek lennének meg tökéletesek de szerencsére annyira azért nem azok és talán nem is lesznek.)

A generáláshoz mindenesetre meg kell tanulnia megerősítésekkel hogy csinálhat olyan pixelzajt amit elfogadunk a hires figurának és olyan pixelzajt amit elfogadunk a hires épületnek, meg ugy összességében hogy elfogadjuk hihető 'kép'nek.

Azt, hogy az egyes elemek vagy az összkép 'megértése', a létrejött modell, egészen pontosan mit takar, az tudtommal nagyonnagyrészt megfejthetetlen számunkra, azon tul amit a különböző osztályozó algoritmusokkal 'irányítunk'.

A kapott eredményekből ítélve valószűleg egy részelem 'megértésekor' nem ugyanolyan struktúrában rendeződik a modell, mint ahogy azt mi értelmeznénk. (hozzátéve hogy a mi megértésünk struktúráiról sincsen különösen definitívnek mondható teóriánk).

Szokás az AI neurális hálók tanítását az evolúciónkhoz hasonlítani, azért a komplexitás nem elhanyagolható, hisz a földi élet annyira sok dinamikus környezeti tényező ölelésében alakult hogy lehetetlennek tartom hogy a mi, és egy MI koncepcióképzése akár köszönőviszonyban is lehessen.

Persze lehet szuper hatékony meg hasznos, csak a folyamatok teljesen mások.

Pl ez a kép a dall-e kezdőlapjáról amit letöltöttem. Egy eleme egy rajzolt nap: Link (a fekete kört én huztam rá)

Amikor a kontúr megszakad máshol folytatódik, kicsit szétesik, nem nehéz kitalálni hogy arra van 'esze' hogyan hitesse el hogy ez egy kör ami egy íven húzódik, valójában ennek a modellnek nem sok köze lehet ahhoz hogy mi mit gondolunk egy körről,vagy hogyan rajzolnánk (hogy az egy folytonos vonal egy középpont körül egyenlő távolságra stb.)

ugyanigy utánozhat lendületességet de annak semmi köze a lendülethez, az eszközhasználat sajátosságaihoz.

De még a digitális világban maradva is, valószinűleg az hogy egy Ait betanitsunk hogy mondjuk nyisson meg egy PS-t és az ottani eszközökkel manipuláljon képet az roppant erőforrás igényes lenne. (És valószinűleg először azt a trükköt használná hogy már legenerált képet ugymond 'brush-nyomtasson' a szoftverrel)

Végtére azt gondolom hogy modellhű hadieszközökről készíthetnének neked ugyan képet ezek a programok elvben, de nem igazán vannak ehhez kiképezve, illetve ahogy írtad ez nagyon sok spéci fogalom modellezését igényelné aminek a pontosságát valószínűleg dollárszázezrek belefektetése után is eléggé akarnod kéne elhinned.

Szerintem olyanokról meg álmodni se lehet ezzel a generálási módszerrel hogy pl egy modell részméreteiben megbízhass, még két szárny hosszának egyezése a 'perspektivából' fotogrammetriával ellenőrizve is szerintem scifi.

Ebben még nagyon sokáig jobban jársz ha találsz egy nagyjából jo 3d modellt, bepózolod egy egyszerűbb real time rendermotorba és nyomsz egy screenshotot..:)

Utoljára szerkesztette: _Atti_, 2023.04.17. 23:10:20

Válasz 'militavia' üzenetére (#89)