Legyen akkor egy paplovag, aki kardjára támaszkodik oldalnézetben, fénylő páncéllal, felnyitott sisakrostéllyal.
Akartam akkor egy sima lovagot piros palástban.
A kardra támaszkodást nem írtam, magától hozta. Amikor előző rajznál kértem, akkor bezzeg nem értette... Arcot nem akar rajzolni, akárhogy erőltettem. A kezek nem működnek itt sem. Anatómiailag a bal és jobb kéz nem jó. Ha ez csak egy kis ikon egy NPC-nek, és, ha lenne arca, akkor tényleg OK. De bármelyik része közel van ahhoz, amit kértem? Hát, nagyon nem.
De akkor legyen tényleg fantázia, római légiósnőt akartam páncélban, sisakban, hosszú hajjal. Hát öö, nem. :)
Mi lenne a feladat?
Legyen ott a kard, ahol a rajzon és a megfelelő irányba álljon. Stimmeljen a haj színe és stílusa. Legyen a tőr jó helyen. A tőr markolata is stimmeljen. Legyen a csuklópánt rajta. A csizma színe és karimája is ott legyen. A melle pont olyan szép kerek legyen, mitn a képen. A szeme színe legyen jó és nézzed az olvasóra. PONTSAN rá. De még tudnék rajta specifikálni ezt-azt, ami ezt a képet megkapóvá teszi és okkal néz ki úgy, ahogy. Ha majd ezt lemásolja legalább 70-80% featurrel, akkor OK.
Egy átlagos grafikusnak ez whatever feladat. Az MJ meg nem tudott értelmezni EGYETLENEGY paramétert sem.
De azt is megtudom mutatni, hogy más által csontig felszopott képekkel mi a hiba...
Nah, a gunfire szót és a fát már érti. De full random harckocsikat rajzol, a torony hol innen, hol onnan, a futógörgők stb. A gunfire sem így néz ki, betette egy random effektet értelem nélkül.
Ez melyik rajzoló amúgy?
A fő probléma, hogy fogalmakat nem ért a cucc. Kéne neki egy másik MI, ami érti, hogy mi a T-55, mi az AMX-13 és mi az M1 Abrams és nem ezeket mixelné.
Én továbbra sem érzem azt, hogy ettől egy grafikusnak be kéne tojnia. Egy viszonylag alap koncepció képnek is annyi paramétere van, hogy esélye nincs az MI-nek lerajzolni azt, amire gondolok. Még kb. sem, nemhogy pontosan.
És akkor még csak fesetegetés / ceruzarajz max. amit tud.
Ha azt kérném, hogy létező dolgokról csináljon wireframe-t 3D modell nélkül? Ezeket én a full noob is megtudtam csinálni és azóta sokkal többet.
Szóval én azt látom, hogy ez még mindig egy érdekes hobbi játékszer és nagyon LQ művészet a fogalmatlanoknak, ha nem számít, hogy mennyire van közel a koncepcióhoz a rajz, csak random nézzen ki jól.
Arra képtelen, amire igazából egy grafikust kell megfizetni...
a bing képek, persze nem is hiszem hogy műszaki rajzokra van, hanem arra hogy egy táncoló majom üljön egy kopasz ficko fején...na az biztos jo kép lesz :-D
ez olyan mint a könyvírás, most az ujdonség miatt megvannak ijedve hogy a chatgpt írja majd a könyveket, valojában nem kell félni mert csak sablonok alapján tud dolgozni amit talál a neten. lelke sosem lesz amit egy jó író könyvét fel leheseen ismerni, lektorálásra nagyon jó vagy hogy rosz magyarsággal megirt sztorit ékes angol nyelvvé varázsolja egy parafázis altt...de ha konkrétan könyvirásra akarnád használni annyi időbetelne mire kisakkozoza mit szeretnél hogy annyi idő alatt én is megirom
ez vonatkozik rád is, lehet kétnapi kinlodás után megcsinálná amit szeretnél de addigra te is megcsinálod mert gondolatot vagy elképzelt vizuális képet nem tud megjeleniteni még
végül is akkor használhatnád, az is már AI működik azt a progit hogy beviszel egy képet a tankrol, csinál egy 3d-s drotvázat és lemodellezi ahogy akarod 3d be és akár körbe is járhatod vagy beleülhetsz :-)
Ezt melyik tudja amúgy? Én annak is örülnék, ha képes lenne az MI megérteni, hogy mutatok egy eszközt, mutatok egy effektust és kombinálja össze a kettőt. De hát erről szó nincs úgy látom.
Jó kérdés amit feltettél szerintem mert megmutatja azt az oldalát ennek a gépgenerálási metódusnak amit a nagy ámulásban nehéz kicsit észrevenni, hogy ezeknek az AI-knak más 'fogalmaik' vannak mint nekünk.
Mi persze az ő fogalmaikat nevesítjük a mi fogalmainkhoz de van köztük egy rés amit a tanítási módszerek fejlesztésével és még több adattal igyekeznek rövidebbre húzni, de szerintem mindig létezni fog.
Amiben tényleg szuper az 'AI' képgenerálás hogy teljesen új képet hoz létre. Amikor rajzol egy híres figurát egy híres épület előtt, olyankor nem 'összefotosoppolja' azokat megkeresett képdarabokból, hanem tényleg nulláról varázsolja elő egy x*z méretű zajfelhőből. (Sajnos ebből van a baj mert még egy photoshoppolt kép lebukhat a források felfedésével, addig egy generativ kép tényleg az első eredeti. Na persze ha hihetőek lennének meg tökéletesek de szerencsére annyira azért nem azok és talán nem is lesznek.)
A generáláshoz mindenesetre meg kell tanulnia megerősítésekkel hogy csinálhat olyan pixelzajt amit elfogadunk a hires figurának és olyan pixelzajt amit elfogadunk a hires épületnek, meg ugy összességében hogy elfogadjuk hihető 'kép'nek. Azt, hogy az egyes elemek vagy az összkép 'megértése', a létrejött modell, egészen pontosan mit takar, az tudtommal nagyonnagyrészt megfejthetetlen számunkra, azon tul amit a különböző osztályozó algoritmusokkal 'irányítunk'.
A kapott eredményekből ítélve valószűleg egy részelem 'megértésekor' nem ugyanolyan struktúrában rendeződik a modell, mint ahogy azt mi értelmeznénk. (hozzátéve hogy a mi megértésünk struktúráiról sincsen különösen definitívnek mondható teóriánk). Szokás az AI neurális hálók tanítását az evolúciónkhoz hasonlítani, azért a komplexitás nem elhanyagolható, hisz a földi élet annyira sok dinamikus környezeti tényező ölelésében alakult hogy lehetetlennek tartom hogy a mi, és egy MI koncepcióképzése akár köszönőviszonyban is lehessen. Persze lehet szuper hatékony meg hasznos, csak a folyamatok teljesen mások.
Pl ez a kép a dall-e kezdőlapjáról amit letöltöttem. Egy eleme egy rajzolt nap: Link (a fekete kört én huztam rá) Amikor a kontúr megszakad máshol folytatódik, kicsit szétesik, nem nehéz kitalálni hogy arra van 'esze' hogyan hitesse el hogy ez egy kör ami egy íven húzódik, valójában ennek a modellnek nem sok köze lehet ahhoz hogy mi mit gondolunk egy körről,vagy hogyan rajzolnánk (hogy az egy folytonos vonal egy középpont körül egyenlő távolságra stb.) ugyanigy utánozhat lendületességet de annak semmi köze a lendülethez, az eszközhasználat sajátosságaihoz. De még a digitális világban maradva is, valószinűleg az hogy egy Ait betanitsunk hogy mondjuk nyisson meg egy PS-t és az ottani eszközökkel manipuláljon képet az roppant erőforrás igényes lenne. (És valószinűleg először azt a trükköt használná hogy már legenerált képet ugymond 'brush-nyomtasson' a szoftverrel)
Végtére azt gondolom hogy modellhű hadieszközökről készíthetnének neked ugyan képet ezek a programok elvben, de nem igazán vannak ehhez kiképezve, illetve ahogy írtad ez nagyon sok spéci fogalom modellezését igényelné aminek a pontosságát valószínűleg dollárszázezrek belefektetése után is eléggé akarnod kéne elhinned. Szerintem olyanokról meg álmodni se lehet ezzel a generálási módszerrel hogy pl egy modell részméreteiben megbízhass, még két szárny hosszának egyezése a 'perspektivából' fotogrammetriával ellenőrizve is szerintem scifi. Ebben még nagyon sokáig jobban jársz ha találsz egy nagyjából jo 3d modellt, bepózolod egy egyszerűbb real time rendermotorba és nyomsz egy screenshotot..:) Utoljára szerkesztette: _Atti_, 2023.04.17. 23:10:20
De, az. A keresőszavak alapján és totál más képzeltem el. Folyamatosan erről beszélek. Ha kontextus és narratíva nélkül teszel ki egy képet, akkor hú, meg há. Ha meg összevetem azzal, hogy ÉN mit képzelek el, vagy ÉN mit akarok láttatni, akkor elröhögöm magam, hogy ez mi a foshuzatos raklapaszar...? :)
1. A szavanna nem így néz ki. Sehol. Ez inkább egy kelet-európai zöldövezet, ahol egy erdő széle van vízátfolyással. Így.
2.Ez clear sky? Ahol szemre 7/10-es borultság van...? WUT? Ez clers sky és szavanna.
3. A képen egy szem truck sincs, pedig azt kérted.
4. Vizet nem kértél, mégis van a rajzon. Páccs.
5. A levegőben levő random tűz és robbanás mitől és hogyan? Csak simán odahányta mert nem érti, hogy minek, miért, hol és hogyan kéne lennie. Full értelem nélkül találgat. A forma, alak, stb se stimmel, hogy akkor mi és hány darabra robbanna.
6. Ilyen harckocsi nem létezik. Se Afrikában, se sehol. Még formára sem. A lövegcső szar helyen, a lövegcső szarul néz ki.
Mondom, ez egyelőre egy érdekes gyerekjáték. Semmire sem alkalmas a fogalmatan tömegek elkápráztatásán túl. A no+1 lépését nem érti egy művészi folyamatnak, hogy mi az a kompozíció... Full random hülyeségeket mixel összevissza.
Ha csak megmutatod, hogy ilyet "rajzolt" az MI, akkor hú és há. Csak te megmutattad mi volt a szó és az ember az asztalt csapkodja a röhögéstől.
t-55 angolan war képeket nézzél. Ha lenne értelme ennek az izének, akkor ez lenne a kiindulási alap, mert Afrika, szavanna és harckocsi az itt volt.
De nem ez. Mert az MI fullhülye. Mert nem ért meg semmit. És mániákusan mindent sötét tónusban akar rajzolni. Mert ez a gyakori a háborús téma tűz és robbanásnál a sötét / sárga kontraszt és fenyegető hatás miatt.
De az MI nem érti ezt, mert nem ember. Csak egy gép, ami sémákat másol. Szarul. Utoljára szerkesztette: militavia, 2023.04.18. 13:04:43
Egy művésznek az angolai, szavannai fotókat megmutatod, felvázolod neki, hogy milyen szögből, melyik hogyan legyen egymáshoz képest és felskiccel neked n+1 felállást, hogy válassz.
Az MI a skicc szintet nem képes hozni, hogy az alapelemek a képen (fogalmak és tárgyak) és pozíciók rajta legyenek. Mert nem érti mit csinál. Egy nagyon szűk mintából találgat aztán sokan elfogadják a full szar végeredményt is és bemesélik maguknak, hogy "na, jó, kb. stimmel." Hát egy f*szt.
Látod, megmutattad mit írtál be és ízekre szedtem. Erőlködés nélkül. A képen lényegében SEMMI SEM STIMMEL.
És erre mondod, hogy nem reménytelen? Én meg pislogok. :) Utoljára szerkesztette: militavia, 2023.04.18. 13:11:15
Nah, ha majd kb. ennek alapjait megérti az MI, hogy mi micsoda és miért ott van, akkor no.1 lépés meglesz.
Ezek egy ovis skicc arról, hogy akkor hol legyen a tank, merre álljon, hol legyen és milyen talaj alapszín, treeline, bokor/sövény, nagyobb szikla és mi robbanjon fel/égjen.
De ez a kb. 50-100 paraméter, amivel fel kéne ruházni a rajzot csak néhány. Ebből egészen pontosan kb. 2-3-at értette meg a buta MI. Legyen rajta tank és robbanás. Van, csak mindkettő szar. A többi nem stimmel.
Mert csak a tank miből állna "paraméterezve"?
* típusa, csak maga a család, legyen T-55A mondjuk * milyen színe legyen? feltesszük, hogy egyszínű...! * merre álljon a képen a test * merre álljon a torony? * milyen szögben álljon a lövegcső? * áll vagy mit csinál? Kifpugóból jön füst? * tüzel a löveg éppen? * a kép melyik részén van? * mekkora részét töltse ki? * milyen távolságban van maga az egész kompozíció, hogy a tank milyen távolságban legyen a nézőtől? * van van a hk-n külsőleg más? Pl. üzemanyag tartály, málházva rá valami stb.
Na, ezt az összes főelemre ráhúzod és kb. meg van, hogy mit kérsz a művésztől. Ő érti néhány kép alapján és megcsinálja.
Az MI-nek egy ilyen 100-as listából azt sikerült eltalálni, hogy legyen rajta tank és robbanás. De az is szarul.
Bocs, fényévekre vagyunk attól, hogy a cucc azt csinálja, amit mondanak neki. A saját feje után látványos, de marhaságokat firkál mindenféle értelem nélkül.
Látni akarom a kardjára támaszkodó női paplovagot, oldalnézetből, ahogy rám néz, fekete copfos hajjal, teljes fémpáncélban a sisakra és kardjára támaszkodva.
Vagy lássuk újra a Afrikában, szavannán a T-55-ös harckocsit.
Látni akarom a kardjára támaszkodó női paplovagot, oldalnézetből, ahogy rám néz, fekete copfos hajjal, teljes fémpáncélban a sisakra és kardjára támaszkodva.
* nem néz rám * nem fekete a haja * copfot se látni * kardra se támaszkodik * sisakra se támaszkodik
A képen az egyetlen pontos dolog kb az, hogy nő és páncél van rajta. Semmi más. És akkor még ahogy az afrikás képnél el sem kezdtem specifikálni milyen páncél legyen, milyen háttérrel stb.
A fogalmatlan tömeg ámul, én meg továbbra is azt mondom, ez egy drága játékszer, hogy kérsz egy buta MI-t, hogy rajzoljon valamit, majd rajzol tök mást, amit kérsz... Ha egy grafikus ennyire buta lenne, fizetnél neki? Szerintem nem. :)
Továbbra is azt látom. Kontextus nélkül, whoa, húdejó, szép. Csak rohadtul nem azt rajzolja, amit én kértem.
Talált a segghülye "MI" valami képet, amin nő és páncél van oszt lemásolta minden értelem nélkül. Utoljára szerkesztette: militavia, 2023.05.09. 10:56:15
Szép? Igen. Ha fagyos tájképet akarok, akkor én pont erre gondoltam? Nem...
Inkább ilyenre, de ez sem pontos, csak úgy kb. De lehet ez megint, erdő, mező, tó, süthet a nap, lehet bordult az ég stb.
Egy grafikusnak csak igénytelen megrendelőtől kell félnie szerintem, az MI rajzolástól nagyon nem. Kb. arra elég ez az izé, hogy kb. a stílust belője a grafikus. Vagy még azt sem, mert láthatólag rá van fixálódva alaptémákara.
De erre most is képes egy grafikus. Gondolom egy nem félhülye is felvillant egy témáról 10-20 féle alap kinézetet, hogy akkor "erre gondol a megrendelő?"
Még a legegyszerűbb képnek is alsó hangon 20-50 paramétere van. A MI full randomra választ ezek közül és stílus is. A végeredmény lehet szép, csak a büdös életbe nem sikerült azt rajzolnia, amit én szeretnék. A közelében nincs soha semminek, amit én akarok látni. Utoljára szerkesztette: militavia, 2023.05.09. 15:14:30
groteszk módon egyedül mondjuk egy programozonak kell félnie, de valoban egy grafikusnak vagy egy írónak nem, legalábbis jelenleg véletlenül az írói cipőben vagyok és ugye probálgattam és random, de kb egy promtal behatárolt mesében mindig valaki elindult valahova, semmi egyedi esztétika vagy példa moralitás kimerül a homokosokat nem lehet megsérteni dologban
attol hogy ugy cseveg mint egy cimbora szkriptek, rutinok sorozata, elolvastattak vele mondjuk 10 ezer könyvet akkor abbol fog példákat felhozni
elsütöttem még egy promtot a tankra de nagyon rugalmasan bánt továbbra is a tank felépitésével.
elképzelhető hogy egy 100 mondatos promtra pontos képet adna de lassan már a promt irás is külöm szakmának számit
Nem értek hozzá sajna, de mintha rémlene valami realistic promt is, lehet meg kell adni valami értéket, hogy mennyire legyen a fikció és valóság aránya ?
A probléma az, hogy a ford mustangot felismeri, a harceszközökről és n+1 másról nem tudja, hogy mi. Nem lehet a realisztikusságát annak állítani, amit meg sem tud rajzolni.
Igy van, a probléma sztem az , hogy tul nagy az elvárás és ráadásul olyantol ami nem is arra valo amire használni szeretnéd, de a program a hibás és nem az aki elvár olyat valamitol amit nem tud. Tipikusan ugy itéli meg valaki a halat , hogy hogy mászik fára akkor eléggé rossz véleménye lesz rola. Mintha bemennél egy ovodás osztályba és számonkérnéd rajtuk, hogy a quantum fizikához miért nem értenek.
DE mondok, jobban ha bemész egy grafikushoz aki 20 éven keresztül fest rajzol és ugyan ezt elmondod neki akkor fejből ö sem fogja tudni neked realisztikusan lerajzolni a tankot ahogy szeretnéd. Egyrészt nem gondolat olvaso, másrészt ha nem jártas a témában mint ahogy az AI sem akkor nem fogja tudni , hogy hogy éz ki, hiába hires festo az illető. DE bármely szakmára rá lehetne ezt huzni, ha olyat kérsz töle ami különleges , azt em fogja tudni.
A mostani AI az kb egy 5 éves szintjén van és egy bizonyos adatbázisbol van tréningelve, ha abban az adatbázisban nem szerepel a katonai téma akkor nem fog tudni neked képet rajzolni rola, általános fogalma lesz, de nem tipus specifikus. ÉS ráadásul a képi AI egy muvészi részre van beálitva, tehát ugymond szabadjára engedi a fantáziáját egy bizonoys kereten belül. Ha minden tüpontosan megcsinálna amit akarsz ahhoz könyvméretü leirás kellene és akkor valoban elmondhatnánk, hogy nincs szukség grafikusokra, ha bárki akinek van sok ideje, hogy több oldal részletes jelzöt irjon a képrol megkapja azt.
ÉS ez nem csak a kép készitő AI-nál a chatGPT-nél is igy van hiába irsz neki , hogy csináljon egy kodot, ha amit ir nem ugy lesz ahogy te szeretnéd akkor az is hulye?
Sztem érdemes elgondolkodni arrol, hogy mit vársz el mitöl mielött valamiről vélemyényt nyilváánitsz ráadásul ilyen meszsemenő kijelentéseket, egy olyan valamirol ami még nincs egy éve sem , hogy használhato a nagyközönyésg által.
Egy grafikusnak mutatok pár rajzot, skiccelek és az alapján megrajzolja. Mert érti. A MJ és az összes többi nem érti. És innentől fogva game over.
Ezeknek a gyakorlati haszna egy szűk spektrumot leszámítva 0. Arra jó, hogy kb. full random kb. egy témához hasonlító illusztrációt csináljon. A lenti női harcos egy HKK / Magic lapra jó, ha nincs konkrét elvárásod, hogy milyen páncél legyen rajta stb. De eddig is tudtál ilyet venni stock oldalakoról kb. annyiért, amimbe a MJ használata kerül vagy picit többe. Ezek árait lentebb nyomhatja.
N+1 területen ez labdába nem rúg egy grafikus mellett.
sztem te nem érted. Mert nem mutatsz képet és skicdet senkinek csak szövegbe irod le egy 5 éves értelmi szinvonalu valaminek aminek lehet hogy köze sincs a haditehnikához olyan szinten ahogy azt szeretnéd.
Ha bemész az ovodába a képeddel és megkéred oket, biztos nagyon realisztikus M1esek fognak készülni neked. ÉS ez egy ART Ai nem egy hogyan csináljunk preciz tüpontos képet program .
Még nem tart ott a fejlödése és a tudása , hogy olyan képet gyártson amilyenre igényed van, és ezt még nem is lehet elvárni, az , hogy te ezt teszed még mindig nem az AI hibája.
A csapból is az folyik, hogy elveszi a grafikusok munkáját az MI. Én meg azt látom, hogy a minimum minimumára sem képes arra, amire kéne és BÁRMIT akartam vele rajzoltatni, ami célfeladat és kicsit is igényes, akkor marhaságokat rajzol.
És volt olyanrol szó, hogy az AI megjelenés másnapján már be se kell jönniuk a grafikusoknak? nem évek multán elöfordulhat igen, vagyis azt amit állitottak nem biztos, hogy nem lesz iaz, de nem azonnal. Rengetek fejleszts és imput kell még és nem is egy van már mindegyik más más megközelitéssel más tréninggel rendelkezik.
ÉS esetleg a fizetős verziot használtad vagy az ingyenest, mert ott is lényeges különbség van.
AS másik, hogy te mit értesz célfeladatnak, célnak és mi határozza meg az igényesség fogalmát, az ami neked az a másiknak nem és forditva is igaz.
Pont hogy arról volt nemrég több cikk is, több platformon, hogy baromira nem kell félni sem a grafikusoknak, sem az íróknak, hogy munka nélkül maradnak az AI miatt. Én grafikus/tördelő vagyok, de baromira nem félek attól, hogy az AI összeállít egy 16 oldalas kiadványt cikkekkel, képekkel, reklámanyagokkal, stb...
még egy minimalista logoval is meg kell küzdeni hogy olyan legyen amilyet akarok
viszont a szkecsre visszatérve most több olyan alaklmazás megjelent ami ez alapján generál képet, talán egy egyszerűbb sherman tankot már lehet vele rajzoltatni
Néhány haverral van egy ilyen zárt csoportunk, ahol AI generált képeket pakolunk fel, meg beszélgetünk a témáról. Arra szerintem tökéletesek a mostani AI-k, hogy pl. ilyen nem túl komoly, nagy precízitást igénylő képeket generáljanak. Mint pl. Andree The Giant balettozik, horror játékbabák, szakállas vigyorgó Bill Gates, hírességek ha black metal bandában lennének, stb... Sokszor meglepően jó eredményeket hoz, persze ehhez minél több és pontosabb preferenciát kell megadni. Néhány kép. :)
Akkor fussunk neki újra az összes lenti történetnek.
A paplovag nőnek a leírt paraméterekkel. Az afrikai képnek, amit te definiáltál.. És legyen egy F-15 vadászgép, hogy indít egy rakétát, mindenféle megkötés nélkül.
Az új kedvenc online ai szolgáltatásom a koboldai horde, ami igazából nem cég hanem ingyenes nyílt forráskódú szoftver, osztott hálózat amihez bárki adhatja a saját hardverét (tehát ha van egy csúcs gamer PCd és napelemed csak telepítsd a szoftvert és amíg nem használod a géped addig is segíted a hálózatot) elven működik, így nem lesz olyan cenzúrázott mint amit a például a chatGPT/character ai esetén látunk.
Szöveg generáló online felületük címe: https://lite.koboldai.net/ Vagy https://agnai.chat/ ... 13 és 20 milliárd paraméteres modelljeik vannak, de már tesztelnek 70 milliárd paramétereset is.
Belegondolva ez olyan mint a torrent, ahol szintén a legtöbb ember van leechel, aztán páran gigabites nettel seedelnek.
A kéréseket a hálózat anonimizálva küldi a workereknek de mivel nyílt forráskódú szoftver a workerek módosíthatják és olvashatják szóval személyes infót ne írjatok a chatbe.
Hallom van új MJ. Akinek van rá ideje és energiája kérem próbálja ki ezeket.
Kipróbálná nekem az alábbiakat valaki, aki használja ezt?
Rajzoljon egy éjszaka F-15-ös vadászgépet, ami rakétát indít.
Rajzoljon egy női paplovagot, ami egyik lábával sisakon áll, kardra dőlve támaszkodik, fekete copfos haja van és feléd néz. Legyen rajta szürkés páncél, ami láncing.
Rajzoljon egy Sz-300 légvédelmi rendszert, ami rakétát indít napos időben egy zöld mezőn.
Rajzoljon egy M1 Abrams harckocsi szakaszt, ami egy erdősáv felé tart és tüzel a löveggel.
Nagyon kíváncsi vagyok, hogy mennyire lesz ostoba. Amikor utoljára próbáltam én és más használni, szokás szerint full hülységeket rajzolt...
SDXL a legegyszerűbb módon, legelső generált képek, controlnet, inpainting és egyéb tökölések nélkül. Tehát a rendszer képpességének 10%-val 5 perc alatt:
Köszi. Sajnos a helyzet változatlan. Látványos, de használhatatlan egzakt célra. Random grafikának jó.
Az elsőn nem létező repülőgép van, na me a repülőgép a hajtóművéből indul a rakéta és hátrafelé. XD Ezen felül full értelmetlen élek stb. van a gépen, egy ilyen gép repülni se tudna.
A 2. nem néz rám. A sisakon állnia kéne és nem viselnie, kard nincs is a képen. Szóval ez továbbra is egy random harcos nő. Egy Magic kártya random illusztrációnak elmegy, konkrét kérdést nem igazán érti. Kitenném a falra képként? Lehet. De valójában nem ezt kértem. Ha nekem egy grafikus ezt adná át kész munkának, egy huncut vasat sem kapna. :)
Az Sz-300-nál a járművek közül az egyik legalább már kb. stimmel, de kíváncsi voltam arra, hogy mennyire ismeri fel. Hát, összemixelte az Sz-300P és Sz-300V családot. :) A rakéta az Sz-300V-re hajaz, a hátszó lánctalpas is, de alapvetően ez kb. karikatúrának jó. Annak viszont nagyon.
A legközelebb az utolsó van, de ott sem tüzel senki, a fire-t láng füstjeként értelmezte, nem a löveg tüzel. Nem specifikáltam, hogy nem oszlopban, hanem sorba kéne mennie, ezt talán már megérti.
Továbbra is azt mondom, hogy ez egy érdekes játékszer, nem munkaeszköz. Legalábbis nekem. Egy érzés átadására képesek, de még ezt sem tudnám használni. Grafikusnak ez kb. kb. az érzés / koncepció átadására jó kb. Ha még részletesebben adnám meg, akkor még ennyit sem tudna az elvárásokból.
Az SDXL hogyan használható és mennyibe kerül amúgy? Mert ez is fontos szempont, ha ezzel valaki profitot akar termelni. És ez ráadásul ugye csak egyféle grafika generálás. Körvonalrajzokat nem tud csinálni, ha jól értem.
Tehát lövés sem lenne, ha csak ilyen rajzokat kéne csinálnia.
Illetve az Sz-300-nál azt sem érti, hogy mikor van indítási pozícióban tubus. Honnan is értené, hiszen értelem nélkül másol továbbra is. Csak már picit talán pontosabban.
stable diffusion (SDXL) teljesen ingyenes és otthon futtathatod egy 10GB-os VGA-val. GUI-nak ott a A1111, ComfyUI vagy Ruined Fooocus, a modelleket meg megtalálod huggingface-en és civitai-on. Telepítési útmutató meg van millió YT-on. Ha nincs 10GB VRAM, akkor meg ott az SD 1.5 modell, ami kisebb/gyorsabb.
Egyébként az eremény amit belinkeltem simán szószerint angolra fordított prompt alapján történt. A generált képeket a végtelenségig lehet finomhangolni, lehet LORA-kat tanítani akár harci járművekkel, stb.
A1111 és ComfyUI-al (lásd kép) lehet utólag szerkeszteni, újragenerálni részleteketet a képeken (inpainting), több modelt, összekötni, kontent szenzitív modelleket használi (LORA) stb, stb.
Ez egy eszköz az alapokhoz, nem célja hogy önállóan kielégítsen minden igényt. Generálsz egy jó alapot aztán fotosopolod ahogy tetszik. Illetve tök jó egyedi "stock fotók" készítésére. A feliratokkal bajban van minden model, azzal kár is próbálkozni. Közvetlenül pénzt keresni max úgy lehet vele, ha pornót vagy kamu instalányokat generálsz. Mint írtam ez csak egy tool. Ahogy a GPT és egyéb LLM modellek is. Utoljára szerkesztette: MerlinW, 2024.01.11. 12:33:08
Akkor ezt buktam, mert az 6GB-os 1660S-mel nem tudom kipróbálni.
Az SD1.5 az még régebbi? Az is telepíthetős igyenes cucc? Olyat tud, hogy mondjuk egy screenshotot adok neki és azt alapján rajzoljon? Utoljára szerkesztette: militavia, 2024.01.11. 14:15:26
Igen az 1.5 az XL előtti. Tudod futtatni némi paraméterezéssel és igen tudsz minta alapján képet generálni, controlnet-nek hívják. Ha ott van huggingface-en akkor igyenes (kb minden az, az OpenAI cuccain kívül). Viszont ha lokálban akarod csinálni, készülj fel pár napnyi tanulásra, meg némi python csomagkezelés alapozásra.
Ha meg nem akarod ezt, akkor a Bing és Bard képgenerálóit is tudod ingyen használni. Midjourney az egyetlen fizetős képgeneráló a nagyok közül. Utoljára szerkesztette: MerlinW, 2024.01.11. 14:22:10
Hm, ez érdekes, hogy ingyenesek. Milyen üzleti modell alapján működnek ezek a cégek akkor?
A többi technikai részhez nem értek. Szóval úgy tűnik, én még kézzel fogok rajzolgatni, ha akarok is valamit. XD Utoljára szerkesztette: militavia, 2024.01.11. 15:09:32
Felhő alapú API-kból és vállalati szolgáltatásokból jön a pénz nekik, illetve támogatásokból. Ahogy a Meta is ingyen adja a Llama model-t (lokális GPT).
Huggingface-ről több mint 460 ezer AI modelt tölthetsz le ingyen és bérmentve. Utoljára szerkesztette: MerlinW, 2024.01.11. 15:30:44
Na tessék. Pont erről beszélek. Egy full random izének elment, de csak kicsit is megnézte a közönség, hogy mi ez és egyből totális bukta, mert látszik ki és mit csinált.
Ahol kemény elvárások vannak, hogy ne f*szág legyen a képen, garantált a lebukás. Az meg tényleg nevetséges, hogy volt olyan, aki erre rányomta az OK-t, hogy kimehet. Kb. lövése lehetett arról, hogy mit kellett volna ellenőrizni...
Nemtom, engem pont nem érdekel ki vagy mi csinál egy képet, ha az tetszik. Itt inkább csak a szakmán belüli hajhúzogatás megy. Az emberek féltik az állásukat, meg persze vannak eltökélt művészlelkek, akik (érthetően) ellenzik a dolgot. A 99,999% meglátja a cikkben szereplő képet, elröffent egy "cool"-t aztán halad tovább.
Fel van kapva a téma. Ugyanúgy sírtak/sírnak évtizedek óta a gyártosorokon dolgozók az automatizációk miatt, vagy a képzett zenészek az elektronikus és digitális eszközök miatt.
Most éppen ez a vonat halad előttünk, ennyi. Új dolog, az emberek nem szeretik a változásokat, majd megnyugszik mindenki. Meg persze a techno is fejlődni fog. Alig egy év alatt jutott ide a generatív képalkotás. Mi lesz belőle 2-5 év múlva?