S novim AI generatorima teksta-u-sliku, koji se lansiraju tako brzo, teško je pratiti šta je dostupno i koji pruža najbolje rezultate.
Teško je poverovati da je prošlo samo godinu dana od kada je beta verzija DALL-E, OpenAI generator slika na osnovu teksta, puštena na internet. Od tada je došlo do eksplozije AI-generisanih vizuelnih sadržaja, pri čemu ljudi stvaraju prosečno 34 miliona slika dnevno, što je više od 15 milijardi slika koje su kreirane korišćenjem algoritama za tekst-u-sliku samo 2022. godine. Prema izveštaju Everypixel Journala, fotografima je trebalo 150 godina, od prvog fotografisanja 1826. godine do 1975. godine, da dostignu brojku od 15 milijardi slika.
S novim AI generatorima teksta-u-sliku, koji se lansiraju tako brzo, teško je pratiti šta je dostupno i koji pruža najbolje rezultate.
ChatGPT: DALL-E 2 i DALL-E3
Jedan od prvih koji se pojavio u talasu AI generatora teksta-u-sliku, DALL-E 2 je postao osnovni izvor za stvaranje umetnosti na osnovu prirodnih jezičkih opisa. Ima četiri puta veću rezoluciju od svog prethodnika DALL-E 1 i dolazi sa nekoliko novih bezbednosnih mera koje sprečavaju korisnike da generišu nasilni ili eksplicitni sadržaj, kao i fotorealistične generacije lica stvarnih osoba, uključujući i javne ličnosti. Takođe, omogućava kreatorima da isključe svoju umetnost iz OpenAI-jevih podataka za obuku, međutim, mukotrpan proces uklanjanja slika jednu po jednu izazvao je frustraciju kod mnogih umetnika zbog ovog novog razvoja. Ako platite za ChatGPT Plus, dobićete direktni pristup DALL-E 3 unutar interfejsa ChatGPT-a, što znači da ne morate trošiti vreme na kreiranje pravog podsticaja za sliku, već, jednostavno, možete zamoliti ChatGPT-a da to uradi za vas. Međutim, ova pogodnost dolazi uz cenu, sa premijum paketom koji košta 20 dolara mesečno.
Prednosti:
– Jednostavan korisnički interfejs, odličan za generisanje nadrealnih slika
Nedostaci:
– Nije najbolja opcija na listi za generisanje lica ili realističnih slika
– Radi na freemium modelu, koji može postati skup
MIDJOURNEY
Midjourney postaje jedna od najboljih opcija za generisanje realističnih slika, lica ili bilo čega što je potrebno. Za razliku od drugih modela na ovom spisku, Midjourney nema posebnu platformu već funkcioniše kao bot unutar Discorda. Korisnici imaju pristup ogromnoj zajednici drugih kreatora unutar Discorda i, po podrazumevanom podešavanju, umetnost koju generišete će se pojaviti u jednom od mnogih javnih kanala s kreacijama svih ostalih. Ako vam smeta pretraživanje prepunog toka umetnosti koja se neprestano generiše, možete kopirati Midjourney bot na privatni server. Trenutno, Midjourney radi na verziji 5.2 i uključuje režime veće varijacije, nove funkcije poput zumiranja van/izvan slike za proširenje okvira slike, i inpaintinga, koji omogućava korisnicima da vrše promene na određenim delovima slike bez potrebe za ponovnim generisanjem celog podsticaja.
Prednosti:
– Odličan kvalitet realističnih slika
– Opsežna dokumentacija na Midjourneyjevom veb sajtu
– Korisna Discord zajednica za početnike
Nedostaci:
– Besplatna verzija je ukinuta
– Generisanje slika unutar javnog Discord servera može postati haotično
ADOBE FIREFLY
Adobe Firefly izašao je iz beta faze u septembru i počeo je da se razlikuje od DALL-E i Midjourneyja iz nekoliko razloga. Glavna razlika je u tome što je Firefly model obučen koristeći Adobe Stock slike i materijal iz javnog domena s isteklim autorskim pravima, što osigurava da su podaci za obuku dobijeni uz eksplicitnu dozvolu kreatora. Sada kada je dostupan komercijalno, Firefly je integrisan u različite Creative Cloud aplikacije, uključujući Photoshop, Illustrator i Adobe Express. Korisnici mogu iskoristiti Generative Fill funkciju u Photoshopu da dodaju, uklone ili prošire sadržaj na slikama, koristeći jednostavne tekstualne podsticaje. Takođe, ima funkciju tekst-u-vektorsku grafiku, koja omogućava korisnicima da kreiraju editabilne vektorske grafike iz tekstualnih podsticaja, što bi moglo da bude prekretnica za dizajnere, posebno kako se model nastavlja poboljšavati.
Prednosti:
– Korisnički interfejs je vrlo intuitivan
– Podržava generisanje teksta u vektorsku grafiku
Nedostaci:
– Ograničene opcije prilagođavanja, nedostatak kontrole.