
Misasi see DALL·E 3 üldse on ja kuidas seda kasutada saab?
DALL·E 3 on OpenAI (just-just, sama seltskond kes on ka ChatGPT taga) loodud tehisintellekti mudel, mis on suudab genereerida visuaalseid kujutisi tekstiliste juhiste ehk promptide põhjal. DALLE 3 vanem “õde” (või “vend”) eksisteeris juba varem, kuid uuendatud versioon 3 on eelmistest kordi võimekam ja mitmekülgsem. Seega pakub DALL·E 3 järjest enam senisele turu parimale tegijale Midjourneyle kõvasti konkrentsi ja leiab järjest enam rakendust erinevates valdkondades, alates kunstiliste kujutiste loomisest kuni spetsiifiliste diagrammide, illustratsioonide või reklaammaterjali loomiseni välja. Nagu allpool lugeda saate, siis DALLE 3 ei ole lihtsalt digitaalne pliiats, vaid võimaldab kasutajatel üsna lihtsasti visualiseerida keerulisi ideid, andes neile vahendid mõistete ja narratiivide graafiliseks esitamiseks.
DALL·E 3 saavad kasutada kõik ChatGPT tasulise versiooni kasutajad või Bing Image Creator kasutajad.
ChatGPT-s näeb DALLE3 välja selline:
 jätta ruumi erinevateks tõlgendusteks, mis kokkuvõttes võib kasutaja ootustele mitte vastavate visuaalideni.
Näiteks, kui kasutaja sisestab prompti "loodusmaastik", võib DALL·E 3 genereerida kõike alates kõrbevaatest kuni mägismaastikuni. Teisalt, ülemäära pikk ja detailne prompt võib olla kujutise loomisel jällegi piirav DALL·E 3-le kui kasutajale endale, sest jätab vähe ruumi loominguliseks üllatuseks.. Seega on oluline leida mõistlik kompromiss, mis sisaldab piisavalt detaile, et juhendada süsteemi, kuid jätta ka ruumi ka kunstilisteks eripäradeks.
Piirangute ja/või konteksti puudumine
Konteksti ja piirangute selge määramine on samuti oluline. Prompt, mis ei sisalda konteksti või mis on liiga laialivalguv, võib tulemuseks anda soovimatuid või ettearvamatuid pilte. Näiteks, kui sisestate prompti "koer palliga", võib DALL·E 3 luua pildi, kus koer hoopis närib palli, selle asemel, et seda püüda vms. Konteksti ja piirangute lisamine, nagu "koer, kes püüab lendavat palli päikeseloojangul", aitab soovitud visuaali kiiremi luua.
Stiili ja kompositsiooni määramatus
Kui võimalik, siis on oluline prompti kirja panna ka soovitud stiili ja kompositsioon. Näiteks võib kasutaja soovida pilti, mis on tehtud akvarelltehnikas või mis järgib kubistlikku stiili. Kui selliseid detaile ei lisata, on tulemuse stiil ja kompositsioon ettearvamatu. Lisaks tasub alati enne prompti kirjutamist läbi mõelda, et kas soovitud visuaalil on olulised ka vaatenurk, valgustus ja kaugus objektist. Kui nii, siis tuleks kõik suunised prompti abil võimalikult täpselt kirja panna.
Kuidas neid probleeme ikkagi vältida ja paremaid visuaale genereerida? Panen alljärgnevalt kirja mõned mõtted ja kui soovite lugemise kõrvale ise katsetama hakata, siis logige kasvõi kohe ChatGPTsse või Bing Image Creatorisse sisse ja hakkake kaasa proovima :)
Kuidas luua Dall-E3-le paremaid prompte?
Loodud visuaal on juba päris äge, aga tihtipeale tekib soov loodud pilt kas huvitavamaks saada või siis mõni detail enda soovi järgi paremaks muuta. Siit mõned nipid, et kuidas seda paremini teha:
Ole võimalikult täpne
Kui su peas on olemas selge nägemus soovitavast tulemusest, siis pane see võimalikult täpselt kirja. Täpsus ei tähenda enamasti teksti pikkust, vaid selgelt sõnastatud ootust. Näiteks selle asemel, et kirjutada "lind puul", võiks öelda "sinine lind istub tammeoksal". Nii saad olla kindlam, et genereeritav pilt vastab rohkem sinu ootustele.
, portree (1024x1792 pikslit) või laiformaadina (1792x1024 pikslit). Kasutage selleks oma promptis siis kas inglise või eestikeelseid täpsustusi.
Näiteks: “Kevadiselt lilleõites aas, hommikuses udus, laiformaat pildina”.
Variatsioonide kasutamine
DALL·E 3 võimaldab tavaliselt samast promptist mitmed erinevaid variante genereerida. Kui loodud visuaali puhul suurem osa on meelepärane, kuid midagi jääb silma kriipima, siis .... Pea meeles, et kui kasutad Dall-E3 läbi ChatGPT, siis ChatGPT ise juba varieerib sinu prompte veidi.
Piltide resolutsiooni parandamine (upscaling)
Kui genereeritud pilt ei vasta soovitud resolutsioonile, võib selle erinevate pilditöötlusvahendite abil üles skaleerida. Need, kellel on Adobe loovvahendite litsentsid, leiavad üles skaleerimise näiteks Adobe Lightroomist. Lisaks on kiidusõnu saanud Topaz Labsi upscaler. Mina ise kasutan hoopis ühte vabavara nimega SwinIR, mis annab samuti väga häid tulemusi.
Kokkuvõte
Kokkuvõtvalt, AI’ga piltide loomisel ei ole mingeid erilisi salanippe. Vast kõige keerulisem osa ongi oma visiooni konkreetsesse sõnastusse seadmine. Klassikaline “tee see pilt ägedamaks!” ei aita ei inimkujundajat ega ka mitte tehisintellekti.
Loodetavasti need mõned soovitused ülal aitavad teil teha esimesi samme ja vältida mõningaid tüüpilisemaid vigasid (mida ma ka ise teinud olen), kuid parimate tulemuste saavutamiseks on muidugi vaja lihtsalt proovida ja harjutada. :)
Seega head katsetamist ja harjutamist!