AI som konstnärer?

31 mars, 2023

Jag har börjat “krångla” mycket med AI på senaste tiden. Kanske är det för att själva konceptet med “smarta datorer” får min Sci-fi hjärna att gå på högvarv. Från början pratade jag med Chat GPT som det vore ett spädbarn, men idag känns det som att det är en riktigt människa i andra änden, som vet allt om allt och gärna delar med sig.

AI kan användas till andra saker än att konversera med, det finns även AI som utbildats till att vara exeptionella konstnärer. Jag säger exceptionella, eftersom det är det närmaste jag kan beskriva det som. Genom att förklara vad man vill ha för bild så skapar AI precis det som efterfrågas och visar det visuellt.

Om du nu rycker på axlarna och tycker att “visst kan dom rita en streckgubbe” så är det länge sedan det var på den nivån. Se bilderna nedan så fortsätter vi strax.

Man kan lätt tro att det är fotografier som är redigerade lite, men så är inte fallet alls. Genom AI som instruerats att rita bilderna så kan man skapa väldigt trovärdiga “fotografier” av i princip vad som helst. Även om porträtt är en stor del av vad den AI jag använder fokuseras på, så kan den även rita arkitekturer och mycket annat. Istället för att använda publikt tillgängliga bilder så kan man alltså skapa den bild man själv visualiserat.

Att instruera en AI så att den förstår vad du visuellt vill se, via ord, är dock inte det enklaste. Som tur är kan en AI normalt sett “fylla i” dom uppgifter som saknas. Om man skriver “rita en gris med stora öron och stora ögon” så blir det en gris med stora ögon och öron, men den kommer troligen att stå på en gräsmatta, även om du inte i detalj skrivit detta. Om du ville visualisera en söt liten fluffig gris, med stora öron, som står på en äng av blommor, så måste du också beskriva det i detalj. Se nedanstående exempel.

Bägge bilderna utgår från samma beskrivning, men den ena är mycket mer detaljerad i hur jag ville ha bilden. Det går också att skapa små variationer genom att ändra i beskrivningen, för att skapa bilder exakt som man själv visualiserat dom.

I nedanstående exempel så bad jag min AI att rita en bild på ett glas med Whiskey, med ljussättning bakifrån. Bägge bilderna är således med exakt samma beskrivning, men är variationer av varandra. På detta sätt så kan en AI “gissa” vad du är intresserad av, för att slutligen få till bilden precis som du ville ha den.

Även porträtt kan modifieras och anpassas för att generera det resultat man är ute efter. Genom att ändra beskrivningen på detaljer i någons ansikte, eller helt enkelt specificera bakgrunden som ska finnas så går det att skapa variationer som ser nästan likadana ut, men ändå slutligen blir precis som man visualiserat det. Lägg märke till ansiktsdragen och bakgrunden i nedanstående exempel.

En intressant aspekt jag brukar leka runt med är att skapa fantasifulla bilder på olika “väsen” och roliga figurer. Här får man lite mer kreativ frihet och det behöver inte längre vara symmetriskt och korrekt. Det är oftast roligare och ger många gånger en humoristisk underton.

Den specifika AI som jag använder heter “Playground 1.0” och är väldigt sofistikerad. Det är lite svårt att få exakt den bild man vill ha på en gång, men den erbjuder många möjligheter, som att utgå från en bild man tagit med sin egen kamera, eller beskrivningar på kändisar som den kan analysera för ansiktsdrag och liknande. Du kan alltså skriva att du vill ha en bild på en krigare i svart rustning, som ser ut som The Rock i ansiktet, vilket den kommer att försöka skapa.

Men att rita med AI är inte en dans på rosor. Ofta blir resultat lite konstiga, ögon och annat i porträtt ser inte riktigt korrekta ut, fingrar försvinner från människor och hundar får 3 ögon i pannan. Det är lite processen i det hela. Det är lite av en utmaning att generera en bild som ser riktigt bra ut, men om den skulle få allt rätt på en gång så skulle det nog inte vara lika roligt att experimentera med den. =)

I grund och botten kan man säga att ju mer detaljerat du kan beskriva en bild för en blind människa, desto större är chansen att denna kan få en bild på vad du beskriver i sin hjärna.

När du tittar på bilderna ovan så ser det ut som “stock-bilder” från en hemsida, men jag kan garantera att du inte hittar dessa bilder någon annanstans på nätet, eftersom dom aldrig existerat tidigare, vilket är delen jag gillar mest.

Med det i åtanke så har jag länkat bilderna, så att du kan ladda ned dom i originalstorlek, om du skulle vilja ha dom. Dom är helt utan copyright och du kan göra vad du vill med dom. Upplösningen är kanske inte den största, men jag måste ju tänka på utrymmet också. =)

Ha en riktigt bra dag så hörs vi snart igen.