Videnskab
 science >> Videnskab >  >> Elektronik

AI-kunst er overalt lige nu. Selv eksperter ved ikke, hvad det vil betyde

'Théâtre D'opéra Spatial' Kredit:Jason Allen / Midjourney

En kunstpris på Colorado State Fair blev tildelt i sidste måned til et værk, der – uvidende for dommerne – blev genereret af et kunstig intelligens (AI) system.

Sociale medier har også set en eksplosion af mærkelige billeder genereret af AI fra tekstbeskrivelser, såsom "ansigtet af en shiba inu blandet ind i siden af ​​et brød på en køkkenbænk, digital kunst."

Eller måske "En havodder i stil med 'Girl with a Pearl Earring' af Johannes Vermeer":

'En havodder i stil med 'Girl with a Pearl Earring' af Johannes Vermeer.' Kredit:OpenAI

Du undrer dig måske over, hvad der foregår her. Som en, der forsker i kreative samarbejder mellem mennesker og AI, kan jeg fortælle dig, at bag overskrifterne og memerne er en fundamental revolution på vej – med dybtgående sociale, kunstneriske, økonomiske og teknologiske implikationer.

Hvordan vi kom hertil

Man kan sige, at denne revolution begyndte i juni 2020, da en virksomhed kaldet OpenAI opnåede et stort gennembrud inden for kunstig intelligens med skabelsen af ​​GPT-3, et system, der kan behandle og generere sprog på meget mere komplekse måder end tidligere bestræbelser. Du kan føre samtaler med den om ethvert emne, bede den om at skrive en forskningsartikel eller en historie, opsummere tekst, skrive en vittighed og lave næsten enhver tænkelig sprogopgave.

I 2021 vendte nogle af GPT-3's udviklere deres hånd til billeder. De trænede en model på milliarder af par billeder og tekstbeskrivelser og brugte den derefter til at generere nye billeder ud fra nye beskrivelser. De kaldte dette system DALL-E, og i juli 2022 udgav de en meget forbedret ny version, DALL-E 2.

Et billede genereret af DALL-E fra prompten "Mind in Bloom", der kombinerer stilene fra Salvador Dali, Henri Matisse og Brett Whiteley'. Kredit:Rodolfo Ocampo / DALL-E

Ligesom GPT-3 var DALL-E 2 et stort gennembrud. Det kan generere meget detaljerede billeder fra tekstinput i frit format, inklusive information om stil og andre abstrakte koncepter.

For eksempel bad jeg den her om at illustrere sætningen "Mind in Bloom", der kombinerer stilene fra Salvador Dalí, Henri Matisse og Brett Whiteley.

Konkurrenter kommer ind på scenen

Siden lanceringen af ​​DALL-E 2 er der dukket et par konkurrenter op. Den ene er den gratis at bruge men lavere kvalitet DALL-E Mini (udviklet uafhængigt og nu omdøbt til Craiyon), som var en populær kilde til meme-indhold.

Omtrent på samme tid udgav et mindre firma ved navn Midjourney en model, der bedre matchede DALL-E 2's muligheder. Selvom Midjourney stadig er lidt mindre dygtig end DALL-E 2, har Midjourney lånt sig til interessante kunstneriske udforskninger. Det var med Midjourney, at Jason Allen genererede kunstværket, der vandt Colorado State Art Fair-konkurrencen.

Google har også en tekst-til-billede-model, kaldet Imagen, som angiveligt giver meget bedre resultater end DALL-E og andre. Imagen er dog endnu ikke blevet frigivet til bredere brug, så det er svært at vurdere Googles påstande.

I juli 2022 begyndte OpenAI at kapitalisere på interessen i DALL-E og annoncerede, at 1 million brugere ville få adgang på basis af betaling for brug.

Men i august 2022 ankom en ny udfordrer:Stable Diffusion.

Stabil diffusion konkurrerer ikke kun med DALL-E 2 i sine muligheder, men endnu vigtigere er det open source. Alle kan bruge, tilpasse og justere koden, som de vil.

Billeder genereret af Craiyon fra prompten 'Darth Vader rider på en trehjulet cykel udenfor på en solskinsdag'. Kredit:Craiyon

Allerede i ugerne siden Stable Diffusions udgivelse har folk presset koden til grænserne for, hvad den kan.

For at tage et eksempel:folk indså hurtigt, at fordi en video er en sekvens af billeder, kunne de justere Stable Diffusions kode for at generere video fra tekst.

Et andet fascinerende værktøj bygget med Stable Diffusions kode er Diffuse the Rest, som lader dig tegne en simpel skitse, give en tekstprompt og generere et billede ud fra den.

Enden på kreativitet?

Hvad betyder det, at du kan generere enhver form for visuelt indhold, billede eller video, med et par linjer tekst og et klik på en knap? Hvad med, hvornår du kan generere et filmmanuskript med GPT-3 og en filmanimation med DALL-E 2?

Og ser vi længere frem, hvad vil det betyde, når sociale mediealgoritmer ikke kun kuraterer indhold til dit feed, men genererer det? Hvad med, når denne trend møder metaverset om et par år, og virtual reality-verdener genereres i realtid, kun til dig?

Disse er alle vigtige spørgsmål at overveje.

Nogle spekulerer i, at det på kort sigt betyder, at menneskelig kreativitet og kunst er dybt truet.

Images generated by the Imagen text-to-image model, together with the text that produced them. Google / Imagen

Perhaps in a world where anyone can generate any images, graphic designers as we know them today will be redundant. However, history shows human creativity finds a way. The electronic synthesizer did not kill music, and photography did not kill painting. Instead, they catalyzed new art forms.

I believe something similar will happen with AI generation. People are experimenting with including models like Stable Diffusion as a part of their creative process.

Or using DALL-E 2 to generate fashion-design prototypes:

A new type of artist is even emerging in what some call "promptology," or "prompt engineering". The art is not in crafting pixels by hand, but in crafting the words that prompt the computer to generate the image:a kind of AI whispering.

Collaborating with AI

The impacts of AI technologies will be multidimensional:we cannot reduce them to good or bad on a single axis.

New artforms will arise, as will new avenues for creative expression. However, I believe there are risks as well.

We live in an attention economy that thrives on extracting screen time from users; in an economy where automation drives corporate profit but not necessarily higher wages, and where art is commodified as content; in a social context where it is increasingly hard to distinguish real from fake; in sociotechnical structures that too easily encode biases in the AI models we train. In these circumstances, AI can easily do harm.

How can we steer these new AI technologies in a direction that benefits people? I believe one way to do this is to design AI that collaborates with, rather than replaces, humans. + Udforsk yderligere

AI system makes image generator models like DALL-E 2 more creative

Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.




Varme artikler