Videnskab
 Science >> Videnskab >  >> Fysik

Spørgsmål og svar:Ekspert forklarer AI-fysikken

Lære handlinger fra data. Vi observerer et fysisk system af interagerende frihedsgrader (grå prikker), hvis præcise interaktioner er ukendte (skraverede områder). Vi træner et neuralt netværk på målinger af systemet. Netværket lærer på en uovervåget måde et skøn over distributionen af ​​træningsdata. Vi udtrækker handlingen fra netværksparametrene lag for lag ved hjælp af et diagrammatisk sprog. De endelige handlingskoefficienter A (k) repræsentere de indlærte interaktioner (lyserøde noder). Kredit:Fysisk gennemgang X (2023). DOI:10.1103/PhysRevX.13.041033

Udviklingen af ​​en ny teori er typisk forbundet med fysikkens store. Du tænker måske på Isaac Newton eller Albert Einstein, for eksempel. Mange nobelpriser er allerede blevet uddelt for nye teorier.



Forskere ved Forschungszentrum Jülich har nu programmeret en kunstig intelligens, der også har mestret denne bedrift. Deres AI er i stand til at genkende mønstre i komplekse datasæt og formulere dem i en fysisk teori. Resultaterne er publiceret i tidsskriftet Physical Review X .

I det følgende interview forklarer prof. Moritz Helias fra Forschungszentrum Jülich's Institute for Advanced Simulation (IAS-6), hvad "Fysik af AI" handler om, og i hvilken grad den adskiller sig fra konventionelle tilgange.

Hvordan finder fysikere på en ny teori?

Man starter normalt med observationer af systemet, før man forsøger at foreslå, hvordan de forskellige systemkomponenter interagerer med hinanden for at forklare den observerede adfærd. Nye forudsigelser udledes derefter af dette og afprøves.

Et velkendt eksempel er Isaac Newtons tyngdelov. Den beskriver ikke kun tyngdekraften på Jorden, men den kan også bruges til at forudsige bevægelser af planeter, måner og kometer – såvel som moderne satellitters kredsløb – ret præcist.

Den måde, hvorpå sådanne hypoteser nås, er dog altid forskellig. Du kan starte med generelle principper og grundlæggende fysikligninger og udlede hypotesen fra dem, eller du kan vælge en fænomenologisk tilgang, der begrænser dig til at beskrive observationer så præcist som muligt uden at forklare deres årsager. Vanskeligheden ligger i at vælge en god tilgang blandt de mange mulige tilgange, tilpasse den om nødvendigt og forenkle den.

Hvilken tilgang har du med AI?

Generelt involverer det en tilgang kendt som "fysik til maskinlæring." I vores arbejdsgruppe bruger vi fysikmetoder til at analysere og forstå den komplekse funktion af en AI.

Den afgørende nye idé udviklet af Claudia Merger fra vores forskergruppe var først at bruge et neuralt netværk, der lærer at kortlægge den observerede komplekse adfærd nøjagtigt til et enklere system. Med andre ord sigter AI på at forenkle alle de komplekse interaktioner, vi observerer mellem systemkomponenter. Vi bruger derefter det forenklede system og laver en omvendt kortlægning med den trænede AI. Vender vi tilbage fra det forenklede system til det komplekse, udvikler vi så den nye teori.

På vejen tilbage bygges de komplekse interaktioner op stykke for stykke fra de forenklede. I sidste ende er tilgangen derfor ikke så forskellig fra en fysikers, med forskellen på, at måden, hvorpå interaktionerne er samlet, nu aflæses ud fra parametrene for AI. Dette perspektiv på verden – der forklarer den ud fra interaktioner mellem dens forskellige dele, der følger visse love – er grundlaget for fysik, deraf udtrykket "AI-fysik."

I hvilke applikationer blev kunstig intelligens brugt?

Vi brugte for eksempel et datasæt af sort-hvide billeder med håndskrevne tal, som ofte bruges i forskning, når man arbejder med neurale netværk. Som en del af sin doktorafhandling undersøgte Claudia Merger, hvordan små understrukturer i billederne, såsom kanterne på tallene, er opbygget af interaktioner mellem pixels. Der findes grupper af pixels, der har en tendens til at være lysere sammen og dermed bidrager til formen på kanten af ​​tallet.

Hvor høj er den beregningsmæssige indsats?

Brugen af ​​AI er et trick, der gør beregningerne mulige i første omgang. Du når meget hurtigt til et meget stort antal mulige interaktioner. Uden at bruge dette trick, kunne du kun se på meget små systemer. Ikke desto mindre er den involverede beregningsmæssige indsats stadig høj, hvilket skyldes, at der er mange mulige interaktioner selv i systemer med mange komponenter.

Vi kan dog effektivt parametrisere disse interaktioner, så vi nu kan se systemer med omkring 1.000 interagerende komponenter, det vil sige billedområder med op til 1.000 pixels. I fremtiden skulle meget større systemer også være mulige gennem yderligere optimering.

Hvordan adskiller denne tilgang sig fra andre AI'er såsom ChatGPT?

Mange AI'er har til formål at lære en teori om de data, der bruges til at træne AI'en. De teorier, som AI'erne lærer, kan dog normalt ikke fortolkes. I stedet er de implicit skjult i parametrene for den trænede AI. I modsætning hertil udtrækker vores tilgang den lærte teori og formulerer den i sproget af interaktioner mellem systemkomponenter, som ligger til grund for fysikken.

Det hører således til feltet for forklarlig AI, nærmere bestemt "AI's fysik", da vi bruger fysikkens sprog til at forklare, hvad AI'en har lært. Vi kan bruge interaktionssproget til at bygge bro mellem AI's komplekse indre funktion og teorier, som mennesker kan forstå.

Flere oplysninger: Claudia Merger et al., Learning Interacting Theories from Data, Physical Review X (2023). DOI:10.1103/PhysRevX.13.041033

Leveret af Forschungszentrum Juelich




Varme artikler