Videnskab
 Science >> Videnskab >  >> Fysik

Forskere bruger generativ kunstig intelligens til at besvare komplekse spørgsmål inden for fysik

Kredit:Pixabay/CC0 Public Domain

Når vand fryser, går det fra en flydende fase til en fast fase, hvilket resulterer i en drastisk ændring i egenskaber som tæthed og volumen. Faseovergange i vand er så almindelige, at de fleste af os nok ikke engang tænker over dem, men faseovergange i nye materialer eller komplekse fysiske systemer er et vigtigt studieområde.



For fuldt ud at forstå disse systemer skal forskerne være i stand til at genkende faser og detektere overgangene imellem. Men hvordan man kvantificerer faseændringer i et ukendt system er ofte uklart, især når data er knappe.

Forskere fra MIT og University of Basel i Schweiz anvendte generative kunstig intelligens-modeller på dette problem og udviklede en ny maskinlæringsramme, der automatisk kan kortlægge fasediagrammer for nye fysiske systemer.

Deres fysik-informerede maskinlæringstilgang er mere effektiv end besværlige, manuelle teknikker, som er afhængige af teoretisk ekspertise. Det er vigtigt, fordi deres tilgang udnytter generative modeller, kræver det ikke enorme, mærkede træningsdatasæt, der bruges i andre maskinlæringsteknikker.

En sådan ramme kunne hjælpe forskere med at undersøge de termodynamiske egenskaber af nye materialer eller opdage sammenfiltring i kvantesystemer, for eksempel. I sidste ende kunne denne teknik gøre det muligt for videnskabsmænd at opdage ukendte faser af stof selvstændigt.

"Hvis du har et nyt system med helt ukendte egenskaber, hvordan ville du så vælge, hvilken observerbar mængde du vil studere? Håbet er, i hvert fald med datadrevne værktøjer, at du kan scanne store nye systemer på en automatiseret måde, og det vil pege på dig til vigtige ændringer i systemet.

"Dette kan være et værktøj i pipelinen af ​​automatiseret videnskabelig opdagelse af nye, eksotiske egenskaber ved faser," siger Frank Schäfer, en postdoc i Julia Lab i Computer Science and Artificial Intelligence Laboratory (CSAIL) og medforfatter til et papir på denne tilgang.

Sammen med Schäfer på papiret er førsteforfatter Julian Arnold, en kandidatstuderende ved universitetet i Basel; Alan Edelman, professor i anvendt matematik ved Institut for Matematik og leder af Julia Lab; og seniorforfatter Christoph Bruder, professor ved Institut for Fysik ved Universitetet i Basel.

Forskningen er publiceret i Physical Review Letters .

Detektering af faseovergange ved hjælp af AI

Mens vandovergang til is kan være blandt de mest åbenlyse eksempler på en faseændring, er mere eksotiske faseændringer, som når et materiale går fra at være en normal leder til en superleder, af stor interesse for videnskabsmænd.

Disse overgange kan detekteres ved at identificere en "ordreparameter", en mængde, der er vigtig og forventes at ændre sig. For eksempel fryser vand og går over til en fast fase (is), når dets temperatur falder til under 0°C. I dette tilfælde kunne en passende ordensparameter defineres i forhold til andelen af ​​vandmolekyler, der er en del af det krystallinske gitter versus dem, der forbliver i en uordnet tilstand.

Tidligere har forskere satset på fysikekspertise til at bygge fasediagrammer manuelt og trække på teoretisk forståelse for at vide, hvilke rækkefølgeparametre der er vigtige. Dette er ikke kun kedeligt for komplekse systemer og måske umuligt for ukendte systemer med ny adfærd, men det introducerer også menneskelig skævhed i løsningen.

For nylig er forskere begyndt at bruge maskinlæring til at bygge diskriminerende klassifikatorer, der kan løse denne opgave ved at lære at klassificere en målestatistik som kommer fra en bestemt fase af det fysiske system, på samme måde som sådanne modeller klassificerer et billede som en kat eller en hund.

MIT-forskerne demonstrerede, hvordan generative modeller kan bruges til at løse denne klassifikationsopgave meget mere effektivt og på en fysikinformeret måde.

Julia-programmeringssproget, et populært sprog til videnskabelig databehandling, som også bruges i MIT's indledende lineære algebraklasser, tilbyder mange værktøjer, der gør det uvurderligt til at konstruere sådanne generative modeller, tilføjer Schäfer.

Generative modeller, som dem, der ligger til grund for ChatGPT og Dall-E, fungerer typisk ved at estimere sandsynlighedsfordelingen af ​​nogle data, som de bruger til at generere nye datapunkter, der passer til fordelingen (såsom nye kattebilleder, der ligner eksisterende kattebilleder) .

Men når simuleringer af et fysisk system ved hjælp af afprøvede videnskabelige teknikker er tilgængelige, får forskerne en model af dets sandsynlighedsfordeling gratis. Denne fordeling beskriver målestatistikken for det fysiske system.

En mere kyndig model

MIT-teamets indsigt er, at denne sandsynlighedsfordeling også definerer en generativ model, som en klassifikator kan konstrueres efter. De plugger den generative model ind i standard statistiske formler for direkte at konstruere en klassificering i stedet for at lære den fra prøver, som det blev gjort med diskriminerende tilgange.

"Dette er en rigtig fin måde at inkorporere noget, du ved om dit fysiske system dybt inde i dit maskinlæringsskema. Det rækker langt ud over blot at udføre funktionsteknologi på dine dataeksempler eller simple induktive skævheder," siger Schäfer.

Denne generative klassifikator kan bestemme, hvilken fase systemet er i givet en eller anden parameter, såsom temperatur eller tryk. Og fordi forskerne direkte tilnærmer de sandsynlighedsfordelinger, der ligger til grund for målinger fra det fysiske system, har klassificereren systemviden.

Dette gør det muligt for deres metode at yde bedre end andre maskinlæringsteknikker. Og fordi det kan fungere automatisk uden behov for omfattende træning, forbedrer deres tilgang betydeligt den beregningsmæssige effektivitet ved at identificere faseovergange.

I slutningen af ​​dagen, svarende til hvordan man kunne bede ChatGPT om at løse et matematisk problem, kan forskerne stille de generative klassificeringsspørgsmål som "hører denne prøve til fase I eller fase II?" eller "blev denne prøve genereret ved høj temperatur eller lav temperatur?"

Forskere kunne også bruge denne tilgang til at løse forskellige binære klassifikationsopgaver i fysiske systemer, muligvis til at detektere sammenfiltring i kvantesystemer (Er staten indviklet eller ej?) eller bestemme, om teori A eller B er bedst egnet til at løse et bestemt problem. De kunne også bruge denne tilgang til bedre at forstå og forbedre store sprogmodeller som ChatGPT ved at identificere, hvordan visse parametre skal indstilles, så chatbotten giver det bedste output.

I fremtiden ønsker forskerne også at studere teoretiske garantier for, hvor mange målinger de skal bruge for effektivt at detektere faseovergange og estimere mængden af ​​beregninger, der vil kræve.




Varme artikler