Automatisk styring af eksperimenter mod videnskabelig opdagelse

At gå fra en manuel til en automatiseret eksperimenteringstilgang gør det muligt for forskere at udforske parameterrum mere grundigt. Med kunstig intelligens (AI) beslutningstagningsmetoder, videnskabsmænd kan komme ind på nøgledele af parameterrummet (her, sammensætning og temperatur) til accelereret materialeopdagelse. Kredit:Brookhaven National Laboratory

I den populære opfattelse af traditionel videnskab, videnskabsmænd er i laboratoriet og svæver over deres eksperimenter, mikrostyring af hver lille detalje. For eksempel, de kan iterativt teste en bred vifte af materialesammensætninger, syntese- og behandlingsprotokoller, og miljøforhold for at se, hvordan disse parametre påvirker materialeegenskaber. I hver iteration, de analyserer de indsamlede data, leder efter mønstre og stoler på deres videnskabelige viden og intuition for at vælge nyttige opfølgende målinger.

Denne manuelle tilgang bruger begrænset instrumenttid og opmærksomhed fra menneskelige eksperter, som ellers kunne fokusere på det større billede. Manuelle eksperimenter kan også være ineffektive, især når der er et stort sæt parametre at udforske, og er underlagt menneskelig skævhed - f.eks. i at beslutte, hvornår man har indsamlet nok data og kan stoppe et eksperiment. Den konventionelle måde at udføre videnskab på kan ikke skaleres til at håndtere den enorme kompleksitet af fremtidige videnskabelige udfordringer. Fremskridt inden for videnskabelige instrumenter og dataanalysekapaciteter på eksperimentelle faciliteter fortsætter med at muliggøre hurtigere målinger. Selvom disse fremskridt kan hjælpe videnskabsmænd med at tackle komplekse eksperimentelle problemer, de forværrer også den menneskelige flaskehals; intet menneske kan følge med moderne eksperimentelle værktøjer!

forestiller sig automatisering

En sådan facilitet, der håndterer disse typer udfordringer, er National Synchrotron Light Source II (NSLS-II) ved US Department of Energy's (DOE) Brookhaven National Laboratory. Ved at rette lysstråler, lige fra infrarød til hård røntgenstråler, mod prøver på forsøgsstationer (strålelinjer), NSLS-II kan afsløre den elektroniske, kemisk, og atomare strukturer af materialer. Da videnskabsmænd designede disse strålelinjer for et årti siden, de havde forudseenhed til at inkorporere automatisering muliggjort af maskinlæring (ML) og kunstig intelligens (AI) – nu et eksploderende felt – som en del af deres vision.

"Vi troede, ville det ikke være fantastisk, hvis videnskabsmænd ikke kun kunne foretage målinger hurtigere, men også foretage intelligent udforskning – dvs. udforske videnskabelige problemer på smartere, mere effektive måder ved at udnytte moderne computervidenskabelige metoder, " sagde Kevin Yager, leder af Electronic Nanomaterials Group i Center for Functional Nanomaterials (CFN) på Brookhaven Lab. "Faktisk, på CFN, vi har defineret et af vores forskningstemaer til at være accelereret opdagelse af nanomaterialer."

Denne idé til en stærkt automatiseret beamline, der intelligent kunne udforske videnskabelige problemer, endte med at blive et langsigtet mål for Complex Materials Scattering (CMS) beamline, udviklet og drevet af et team ledet af Masafumi Fukuto.

"Vi startede med at bygge high-throughput-kapaciteter til hurtige målinger, som en prøveudvekslingsrobot og masser af in-situ værktøjer til at udforske forskellige parametre såsom temperatur, Damptryk, og fugtighed, " sagde Fukuto. "På samme tid, vi begyndte at tænke på at automatisere ikke kun beamline-hardwaren til dataindsamling, men også dataanalyse i realtid og eksperimentel beslutningstagning. Evnen til at tage målinger meget hurtigt er nyttig og nødvendig, men ikke tilstrækkelig til revolutionerende materialeopdagelse, fordi materialeparameterrum er meget store og multidimensionelle."

For eksempel, et eksperiment kan have et parameterrum med fem dimensioner og mere end 25, 000 forskellige punkter i det rum at udforske. Både dataindsamlings- og analysesoftwaren til at håndtere disse store, højdimensionelle parameterrum blev bygget i huset ved Brookhaven. Til dataindsamling, de byggede oven på Bluesky software, som NSLS-II udviklede. For at analysere data, Yager skrev kode til et billedanalysesoftware kaldet SciAnalysis.

Lukning af løkken

I 2017 Fukuto og Yager begyndte at samarbejde med Marcus Noack, derefter postdoc og nu forsker i Center for Advanced Mathematics for Energy Research Applications (CAMERA) ved DOE's Lawrence Berkeley National Laboratory. I sin tid som postdoc, Noack fik til opgave at samarbejde med Brookhaven-teamet om deres autonome beamline-koncept. Specifikt, de arbejdede sammen om at udvikle det sidste stykke for at skabe et fuldt automatiseret eksperimentelt setup:en beslutningsalgoritme. Brookhaven-teamet definerede deres behov, mens Noack leverede sin anvendte matematikekspertise og skrev softwaren for at imødekomme disse behov.

Ved at udnytte AI og ML, denne algoritme bestemmer de bedste næste målinger at foretage, mens et eksperiment er i gang. (AI refererer til en maskine, der simulerer menneskelig adfærd, mens ML er et underfelt af AI, hvor en maskine automatisk lærer af tidligere data.) For at algoritmen skal begynde at modellere et system, det er så simpelt som at en bruger definerer input og output:hvad er de variabler, jeg kan kontrollere i eksperimentet, og hvad skal jeg måle? Men jo mere information mennesker giver i forvejen - såsom systemets forventede respons eller kendte begrænsninger baseret på det særlige problem, der undersøges - jo mere robust vil modelleringen være. Bag scenen, en Gauss-proces er i gang med at modellere systemets adfærd.

"En Gauss-proces er en matematisk streng måde at estimere usikkerhed på, " forklarede Yager. "Det er en anden måde at sige viden på i mit sind. Og det er en anden måde at sige videnskab på. For i videnskaben, det er det, vi er mest interesserede i:Hvad ved jeg, og hvor godt kender jeg det?"

"Det er ML-delen af det, " tilføjede Fukuto. "Algorithmen går et skridt ud over det. Den træffer automatisk beslutninger baseret på denne viden og menneskelige input for at vælge, hvilket punkt der ville give mening at måle næste gang."

I et forenklet tilfælde, denne næste måling ville være det sted i parameterrummet, hvor informationsgevinsten kan maksimeres (eller reducere usikkerheden). Holdet demonstrerede første gang dette proof of concept i 2019 på NSLS-II CMS beamline, billeddannelse af en nanomaterialefilm lavet specielt til denne demonstration.

Siden denne første succes, holdet har gjort algoritmen mere sofistikeret, anvende det til at studere en bred vifte af reelle (i stedet for konstruerede) videnskabelige problemer fra forskellige grupper, og udvide det til mere eksperimentelle teknikker og faciliteter.

Mens standardversionen af algoritmen sigter mod at minimere usikkerhed eller maksimere videnindvinding på en iterativ måde, der er andre måder at tænke på, hvor man skal fokusere eksperimentel opmærksomhed for at opnå mest værdi. For eksempel, for nogle videnskabsmænd, omkostningerne ved eksperimentet – om dets varighed eller mængden af brugte materialer – er vigtig. Med andre ord, det er ikke bare hvor du tager data, men hvordan dyrt det er at tage disse data. Andre kan finde værdi i at søge efter specifikke funktioner, såsom grænser inden for et parameterrum eller kornstørrelse af en krystal. Jo mere sofistikeret, fleksibel version af den algoritme, som Noack udviklede, kan programmeres til at have øget følsomhed over for disse funktioner.

"Du kan indstille, hvad dine mål er i eksperimentet, " forklarede Yager. "Så, det kan være vidensvinding, eller vidensvinding reguleret af eksperimentelle omkostninger eller forbundet med specifikke funktioner."

Andre forbedringer omfatter algoritmens evne til at håndtere kompleksiteten af rigtige systemer, såsom det faktum, at materialer er inhomogene, hvilket betyder, at de ikke er ens på hvert punkt på tværs af en prøve. En del af en prøve kan have en ensartet sammensætning, mens en anden kan have en variabel sammensætning. I øvrigt, Algoritmen tager nu højde for anisotropi, eller hvordan individuelle parametre kan være meget forskellige fra hinanden i forhold til hvordan de påvirker et system. For eksempel, "x" og "y" er ækvivalente parametre (de er begge positionskoordinater), men temperatur og tryk er det ikke.

"Gaussiske processer bruger kerner - funktioner, der beskriver, hvordan datapunkter afhænger af hinanden på tværs af rummet - til interpolation, " sagde Noack. "Kerner har alle mulige interessante matematiske egenskaber. For eksempel, de kan kode for forskellige grader af inhomogenitet for en prøve."

At øge sofistikeringen af algoritmen er kun en del af udfordringen. Derefter, Fukuto og Yager skal integrere den opdaterede algoritme i den automatiserede eksperimentelle arbejdsgang med lukket sløjfe og teste den på forskellige eksperimenter - ikke kun dem, der udføres internt, men også dem, der udføres af brugere.

Implementering af metoden til det større videnskabelige samfund

For nylig, Fukuto, Yager, Noack, og kolleger har implementeret den autonome metode til adskillige rigtige eksperimenter ved forskellige NSLS-II beamlines, herunder CMS og Soft Matter Interfaces (SMI). Noack og samarbejdspartnere har også implementeret metoden hos LBNL's Advanced Light Source (ALS) og Institut Laue-Langevin (ILL), et neutronspredningsanlæg i Frankrig. Holdet udgav deres beslutningstagningssoftware, gpCAM, til det bredere videnskabelige samfund, så enhver kunne oprette deres egne autonome eksperimenter.

I et forsøg, i samarbejde med U.S. Air Force Research Laboratory (AFRL), de brugte metoden i et autonomt synkrotron røntgenspredningseksperiment ved CMS-strålelinjen. Ved røntgenspredning, røntgenstrålerne preller af en prøve i forskellige retninger afhængigt af prøvens struktur. Det første mål med eksperimentet var at udforske, hvordan den ordnede struktur af nanorod-polymer-kompositfilm afhænger af to fremstillingsparametre:filmbelægningens hastighed og substratets kemiske belægning. Det andet mål var at bruge denne viden til at lokalisere og komme ind på de områder af filmene med de højeste grader af orden.

"Disse materialer er af interesse for optiske belægninger og sensorer, " forklarede CMS-strålelinjeforsker Ruipeng Li. "Vi brugte en særlig fremstillingsmetode, der efterligner industrielle roll-to-roll processer for at finde ud af den bedste måde at danne disse ordnede film ved hjælp af industrielt skalerbare processer."

I et andet røntgenspredningseksperiment, ved SMI-strålelinjen, Algoritmen identificerede med succes områder af uventet rækkefølge i et parameterrum, der er relevant for selvsamling af blokcopolymerfilm. Blokcopolymerer er polymerer, der består af to eller flere kemisk adskilte "blokke" forbundet med hinanden. Ved at identificere disse funktioner, det autonome eksperiment belyste et problem med fremstillingsmetoden.

"Det var ikke hypotetisk - vi har arbejdet på dette projekt i mange år, " sagde CFN-materialeforsker Gregory Doerk. "Vi havde gentaget på den gamle måde, laver nogle eksperimenter, at tage billeder på steder, vi vilkårligt har valgt, ser på billederne, og undrer sig over, hvad der sker. Med den autonome tilgang, i en dag med eksperimenter ved beamline, vi var i stand til at finde fejlene og derefter straks rette dem i næste runde. Det er en dramatisk acceleration af den normale forskningscyklus, hvor du laver en undersøgelse, finde ud af at det ikke virkede, og gå tilbage til tegnebrættet."

Noack og hans samarbejdspartnere anvendte også metoden til en anden slags røntgenteknik kaldet autonom synkrotron infrarød kortlægning, som kan give kemisk information om en prøve. Og de demonstrerede, hvordan metoden kunne anvendes til en spektroskopiteknik til autonomt at opdage faser, hvor elektroner opfører sig på en stærkt korreleret måde, og til neutronspredning for autonomt at måle magnetiske korrelationer.

At forme fremtiden for autonome eksperimenter

Ifølge Yager, deres metode kan anvendes på enhver teknik, hvor dataindsamlingen og dataanalysen allerede er automatiseret. En af fordelene ved tilgangen er, at den er "fysikagnostisk, "det betyder, at det ikke er bundet til nogen bestemt form for materiale, fysiske problemer, eller teknik. De fysisk betydningsfulde mængder for beslutningstagningen udvindes gennem analysen af rådataene.

"Vi ønskede at gøre vores tilgang meget generel, så den kunne anvendes på hvad som helst og derefter hen ad vejen skræddersyet til specifikke problemer, " sagde Yager. "Som en brugerfacilitet, vi ønsker at give det største antal mennesker mulighed for at udføre interessant videnskab."

I fremtiden, holdet vil tilføje funktionalitet, så brugerne kan inkorporere fysikbevidsthed, eller viden om de materialer eller fænomener, de studerer, hvis de ønsker det. Men teamet vil gøre det på en måde, der ikke ødelægger tilgangens generelle fleksibilitet; brugere vil være i stand til at slå denne ekstra viden til eller fra.

Et andet aspekt af fremtidigt arbejde er at anvende metoden til at kontrollere processer i realtid – med andre ord, styre et system, der dynamisk udvikler sig over tid, efterhånden som et eksperiment skrider frem.

"Hidtil har vi har koncentreret os om at træffe beslutninger om, hvordan vi skal måle eller karakterisere forberedte materialesystemer, " sagde Fukuto. "Vi ønsker også at træffe beslutninger om, hvordan vi skal ændre materialer, eller hvilke slags materialer vi vil lave. At forstå den grundlæggende videnskab bag materielle ændringer er vigtig for at forbedre fremstillingsprocesser."

At realisere denne evne til intelligent at udforske materialer, der udvikler sig i realtid, vil kræve at overvinde algoritmiske og instrumenteringsmæssige udfordringer.

"Beslutningstagningen skal være meget hurtig, og du skal bygge prøvemiljøer for at lave materialesyntese i realtid, mens du tager målinger med en røntgenstråle, " forklarede Yager.

På trods af disse udfordringer, holdet er spændt på, hvad fremtiden for autonome eksperimenter bringer.

"Vi startede denne indsats i meget lille skala, men det voksede til noget meget større, " sagde Fukuto. "Mange mennesker er interesserede i det, ikke kun os. Brugerfællesskabet er blevet udvidet, og med brugere, der studerer forskellige slags problemer, denne tilgang kan have en stor indflydelse på at fremskynde en lang række videnskabelige opdagelser."

"Det repræsenterer et virkelig stort skift i tankegangen at gå fra den gamle måde at mikrostyre eksperimenter til denne nye vision om automatiserede systemer, der kører eksperimenter med mennesker, der orkestrerer dem på et meget højt niveau, fordi de forstår, hvad der skal gøres, og hvad videnskaben betyder, " sagde Yager. "Det er en meget spændende vision for videnskabens fremtid. Vi vil være i stand til at tackle problemer i fremtiden, som folk for 10 år siden ville have sagt, er umulige."

Sidste artikelForskere sikrer højopløsningsmålinger for CO2-diplomati

Næste artikelIlt-tomgangsmedieret katalyse øger direkte metanering af biomasse