Kredit:Pixabay/CC0 Public Domain
Computere har været i stand til hurtigt at behandle 2D-billeder i nogen tid. Din mobiltelefon kan tage digitale fotografier og manipulere dem på en række måder. Meget sværere, imidlertid, behandler et billede i tre dimensioner, og gør det rettidigt. Matematikken er mere kompleks, og knuser de tal, selv på en supercomputer, tager tid.
Det er den udfordring, en gruppe videnskabsmænd fra det amerikanske energiministeriums (DOE) Argonne National Laboratory arbejder på at overvinde. Kunstig intelligens er opstået som en alsidig løsning på de problemer, som big data-behandling udgør. For forskere, der bruger Advanced Photon Source (APS), en DOE Office of Science brugerfacilitet i Argonne, at behandle 3D-billeder, det kan være nøglen til at gøre røntgendata til synlige, forståelige former i et meget hurtigere tempo. Et gennembrud på dette område kan få konsekvenser for astronomi, elektronmikroskopi og andre videnskabsområder afhængige af store mængder 3D-data.
"For at gøre fuld brug af, hvad den opgraderede APS vil være i stand til, vi er nødt til at genopfinde dataanalyse. Vores nuværende metoder er ikke nok til at følge med. Maskinlæring kan gøre fuld brug og gå ud over, hvad der i øjeblikket er muligt, " siger Mathew Cherukara fra Argonne National Laboratory
Forskerholdet, som omfatter forskere fra tre Argonne-divisioner, har udviklet en ny beregningsramme kaldet 3D-CDI-NN, og har vist, at det kan skabe 3D-visualiseringer fra data indsamlet ved APS hundredvis af gange hurtigere end traditionelle metoder kan. Holdets forskning blev offentliggjort i Anvendt fysik anmeldelser , en publikation fra American Institute of Physics.
CDI står for kohærent diffraktionsbilleddannelse, en røntgenteknik, der involverer at kaste ultra-lyse røntgenstråler ud af prøver. Disse lysstråler vil derefter blive indsamlet af detektorer som data, og det kræver en vis beregningsmæssig indsats at omdanne disse data til billeder. En del af udfordringen, forklarer Mathew Cherukara, leder af Computational X-ray Science-gruppen i Argonnes X-ray Science Division (XSD), er, at detektorerne kun fanger nogle af informationerne fra strålerne.
Men der er vigtige oplysninger indeholdt i de manglende data, og videnskabsmænd er afhængige af computere til at udfylde disse oplysninger. Som Cherukara bemærker, mens dette tager lidt tid at gøre i 2D, det tager endnu længere tid at gøre med 3D-billeder. Løsningen, derefter, er at træne en kunstig intelligens til at genkende objekter og de mikroskopiske ændringer, de gennemgår direkte fra rådata, uden at skulle udfylde de manglende oplysninger.
At gøre dette, holdet startede med simulerede røntgendata for at træne det neurale netværk. NN i rammens titel, et neuralt netværk er en række algoritmer, der kan lære en computer at forudsige resultater baseret på data, den modtager. Henry Chan, hovedforfatteren på papiret og en postdoc-forsker i Center for Nanoscale Materials (CNM), en DOE Office of Science brugerfacilitet i Argonne, ledet denne del af arbejdet.
"Vi brugte computersimuleringer til at skabe krystaller af forskellige former og størrelser, og vi konverterede dem til billeder og diffraktionsmønstre for det neurale netværk at lære, " sagde Chan. "Den lethed det er at hurtigt generere mange realistiske krystaller til træning er fordelen ved simuleringer."
Dette arbejde blev udført ved hjælp af grafikbehandlingsenhedens ressourcer på Argonne's Joint Laboratory for System Evaluation, som implementerer avancerede testbeds for at muliggøre forskning i nye højtydende computerplatforme og -funktioner.
Når netværket er trænet, siger Stephan Hruszkewycz, fysiker og gruppeleder hos Argonne's Materials Science Division, det kan komme ret tæt på det rigtige svar, ret hurtigt. Imidlertid, der er stadig plads til raffinement, så 3D-CDI-NN-rammen inkluderer en proces til at få netværket resten af vejen dertil. Hruszkewycz, sammen med Northwestern University kandidatstuderende Saugat Kandel, arbejdet med dette aspekt af projektet, hvilket reducerer behovet for tidskrævende iterative trin.
"Materialvidenskabsafdelingen bekymrer sig om kohærent diffraktion, fordi du kan se materialer på få nanometers længdeskalaer - omkring 100, 000 gange mindre end bredden af et menneskehår - med røntgenstråler, der trænger ind i miljøer, " sagde Hruszkewycz. "Dette papir er en demonstration af disse avancerede metoder, og det letter billeddannelsesprocessen i høj grad. Vi vil gerne vide, hvad et materiale er, og hvordan det ændrer sig over tid, og dette vil hjælpe os med at tage bedre billeder af det, mens vi foretager målinger."
Som et sidste skridt, 3D-CDI-NN's evne til at udfylde manglende information og komme med en 3D-visualisering blev testet på rigtige røntgendata fra små partikler af guld, opsamlet ved beamline 34-ID-C ved APS. Resultatet er en beregningsmetode, der er hundredvis af gange hurtigere på simulerede data, og næsten så hurtigt på rigtige APS-data. Testene viste også, at netværket kan rekonstruere billeder med færre data, end der normalt kræves for at kompensere for den information, der ikke fanges af detektorerne.
Det næste skridt for denne forskning, ifølge Chan, er at integrere netværket i APS'ens arbejdsgang, så den lærer af data, efterhånden som den tages. Hvis netværket lærer af data ved beamline, han sagde, det vil løbende forbedres.
For dette hold, der er også et tidselement til denne forskning. Som Cherukara påpeger, en massiv opgradering af APS er undervejs, og mængden af data, der genereres nu, vil stige eksponentielt, når projektet er afsluttet. Den opgraderede APS vil generere røntgenstråler, der er op til 500 gange lysere, og kohærensen af strålen - karakteristikken for lys, der gør det muligt at diffraktere på en måde, der koder for mere information om prøven - vil blive stærkt forøget.
Det betyder, at selvom det nu tager to til tre minutter at indsamle kohærente diffraktionsbilleddata fra en prøve og få et billede, dataindsamlingsdelen af denne proces vil snart være op til 500 gange hurtigere. Processen med at konvertere disse data til et brugbart billede skal også være hundredvis af gange hurtigere, end det er nu for at følge med.
"For at gøre fuld brug af, hvad den opgraderede APS vil være i stand til, vi er nødt til at genopfinde dataanalyse, " sagde Cherukara. "Vores nuværende metoder er ikke nok til at følge med. Maskinlæring kan gøre fuld brug og gå ud over, hvad der i øjeblikket er muligt."
Ud over Chan, Cherukara og Hruszkewycz, forfattere på papiret inkluderer Subramanian Sankaranarayanan og Ross Harder, begge af Argonne; Youssef Nashed fra SLAC National Accelerator Laboratory; og Saugat Kandel fra Northwestern University.