Maskinlæring giver et farvekodet kort over røntgendata baseret på temperaturafhængigheden i hver region. X-TEC identificerede placeringen af to sæt skarpe toppe (gule og grønne firkanter) i dataene, såvel som diffuse spredningshaloer omkring dem (rød og blå). Kredit:Argonne National Laboratory
Farvekodning gør luftkort meget lettere at forstå. Gennem farver kan vi med et øjeblik se, hvor der er en vej, skov, ørken, by, flod eller sø.
I samarbejde med flere universiteter har U.S. Department of Energy's (DOE) Argonne National Laboratory udtænkt en metode til at skabe farvekodede grafer af store mængder data fra røntgenanalyse. Dette nye værktøj bruger beregningsmæssig datasortering til at finde klynger relateret til fysiske egenskaber, såsom en atomare forvrængning i en krystalstruktur. Det skulle i høj grad fremskynde fremtidig forskning i strukturelle ændringer på atomær skala, der induceres af varierende temperatur.
Forskerholdet offentliggjorde deres resultater i Proceedings of the National Academy of Sciences i en artikel med titlen "Udnyttelse af fortolkelig og uovervåget maskinlæring til at adressere big data fra moderne røntgendiffraktion."
"Vores metode bruger maskinlæring til hurtigt at analysere enorme mængder af data fra røntgendiffraktion," sagde Raymond Osborn, seniorfysiker i Argonnes Materials Science-afdeling. "Det, der kunne have taget os måneder i fortiden, tager nu omkring et kvarter, med meget mere finkornede resultater."
I over et århundrede har røntgendiffraktion (eller XRD) været en af de mest frugtbare af alle videnskabelige metoder til at analysere materialer. Det har givet nøgleoplysninger om 3D-atomstrukturen af utallige teknologisk vigtige materialer.
I de seneste årtier er mængden af data, der produceres i XRD-eksperimenter, steget dramatisk på store faciliteter såsom Advanced Photon Source (APS), en DOE Office of Science-brugerfacilitet i Argonne. Der mangler dog i høj grad analysemetoder, der kan klare disse enorme datasæt.
Holdet kalder deres nye metode for X-ray Temperature Clustering, eller kort sagt XTEC. Det accelererer materialeopdagelser gennem hurtig klyngedannelse og farvekodning af store røntgendatasæt for at afsløre tidligere skjulte strukturelle ændringer, der opstår, når temperaturen stiger eller falder. Et typisk stort datasæt ville være 10.000 gigabyte, svarende til omkring 3 millioner sange med streaming musik.
XTEC trækker på kraften i uovervåget maskinlæring ved at bruge metoder udviklet til dette projekt på Cornell University. Denne maskinlæring afhænger ikke af indledende træning og læring med data, der allerede er godt undersøgt. I stedet lærer den ved at finde mønstre og klynger i store datasæt uden en sådan træning. Disse mønstre repræsenteres derefter af farvekodning.
"For eksempel kan XTEC tildele rød til dataklynge en, som er forbundet med en bestemt egenskab, der ændrer sig med temperaturen på en bestemt måde," sagde Osborn. "Så ville klynge to være blå og forbundet med en anden egenskab med en anden temperaturafhængighed og så videre. Farverne fortæller, om hver klynge repræsenterer det, der svarer til en vej, skov eller sø på et luftkort."
Som et testcase analyserede XTEC data fra beamline 6-ID-D ved APS, taget fra to krystallinske materialer, der er superledende ved temperaturer tæt på det absolutte nulpunkt. Ved denne ultralave temperatur skifter disse materialer til en superledende tilstand og giver ingen modstand mod elektrisk strøm. Mere vigtigt for denne undersøgelse, andre usædvanlige træk dukker op ved højere temperaturer relateret til ændringer i materialestrukturen.
Ved at anvende XTEC udtrak holdet en hidtil uset mængde information om ændringer i atomstruktur ved forskellige temperaturer. Disse omfatter ikke kun forvrængninger i det ordnede arrangement af atomer i materialet, men også fluktuationer, der opstår, når sådanne ændringer sker.
"På grund af maskinlæring er vi i stand til at se materialers adfærd, der ikke er synlig ved konventionel XRD," sagde Osborn. "Og vores metode er anvendelig til mange big data-problemer i ikke kun superledere, men også batterier, solceller og enhver temperaturfølsom enhed."
APS gennemgår en massiv opgradering, der vil øge lysstyrken af dens røntgenstråler med op til 500 gange. Sammen med opgraderingen vil der komme en betydelig stigning i data indsamlet på APS, og maskinlæringsteknikker vil være afgørende for at analysere disse data rettidigt. + Udforsk yderligere