En iterativ, flertrinsproces til træning af et neuralt netværk, som afbildet øverst til venstre, fører til en vurdering af afvejningen mellem to konkurrerende kvaliteter, som afbildet i grafen i midten. Den blå linje repræsenterer en såkaldt Pareto-front, at definere de tilfælde, ud over hvilke materialevalget ikke kan forbedres yderligere. Dette gør det muligt at identificere specifikke kategorier af lovende nye materialer, som den, der er afbildet af molekylediagrammet til højre. Kredit:Massachusetts Institute of Technology
Når du søger gennem teoretiske lister over mulige nye materialer til bestemte applikationer, batterier eller andre energirelaterede enheder, der er ofte millioner af potentielle materialer, der kunne overvejes, og flere kriterier, der skal opfyldes og optimeres på én gang. Nu, forskere ved MIT har fundet en måde til dramatisk at strømline opdagelsesprocessen, ved hjælp af et maskinlæringssystem.
Som en demonstration, holdet nåede frem til et sæt af de otte mest lovende materialer, ud af næsten 3 millioner kandidater, for et energilagringssystem kaldet et flowbatteri. Denne nedslagningsproces ville have taget 50 år med konventionelle analysemetoder, de siger, men de nåede det på fem uger.
Resultaterne er rapporteret i tidsskriftet ACS Central Science , i et papir af MIT professor i kemiteknik Heather Kulik, Jon Paul Janet Ph.D. '19, Sahasrajit Ramesh, og kandidatstuderende Chenru Duan.
Undersøgelsen så på et sæt materialer kaldet overgangsmetalkomplekser. Disse kan eksistere i en lang række forskellige former, og Kulik siger, at de "er virkelig fascinerende, funktionelle materialer, der er ulig mange andre materialefaser. Den eneste måde at forstå, hvorfor de arbejder, som de gør, er at studere dem ved hjælp af kvantemekanik."
At forudsige egenskaberne af et af millioner af disse materialer ville kræve enten tidskrævende og ressourcekrævende spektroskopi og andet laboratoriearbejde, eller tidskrævende, meget kompleks fysikbaseret computermodellering for hvert muligt kandidatmateriale eller kombination af materialer. Hver sådan undersøgelse kunne forbruge timer til dages arbejde.
I stedet, Kulik og hendes team tog et lille antal forskellige mulige materialer og brugte dem til at lære et avanceret maskinlærende neuralt netværk om forholdet mellem materialernes kemiske sammensætning og deres fysiske egenskaber. Denne viden blev derefter anvendt til at generere forslag til den næste generation af mulige materialer, der skulle bruges til den næste runde af træning af det neurale netværk. Gennem fire på hinanden følgende iterationer af denne proces, det neurale netværk forbedredes markant hver gang, indtil det nåede et punkt, hvor det var klart, at yderligere iterationer ikke ville give yderligere forbedringer.
Dette iterative optimeringssystem strømlinede i høj grad processen med at nå frem til potentielle løsninger, der opfyldte de to modstridende kriterier, der søges. Denne form for proces med at finde de bedste løsninger i situationer, hvor forbedring af en faktor har tendens til at forværre den anden, er kendt som en Pareto-front, repræsenterer en graf over punkterne, således at enhver yderligere forbedring af en faktor ville gøre den anden værre. Med andre ord, grafen repræsenterer de bedst mulige kompromispunkter, afhængigt af den relative betydning, der tildeles hver faktor.
Træning af typiske neurale netværk kræver meget store datasæt, lige fra tusinder til millioner af eksempler, men Kulik og hendes team var i stand til at bruge denne iterative proces, baseret på Pareto frontmodellen, at strømline processen og give pålidelige resultater ved kun at bruge de få hundrede prøver.
I tilfælde af screening for flowbatterimaterialerne, de ønskede egenskaber var i konflikt, som det ofte er tilfældet:Det optimale materiale ville have høj opløselighed og høj energitæthed (evnen til at lagre energi til en given vægt). Men stigende opløselighed har en tendens til at mindske energitætheden, og omvendt.
Ikke alene var det neurale netværk i stand til hurtigt at finde frem til lovende kandidater, det var også i stand til at tildele niveauer af tillid til sine forskellige forudsigelser gennem hver iteration, hvilket hjalp med at forfine prøveudvælgelsen på hvert trin. "Vi udviklede en bedre end klassens bedste usikkerhedskvantificeringsteknik til virkelig at vide, hvornår disse modeller ville fejle, " siger Kulik.
Udfordringen de valgte til proof-of-concept forsøget var materialer til brug i redox flow batterier, en type batteri, der lover store, batterier i netskala, der kan spille en væsentlig rolle i at muliggøre rene, vedvarende energi. Overgangsmetalkomplekser er den foretrukne kategori af materialer til sådanne batterier, Kulik siger, men der er for mange muligheder til at evaluere med konventionelle midler. De startede med en liste over 3 millioner sådanne komplekser, før de i sidste ende reducerede det til de otte gode kandidater, sammen med et sæt designregler, der skal gøre det muligt for eksperimentalister at udforske disse kandidaters potentiale og deres variationer.
"Gennem den proces, det neurale net bliver både mere og mere klogere på [design]rummet, men også mere og mere pessimistisk over, at alt ud over det, vi allerede har karakteriseret, kan forbedres yderligere i forhold til det, vi allerede ved, " hun siger.
Bortset fra de specifikke overgangsmetalkomplekser foreslået til yderligere undersøgelse ved brug af dette system, hun siger, metoden i sig selv kunne have meget bredere anvendelser. "Vi ser det som den ramme, der kan anvendes til enhver materialedesignudfordring, hvor du virkelig forsøger at løse flere mål på én gang. Du ved, alle de mest interessante udfordringer med materialedesign er dem, hvor du har én ting, du forsøger at forbedre, men at forbedre det forværrer en anden. Og for os, redoxflow-batteriets redox-par var bare en god demonstration af, hvor vi tror, vi kan gå hen med denne maskinlæring og accelererede materialeopdagelse."
For eksempel, optimering af katalysatorer til forskellige kemiske og industrielle processer er en anden form for så kompleks materialesøgning, siger Kulik. Nuværende anvendte katalysatorer involverer ofte sjældne og dyre elementer, så det kan være en væsentlig fordel at finde lignende effektive forbindelser baseret på rigelige og billige materialer.
"Dette papir repræsenterer, Jeg tror, den første anvendelse af multidimensionel rettet forbedring i de kemiske videnskaber, " siger hun. Men den langsigtede betydning af arbejdet ligger i selve metodikken, på grund af ting, som ellers måske slet ikke ville være mulige. "Du begynder at indse, at selv med parallelle beregninger, det er tilfælde, hvor vi ikke ville have fundet på et designprincip på nogen anden måde. Og disse spor, der kommer ud af vores arbejde, det er slet ikke nødvendigvis ideer, som allerede var kendt fra litteraturen, eller som en ekspert ville have kunnet henvise dig til."
"Dette er en smuk kombination af begreber i statistik, anvendt matematik, og fysisk videnskab, der vil være ekstremt nyttig i tekniske applikationer, " siger George Schatz, en professor i kemi og i kemisk og biologisk ingeniørvidenskab ved Northwestern University, som ikke var tilknyttet dette arbejde. Han siger, at denne forskning omhandler "hvordan man laver maskinlæring, når der er flere mål. Kuliks tilgang bruger førende metoder til at træne et kunstigt neuralt netværk, der bruges til at forudsige, hvilken kombination af overgangsmetalioner og organiske ligander der vil være bedst til redoxflowbatterier elektrolytter."
Schatz siger, "This method can be used in many different contexts, so it has the potential to transform machine learning, which is a major activity around the world."
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.