Resultater fra en analyse af kunstigt neuralt netværk (ANN) er muligvis ikke pålidelige for molekyler, der er for forskellige fra dem, som ANN blev trænet på. De sorte skyer, der er vist her, dækker overgangsmetalkomplekser i datasættet, hvis numeriske repræsentationer er for fjernt fra træningskompleksernes til at blive betragtet som pålidelige. Kredit:Massachusetts Institute of Technology
I de seneste år, maskinlæring har vist sig at være et værdifuldt værktøj til at identificere nye materialer med egenskaber optimeret til specifikke applikationer. Arbejder med store, veldefinerede datasæt, computere lærer at udføre en analytisk opgave for at generere et korrekt svar og derefter bruge den samme teknik på et ukendt datasæt.
Mens denne tilgang har styret udviklingen af værdifulde nye materialer, de har primært været organiske forbindelser, bemærker Heather Kulik Ph.D. '09, en adjunkt i kemiteknik. Kulik fokuserer i stedet på uorganiske forbindelser - især, dem, der er baseret på overgangsmetaller, en familie af grundstoffer (herunder jern og kobber), der har unikke og nyttige egenskaber. I disse forbindelser - kendt som overgangsmetalkomplekser - forekommer metalatomet i midten med kemisk bundne arme, eller ligander, lavet af kulstof, brint, nitrogen, eller iltatomer, der stråler udad.
Overgangsmetalkomplekser spiller allerede vigtige roller inden for områder lige fra energilagring til katalyse til fremstilling af finkemikalier - f.eks. for lægemidler. Men Kulik mener, at maskinlæring kan udvide deres anvendelse yderligere. Ja, hendes gruppe har ikke kun arbejdet på at anvende maskinlæring på uorganiske stoffer – en ny og udfordrende virksomhed – men også på at bruge teknikken til at udforske nyt territorium. "Vi var interesserede i at forstå, hvor langt vi kunne skubbe vores modeller til at gøre opdagelse - at lave forudsigelser om forbindelser, der ikke er set før, " siger Kulik.
Sensorer og computere
I de sidste fire år har Kulik og Jon Paul Janet, en kandidatstuderende i kemiteknik, har fokuseret på overgangsmetalkomplekser med "spin" - en kvantemekanisk egenskab ved elektroner. Som regel, elektroner forekommer i par, en med spin op og den anden med spin ned, så de annullerer hinanden, og der er ingen nettospin. Men i et overgangsmetal, elektroner kan være uparrede, og det resulterende nettospin er den egenskab, der gør uorganiske komplekser af interesse, siger Kulik. "At skræddersy, hvor uparrede elektronerne er, giver os en unik knap til at skræddersy egenskaber."
Et givet kompleks har en foretrukken spin-tilstand. Men tilføj noget energi - siger, fra lys eller varme - og det kan vende til den anden tilstand. I processen, det kan udvise ændringer i egenskaber i makroskala, såsom størrelse eller farve. Når den energi, der er nødvendig for at forårsage vendingen - kaldet spin-splittende energi - er tæt på nul, komplekset er en god kandidat til brug som sensor, eller måske som en grundlæggende komponent i en kvantecomputer.
Kemikere kender til mange metal-ligand-kombinationer med spin-splittende energier nær nul, gør dem til potentielle "spin-crossover" (SCO) komplekser til sådanne praktiske anvendelser. Men det fulde sæt af muligheder er enormt. Spin-spaltningsenergien af et overgangsmetalkompleks bestemmes af hvilke ligander der er kombineret med et givet metal, og der er næsten uendelige ligander at vælge imellem. Udfordringen er at finde nye kombinationer med den ønskede egenskab for at blive SCO'er - uden at ty til millioner af trial-and-error-tests i et laboratorium.
Oversættelse af molekyler til tal
Standardmetoden til at analysere den elektroniske struktur af molekyler er at bruge en beregningsmodelleringsmetode kaldet tæthedsfunktionel teori, eller DFT. Resultaterne af en DFT-beregning er ret nøjagtige - især for organiske systemer - men at udføre en beregning for en enkelt forbindelse kan tage timer, eller endda dage. I modsætning, et maskinlæringsværktøj kaldet et kunstigt neuralt netværk (ANN) kan trænes til at udføre den samme analyse og derefter gøre det på få sekunder. Som resultat, ANN'er er meget mere praktiske til at lede efter mulige SCO'er i det enorme rum af mulige komplekser.
Denne grafik repræsenterer et eksempel på et overgangsmetalkompleks. Et overgangsmetalkompleks består af et centralt overgangsmetalatom (orange) omgivet af en række kemisk bundne organiske molekyler i strukturer kendt som ligander. Kredit:Massachusetts Institute of Technology
Fordi en ANN kræver et numerisk input for at fungere, forskernes første udfordring var at finde en måde at repræsentere et givent overgangsmetalkompleks som en række tal, hver beskriver en valgt egenskab. Der er regler for at definere repræsentationer for organiske molekyler, hvor den fysiske struktur af et molekyle fortæller meget om dets egenskaber og adfærd. Men da forskerne fulgte disse regler for overgangsmetalkomplekser, det virkede ikke. "Det metal-organiske bånd er meget vanskeligt at få rigtigt, " siger Kulik. "Der er unikke egenskaber ved bindingen, der er mere variable. Der er mange flere måder, hvorpå elektronerne kan vælge at danne en binding." Så forskerne skulle lave nye regler for at definere en repræsentation, der ville være forudsigelig i uorganisk kemi.
Brug af maskinlæring, de udforskede forskellige måder at repræsentere et overgangsmetalkompleks til at analysere spin-splittende energi. Resultaterne var bedst, når repræsentationen lagde mest vægt på egenskaberne af metalcentret og metal-ligand-forbindelsen og mindre vægt på egenskaberne af ligander længere ude. Interessant nok, deres undersøgelser viste, at repræsentationer, der gav mere lige vægt generelt, fungerede bedst, når målet var at forudsige andre egenskaber, såsom ligand-metalbindingslængden eller tendensen til at acceptere elektroner.
Test af ANN
Som en test af deres tilgang, Kulik og Janet – assisteret af Lydia Chan, en sommerpraktikant fra Troy High School i Fullerton, Californien - definerede et sæt overgangsmetalkomplekser baseret på fire overgangsmetaller - krom, mangan, jern, og kobolt - i to oxidationstilstande med 16 ligander (hvert molekyle kan have op til to). Ved at kombinere disse byggesten, de oprettede et "søgeområde" på 5, 600 komplekser - nogle af dem velkendte og velundersøgte, og nogle af dem helt ukendte.
I tidligere arbejde, forskerne havde trænet en ANN på tusindvis af forbindelser, der var velkendte i overgangsmetalkemi. For at teste den trænede ANN's evne til at udforske et nyt kemisk rum for at finde forbindelser med de målrettede egenskaber, de prøvede at anvende det på puljen af 5, 600 komplekser, 113, som den havde set i den tidligere undersøgelse.
Resultatet var plottet mærket "Figur 1" i diasshowet ovenfor, som sorterer komplekserne på en overflade som bestemt af ANN. De hvide områder angiver komplekser med spin-splittende energier inden for 5 kilokalorier pr. mol nul, hvilket betyder, at de er potentielt gode SCO-kandidater. De røde og blå områder repræsenterer komplekser med spin-splittende energier for store til at være nyttige. De grønne diamanter, der vises i det indsatte, viser komplekser, der har jerncentre og lignende ligander - med andre ord, relaterede forbindelser, hvis spin-crossover-energier bør være ens. Deres udseende i samme område af plottet er bevis på den gode overensstemmelse mellem forskernes repræsentation og kompleksets centrale egenskaber.
Men der er én fangst:Ikke alle forudsigelserne om spindeling er nøjagtige. Hvis et kompleks er meget forskelligt fra dem, netværket blev trænet på, ANN-analysen er muligvis ikke pålidelig - et standardproblem, når man anvender maskinlæringsmodeller til opdagelse inden for materialevidenskab eller kemi, bemærker Kulik. Ved at bruge en tilgang, der så vellykket ud i deres tidligere arbejde, forskerne sammenlignede de numeriske repræsentationer for trænings- og testkomplekserne og udelukkede alle de testkomplekser, hvor forskellen var for stor.
Fokus på de bedste muligheder
Udførelse af ANN-analysen af alle 5, 600 komplekser tog kun en time. Men i den virkelige verden, antallet af komplekser, der skal udforskes, kunne være tusindvis af gange større - og enhver lovende kandidat ville kræve en fuld DFT-beregning. Forskerne havde derfor brug for en metode til at evaluere et stort datasæt for at identificere eventuelle uacceptable kandidater allerede før ANN-analysen. Til det formål, de udviklede en genetisk algoritme – en tilgang inspireret af naturlig selektion – til at score individuelle komplekser og kassere dem, der anses for at være uegnede.
Et kunstigt neuralt netværk tidligere trænet på velkendte forbindelser analyseret 5, 600 overgangsmetalkomplekser for at identificere potentielle spin-crossover-komplekser. Resultatet blev dette plot, hvor komplekser er farvet baseret på deres spin-splittende energi i kilokalorier pr. mol (kcal/mol). I lovende kandidater, at energien er inden for 5 kcal/mol af nul. De lyse grønne diamanter i indsatsen er relaterede komplekser. Kredit:Massachusetts Institute of Technology
For at forhåndsscreene et datasæt, den genetiske algoritme udvælger først tilfældigt 20 prøver fra det fulde sæt af komplekser. Den tildeler derefter en "fitness"-score til hver prøve baseret på tre mål. Først, er dens spin-crossover-energi lav nok til, at den er en god SCO? At finde ud af, det neurale netværk evaluerer hvert af de 20 komplekser. Sekund, er komplekset for langt væk fra træningsdataene? Hvis så, spin-crossover-energien fra ANN kan være unøjagtig. Og endelig, er komplekset for tæt på træningsdataene? Hvis så, forskerne har allerede kørt en DFT-beregning på et lignende molekyle, så kandidaten er ikke af interesse i jagten på nye muligheder.
Baseret på dens tredelte evaluering af de første 20 kandidater, den genetiske algoritme smider uegnede muligheder ud og gemmer de stærkeste til næste runde. For at sikre mangfoldigheden af de gemte forbindelser, algoritmen kræver, at nogle af dem muterer en smule. Et kompleks kan tildeles en ny, tilfældigt udvalgt ligand, eller to lovende komplekser kan bytte ligander. Trods alt, hvis et kompleks ser godt ud, så kunne noget meget lignende være endnu bedre - og målet her er at finde nye kandidater. Den genetiske algoritme tilføjer så nogle nye, tilfældigt udvalgte komplekser for at udfylde den anden gruppe på 20 og udfører sin næste analyse. Ved at gentage denne proces i alt 21 gange, det producerer 21 generationer af muligheder. Det fortsætter således gennem søgerummet, lader de dygtigste kandidater overleve og formere sig, og de uegnede til at dø ud.
Udførelse af 21-generationsanalysen på de fulde 5, 600-kompleks datasæt kræves lidt over fem minutter på en standard stationær computer, og det gav 372 kundeemner med en god kombination af høj diversitet og acceptabel selvtillid. Forskerne brugte derefter DFT til at undersøge 56 komplekser tilfældigt udvalgt blandt disse leads, og resultaterne bekræftede, at to tredjedele af dem kunne være gode SCO'er.
Selvom en succesrate på to tredjedele måske ikke lyder godt, forskerne gør to pointer. Først, deres definition af, hvad der kunne gøre en god SCO, var meget restriktiv:For at et kompleks skal overleve, dens spin-splittende energi skulle være ekstremt lille. Og for det andet, givet et mellemrum på 5, 600 komplekser og intet at gå efter, hvor mange DFT-analyser kræves der for at finde 37 leads? Som Janet bemærker, "Det er lige meget, hvor mange vi evaluerede med det neurale netværk, fordi det er så billigt. Det er DFT-beregningerne, der tager tid."
Bedst af alt, ved at bruge deres tilgang gjorde det muligt for forskerne at finde nogle ukonventionelle SCO-kandidater, som ikke ville have været tænkt på baseret på, hvad der er blevet undersøgt tidligere. "Der er regler, som folk har - heuristik i deres hoveder - for, hvordan de ville bygge et spin-crossover-kompleks, " siger Kulik. "Vi viste, at du kan finde uventede kombinationer af metaller og ligander, som normalt ikke studeres, men som kan være lovende som spin-crossover-kandidater."
Deling af de nye værktøjer
For at støtte den verdensomspændende søgen efter nye materialer, forskerne har inkorporeret den genetiske algoritme og ANN i "molSimplify, "gruppen er online, open source softwareværktøj, som alle kan downloade og bruge til at bygge og simulere overgangsmetalkomplekser. For at hjælpe potentielle brugere, webstedet giver tutorials, der viser, hvordan man bruger nøglefunktionerne i open source-softwarekoderne. Udviklingen af molSimplify begyndte med finansiering fra MIT Energy Initiative i 2014, og alle eleverne i Kuliks gruppe har bidraget til det siden da.
Forskerne fortsætter med at forbedre deres neurale netværk til at undersøge potentielle SCO'er og til at poste opdaterede versioner af molSimplify. I mellemtiden andre i Kuliks laboratorium er ved at udvikle værktøjer, der kan identificere lovende forbindelser til andre anvendelser. For eksempel, et vigtigt fokusområde er katalysatordesign. Kandidatstuderende i kemi Aditya Nandy fokuserer på at finde en bedre katalysator til at omdanne metangas til et lettere at håndtere flydende brændstof såsom methanol - et særligt udfordrende problem. "Nu har vi et eksternt molekyle, der kommer ind, og vores kompleks – katalysatoren – skal virke på det molekyle for at udføre en kemisk transformation, der finder sted i en hel række trin, " siger Nandy. "Maskinlæring vil være super nyttig til at finde ud af de vigtige designparametre for et overgangsmetalkompleks, der vil gøre hvert trin i den proces energisk gunstigt."
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.