Videnskab
 science >> Videnskab >  >> Kemi

Kunstig intelligens hjælper materialefremstilling

Et team af forskere ved MIT, University of Massachusetts i Amherst, og University of California i Berkeley håber at lukke materiale-videnskabens automatiseringskløft, med et nyt kunstig intelligens-system, der ville gennemsøge forskningsartikler for at udlede "opskrifter" til fremstilling af bestemte materialer. Kredit:Chelsea Turner/MIT

I de seneste år, forskningsindsatser såsom Materials Genome Initiative og Materials Project har produceret et væld af beregningsværktøjer til at designe nye materialer, der er nyttige til en række applikationer, fra energi og elektronik til luftfart og anlægsteknik.

Men udvikling af processer til fremstilling af disse materialer er fortsat afhængig af en kombination af erfaring, intuition, og manuelle litteraturgennemgange.

Et team af forskere ved MIT, University of Massachusetts i Amherst, og University of California i Berkeley håber at lukke det materiale-videnskabelige automationsgab, med et nyt kunstig intelligens-system, der ville gennemsøge forskningsartikler for at udlede "opskrifter" til fremstilling af bestemte materialer.

"Beregningsmaterialeforskere har gjort store fremskridt i 'hvad' de skal lave - hvilket materiale der skal designes baseret på ønskede egenskaber, " siger Elsa Olivetti, Atlantic Richfield Assistant Professor of Energy Studies i MIT's Department of Materials Science and Engineering (DMSE). "Men på grund af den succes, flaskehalsen er flyttet til, 'Okay, hvordan laver jeg det nu?'"

Forskerne forestiller sig en database, der indeholder materialeopskrifter udvundet fra millioner af papirer. Forskere og ingeniører kunne indtaste navnet på et målmateriale og ethvert andet kriterium - forløbermaterialer, reaktionsbetingelser, fremstillingsprocesser - og træk foreslåede opskrifter op.

Som et skridt mod at realisere denne vision, Olivetti og hendes kolleger har udviklet et maskinlæringssystem, der kan analysere en forskningsartikel, udlede, hvilke af dens afsnit der indeholder materialeopskrifter, og klassificer ordene i disse afsnit efter deres roller i opskrifterne:navne på målmaterialer, numeriske mængder, navne på udstyr, driftsbetingelser, beskrivende adjektiver, og lignende.

I et papir, der vises i det seneste nummer af tidsskriftet Materialernes kemi , de demonstrerer også, at et maskinlæringssystem kan analysere de udtrukne data for at udlede generelle karakteristika for klasser af materialer - såsom de forskellige temperaturområder, som deres syntese kræver - eller særlige egenskaber ved individuelle materialer - såsom de forskellige fysiske former, de vil antage når deres fremstillingsbetingelser varierer.

Olivetti er ledende forfatter på avisen, og hun får følgeskab af Edward Kim, en MIT kandidatstuderende i DMSE; Kevin Huang, en DMSE postdoc; Adam Saunders og Andrew McCallum, dataloger ved UMass Amherst; og Gerbrand Ceder, en kanslerprofessor i afdelingen for materialevidenskab og teknik i Berkeley.

At udfylde hullerne

Forskerne trænede deres system ved at bruge en kombination af overvågede og uovervågede maskinlæringsteknikker. "Overvåget" betyder, at træningsdataene, der føres til systemet, først annoteres af mennesker; systemet forsøger at finde sammenhænge mellem rådata og annoteringer. "Utilsyn" betyder, at træningsdataene er uannoterede, og systemet lærer i stedet at klynge data sammen efter strukturelle ligheder.

Fordi materialeopskriftsudvinding er et nyt forskningsområde, Olivetti og hendes kolleger havde ikke den luksus at store, kommenterede datasæt akkumuleret over år af forskellige teams af forskere. I stedet, de skulle selv kommentere deres data - i sidste ende, omkring 100 papirer.

Ved maskinlæringsstandarder, det er et ret lille datasæt. For at forbedre det, de brugte en algoritme udviklet hos Google kaldet Word2vec. Word2vec ser på de sammenhænge, ​​som ord forekommer i – ordenes syntaktiske roller i sætninger og de andre ord omkring dem – og grupperer ord, der har en tendens til at have lignende sammenhænge. Så, for eksempel, hvis et papir indeholdt sætningen "Vi opvarmede titantetracholoridet til 500 C, " og en anden indeholdt sætningen "Natriumhydroxidet blev opvarmet til 500 C, " Word2vec ville gruppere "titanium tetracholoride" og "natriumhydroxid" sammen.

Med Word2vec, forskerne var i stand til i høj grad at udvide deres træningssæt, da maskinlæringssystemet kunne udlede, at en etiket knyttet til et givet ord sandsynligvis ville gælde for andre ord, der er klynget sammen med det. I stedet for 100 papirer, forskerne kunne således træne deres system på omkring 640, 000 papirer.

Toppen af ​​isbjerget

For at teste systemets nøjagtighed, imidlertid, de måtte stole på de mærkede data, da de ikke havde noget kriterium for at evaluere dens ydeevne på de umærkede data. I de test, systemet var i stand til med 99 procents nøjagtighed at identificere de afsnit, der indeholdt opskrifter, og at mærke ordene i disse afsnit med 86 procents nøjagtighed.

Forskerne håber, at yderligere arbejde vil forbedre systemets nøjagtighed, og i det igangværende arbejde udforsker de et batteri af deep learning-teknikker, der kan gøre yderligere generaliseringer om strukturen af ​​materialeopskrifter, med det mål automatisk at udtænke opskrifter på materialer, der ikke er medtaget i den eksisterende litteratur.

Meget af Olivettis tidligere forskning har koncentreret sig om at finde mere omkostningseffektive og miljømæssigt ansvarlige måder at producere nyttige materialer på, og hun håber, at en database med materialeopskrifter kan understøtte dette projekt.

"Dette er skelsættende arbejde, " siger Ram Seshadri, Fred og Linda R. Wudl professor i materialevidenskab ved University of California i Santa Barbara. "Forfatterne har påtaget sig den svære og ambitiøse udfordring at fange, gennem AI-metoder, strategier anvendt til fremstilling af nye materialer. Værket demonstrerer kraften ved maskinlæring, men det ville være korrekt at sige, at den endelige dommer af succes eller fiasko ville kræve overbevisende praktikere om, at brugen af ​​sådanne metoder kan sætte dem i stand til at opgive deres mere instinktive tilgange.

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.