Struktur motiv-centreret læringsramme for uorganiske krystallinske systemer

Ekstraktion af strukturmotivinformation i uorganiske krystallinske forbindelser (metaloxider) og generering af globale motivrepræsentationer ved hjælp af motivmiljømatrixen. Kredit: Videnskab fremskridt , doi:10.1126/sciadv.abf1754

Fysiske principper kan inkorporeres i en maskinlæringsarkitektur som et grundlæggende setup for at udvikle kunstig intelligens til uorganiske materialer. I en ny rapport nu Videnskab fremskridt , Huta R. Banjade, og et forskerhold i fysik, computer- og informationsvidenskab og nanovidenskab i USA og Belgien foreslog strukturmotiver i uorganiske krystaller for at tjene som et centralt input til en machine learning -ramme. Teamet demonstrerede, hvordan tilstedeværelsen af strukturmotiver og deres forbindelser i et stort sæt krystallinske forbindelser kunne konverteres til unikke vektorrepræsentationer via en uovervåget læringsalgoritme. De opnåede dette ved at oprette en motivcentrisk hældende ramme ved at kombinere motivinformation med atombaserede grafneurale netværk for at danne et atommotiv dual grafnetværk (AMDNet). Opsætningen forudsagde nøjagtigt den elektroniske struktur af metaloxider, såsom båndgap. Værket illustrerer en metode til at designe grafiske neurale netværksindlæringsarkitekturer for at undersøge komplekse materialer ud over atomfysiske egenskaber.

ML metoder

Maskinlæringsmetoder (ML) kan kombineres med massive materialedata for at fremskynde opdagelsen og rationelt design af funktionelle faststofforbindelser. Overvåget læring kan føre til materielle ejendomsforudsigelser, herunder fasestabilitet og krystal natur, effektiv til molekyledynamiksimuleringer. Strukturmotiver kan oprettes i overensstemmelse med Paulings første regel, ved at danne et koordineret polyeder af anioner om hver kation i en forbindelse til at opføre sig som grundlæggende byggesten, der er stærkt korreleret med materialegenskaber. For eksempel, strukturmotiverne i krystallinske forbindelser kan spille en væsentlig rolle for at bestemme materialegenskaberne i forskellige tekniske og videnskabelige anvendelser. I dette arbejde, Banjade et al. indarbejdet strukturmotivinformation i en maskine -lænet (ML) ramme. Forskerne kombinerede motivinformationen med grafkonvolutions neurale netværk for at udvikle en motivcentrisk dyb læringsarkitektur kendt som atommotiv dual graph network (AMDNet). Strukturens nøjagtighed overgik den for et eksisterende state-of-the-art atombaseret grafnetværk for at forudsige de elektroniske strukturer af uorganiske krystallinske materialer.

Den t-distribuerede stokastiske nabo indlejrer projektion af motivvektorer konstrueret ved hjælp af motivmiljømatrixen. Motivklyngerne 1 til 4 er forbundet med forskellige motivtyper, herunder (1) terning, (2) cuboctahedron, (3) oktaeder, og (4) en blanding af tetraeder (i magenta) og kvadratisk plan (i rest). t-SNE, t-distribueret stokastisk naboindlejring. Kredit: Videnskab fremskridt , doi:10.1126/sciadv.abf1754

Strukturmotiver klynge

En uovervåget indlæringsalgoritme Atom2Vec kan forstå højdimensionelle vektorrepræsentationer af atomer ved at kode grundlæggende egenskaber for atomer baseret på en omfattende database med kemiske formler. Banjade et al. fokuseret på binære og ternære metaloxider, der udgør et stort og mangfoldigt materialerum, hvor krystalstrukturer karakteriseres via kation-ilt-koordination. For at udtrække strukturmotivoplysningerne, teamet brugte den lokale miljøidentifikationsmetode udviklet af Waroquiers et al. som implementeret af Pymatgen -koden. Teamet identificerede tre forskellige former for forbindelse mellem et motiv og dets nabomotiv; herunder indre deling (delt med et atom), kantdeling (to atomer delt), og ansigtsdeling (tre eller flere atomer delt). Forskerne foreslog derefter en indlæringsalgoritme for at drage fordel af motivdataindsamlingsprocessen og konverterede effektivt hver række af motivmiljømatrixen til en højdimensionel vektor for at repræsentere et unikt strukturmotiv. De hentede derefter motivinformation til læreprocessen ved hjælp af et grafkonvolutionsnetværk. Teamet havde til formål at identificere mønstre og klyngeinformation for disse højdimensionelle motivvektorer for at påvirke de komplekse materialegenskaber af oxidforbindelser. De visualiserede de højdimensionelle data ved hjælp af den t-distribuerede stokastiske naboindlejring (t-SNE)-en ikke-lineær dimensionel reduktionsteknik.

Brug af motivinformation i grafneurale netværk.

Konstruktion af en motivgraf baseret på både atom-niveau og motiv-niveau information kodet i en uorganisk krystal. Kredit: Videnskab fremskridt , doi:10.1126/sciadv.abf1754

Forskerne opnåede projekterede motivvektordata i to dimensioner ved hjælp af t-SNE-processen. De noterede forskellige klynger baseret på motivtyperne. De kemiske egenskaber ved elementerne, der danner motiverne, spillede en nøglerolle under dannelse af klynger. For eksempel, Lanthanid-baserede motiver dannede forskellige klynger på grundlag af motivtype, og Yttrium-baserede motiver forblev tæt på de Lanthanid-baserede motiver på grund af deres kemiske ligheder. Motiver forbundet med zink og magnesium klyngede også sammen. De uovervåget læringsbaserede fund understøttede strukturmotiverne til at tjene som essentielle input til krystallinske forbindelser, der bærer elementær og strukturel information. Holdet brugte derefter strukturmotivinformation som en væsentlig input til et grafisk neuralt netværk (GNN) til at forudsige materialers fysiske egenskaber. De fleste af grafnetværkerne anvendes på krystallinske materialer. For at muliggøre en læringsarkitektur af grafiske fremstillinger af materialer på atom- og motivniveau, Banjade et al. foreslog, at AMDNet kunne konstrueres for at forbedre læreprocessen og forbedre forudsigelsesnøjagtigheden for metaloxiders elektroniske strukturegenskaber. I motivgraferne, forskerne kodede oplysninger på atomniveau og motivniveau i hver knude og konstruerede motivgrafen, herunder udvidet forbindelse, vinkel, afstand og ordreparametre ved hjælp af Python -pakke robokrystallografi.

AMDNet

I den foreslåede AMDNet -arkitektur, Banjade et al. inkorporeret motivinformation i en grafnetværksindlæringsramme for at generere motivgrafer og atomgrafer, der repræsenterer forbindelser med forskellige kardinalitet af kanter og knuder for at kombinere oplysningerne, inden der foretages forudsigelser. For hvert materiale, teamet genererede en atomgraf og en motivgraf. De brugte derefter 22, 606 binære og ternære metaloxider fra Materials Project -databasen for at teste effektiviteten af den foreslåede model og fokuserede på forudsigelse af båndgab - et komplekst elektronisk strukturproblem. Resultaterne viste AMDNet's overlegenhed under bandgapforudsigelse sammenlignet med foregående netværk. Modellen viste også overlegen ydeevne under en metal versus ikke -metal klassifikationsopgave. Arbejdet viste de første bestræbelser på at indarbejde materialeinformation på højt niveau i dybe læringsmodeller for materialer i solid state.

AMDNet -arkitektur og forudsigelser af egenskaber for materialer. (A) Demonstration af læringsarkitekturen for det foreslåede atommotiv dobbeltgrafnetværk (AMDNet) til effektiv læring af elektroniske strukturer og andre materialegenskaber for uorganiske krystallinske materialer. (B) Sammenligning af forudsagte og faktiske båndgap [fra beregninger af densitetsfunktionsteori (DFT)] og (C) sammenligning af forudsagte og faktiske formationsenergier (fra DFT -beregninger) i testdatasættet med 4515 forbindelser. Kredit: Videnskab fremskridt , doi:10.1126/sciadv.abf1754

Outlook

På denne måde, Huta R. Banjade og kolleger viste, hvordan strukturmotiver i krystalstrukturer kunne kombineres med uovervåget og overvåget maskinlæringsmetoder for at forbedre den effektive repræsentation af solid-state materialesystemer. For komplekse elektroniske strukturer, teamet inkluderede strukturen og motivforbindelsesinformationen i en AMDNet -model for at overgå eksisterende netværk og forudsige elektroniske båndgange og metal versus ikke -metale klassificeringsopgaver. Denne generelle læringsramme kan bruges til at forudsige andre materialegenskaber, herunder mekaniske og eksiterede tilstandsegenskaber på tværs af todimensionelle materialer og metalorganiske rammer.

Sidste artikelTargeting viral RNA:Grundlaget for næste generations bredspektrede antivirale lægemidler

Næste artikelPepsin-nedbrydelig plast af bio-nyloner fra itaconsyre og aminosyrer