Videnskab
 Science >> Videnskab >  >> Kemi

Retificering af brugen af ​​AI'er i jagten på termoelektriske materialer

Evaluering af ML-modeller og deres forudsigelser for nye materialer. (a–c) Ydelse af ML-modellen i (a) træningsdatasæt, (b) testdatasæt og (c) de yderligere data offentliggjort i år 2023; (d) screeningsproces for udvælgelse af materialer fra materialeprojektets datasæt; (e) antallet af forbindelser efter hvert screeningstrin; (f) forudsagte zT-værdier for de nye materialer. Kredit:Science China Materials (2024). DOI:10.1007/s40843-023-2777-2

Et team af forskere har brugt AI til at identificere et termoelektrisk materiale med gunstige værdier. Gruppen var i stand til at navigere i AI's konventionelle faldgruber og big data-udfordringer, hvilket giver et glimrende eksempel på, hvordan AI kan revolutionere materialevidenskab. Detaljer blev offentliggjort i tidsskriftet Science China Materials den 8. marts 2024.



"Traditionelle metoder til at finde egnede materialer involverer trial-and-error, hvilket er tidskrævende og ofte dyrt," udtaler Hao Li, lektor ved Tohoku Universitys Advanced Institute for Materials Research (WPI-AIMR) og den tilsvarende forfatter til papiret. "AI transformerer dette ved at kæmme gennem databaser for at identificere potentielle materialer, som derefter kan verificeres eksperimentelt."

Alligevel er der stadig udfordringer. Storskala materialedatasæt indeholder nogle gange fejl, og overtilpasning af de forudsagte temperaturafhængige egenskaber er også en almindelig fejl. Overtilpasning opstår, når en model lærer at fange støj eller tilfældige fluktuationer i træningsdataene i stedet for det underliggende mønster eller forhold.

Som følge heraf klarer modellen sig godt på træningsdataene, men formår ikke at generalisere nye, usete data. Når man forudsiger temperaturafhængige egenskaber, kan overtilpasning føre til unøjagtige forudsigelser, når modellen støder på nye forhold uden for rækkevidden af ​​træningsdataene.

Li og hans kolleger forsøgte at overvinde dette for at udvikle et termoelektrisk materiale. Disse materialer omdanner varmeenergi til elektrisk energi eller omvendt. Derfor er det afgørende at få en meget nøjagtig temperaturafhængighed.

"Først udførte vi en række rationelle handlinger for at identificere og kassere tvivlsomme data og opnåede 92.291 datapunkter omfattende 7.295 sammensætninger og forskellige temperaturer fra Starrydata2-databasen - en onlinedatabase, der indsamler digitale data fra offentliggjorte papirer," siger Li.

Derefter byggede forskerne maskinbygningsmodeller ved hjælp af Gradient Boosting Decision Tree-metoden. Modellen opnåede bemærkelsesværdige R2-værdier 0,89, ~0,90 og ~0,89 på træningsdatasættet, testdatasættet og nye eksperimentelle data uden for stikprøven udgivet i 2023, hvilket demonstrerer modellernes nøjagtighed i forudsigelse af nyligt tilgængelige materialer.

"Vi kunne bruge denne model til at udføre en storstilet evaluering af de stabile materialer fra Materials Project-databasen, forudsige den potentielle termoelektriske ydeevne af nye materialer og give vejledning til eksperimenter," siger Xue Jia, adjunkt ved WPI-AIMR, og medforfatter til papiret.

I sidste ende illustrerer undersøgelsen vigtigheden af ​​at følge strenge retningslinjer, når det kommer til dataforbehandling og dataopdeling i maskinlæring, så det adresserer de presserende problemer inden for materialevidenskab. Forskerne er optimistiske med hensyn til, at deres strategi også kan anvendes på andre materialer, såsom elektrokatalysatorer og batterier.

Flere oplysninger: Xue Jia et al., Håndtering af big data-udfordringerne i AI for termoelektriske materialer, Science China Materials (2024). DOI:10.1007/s40843-023-2777-2

Leveret af Tohoku University




Varme artikler