Videnskab
 science >> Videnskab >  >> Kemi

Hvor tydeligere rapportering af negative eksperimentelle resultater ville forbedre reaktionsplanlægning i kemi

Kredit:Angewandte Chemie

Databaser indeholdende enorme mængder eksperimentelle data er tilgængelige for forskere på tværs af en lang række kemiske discipliner. Et team af forskere har imidlertid opdaget, at de tilgængelige data ikke lykkes med at forudsige udbyttet af nye synteser ved hjælp af kunstig intelligens (AI) og maskinlæring. Deres undersøgelse offentliggjort i tidsskriftet Angewandte Chemie International Edition tyder på, at dette i høj grad skyldes videnskabsmænds tendens til ikke at rapportere mislykkede eksperimenter.

Selvom AI-baserede modeller har haft særlig succes med at forudsige molekylære strukturer og materialeegenskaber, returnerer de ret unøjagtige forudsigelser for information vedrørende produktudbytte i syntese, som Frank Glorius og hans team af forskere ved Westfälische Wilhelms-Universität Münster, Tyskland, har opdaget .

Forskerne tilskriver denne fejl til de data, der bruges til at træne AI-systemer. "Interessant nok er forudsigelsen af ​​reaktionsudbytter (reaktivitet) meget mere udfordrende end forudsigelsen af ​​molekylære egenskaber. Reaktanter, reagenser, mængder, betingelser, den eksperimentelle udførelse - alle bestemmer udbyttet, og dermed bliver problemet med forudsigelse af udbytte meget data -intensivt," forklarer Glorius. Så på trods af de enorme mængder af tilgængelig litteratur og resultater indså forskerne, at dataene ikke er egnede til nøjagtige forudsigelser af det forventede udbytte.

Problemet skyldes ikke kun mangel på eksperimenter. I modsætning hertil identificerede holdet tre mulige årsager til forudindtaget data. For det første kan resultaterne af kemiske synteser være mangelfulde på grund af eksperimentel fejl. For det andet, når kemikere planlægger deres eksperimenter, kan de, enten bevidst eller ubevidst, indføre bias baseret på personlig erfaring og afhængighed af veletablerede metoder. Endelig, da kun reaktioner med et positivt resultat menes at bidrage til fremskridt, rapporteres fejlede reaktioner sjældnere.

For at finde ud af, hvilken af ​​disse tre faktorer der havde den største indflydelse, ændrede Glorius og teamet med vilje datasættene for fire forskellige, almindeligt anvendte (og derfor datarige) organiske reaktioner. De øgede kunstigt eksperimentel fejl, reducerede størrelsen af ​​datasampling-sættene eller fjernede negative resultater fra dataene. Deres undersøgelser viste, at den eksperimentelle fejl havde den mindste indflydelse på modellen, mens bidraget fra manglen på negative resultater var fundamentalt.

Gruppen håber, at disse resultater vil tilskynde videnskabsmænd til altid at rapportere mislykkede eksperimenter såvel som deres succeser. Dette ville forbedre datatilgængeligheden til træning af AI og i sidste ende hjælpe med at fremskynde planlægningen og gøre eksperimenter mere effektive. Glorius tilføjer, at "maskinlæring i (molekylær) kemi vil øge effektiviteten dramatisk, og færre reaktioner vil skulle udføres for at nå et bestemt mål, for eksempel en optimering. Dette vil styrke kemikere og vil hjælpe dem med at lave kemiske processer - og de verden - mere bæredygtig." + Udforsk yderligere

Kemikere bruger lysenergi til at producere små molekylære ringe




Varme artikler