Kredit:CC0 Public Domain
I de seneste år, forskere har i stigende grad vendt sig mod datavidenskabelige teknikker for at hjælpe med problemløsning i organisk syntese.
Forskere i laboratoriet til Abigail Doyle, Princetons A. Barton Hepburn professor i kemi, samarbejdede med professor i datalogi Ryan Adams om at udvikle open source-software, der giver dem en avanceret optimeringsalgoritme til brug i det daglige arbejde, folde det, der er lært inden for maskinindlæringsfeltet, til syntetisk kemi.
Softwaren tilpasser nøgleprincipperne for Bayesiansk optimering for at muliggøre hurtigere og mere effektiv syntese af kemikalier.
Baseret på Bayes sætning, en matematisk formel til bestemmelse af betinget sandsynlighed, Bayesiansk optimering er en meget brugt strategi i videnskaberne. Bredt defineret, det gør det muligt for mennesker og computere at bruge forudgående viden til at informere og optimere fremtidige beslutninger.
Kemikerne i Doyles laboratorium, i samarbejde med Adams, professor i datalogi, og kolleger hos Bristol-Myers Squibb, sammenlignede menneskelige beslutningsevner med softwarepakken. De fandt ud af, at optimeringsværktøjet både giver større effektivitet i forhold til menneskelige deltagere og mindre bias på en testreaktion. Deres arbejde vises i det aktuelle nummer af tidsskriftet Natur .
"Reaktionsoptimering er allestedsnærværende i kemisk syntese, både i den akademiske verden og på tværs af den kemiske industri, "sagde Doyle." Da kemisk rum er så stort, det er umuligt for kemikere at evaluere hele et reaktionsrum eksperimentelt. Vi ønskede at udvikle og vurdere Bayesiansk optimering som et værktøj til syntetisk kemi givet dens succes for relaterede optimeringsproblemer i videnskaberne."
Benjamin Shields, en tidligere postdoktor i Doyle-laboratoriet og avisens hovedforfatter, oprettet Python-pakken.
"Jeg kommer fra en syntetisk kemi baggrund, så jeg forstår bestemt, at syntetiske kemikere er ret gode til at tackle disse problemer på egen hånd, "sagde Shields." Hvor jeg tror, at den virkelige styrke ved Bayesian Optimization kommer ind, er, at det giver os mulighed for at modellere disse højdimensionelle problemer og fange tendenser, som vi måske ikke selv ser i dataene, så den kan behandle dataene meget bedre.
"Og to, i et rum, det vil ikke blive holdt tilbage af en menneskelig kemikers fordomme, " han tilføjede.
Hvordan det virker
Softwaren startede som et projekt uden for felten for at opfylde Shields' doktorgradskrav. Doyle og Shield dannede derefter et team under Center for Computer Assisted Synthesis (C-CAS), et National Science Foundation-initiativ lanceret på fem universiteter for at transformere, hvordan syntesen af komplekse organiske molekyler planlægges og udføres. Doyle har været hovedefterforsker hos C-CAS siden 2019.
"Reaktionsoptimering kan være en dyr og tidskrævende proces, " sagde Adams, som også er direktør for programmet i statistik og maskinlæring. "Denne tilgang accelererer den ikke kun ved at bruge state-of-the-art teknikker, men finder også bedre løsninger, end mennesker typisk ville identificere. Jeg tror, at dette kun er begyndelsen på, hvad der er muligt med Bayesiansk optimering i dette rum."
Brugere starter med at definere et søgeområde – plausible eksperimenter at overveje – såsom en liste over katalysatorer, reagenser, ligander, opløsningsmidler, temperaturer, og koncentrationer. Når dette rum er forberedt, og brugeren definerer, hvor mange eksperimenter der skal køres, softwaren vælger indledende eksperimentelle forhold, der skal evalueres. Så foreslår den nye eksperimenter at køre, iteration gennem et mindre og mindre udvalg af valg, indtil reaktionen er optimeret.
"Ved at designe softwaren, Jeg forsøgte at inkludere måder, hvorpå folk på en måde kan indsprøjte, hvad de ved om en reaktion, " sagde Shields. "Uanset hvordan du bruger dette eller maskinlæring generelt, der vil altid være en sag, hvor menneskelig ekspertise er værdifuld."
Softwaren og eksempler på dens brug kan tilgås på dette lager. GitHub-links er tilgængelige for følgende:software, der repræsenterer de kemikalier, der evalueres i et maskinlæsbart format via densitetsfunktionel teori; software til reaktionsoptimering; og spillet, der samler kemikernes beslutningstagning om optimering af testreaktionen.
"Bayesiansk reaktionsoptimering som et værktøj til kemisk syntese, " af Benjamin J. Shields, Jason Stevens, juni Li, Marvin Parasram, Farhan Damani, Jesus I. Martinez Alvarado, Jacob M. Janey, Ryan P. Adams og Abigail G. Doyle, optræder i 3. februar-udgaven af tidsskriftet Natur .
Sidste artikelTegn på udbrændthed kan påvises i sved
Næste artikelNy måde at tænde for nanomaterialer til elektroniske applikationer