Forskere fra Purdue University bruger maskinlæringsmodeller til at skabe nye muligheder for pipelines til lægemiddelopdagelse. Kredit:Purdue University/Gaurav Chopra
Maskinlæring er blevet brugt bredt i de kemiske videnskaber til lægemiddeldesign og andre processer.
De modeller, der prospektivt testes for nye reaktionsresultater og bruges til at øge den menneskelige forståelse for at fortolke beslutninger om kemisk reaktivitet truffet af sådanne modeller, er ekstremt begrænsede.
Purdue Universitys innovatører har introduceret flowcharts for kemiske reaktivitet for at hjælpe kemikere med at fortolke reaktionsresultater ved hjælp af statistisk robuste maskinlæringsmodeller trænet på et lille antal reaktioner. Værket er udgivet i Økologiske bogstaver .
"At udvikle nye og hurtige reaktioner er afgørende for kemisk biblioteksdesign i lægemiddelopdagelse, " sagde Gaurav Chopra, en assisterende professor i analytisk og fysisk kemi i Purdue's College of Science. "Vi har udviklet en ny, hurtig og one-pot multikomponentreaktion (MCR) af N-sulfonyliminer, der blev brugt som et repræsentativt tilfælde til at generere træningsdata til maskinlæringsmodeller, forudsige reaktionsudfald og teste nye reaktioner på en blind prospektiv måde.
"Vi forventer, at dette arbejde vil bane vejen for at ændre det nuværende paradigme ved at udvikle nøjagtige, menneskelige forståelige maskinlæringsmodeller til at fortolke reaktionsresultater, der vil øge kreativiteten og effektiviteten hos menneskelige kemikere til at opdage nye kemiske reaktioner og forbedre organiske og proceskemi-pipelines."
Chopra sagde, at Purdue-teamets menneske-fortolkbare maskinlæringstilgang, introduceret som flowcharts for kemisk reaktivitet, kan udvides til at udforske reaktiviteten af enhver MCR eller enhver kemisk reaktion. Det kræver ikke robotteknologi i stor skala, da disse metoder kan bruges af kemikerne, mens de laver reaktionsscreening i deres laboratorier.
"Vi leverer den første rapport om en ramme til at kombinere hurtige syntetiske kemiske eksperimenter og kvantekemiske beregninger for at forstå reaktionsmekanismer og human-fortolkbare statistisk robuste maskinlæringsmodeller for at identificere kemiske mønstre til forudsigelse og eksperimentelt test af heterogen reaktivitet af N-sulfonyliminer, " sagde Chopra.
"Den hidtil usete brug af en maskinlæringsmodel til at generere flowcharts for kemiske reaktivitet hjalp os med at forstå reaktiviteten af traditionelt anvendte forskellige N-sulfonyliminer i MCR'er, " sagde Krupal Jethava, en postdoc i Chopras laboratorium, der var medforfatter til værket. "Vi tror på, at arbejde hånd-til-hånd med organiske og beregningskemikere vil åbne en ny vej til at løse komplekse kemiske reaktivitetsproblemer for andre reaktioner i fremtiden."
Chopra sagde, at Purdue-forskerne håber, at deres arbejde vil bane vejen for at blive et af mange eksempler, der vil fremvise kraften ved maskinlæring til udvikling af ny syntetisk metodologi til lægemiddeldesign og videre i fremtiden.
"I dette arbejde, vi bestræbte os på at sikre, at vores maskinlæringsmodel let kan forstås af kemikere, der ikke er velbevandret på dette område, " sagde Jonathan Fine, en tidligere Purdue kandidatstuderende, der var medforfatter til værket. "Vi mener, at disse modeller har evnen til ikke kun at blive brugt til at forudsige reaktioner, men også bruges til bedre at forstå, hvornår en given reaktion vil opstå. For at demonstrere dette, vi brugte vores model til at guide yderligere substrater for at teste, om en reaktion vil forekomme."