Forskere har udviklet en platform, der kombinerer automatiserede eksperimenter med AI for at forudsige, hvordan kemikalier vil reagere med hinanden, hvilket kan fremskynde designprocessen for nye lægemidler.
At forudsige, hvordan molekyler vil reagere, er afgørende for opdagelsen og fremstillingen af nye lægemidler, men historisk set har dette været en trial-and-error-proces, og reaktionerne fejler ofte. For at forudsige, hvordan molekyler vil reagere, simulerer kemikere normalt elektroner og atomer i forenklede modeller, en proces, der er beregningsmæssigt dyr og ofte unøjagtig.
Nu har forskere fra University of Cambridge udviklet en datadrevet tilgang, inspireret af genomik, hvor automatiserede eksperimenter kombineres med maskinlæring for at forstå kemisk reaktivitet, hvilket i høj grad fremskynder processen. De har kaldt deres tilgang, som blev valideret på et datasæt med mere end 39.000 farmaceutisk relevante reaktioner, det kemiske "reaktom."
Deres resultater, rapporteret i tidsskriftet Nature Chemistry , er resultatet af et samarbejde mellem Cambridge og Pfizer.
"Reaktomen kan ændre den måde, vi tænker om organisk kemi på," sagde Dr. Emma King-Smith fra Cambridges Cavendish Laboratory, avisens første forfatter. "En dybere forståelse af kemien kunne gøre os i stand til at fremstille lægemidler og så mange andre nyttige produkter meget hurtigere. Men mere grundlæggende vil den forståelse, vi håber at skabe, være gavnlig for alle, der arbejder med molekyler."
Reaktomtilgangen udvælger relevante korrelationer mellem reaktanter, reagenser og reaktionens ydeevne fra dataene og påpeger huller i selve dataene. Dataene genereres fra meget hurtige eller høje gennemløbsautomatiserede eksperimenter.
"Kemi med høj gennemløb har været en game-changer, men vi mente, at der var en måde at afdække en dybere forståelse af kemiske reaktioner på, end hvad der kan observeres fra de første resultater af et eksperiment med høj gennemløb," sagde King-Smith.
"Vores tilgang afslører de skjulte forhold mellem reaktionskomponenter og resultater," sagde Dr. Alpha Lee, der ledede forskningen. "Datasættet, vi trænede modellen på, er massivt – det vil hjælpe med at bringe processen med kemisk opdagelse fra trial-and-error til big data-alderen."
I et relateret papir, udgivet i Nature Communications , udviklede holdet en maskinlæringstilgang, der gør det muligt for kemikere at introducere præcise transformationer til forudspecificerede molekyleområder, hvilket muliggør hurtigere lægemiddeldesign.
Fremgangsmåden giver kemikere mulighed for at justere komplekse molekyler - som en sidste minuts designændring - uden at skulle lave dem fra bunden. At lave et molekyle i laboratoriet er typisk en proces i flere trin, ligesom at bygge et hus. Hvis kemikere ønsker at variere kernen i et molekyle, er den konventionelle måde at genopbygge molekylet, som at vælte huset og genopbygge fra bunden. Kernevariationer er dog vigtige for medicindesign.
En klasse af reaktioner kendt som funktionaliseringsreaktioner på sent stadium forsøger direkte at introducere kemiske transformationer til kernen, hvilket undgår behovet for at starte fra bunden. Det er dog udfordrende at gøre funktionalisering i de sene stadier selektiv og kontrolleret – der er typisk mange områder af molekylerne, der kan reagere, og det er svært at forudsige resultatet.
"Sent stadie funktionaliseringer kan give uforudsigelige resultater, og de nuværende metoder til modellering, inklusive vores egen ekspertintuition, er ikke perfekte," sagde King-Smith. "En mere prædiktiv model ville give os mulighed for bedre screening."
Forskerne udviklede en maskinlæringsmodel, der forudsiger, hvor et molekyle ville reagere, og hvordan reaktionsstedet varierer som funktion af forskellige reaktionsbetingelser. Dette gør det muligt for kemikere at finde måder at justere kernen i et molekyle på.
"Vi fortrænede modellen på en stor mængde spektroskopiske data - som effektivt underviste modellen i generel kemi - før vi finjusterede den til at forudsige disse indviklede transformationer," sagde King-Smith. Denne tilgang gjorde det muligt for holdet at overvinde begrænsningen af lave data:der er relativt få funktionaliseringsreaktioner i det sene stadie rapporteret i den videnskabelige litteratur. Holdet validerede eksperimentelt modellen på et forskelligartet sæt lægemiddellignende molekyler og var i stand til nøjagtigt at forudsige reaktivitetssteder under forskellige forhold.
"Anvendelsen af maskinlæring til kemi er ofte begrænset af problemet med, at mængden af data er lille sammenlignet med det store kemiske rum," sagde Lee. "Vores tilgang - at designe modeller, der lærer af store datasæt, der ligner, men ikke er det samme som det problem, vi forsøger at løse - løser denne grundlæggende udfordring med lavt dataindhold og kan låse op for fremskridt ud over funktionalisering på sene trin."
Flere oplysninger: Emma King-Smith et al., Undersøgelse af det kemiske 'reaktom' med høj-throughput eksperimenteringsdata, Nature Chemistry (2024). DOI:10.1038/s41557-023-01393-w
Forudsigende Minisci funktionalisering på det sene stadie med overførselslæring, naturkommunikation (2024). DOI:10.1038/s41467-023-42145-1. www.nature.com/articles/s41467-023-42145-1
Journaloplysninger: Nature Communications , Naturkemi
Leveret af University of Cambridge
Sidste artikelHvordan levende materialer fra alger bedst kan opfange kulstof
Næste artikelFødevaregodkendte indkapslede fotokatalysatormaterialer til generering af ren, grøn brint