Kredit:Денис Марчук fra Pixabay
Forskere har designet en maskinlæringsalgoritme, der forudsiger resultatet af kemiske reaktioner med meget højere nøjagtighed end uddannede kemikere og foreslår måder at lave komplekse molekyler på. fjerne en væsentlig hindring i lægemiddelopdagelse.
Forskere fra University of Cambridge har vist, at en algoritme kan forudsige resultaterne af komplekse kemiske reaktioner med over 90 % nøjagtighed, bedre end uddannede kemikere. Algoritmen viser også kemikere, hvordan man laver målforbindelser, at levere det kemiske "kort" til den ønskede destination. Resultaterne er rapporteret i to undersøgelser i tidsskrifterne ACS Central Science og Kemisk kommunikation .
En central udfordring inden for lægemiddelopdagelse og materialevidenskab er at finde måder at lave komplicerede organiske molekyler ved kemisk at sammenføje enklere byggesten. Problemet er, at disse byggeklodser ofte reagerer på uventede måder.
"At lave molekyler beskrives ofte som en kunst, der realiseres med trial-and-error eksperimentering, fordi vores forståelse af kemisk reaktivitet er langt fra fuldstændig, " sagde Dr. Alpha Lee fra Cambridges Cavendish Laboratory, der ledede studierne. "Maskinlæringsalgoritmer kan have en bedre forståelse af kemi, fordi de destillerer reaktivitetsmønstre fra millioner af offentliggjorte kemiske reaktioner, noget, som en kemiker ikke kan."
Algoritmen udviklet af Lee og hans gruppe bruger værktøjer til mønstergenkendelse til at genkende, hvordan kemiske grupper i molekyler reagerer, ved at træne modellen på millioner af reaktioner offentliggjort i patenter.
Forskerne så på forudsigelse af kemisk reaktion som et maskinoversættelsesproblem. De reagerende molekyler betragtes som ét sprog, mens produktet betragtes som et andet sprog. Modellen bruger derefter mønstrene i teksten til at lære at oversætte mellem de to sprog.
Ved at bruge denne tilgang, modellen opnår 90 % nøjagtighed i at forudsige det korrekte produkt af usete kemiske reaktioner, der henviser til, at nøjagtigheden af uddannede menneskelige kemikere er omkring 80 %. Forskerne siger, at modellen er nøjagtig nok til at opdage fejl i dataene og korrekt forudsige et væld af vanskelige reaktioner.
Modellen ved også, hvad den ikke ved. Det giver en usikkerhedsscore, som eliminerer forkerte forudsigelser med 89 % nøjagtighed. Da eksperimenter er tidskrævende, nøjagtig forudsigelse er afgørende for at undgå at forfølge dyre eksperimentelle veje, der til sidst ender i fiasko.
I den anden undersøgelse, Lee og hans gruppe, samarbejder med den biofarmaceutiske virksomhed Pfizer, demonstreret det praktiske potentiale af metoden i lægemiddelopdagelse.
Forskerne viste, at når de blev trænet i publiceret kemiforskning, modellen kan lave nøjagtige forudsigelser af reaktioner baseret på laboratorie-notesbøger, viser, at modellen har lært reglerne for kemi og kan anvende den på lægemiddelopdagelsesmiljøer.
Holdet viste også, at modellen kan forudsige sekvenser af reaktioner, der ville føre til et ønsket produkt. De anvendte denne metode til forskellige lægemiddellignende molekyler, viser, at de skridt, den forudsiger, er kemisk rimelige. Denne teknologi kan reducere tiden for præklinisk lægemiddelopdagelse betydeligt, fordi den giver lægemiddelkemikere en plan for, hvor de skal begynde.
"Vores platform er som en GPS for kemi, " sagde Lee, som også er forskningsstipendiat ved St Catharine's College. "Den informerer kemikere om, hvorvidt en reaktion er en go eller en no-go, og hvordan man navigerer reaktionsruter for at lave et nyt molekyle."
Cambridge-forskerne bruger i øjeblikket denne reaktionsforudsigelsesteknologi til at udvikle en komplet platform, der bygger bro over design-make-test-cyklussen i lægemiddelopdagelse og materialeopdagelse:forudsigelse af lovende bioaktive molekyler, måder at lave disse komplekse organiske molekyler på, og udvælge de eksperimenter, der er de mest informative. Forskerne arbejder nu på at udvinde kemisk indsigt fra modellen, forsøger at forstå, hvad det har lært, som mennesker ikke har.
"Vi kan potentielt gøre en masse fremskridt inden for kemi, hvis vi lærer, hvilke slags mønstre modellen kigger på for at lave en forudsigelse, sagde Peter Bolgar, en ph.d. studerende i syntetisk organisk kemi involveret i begge studier. "Modellen og menneskelige kemikere ville sammen blive ekstremt magtfulde til at designe eksperimenter, mere end hver ville være uden den anden."