Videnskab
 science >> Videnskab >  >> Kemi

Maskinlæringsmodel hjælper med at karakterisere forbindelser til lægemiddelopdagelse

Kredit:CC0 Public Domain

Tandem massespektrometri er et kraftfuldt analytisk værktøj, der bruges til at karakterisere komplekse blandinger inden for lægemiddelopdagelse og andre områder.

Nu, Purdue University innovatører har skabt en ny metode til at anvende maskinlæringskoncepter til tandem massespektrometriprocessen for at forbedre informationsstrømmen i udviklingen af ​​nye lægemidler. Deres arbejde er udgivet i Kemisk Videnskab .

"Massespektrometri spiller en integreret rolle i lægemiddelopdagelse og -udvikling, " sagde Gaurav Chopra, en assisterende professor i analytisk og fysisk kemi i Purdue's College of Science. "Den specifikke implementering af bootstrapped machine learning med en lille mængde positive og negative træningsdata præsenteret her vil bane vejen for at blive mainstream i daglige aktiviteter med at automatisere karakterisering af forbindelser af kemikere."

Chopra sagde, at der er to store problemer inden for maskinlæring, der bruges til kemiske videnskaber. De anvendte metoder giver ikke kemisk forståelse af de beslutninger, der træffes af algoritmen, og nye metoder bruges typisk ikke til at lave blinde eksperimentelle tests for at se, om de foreslåede modeller er nøjagtige til brug i et kemisk laboratorium.

"Vi har adresseret begge disse punkter for en metode, der er isomer-selektiv og ekstremt nyttig i kemiske videnskaber til at karakterisere komplekse blandinger, identificere kemiske reaktioner og lægemiddelmetabolitter, og inden for områder som proteomics og metabolomics, " sagde Chopra.

Purdue-forskerne skabte statistisk robuste maskinlæringsmodeller til at arbejde med færre træningsdata - en teknik, der vil være nyttig til lægemiddelopdagelse. Modellen ser på et almindeligt neutralt reagens - kaldet 2-methoxypropen (MOP) - og forudsiger, hvordan forbindelser vil interagere med MOP i et tandem massespektrometer for at opnå strukturel information for forbindelserne.

"Dette er første gang, at maskinlæring er blevet koblet med diagnostiske gasfase-ion-molekylereaktioner, og det er en meget kraftfuld kombination, fører vejen til fuldstændig automatiseret massespektrometrisk identifikation af organiske forbindelser, " sagde Hilkka Kentämaa, Frank Browns fornemme professor i analytisk kemi og organisk kemi. "Vi introducerer nu mange nye reagenser i denne metode."

Purdue-teamet introducerer flowcharts for kemiske reaktivitet for at lette kemisk fortolkning af de beslutninger, der er truffet af maskinlæringsmetoden, som vil være nyttige til at forstå og fortolke massespektrene for strukturel information.