Joanna Slusky, lektor i molekylær biovidenskab og beregningsbiologi ved University of Kansas, leder laboratoriet, hvor maskinlæring forbedrede præcisionen ved at identificere enzymatiske og ikke-enzymatiske metaller i proteiner. Kredit:Meg Kumin
Sidste sæson, Kansas City Chiefs quarterback Patrick Mahomes pralede med en 66,3 procent af gennemførelsen.
Men Mahomes imponerende stat bleger i forhold til MAHOMES nøjagtighed, eller metalaktivitet heuristisk for metalloprotein og enzymatiske steder, en maskinlæringsmodel udviklet ved University of Kansas-og navngivet til quarterbackens ære-der kunne føre til mere effektiv, miljøvenlige og billigere lægemiddelterapier og andre industriprodukter.
I stedet for at målrette mod brede modtagere, MAHOMES skelner mellem enzymatiske og ikke-enzymatiske metaller i proteiner med en præcisionshastighed på 92,2%. Et team på KU offentliggjorde for nylig resultater om denne machine-learning-tilgang til differentiering af enzymer i Naturkommunikation .
"Enzymer er super interessante proteiner, der gør al kemi - et enzym reagerer på en kemisk reaktion på noget for at omdanne det fra en ting til en anden ting, "sagde den tilsvarende forfatter Joanna Slusky, lektor i molekylær biovidenskab og beregningsbiologi ved KU. "Alt hvad du bringer ind i din krop, din krop nedbryder det og gør det til nye ting, og den proces med at bryde ned og lave nye ting - alt dette skyldes enzymer. "
Slusky og kandidatstuderende samarbejdspartnere i hendes laboratorium, Ryan Feehan (Chiefs -fanen, der navngav MAHOMES) og Meghan Franklin fra KU's Center for Computational Biology, søgte at bruge computere til at skelne mellem metalloproteiner, som ikke udfører kemiske reaktioner, og metalloenzymer, som letter kemiske reaktioner med fantastisk kraft og effektivitet.
Problemet er metalloproteiner, og metalloenzymer er på mange måder identiske.
"Folk ved ikke ligefrem, hvordan enzymer virker, "Slusky sagde." For et givet enzym kan du sige, "OKAY, du ved, det fjerner dette brint og sætter på -OH -gruppen, "eller hvad det nu gør. Men hvis jeg gav dig et protein, du aldrig havde set før, og jeg spurgte, 'Hvilken ende er der? Hvilken side af dette reagerer reaktionen ?, 'dig, som videnskabsmand og endda som enzymolog, kunne nok ikke fortælle mig det. Nu, en af nøglerne er omkring 40% af alle enzymer, der bruger metaller til katalyse - så deres protein binder et metal, og så kommer det, der ændres, ind på det aktive sted og ændres. Vi ser dette disse metalbindende proteiner og metalloenzymer, som er enzymer, der binder metaller, som en enorm mulighed for os, fordi mit laboratorium er interesseret i maskinlæring, der kan gøre et rigtig godt stykke arbejde på at differentiere enzymsteder fra lignende, men ikke -enzymatiske steder. "
Som en KU -bachelor, medlederforfatter Feehan begyndte at samle verdens største strukturelle datasæt af enzymatiske og ikke-enzymatiske metalloproteinsteder-arbejde, der fortsatte ind i hans karriere som kandidatstuderende. Derefter, han stillede datasættet frit tilgængeligt for andre forskere på Github.
"Strukturelle data er meget svære at finde frem til, "Slusky sagde." Men hvis du er interesseret i, hvad fysik og kemi er, og hvor disse atomer er, og hvad kan de gøre inden for disse relationer, du har brug for proteinstrukturer. Den svære del af dette var at få en masse strukturer af enzymsteder, ved at de var enzymsteder, derefter få en masse nonenzym -steder, der binder metaller - og ved, at de ikke var enzymer - og graver dem ud af en stor strukturel database. "
Feehan var i stand til at finde tusinder af unikke aktive og inaktive metalbindingssteder, testede derefter maskinlæringsmetoder for at skelne mellem de to. For at opnå dette, Feehan og Franklin uddannede en computer-læringsmodel (MAHOMES) til at undersøge en kløft i et protein og forudsige, om den spalte kunne udføre kemi (hvilket betyder, at det var et enzym). Ved at se på fysisk -kemiske træk, MAHOMES opnåede 92,2% præcision og 90,1% tilbagekaldelse ved at adskille de aktive og inaktive steder.
Slusky sagde, at tilgangen kunne være et vigtigt skridt til at gøre enzymer mere nyttige til produktion af livreddende lægemiddelterapier og et væld af andre industrielle processer. Ja, den fremgangsmåde, som KU -teamet var banebrydende for, kunne endda revolutionere, hvordan enzymer er designet.
"Jeg håber, at det generelt vil ændre syntese, "sagde hun." Jeg håber, at der bliver lavet billigere lægemidler med færre miljømæssige konsekvenser. Lige nu, farmaceutiske virksomheders syntese har enorme miljømæssige konsekvenser, og det ville være fantastisk, hvis vi kunne sænke dem. Men der er også syntese i generelt alle brancher. Hvis du vil lave maling, maling har brug for syntese. Alt er lavet af kemikalier - f.eks. tekstiler. Du kan høste bomuld, men i sidste ende, du vil give bestemte bomuldsegenskaber til den bomuld, før du sælger den, og det kræver kemikalier. Jo mere syntese vi kan udføre ved hjælp af enzymer, og jo lettere kan vi gøre det for virksomheder at udføre denne syntese ved hjælp af enzymer, jo billigere bliver det, og jo grønnere bliver det. "
Ifølge Slusky, maskinlæringsforskningen ville fortsætte på tre linjer.
"Nummer et, vi forsøger at få maskinlæringsmetoden til at fungere en smule bedre, "sagde hun." Nummer to, Vi begynder at designe enzymer med det. Og nummer tre er, at vi vil gøre dette for enzymer, der ikke binder metaller. Fyrre procent af alle enzymaktive steder har metaller bundet. Lad os gøre de andre 60%, også - og at finde det rigtige sammenligningssæt for de andre 60% er et projekt, en anden kandidatstuderende i mit laboratorium arbejder på. "