Maskinindlæringsteknikker kan afsløre årsag-virkning-forhold i proteindynamikdata

Maskinindlæringsbaseret analyse af signalveje fundet inde i aminosyrer fundet i humane proteiner. Kredit:Navli Duro/University of South Florida

Maskinlæringsalgoritmer udmærker sig ved at finde komplekse mønstre inden for big data, så forskere bruger dem ofte til at forudsige. Forskere skubber denne nye teknologi ud over at finde sammenhænge for at hjælpe med at afdække skjulte årsag-virkningsforhold og drive videnskabelige opdagelser.

På University of South Florida, forskere integrerer maskinlæringsteknikker i deres arbejde med at studere proteiner. Som de melder ind Journal of Chemical Physics , en af deres største udfordringer har været mangel på metoder til at identificere årsag-virkningsforhold i data hentet fra molekylære dynamiksimuleringer.

"Proteiner kan betragtes som nanoskopiske maskiner, der udfører et sæt opgaver. Men når og hvor proteiner udfører deres specifikke opgaver, styres af celler gennem forskellige stimuli, såsom små molekyler, "sagde Sameer Varma, lektor i biofysik ved USF. "Disse stimuli interagerer med proteiner for at tænde og slukke dem, 'og kan endda ændre deres hastigheder og styrker. "

I de fleste proteiner, de biologiske stimuli interagerer med et sted på proteinet, der er relativt langt væk fra den del, der udfører sin tilsvarende opgave, kræver en signalvej. "Denne fjernstyrede måde at skifte proteiner på er kendt som 'allosterisk signalering'. Mange proteiner af farmaceutisk betydning er nu blevet identificeret, hvor dynamikken eller 'jiggling and wiggling' af deres bestanddele er kendt for at være afgørende for allosterisk signalering, "Sagde Varma." Detaljerne, imidlertid, forblive tegnet. "

Varma og kolleger mener, at maskinlæringsmetoder kan gøre en forskel. "Udvikling og brug af maskinlæringsteknikker vil gøre det muligt for os at finde årsag-virkningsforhold i proteindynamikdata og endelig begynde at behandle nogle af de helt grundlæggende spørgsmål inden for proteindeling, "sagde han." Et af vores vigtigste fund var, at det signal, der blev initieret på proteinets stimuleringssted, syntes at svække, da det bevægede sig væk fra stimuleringsstedet. Det kom som en overraskelse, fordi der ikke blev observeret afstandsafhængighed for koblingen af termiske bevægelser mellem proteinsteder. "

Gruppens arbejde demonstrerer, hvordan maskinlæringsmetoder kan bruges til at identificere årsag-virkningsforhold inden for data. Ud over dette, "Disse teknikker gør det muligt for os at tilslutte kritiske huller i proteindeling, "Sagde Varma." I sidste ende, når vores metoder anvendes på de mange proteiner af farmaceutisk interesse, vi forventer, at de mekanistiske detaljer afslører tiltrængte nye interventionsstrategier for at genoprette proteinaktiviteter i syge stater. Den generelle biofysiske indsigt, vi får, bør også bidrage til at inspirere til nye biomimetiske løsninger på mange nanoengineering -problemer, såsom nanosensordesign til målrettet lægemiddellevering. "

Forskerne forestiller sig spændende nyt arbejde, der vil vokse fra deres nylige fund. "Indtil nu, vi har fokuseret på ligevægtsdata, men signalprocessen har en kritisk ikke -ligevægtskomponent, som vi ikke har undersøgt endnu, "Sagde Varma. Gruppen planlægger også at undersøge de omgivende farvands rolle i signalering mere detaljeret, samt anvende deres machine learning -teknikker til et bredt sæt proteinfamilier for at bestemme, i hvilket omfang deres nye biofysiske fund kan generaliseres.

Sidste artikelNy opdagelse i forskydningsfortykkende væsker som vaskemidler

Næste artikelFra isolator til leder hurtigt