Forskere fra University of Maryland anvendte et sprogbehandlingssystem til bevægelser af et riboswitchmolekyle afbildet her, at forstå, hvordan og hvornår molekylet antager forskellige former. Kredit:Zachary Smith/UMD
Ved at anvende værktøjer til bearbejdning af naturligt sprog til proteinmolekylers bevægelser, University of Maryland forskere skabte et abstrakt sprog, der beskriver de flere former, et proteinmolekyle kan antage, og hvordan og hvornår det overgår fra en form til en anden.
Et proteinmolekyls funktion bestemmes ofte af dets form og struktur, så forståelse af den dynamik, der styrer form og struktur, kan åbne en dør for at forstå alt fra, hvordan et protein fungerer til årsagerne til sygdom og den bedste måde at designe målrettede lægemiddelterapier på. Dette er første gang, en maskinlæringsalgoritme er blevet anvendt til biomolekylær dynamik på denne måde, og metodens succes giver indsigt, der også kan hjælpe med at fremme kunstig intelligens (AI). En forskningsartikel om dette arbejde blev offentliggjort den 9. oktober, 2020, i journalen Naturkommunikation .
"Her viser vi de samme AI -arkitekturer, der bruges til at fuldføre sætninger, når skrivning af e -mails kan bruges til at afdække et sprog, der tales af livets molekyler, "sagde avisens seniorforfatter, Pratyush Tiwary, en adjunkt i UMD's Institut for Kemi og Biokemi og Institut for Fysisk Videnskab og Teknologi. "Vi viser, at bevægelsen af disse molekyler kan kortlægges til et abstrakt sprog, og at AI -teknikker kan bruges til at generere biologisk sandfærdige historier ud af de resulterende abstrakte ord. "
Biologiske molekyler er konstant i bevægelse, jiggling rundt i deres miljø. Deres form bestemmes af, hvordan de foldes og vrides. De kan forblive i en given form i sekunder eller dage, før de pludselig springer op og foldes tilbage til en anden form eller struktur. Overgangen fra en form til en anden sker meget som strækningen af en sammenfiltret spole, der åbner i etaper. Når forskellige dele af spolen frigives og udfoldes, molekylet antager forskellige mellemliggende konformationer.
Men overgangen fra en form til en anden sker i picosekunder (billioner af et sekund) eller hurtigere, hvilket gør det vanskeligt for eksperimentelle metoder såsom kraftige mikroskoper og spektroskopi at fange præcis, hvordan udfoldelsen sker, hvilke parametre, der påvirker udfoldelsen, og hvilke forskellige former der er mulige. Svarene på disse spørgsmål danner den biologiske historie, som Tiwarys nye metode kan afsløre.
Tiwary og hans team anvendte Newtons bevægelseslove - som kan forudsige atomers bevægelse inden for et molekyle - med kraftfulde supercomputere, herunder UMD's Deepthought2, at udvikle statistiske fysikmodeller, der simulerer formen, bevægelse og bane af individuelle molekyler.
Derefter fodrede de disse modeller ind i en algoritme til maskinlæring, ligesom den, Gmail bruger til automatisk at fuldføre sætninger, mens du skriver. Algoritmen nærmede sig simuleringerne som et sprog, hvor hver molekylær bevægelse danner et bogstav, der kan spændes sammen med andre bevægelser for at lave ord og sætninger. Ved at lære reglerne for syntaks og grammatik, der bestemmer, hvilke former og bevægelser der følger hinanden, og hvilke der ikke gør, algoritmen forudsiger, hvordan proteinet vikler sig, når det ændrer form og de forskellige former, det antager undervejs.
For at demonstrere, at deres metode virker, holdet anvendte det på et lille biomolekyle kaldet riboswitch, som tidligere var blevet analyseret ved hjælp af spektroskopi. Resultaterne, som afslørede de forskellige former, riboswitch kunne tage, da den blev strakt, matchede resultaterne af spektroskopiundersøgelserne.
"En af de vigtigste anvendelser af dette, Jeg håber, er at udvikle lægemidler, der er meget målrettede, "Sagde Tiwary." Du vil have stærke lægemidler, der binder meget stærkt, men kun til den ting, du vil have dem til at binde sig til. Det kan vi opnå, hvis vi kan forstå de forskellige former, som et givet biomolekyle af interesse kan antage, fordi vi kan lave stoffer, der kun binder til en af disse specifikke former på det passende tidspunkt og kun så længe vi vil. "
En lige så vigtig del af denne forskning er den viden, der er opnået om sprogbehandlingssystemet, Tiwary og hans team brugte, som generelt kaldes et tilbagevendende neuralt netværk, og i dette specifikke tilfælde et korttidshukommelsesnetværk. Forskerne analyserede matematikken, der ligger til grund for netværket, da det lærte sproget i molekylær bevægelse. De fandt ud af, at netværket brugte en slags logik, der lignede et vigtigt begreb fra statistisk fysik kaldet stientropi. At forstå dette åbner muligheder for at forbedre tilbagevendende neurale netværk i fremtiden.
"Det er naturligt at spørge, om der er styrende fysiske principper, der gør AI -værktøjer vellykkede, "Sagde Tiwary." Her opdager vi det, Ja, det er fordi AI lærer entropi. Nu hvor vi ved det, det åbner flere knapper og gear, vi kan stille op til at gøre bedre AI til biologi og måske, ambitiøst, endda forbedre AI selv. Når som helst du forstår et komplekst system som AI, det bliver mindre af en sort boks og giver dig nye værktøjer til at bruge den mere effektivt og pålideligt. "