Videnskab
 science >> Videnskab >  >> Fysik

Reimagination af formen af ​​støj fører til forbedrede molekylære modeller

Kredit:CC0 Public Domain

Vedholdenhed kommer naturligt for en fyr, der stammer fra "verdens muldyrshovedstad." Denne egenskab har stået Columbia, Tennessee, indfødte Elliot Perryman i god stand som praktikant på Lawrence Berkeley National Laboratory (Berkeley Lab). Sidste efterår, han begyndte at arbejde med personaleforsker Peter Zwart i Center for Advanced Mathematics for Energy Research Applications (CAMERA) gennem Berkeley Lab Undergraduate Research -programmet.

CAMERA har til formål at identificere områder inden for eksperimentel videnskab, der kan hjælpes af ny anvendt matematisk indsigt. Disse tværfaglige forskere udvikler de nødvendige algoritmiske værktøjer og leverer dem som brugervenlig software. Zwart satte Perryman, en datalogi og fysik hovedfag ved University of Tennessee, på et projekt han sammenlignede med at "gå rundt i et mørkt rum og forsøge at finde en kat."

Den undvigende feline i dette tilfælde var et matematisk problem, der har svækket det eksperimentelle krystallografisamfund i nogen tid:hvordan man modellerer tilstedeværelsen af ​​støj i data på en mere realistisk måde.

Krystallografi er et uundværligt værktøj til bestemmelse af molekylernes atomstrukturer - hvilket igen giver forskere indsigt i deres adfærd og funktion. Når en fokuseret lysstråle er rettet mod en renset, krystallinsk prøve, lyset diffrakterer fra atomerne og en detektor registrerer det diffrakterede lys. Når prøven roteres, todimensionelle billeder af diffraktionsmønstrene fanges i forskellige retninger. Algoritmer anvendes derefter på diffraktionsdataene for at rekonstruere et tredimensionelt kort over arrangementet af atomer i prøven.

Når du bestemmer, eller løse, en struktur fra diffraktionsdata, du skal relatere modellen til dine observationer, forklarede Zwart, som er en del af Berkeley Labs Molecular Biophysics and Integrating Bioimaging Division. De målfunktioner, der bruges til at gøre dette, kaldes maksimal sandsynlighedsfunktioner. De fungerer rigtig godt, hvis dine data er gode, bemærker han, men når mængden af ​​støj i dataene stiger - hvilket bliver tilfældet ved højere opløsninger - er de nuværende metoder ikke i stand til at give det bedst mulige svar.

Grunden til at målfunktioner mangler i sådanne tilfælde er, at der er et trin i beregningen, en integration, det kan ikke gøres analytisk - det vil sige, med blyant-og-papir matematik, der giver dig et udtryk, du kan forvandle til kode. Tidligere forsøg på at håndtere dette problem har enten simpelthen ignoreret integrationstrinnet, eller komme med tilnærmelser, der kun fungerer i eksperiment- eller teknikspecifikke scenarier. Så Zwart og Perryman gik tilbage til det grundlæggende, forsøger en lang række forskellige maskinlæringsmetoder til numerisk at udlede en så præcis tilnærmelse som muligt på den mest effektive måde.

Tre fjerdedele af vejen gennem Perrymans 16-ugers praktik, de to nåede frem til, at de fleste af de stier, der havde virket lovende i starten, faktisk var blinde gyder. "Jeg ville prøve ting, og det tog et stykke tid bare at finde ud af, om noget er en succes eller en fiasko, fordi, med et helt nyt problem, du ved det bare ikke, "sagde Perryman. Tingene klikkede endelig, da de indså, at en fælles antagelse, folk har gjort sig i 30 år, kunne forbedres.

Univ. af Tennessee -uddannelsen Elliot Perryman (til højre) arbejdede sammen med biovidenskabelige videnskabsfolk Peter Zwart i løbet af efteråret 2019 Berkeley Lab Undergraduate Research (BLUR) praktik. Kredit:Thor Swift/Berkeley Lab

Antagelsen har at gøre med formen på støj i dataene. Den almindeligt accepterede opfattelse har været, at eksperimentelle fejl falder ind i en klassisk normalfordeling, ligesom den gaussiske klokkekurve, hvor næsten 100 procent af observationer falder inden for 3,5 standardafvigelser. Men en mere realistisk kurve har tykkere "haler" på grund af sjældne, men forudsigelige hændelser. "Inkludering af disse lidt mere realistiske fejlmodeller i krystallografiske målfunktioner giver os mulighed for at modellere tilstedeværelsen af ​​det, der normalt kan kaldes outliers på en mere realistisk måde, "Sagde Zwart.

Deres metode, som de offentliggjorde i tidsskriftet Acta Crystallographica Afsnit D:Strukturel biologi , er bredt anvendelig på tværs af det eksperimentelle krystallografiområde og vil gøre det muligt for forskere at udnytte marginal eller lav kvalitet diffraktionsdata bedre. Denne forskning blev støttet af National Institutes of Health, og CAMERA er finansieret af US Department of Energy's Office of Science.

En postdoktor i Zwart's laboratorium arbejder nu på at omdanne den matematiske konceptramme til en applikation, der i sidste ende kan implementeres i Phenix softwarepakken. MBIB -direktør Paul Adams leder udviklingen af ​​Phenix, en samling værktøjer til automatiseret strukturløsning, der er meget udbredt af krystallografisamfundet.

"Elliot brugte meget tid og energi på tilgange, der i sidste ende ikke udspillede sig, men var afgørende for den samlede indsats, fordi han selv var i stand til at lære meget og uddanne mig, "Tilføjede Zwart. Og den erfaring, Perryman fik, hjalp ham med at finde en opfølgende praktikplads sammen med Tess Smidt, en postdoc i Computational Research Division, og i sidste ende en studenterassistentstilling, der arbejder med CAMERA postdoc Marcus Noack om maskinassisteret beslutningstagning for eksperimentelle videnskaber.

Projektet Perryman og Noack har arbejdet på har til formål at vende traditionelle metoder til automatiseret billedudtagning på hovedet. De foreslår at bruge en tilfældig tilgang, der er størrelsesordener mere effektiv og vil give en forudsigelse af, hvordan billedet kunne se ud på et eller andet sted, samt en indikation af usikkerheden i den forudsigelse. Perryman har arbejdet på en distribueret optimeringsmetode, navngivet HGDL (Hybrid Global Deflated Local), at forbedre en kritisk optimeringsfunktion.

Der er mange udfordrende beregningsproblemer i biovidenskaberne, der kan løses med tilgange, der allerede er udviklet af anvendte matematikere, Zwart bemærket. "Nogle ideer tager bare længere tid at trænge ind på andre områder, "sagde han." Derfor er det så fantastisk at arbejde i CAMERA:matematikere har et andet syn på verden, et andet sæt færdigheder, og læste forskellige papirer. Men de kender ikke de eksperimentelle felter som strukturbiologer gør. Det er vigtigt at bringe disse mennesker sammen, så vi kan identificere problemer inden for biovidenskaben og finde løsninger inden for matematik og computing. "

"Det har været en af ​​de store fordele ved denne praktikplads, "sagde Perryman." Jeg startede med atomfysik, så jeg var bare bekendt med typerne af problemer på det område. Men efter at have arbejdet med Peter, eller arbejdede med Tess i foråret, eller Marcus, Jeg er klar over, at der er så mange analoge problemer. Synes godt om, hvis du har det samme problem, Marcus ville indramme det i form af en slags geofysisk ting, og Tess ville sige, at det er et geometri problem, men det er nok også et biologiproblem. "

Til sidst, Perryman er ikke blevet afskrækket af nogen af ​​disse genstridige udfordringer:"Der er så mange interessante projekter, det er svært ikke at blive begejstret for dem. "


Varme artikler