Cecilia Clementi. Kredit:Jeff Fitlow/Rice University
Beregningsmodeller er kommet langt i deres evne til at simulere de mest basale biologiske processer, såsom hvordan proteiner folder. En ny teknik skabt af forskere fra Rice University skulle gøre det muligt for forskere at modellere større molekyler med større nøjagtighed end nogensinde før.
Beregningskemikeren Cecilia Clementis Rice-laboratorium har udviklet en molekylær modelleringsramme, der mere nøjagtigt kan gengive eksperimentelle resultater med simple grovkornede modeller, der bruges til at simulere proteindynamik.
Rammen, Observerbart drevet design af effektive molekylære modeller (ODEM), inkorporerer tilgængelige eksperimentelle data i definitionen af en grovkornet simuleringsmodel. For en given grovkornet model, gentagelse af simuleringen med trinvise ændringer i modelparametrene forbedrer algoritmens evne til at forudsige, for eksempel, hvordan et protein finder sin funktionelle form.
Værket ledet af Clementi og Rice kandidatstuderende og hovedforfatter Justin Chen vises i American Chemical Society's Journal of Chemical Theory and Computation .
"Forståelse af proteiner, især deres dynamik, er afgørende for at forstå livet, " sagde Clementi. "Der er to komplementære måder at gøre dette på:enten gennem simulering eller eksperimentering. I et eksperiment, du måler noget, der er ægte, men du er meget begrænset i de mængder, du kan måle direkte. Det er som at lægge et puslespil med kun ganske få brikker."
Hun sagde simuleringer giver forskere mulighed for at se på alle aspekter af proteindynamik, men modeller, der inkorporerer egenskaberne for hvert atom, kan tage supercomputere måneder eller år at beregne, selvom proteinerne selv foldes på sekunder in vivo. For hurtigere resultater, videnskabsmænd bruger ofte grovkornede modeller, simplificerede simuleringer, hvor nogle få effektive "perler" repræsenterer grupper af atomer i et protein.
"I meget simple modeller skal du lave stærke tilnærmelser, og som en konsekvens, resultaterne kan afvige fra virkeligheden, " sagde Clementi. "Vi kombinerer disse to tilgange og bruger simuleringens kraft på en måde, der gengiver eksperimenterne. Den vej, vi får det bedste fra begge verdener."
Indhentning af indledende data er ikke et problem, sagde Chen. "Der er allerede et væld af eksperimentelle data om proteiner, så det er ikke svært at finde, " sagde han. "Det er bare et spørgsmål om at finde en måde at modellere disse data på i en simulering."
Clementi sagde, at dataene kan komme fra en hvilken som helst eller en kombination af kilder som Förster resonansenergioverførsel (FRET), mutagenese eller kernemagnetisk resonans. Beregningsrammen udnytter Markov-modeller til at kombinere flere korte proteinsimuleringer for at opnå ligevægtsfordelingen af proteinkonfigurationer, der bruges i ODEM. "Markov-modeller lader os kombinere og udforske forskellige dele af et proteins konfigurationsrum, sagde hun. Det er en smart måde at dele og erobre på.
Nøglen, ifølge forskerne, er kun at inkludere så mange fysiske detaljer som nødvendigt for at modellere processen nøjagtigt.
"Der er modeller, der er meget præcise, men de er beregningsmæssigt for dyre, " sagde Clementi. "Der er for meget information i de modeller, så du ved ikke, hvad der er de vigtigste fysiske ingredienser.
"I vores forenklede modeller, vi medtager kun de fysiske faktorer, vi synes er vigtige, " sagde hun. "Hvis simuleringerne ved at bruge ODEM forbedrer deres overensstemmelse med eksperimenter, det betyder, at hypotesen var korrekt. Hvis de ikke gør det, så ved vi, at der mangler ingredienser."
Forskerne fandt ud af, at deres teknik kan afsløre uventede molekylære egenskaber. I processen med at teste deres algoritme, forskerne opdagede en ny detalje om foldemekanismen af FiP35, et almindeligt WW-domæneprotein, der er et stykke større signal- og strukturproteiner. FiP35, med kun 35 aminosyrer, er velforstået og bruges ofte i foldestudier.
ODEM-modellen af FiP35, baseret på eksperimentelle data fra simulerede FRET-resultater, afslørede flere områder, hvor lokal frustration fremtvang ændringer i foldningsprocessen. Deres analyse viste, at interaktionerne er vigtige for processen og sandsynligvis evolutionært bevarede, men de sagde, at de data, der førte til den konklusion, aldrig ville være dukket op, hvis de simulerede FRET-data ikke blev brugt i den grovkornede model.
"Nu skalerer vi det op til større systemer, som proteiner med 400 rester, omkring 10 gange større end vores testprotein, " sagde Chen. "Du kan ikke lave fuld-atom simuleringer af disse store bevægelser og lange tidsskalaer, men hvis du laver 10 eller 11 iterationer af en grovkornet model med ODEM, de tager kun et par timer. Det er en enorm reduktion af den tid, det ville tage en person at se rimelige resultater."
Sidste artikelUdforskning af grønnere tilgange til nitrogenfiksering
Næste artikelKlæbende situation:Ny proces forvandler trærester til tape