Kredit:CC0 Public Domain
To computerforskere ved Freie Universität Berlin ændrer måden, store proteiner modelleres inde i computere ved at kombinere maskinlæring, et område med kunstig intelligens, med statistisk fysik. Resultaterne blev offentliggjort i Proceedings of the National Academy of Science .
"Selvom biologiske molekyler såsom proteiner er for små til at se med det blotte øje, de består af et stort antal atomer, " siger Dr. Simon Olsson, Alexander von Humboldt-stipendiat og hovedforfatter på undersøgelsen. "Dette gør det teknisk udfordrende at studere dem i det omfang, det er nødvendigt for at forstå, hvordan de fungerer." At få indsigt i, hvordan proteiner virker, er afgørende for flere biomedicinske og bioteknologiske anvendelser, herunder forbedring af den globale fødevaresikkerhed, afgrødebeskyttelse og bekæmpelse af fremkomsten af multiresistente patogener.
I deres artikel, forfatterne beskriver en procedure til at overvinde de tekniske udfordringer ved at simulere store proteiner. Den vigtigste indsigt er at indse, at proteiner er ligesom sociale netværk. Dr. Frank Noé, professor ved Freie Universität Berlin, siger, "Proteiner er kendt for at være sammensat af flere mindre byggesten - den rigtige sammensætning af disse fører til fremkomsten af biologiske funktioner, som vi kender det."
Traditionelt, proteiner betragtes som en helhed, når de simuleres inde i en computer, da det er sådan de observeres i eksperimentet. Imidlertid, deres byggesten er små molekylære kontakter, som hver spontant kan skifte mellem flere tilstande. Det er vigtigt at forstå denne skiftadfærd for at forstå, hvordan funktion opstår, og derfor, også vigtigt for applikationer.
"Problemet er virkelig, at vi aldrig vil være i stand til at simulere alle de mulige konfigurationer af disse switches, " Dr. Simon Olsson siger. "Der er bare for mange af dem, de vokser eksponentielt hurtigt. Lad os sige, at en kontakt har to tilstande, to kontakter kan være i fire indstillinger, tre kontakter i otte. Når du har 200 kontakter, antallet af indstillinger er lig med antallet af atomer i det kendte univers."
Omformulering af simuleringerne for at bruge de lokale byggeklodser og for at lære, hvordan de kobles sammen, bryder denne ugunstige skalering og gør store proteinsimuleringer mulige. Denne læring sker med metoder for moderne kunstig intelligens (AI). Simon Olsson forklarer, "Selvom det ser mere kompliceret ud at modellere mange byggeklodser i stedet for blot en enkelt konfigurationstilstand, det viser sig, at vi kan bruge ideer fra AI til at få computere til at lære et 'socialt netværk' af byggestenene og bruge dette til at forstå deres adfærd."
At kende dette sociale netværk af proteinbyggestenene viser sig at have flere fordele. Dr. Frank Noé forklarer, "At bestemme dette netværk kræver ikke, at vi ser alle de mulige konfigurationer af det molekylære system, men når vi først har netværket, kan vi karakterisere dem!" Det sociale proteinnetværk destillerer det væsentlige om, hvordan proteiner virker, og gør derved betydelige fremskridt i retning af at nedbringe det beregningsmæssige fodaftryk, der bestemmer proteinfunktionen.