Videnskab
 Science >> Videnskab >  >> Biologi

To faciliteter slår sig sammen om fremskridt inden for strukturbiologi med røntgen-frielektronlasere og exascale computing

Den nye dataportal, samlet under DOE's Integrated Research Infrastructure-initiativ, vil muliggøre databehandling, genbehandling og storstilede multimodale undersøgelser mellem DOE-faciliteter. Strukturelle og molekylære dynamikdata indsamlet på LCLS-II vil blive registreret i et centralt arbejdsflowregister for at lette hurtig samlokalisering med data indsamlet fra andre faciliteter og højtydende computerressourcer, såsom Frontier exascale supercomputeren. Kredit:Gregory Stewart/SLAC National Accelerator Laboratory

Planer om at forene mulighederne i to banebrydende teknologiske faciliteter lover at indlede en ny æra med dynamisk strukturel biologi. Gennem DOE's Integrated Research Infrastructure, eller IRI, initiativ, vil faciliteterne komplementere hinandens teknologier i jagten på videnskab på trods af, at de er næsten 2.500 miles fra hinanden.



Linac Coherent Light Source, eller LCLS, som er placeret på DOE's SLAC National Accelerator Laboratory i Californien, afslører den strukturelle dynamik af atomer og molekyler gennem røntgenbilleder leveret af en lineær accelerator på ultrahurtige tidsskalaer.

Med sidste års lancering af LCLS-II-opgraderingen, vil det maksimale antal af dets snapshots stige fra 120 pulser i sekundet til 1 million pulser i sekundet, hvilket giver et kraftfuldt nyt værktøj til videnskabelig undersøgelse. Det betyder også, at forskere vil producere meget større mængder data, der skal analyseres.

Frontier, verdens mest kraftfulde videnskabelige supercomputer, blev lanceret i 2022 på DOE's Oak Ridge National Laboratory i Tennessee. Som det første exascale-klassesystem – i stand til en kvintillion eller flere beregninger i sekundet – kører det simuleringer af hidtil uset skala og opløsning.

Under IRI er et hold fra ORNL og SLAC ved at etablere en dataportal, der vil gøre det muligt for Frontier at behandle resultaterne fra eksperimenter udført af LCLS-II. Forskere og brugere hos LCLS vil udnytte ORNL's computerkraft til at studere deres data, udføre simuleringer og hurtigere informere deres igangværende eksperimenter, alt sammen inden for en problemfri ramme.

Udviklerne bag denne synergistiske arbejdsgang sigter mod at gøre den til en køreplan for fremtidige videnskabelige samarbejder på DOE-faciliteter, og de skitserer denne arbejdsgang i et papir offentliggjort i Current Opinion in Structural Biology . Forfatterne omfatter forskerne Sandra Mous, Fred Poitevin og Mark Hunter fra SLAC, og Dilip Asthagiri og Tom Beck fra ORNL.

"Det er i sandhed en spændende periode med samtidig hurtig vækst i eksperimentelle faciliteter såsom LCLS-II og exascale computing med Frontier. Vores artikel opsummerer de seneste eksperimentelle og simuleringsfremskridt inden for studier på atomniveau af biomolekylær dynamik og præsenterer en vision for at integrere disse udviklinger, " sagde Beck, sektionsleder for Scientific Engagement ved DOE's National Center for Computational Sciences på ORNL.

Samarbejdet spirede gennem diskussioner mellem Beck og Hunter om deres laboratoriers gensidige mission om at tackle "stor" videnskab, og hvordan man kan samle deres ressourcer.

"Vi har disse fantastiske supercomputere på vej online, startende ved ORNL, og den nye superledende lineære accelerator med høj pulshastighed hos LCLS vil være transformerende med hensyn til, hvilken slags data vi vil være i stand til at indsamle. Det er svært at fange disse data, men nu vi har databehandling i en skala, der kan holde styr på det.

"Hvis du parrer disse to, er den vision, vi forsøger at vise, at denne kombination vil være transformerende for biovidenskab og andre videnskaber fremad," sagde Hunter, seniorforsker ved LCLS og leder af dets biologiske videnskabsafdeling.

Da den oprindelige LCLS begyndte at fungere i 2009, præsenterede den en banebrydende teknologi til at studere atomarrangementerne af molekyler såsom proteiner eller nukleinsyrer:røntgenfrie elektronlasere eller XFEL'er. Sammenlignet med tidligere metoder, der brugte synkrotronlyskilder, øger XFEL'er lysstyrken betydeligt, så der bruges mange flere røntgenfotoner til at sondere prøven.

Ydermere sendes disse røntgenstråler i form af laserlysimpulser, der kun varer et par tiere femtosekunder, og dette er meget mere komprimeret i tid sammenlignet med andre lyskilder.

Selvom røntgenstråler giver den rumlige opløsning til at forstå, hvor atomer er i rummet, er de også ioniserende stråling, så de er iboende skadelige for selve de strukturer, som videnskabsmænd forsøger at forstå. Jo længere eksponeringen er, jo mere skade påføres prøven.

"Historisk set var alle disse strukturbestemmelser et race. Kan du få den information, du har brug for, i en høj nok rumlig opløsning til at give mening ud af det, før du nedbryder den prøve med røntgenstrålerne til det punkt, hvor den ikke længere er repræsentativ? " Hunter sagde.

"LCLS har fået alle røntgenstrålerne til at dukke op hurtigere, end molekylet kan reagere på det, og derfor er kapløbet mellem indsamling af information og beskadigelse af strukturen blevet brudt - prøven kan ikke blive beskadiget i den tid, som en enkelt LCLS pulsen kommer."

Med LCLS-II's evne til hurtigt at tage mange flere røntgenbilleder af en prøve, kan den muligvis fange sjældne hændelser, som ellers ville være uobserverbare.

"Der er meget vigtige kortlivede tilstande i biologi, som vi desværre lige nu ikke altid fanger på grund af deres begrænsede levetid," sagde Mous, en associeret stabsforsker ved SLAC og hovedforfatter af holdets papir.

"Men med LCLS-II er vi måske virkelig i stand til at tage mange flere snapshots, så vi kan observere disse sjældne hændelser og få en meget bedre forståelse af dynamikken og mekanismen af ​​biomolekyler."

Linac Coherent Light Source på DOE's SLAC National Accelerator Laboratory i Californien afslører den strukturelle dynamik af atomer og molekyler gennem røntgenbilleder på ultrahurtige tidsskalaer. På billedet her er LCLS-II-tunnelen. Kredit:Jim Gensheimer/SLAC National Accelerator Laboratory

I et typisk eksperiment kunne den originale LCLS sende 120 pulser af røntgenstråler pr. sekund til prøver og derved generere omkring 120 billeder pr. sekund - eller 1 til 10 gigabyte billeddata pr. sekund - som alt sammen blev håndteret af SLAC's interne computerinfrastruktur .

Med de udvidede muligheder for den nye superledende lineære accelerator kan den potentielt sende 1 million pulser af røntgenstråler pr. sekund til prøver og dermed skabe op til 1 terabyte billeddata pr. sekund.

"Det er mindst 1.000 gange, hvad vi gør i dag, så med den mængde data, vi er vant til at håndtere i løbet af ugen, skal vi nu gøre det inden for en time. Og det kan vi bare ikke gøre lokalt mere. Der vil være udbrud, hvor vi bliver nødt til at sende dataene et sted, hvor vi rent faktisk kan studere dem - ellers mister vi dem," sagde Poitevin, stabsforsker i LCLS's Data Systems-division.

Poitevin leder udviklingen af ​​beregningsværktøjerne til LCLS's datainfrastruktur, herunder applikationsprogrammeringsgrænsefladen til den nye dataportal, som begyndte at teste tidligere i år på ORNL's forrige generations supercomputer, Summit.

Både Summit og Frontier administreres af Oak Ridge Leadership Computing Facility, som er en DOE Office of Science brugerfacilitet beliggende på ORNL. Projektet blev tildelt computertid på Summit gennem DOE's SummitPLUS-program, som udvider driften af ​​supercomputeren til oktober 2024 med 108 projekter, der dækker spektret af videnskabelige undersøgelser.

"Med den nye lineære accelerator's høje gentagelseshastighedsegenskaber, foregår eksperimenterne nu i et meget hurtigere tempo. Vi skal have noget feedback ind, som vil være nyttigt for brugerne, og vi har ikke råd til at vente en uge fordi eksperimentet måske kun varer et par dage," sagde Poitevin.

"Vi er nødt til at lukke sløjfen mellem analyse og kontrol af eksperimentet. Hvordan tager vi resultaterne af vores analyse på tværs af landet og bringer derefter den information tilbage, der er nødvendig lige i tide til at træffe de rigtige beslutninger?"

Det er punktet i den nye arbejdsgang, hvor senior biomedicinske computerforskere Asthagiri og Beck kommer ind. Som en del af ORNL's Advanced Computing for Life Sciences and Engineering-gruppe har Asthagiri specialiseret sig i biomolekylære simuleringer.

Frontiers regnekraft vil give ham mulighed for at udvikle beregningsmetoder med LCLS-II-data, der gør det muligt hurtigt at sende rettidig information tilbage til forskerne på SLAC.

"Den næsten en-til-en overensstemmelse mellem XFEL-eksperimenter og simuleringer af molekylær dynamik åbner interessante muligheder," sagde Asthagiri.

"For eksempel giver simuleringer information om makromolekylernes reaktion på varierende ydre forhold, og dette kan undersøges i eksperimenterne. Ligeledes kan forsøg på at fange de konformationelle tilstande set eksperimentelt informere simuleringsmodellerne."

LCLS-II er i øjeblikket ved at blive taget i brug, men Hunter vurderer, at instrumentets biologiundersøgelser vil øges om cirka tre år, og teamet vil bruge dataportalen til ORNL til adskillige projekter i mellemtiden.

Med LCLS-II's stærkt forbedrede evne til at fange en række molekylære bevægelser og med Frontiers dataanalyse er Hunter overbevist om projektets indvirkning på videnskaben. At opnå ny forståelse af proteiners strukturelle dynamik kan for eksempel fremskynde udviklingen af ​​lægemiddelmål eller føre til identifikation af molekyler forbundet med en sygdom, der kan behandles med et bestemt lægemiddel.

"Det kan åbne op for en helt ny måde at forsøge at designe terapeutiske midler på. Hvert andet tidspunkt for et biomolekyle kunne være uafhængigt medicinerbart, hvis du forstod, hvordan dette molekyle ser ud eller ved, hvad dette molekyle gør," sagde Hunter.

"Eller hvis du skulle gå med den syntetiske biologi eller bio-industrielle applikationer, kunne forståelsen af ​​nogle dele af disse molekylers udsving måske hjælpe dig med at designe en bedre katalysator."

At opnå sådanne videnskabelige gennembrud kræver tæt integration mellem specialiserede faciliteter, og Hunter tilskriver holdenes samhørighed til IRI.

"Vi er nødt til at have IRI bag dette for at få det til at ske, fordi sådanne samarbejder ikke vil fungere, hvis alle faciliteterne taler et andet sprog. Og jeg tror, ​​at det, IRI bringer, er dette fælles sprog, som vi skal bygge," sagde han.

Flere oplysninger: Sandra Mous et al., Strukturel biologi i en tidsalder af røntgenfrielektronlasere og exascale computing, Current Opinion in Structural Biology (2024). DOI:10.1016/j.sbi.2024.102808

Leveret af Oak Ridge National Laboratory




Varme artikler