Videnskab
 science >> Videnskab >  >> Kemi

Forskere bruger Theta til analyse i realtid af COVID-19 proteiner

Nsp10/16 overflade med ligander. Forskere har udviklet en pipeline til at forbinde ALCF-supercomputere med APS-eksperimenter for at muliggøre analyse i realtid af COVID-19-proteiner, baner vejen for at belyse vigtige proteinstrukturdynamikker for coronavirus. Kredit:Mateusz Wilamowski, University of Chicago, Center for strukturel genomik af infektionssygdomme; George Minasov, Northwestern University, Center for strukturel genomik af infektionssygdomme

Argonne-forskere har udviklet en rørledning mellem ALCF-supercomputere og Advanced Photon Source-eksperimenter for at muliggøre on-demand-analyse af krystalstrukturen af ​​COVID-19-proteiner.

Som coronavirus SARS-CoV-2 og den tilhørende sygdom, COVID-19, udviklet og spredt ud over landet og planeten, det amerikanske energiministerium (DOE) Argonne National Laboratory sluttede sig til den globale kamp ved at begynde arbejdet for bedre at forstå og behandle pandemien. Flere sådanne forskningsområder er blevet lanceret på Argonne Leadership Computing Facility, en DOE Office of Science brugerfacilitet, at udnytte sine betydelige videnskabelige ressourcer; en af ​​disse linjer har analyseret krystalstrukturen i et proteinkompleks, der er forbundet med coronavirus.

Nøglen til at forstå coronavirus er at opklare dens struktur. Til denne ende, Argonne-forskere har udnyttet ALCF's Theta-supercomputer til at analysere krystallografiske billeder af et proteinkompleks, der er forbundet med SARS-CoV-2. Billederne kommer fra Argonnes Advanced Photon Source (APS), en DOE Office of Science brugerfacilitet, efter eksperimenter ved hjælp af en teknik kendt som seriel synkrotronkrystallografi, der er designet til at belyse den komplekse kemi af virale proteiner.

Serielle synkrotronkrystallografiforsøg anvender højintensitets røntgenstråler til at afsløre strukturer af store molekyler ved hjælp af kun fraktionerede stråledoser sammenlignet med kravene i traditionelle krystallografiske teknikker. Som resultat, seriel synkrotronkrystallografi gør det muligt for forskere at se titusinder af mikroskopiske krystaller, med meget korte eksponeringslængder for hver enkelt prøve. Teknikkens høje hastighed fører til generering af en lang række data, hvis kompleksitet og densitet nødvendiggør sofistikerede og beregningsmæssigt krævende analyser.

Massivt parallelle systemer som Theta er unikke i deres evne til at opfylde de krav, som seriel synkrotronkrystallografi stiller til hurtige, on-the-fly behandling. Aktivering af Theta til brug i on-the-fly-behandling er en datapipeline konstrueret omkring supercomputeren. Denne pipeline automatiserer dataindsamling, analyse, kuratering, og visualisering, transportere resultater til et depot, hvorfra metadata kan ekstraheres til offentliggørelse.

Rørledningen genererer store billedbatcher med høj hastighed, med dataoverførsler, der opnår hastigheder på 700 megabyte i sekundet takket være Globus, en datastyringstjeneste, der drives af University of Chicago.

"Denne pipelines implementering mellem APS og ALCF til on-demand analyse har været en enorm succes, "sagde Ryan Chard, en datalog ved Argonne, der leder billedbehandlingsindsatsen. "Vi opnåede en behandlingshastighed på op til 95 billeder i sekundet." Denne høje hastighed gjorde det muligt at levere øjeblikkelig feedback til eksperimentelle på APS.

Rørledningen begynder med, at Globus overfører billeder fra APS til Theta -systemet. Billederne analyseres og behandles derefter ved hjælp af FuncX, et funktions-som-en-tjeneste-beregningssystem, der organiserer afsendelse af individuelle opgaver til tilgængelige computerknudepunkter. FuncX bruges efterfølgende også til at udtrække metadata om hits, identificere krystal diffraktioner, og generere visualiseringer, der viser både prøve- og hitlokationerne. Herefter rådata, metadata, og relaterede visualiseringer udgives til en portal, der hostes på ALCF, hvor de er indekseret og gjort søgbare til genbrug.

Nitten prøver blev analyseret på tværs af næsten 1, 500 strømmer i løbet af tre ti-timers kørsler på APS-strålen, hvor over 700, 000 billeder blev behandlet på Theta. De resulterende data blev offentliggjort til dataportalen og blev brugt til yderligere at forfine eksperimentelt arbejde og konfigurationer. Den orkestrering, der kræves for at lette forskning i denne skala, aktiveres af forskningsdataautomatiseringstjenester, der i øjeblikket er under udvikling på Globus -platformen, og understøttet af den pålidelige filoverførsel, og sikre datadelingsfunktioner, der allerede er meget udbredt på tværs af APS -strålelinjer. Disse muligheder vil fortsat blive forbedret med fremtidige planlagte forbedringer af APS -strålelinjer, ALCF -supercomputere, Globus, og APS-til-ALCF-netværket. Den kommende APS -opgradering, som gør det muligt for forskere at se ting i stor skala, som de aldrig har set før med lagerringbaserede røntgenstråler, øger datahastighederne med størrelsesordener. Kombination af disse muligheder for ALCF og APS Upgrade vil i høj grad forbedre den videnskabelige opdagelse.

"Den stigende biologiske relevans af serielle synkrotronkrystallografiforsøg får forskere til at forberede en række yderligere forsøg i de kommende uger, "sagde Darren Sherrell, en biofysiker og beamline-videnskabsmand ved X-ray Science Division i APS. "Dette arbejde baner vejen for at belyse vigtige proteinstrukturdynamikker for coronavirus."


Varme artikler