Videnskab
 Science >> Videnskab >  >> Biologi

En universel ramme for rumlig biologi

SpatialData forener og integrerer data fra forskellige rumlige omics-teknologier. Kredit:Isabel Romero Calvo/EMBL

Biologiske processer er indrammet af den kontekst, de finder sted i. Et nyt værktøj udviklet af Stegle-gruppen fra EMBL Heidelberg og det tyske cancerforskningscenter (DKFZ) hjælper med at sætte molekylærbiologiske forskningsresultater i en bedre kontekst af cellulære omgivelser ved at integrere forskellige former af geografiske data.



I et væv er hver enkelt celle omgivet af andre celler, og de interagerer alle konstant med hinanden for at give anledning til biologisk funktion. For at forstå, hvordan væv fungerer eller ikke fungerer i sygdomme som kræft, er det afgørende ikke kun at lære hver celles egenskaber, men også at redegøre for deres rumlige kontekst. Kvantitativ karakterisering af celler i sammenhæng med det fysiske rum, de bebor er nøglen til at forstå komplekse systemer.

De teknologier, der muliggør disse typer udforskning, kaldes spatial omics-teknologier, og deres fremadskridende udvikling bidrager til den stigende popularitet af rumlig biologi. Sådanne teknologier kan give detaljerede oplysninger om den molekylære sammensætning af individuelle celler og deres rumlige arrangement.

Imidlertid fokuserer disse teknologier på forskellige karakteristika ved en celle - såsom RNA- eller proteinniveauer, og de resulterende datasæt administreres og opbevares på forskellige måder. For at løse denne udfordring udviklede et samarbejdsprojekt ledet af Stegle-gruppen SpatialData, en datastandard og softwareramme, som gør det muligt for forskere at repræsentere data fra en bred vifte af rumlige omics-teknologier på en samlet måde.

Teknologiudvikling til rumlig biologi

I løbet af det sidste årti er adskillige teknologier blevet udviklet af både den akademiske verden og industrien til rumlig visualisering af væv, celler og subcellulære rum. Hver teknik fokuserer dog på et lille antal ønskværdige egenskaber og præsenterer relaterede afvejninger. For eksempel fanger Visium fra 10x Genomics information om ekspressionen af ​​alle gener i et væv, men giver ikke enkeltcelleopløsning.

I modsætning hertil giver 10x Genomics Xenium-assayet, MERFISH eller MERSCOPE-platformen fra Vizgen finkornede kort over genekspression med subcellulær opløsning. Imidlertid er disse assays i øjeblikket begrænset til et par hundrede forudvalgte gener. Og listen over sådanne teknologier, der hver giver et lille udsnit af det fulde billede, bliver ved med at vokse.

Udfordringer ved rumlige omics-teknologier

Denne heterogenitet af teknologier afspejles på beregningssiden af ​​en endnu større heterogenitet af filformater:hver teknologi kommer med sit eget lagerformat, og ofte kan data genereret af den samme teknologi lagres i flere formater.

Praktisk set bringer dette adskillige udfordringer til analysen af ​​rumlige omics-data. Visualiserings- og analysemetoder er normalt skræddersyet til en bestemt teknologi, hvilket begrænser datakompatibiliteten og gør det svært at integrere forskellige metoder i en enkelt analysepipeline. Men for en holistisk forståelse af et biologisk system er det vigtigt at se på forskellige cellekarakteristika eller prøver fra forskellige steder samtidigt.

Omics-teknologier genererer enorme mængder data (terabyte billeder, millioner af celler, milliarder af enkelte molekyler), hvilket kræver optimerede tekniske løsninger. Derfor har rumlig biologi et presserende behov for en universel ramme, der kan integrere data på tværs af eksperimenter og teknologier og give holistisk indsigt i sundhed og sygdom. Det er her SpatialData træder ind.

SpatialData – en ramme til at forene dem alle

"Der er et stærkt behov for at etablere fællesskabsløsninger til styring og lagring af rumlige omics-data. Der er især behov for at udvikle nye datastandarder og beregningsgrundlag, der giver mulighed for at samle analysetilgange på tværs af hele spektret af forskellige rumlige omics-teknologier der er ved at dukke op," sagde Oliver Stegle, gruppeleder ved EMBL i Genome Biology Unit og leder af Computational Genomics and Systems Genetics-divisionen ved det tyske cancerforskningscenter (DKFZ).

"Et første større skridt i denne retning er SpatialData, en datastandard og softwareramme, der bygger bro og tilpasser tidligere datahåndteringskoncepter fra enkeltcellede multi-omics til det rumlige domæne."

SpatialData forener og integrerer data fra forskellige omics-teknologier og bygger bro mellem state-of-the-art-teknologier med en ramme, der giver mulighed for beregningseffektiv adgang og manipulation af dataene.

Dette værktøj blev introduceret i en Naturmetoder publikation, forfattet af Luca Marconato under hans ph.d. ved EMBL i Stegle-gruppen, en fælles grad med Fakultet for Biovidenskab ved Universitetet i Heidelberg.

"Vi udviklede SpatialData-rammen for at afhjælpe udfordringerne med datarepræsentation, når de studerer rumlig biologi, så forskeren kan fokusere på den biologiske analyse, i stedet for at blive bremset af kedelige datamanipulationer, der ellers kræves for blot at visualisere dataene. Rammen giver en samlet repræsentation og implementerer ergonomiske operationer til bekvem behandling af rumlige omics-data," sagde Marconato.

Værktøjet gør det muligt for enhver forsker at importere deres data og udføre opgaver som datarepræsentation, behandling og visualisering. Derudover giver det mulighed for interaktivt at annotere dataene og gemme dem i et sprogagnostisk format, hvilket letter fremkomsten af ​​analysestrategier, der kombinerer metoder fra forskellige programmeringssprog eller analysefællesskaber.

Rammerne er udviklet som et samarbejdsprojekt mellem flere institutioner såsom DKFZ, det tekniske universitet i München, Helmholtz Center München, German BioImaging, ETH Zürich, VIB Center for Inflammation Research i Belgien samt Huber og Saka grupper på EMBL.

"Vi har udført vores forskning og teknologiske udvikling for at holde fordelen for det større videnskabssamfund i tankerne," sagde Giovanni Palla, medforfatter og Ph.D. studerende ved Helmholtz Center München.

"Vi etablerede ikke kun et tværfagligt samarbejdsprojekt mellem forskningsinstitutter, men arbejdede også tæt sammen med udviklere, der arbejdede med forskellige rumlige teknologier og på forskellige programmeringssprog for at løse problemet med interoperabilitet. Som et resultat er vores rammer kompatibel med langt de fleste rumlige omics analyser fra den akademiske verden og industrien.

"Ved at blive offentliggjort åbent kan andre forskere nu frit bruge SpatialData til at administrere deres egne data og have mulighed for at samarbejde på tværs af forskellige teknologier og forskningsemner."

"I vores papir illustrerer vi tre vigtige træk ved SpatialData," forklarede Kevin Yamauchi, medforfatter og postdoc-forsker ved ETH Zürich.

"For det første præsenterer vi en standardiseret grænseflade og et unified storage-format (baseret på OME-NGFF) for alle rumlige omics-teknologier. For det andet integrerer vi ved hjælp af den forenede repræsentation signaler fra flere modaliteter. Her overfører vi annoteringer på tværs af modaliteter og kvantificerer signaler ved hjælp af disse overførte annoteringer Til sidst præsenterer vi en måde at interaktivt annotere (patologi)billeder og bruge annoteringerne til at analysere de tilknyttede molekylære profiler."

SpatialData giver en interaktiv repræsentation af data, både på din harddisk og din computers RAM, som muliggør analyse af store billeddata eller flere geometrier eller celler.

Andre fremtrædende nøgletræk er rammens evne til at justere og annotere omics-data i et fælles koordinatsystem. SpatialData muliggør således effektiv styring og manipulation af rumlige datasæt, herunder definitionen af ​​et fælles koordinatsystem på tværs af sekventerings- og billeddannelsesbaserede teknologier.

Anvendelse ved brystkræft

Det tværfaglige team brugte SpatialData-rammen til at genanalysere et multimodalt brystkræftdatasæt fra 10X Genomics som et proof of concept. Dette datasæt omfatter på hinanden følgende sektioner af den samme brystkræftblok, hvor hvert afsnit analyseres ved hjælp af forskellig teknologi, såsom Visium, Xenium og et separat scRNA-seq-datasæt.

Undersøgelsen viser den komplementære karakter af disse teknologier. "Ved at integrere 10X Xenium og scRNAseq kortlagde vi celletyperne i rummet," sagde Elyas Heidari, en Ph.D. kandidat ved DKFZ og en af ​​forfatterne til undersøgelsen.

"Dernæst brugte vi 10X Visium til at identificere kræftkloner i rummet. Dette kan gøres, fordi vi har transkriptom-dækkende udlæsninger. Endelig brugte vi de H&E-farvede mikroskopibilleder til at identificere områder af interesse for histopatologiske annoteringer. Denne analyse viste med succes en unik anvendelse af SpatialData til at låse op for multimodale analyser af rumligt løste datasæt."

I fremtiden vil en patients tumor muligvis blive analyseret med forskellige teknologier, der almindeligvis anvendes i klinikken, hvor dataene derefter forenes af SpatialData for at opnå en holistisk forståelse af tumoren. Ydermere ville den interaktive grænseflade give lægen mulighed for at annotere dataene og dermed muliggøre detaljeret analyse af specifikke tumorregioner og karakteristika, hvilket potentielt kan føre til personlige behandlingstilgange.

Flere oplysninger: Luca Marconato et al, SpatialData:en åben og universel dataramme for rumlig omics, Naturmetoder (2024). DOI:10.1038/s41592-024-02212-x

Journaloplysninger: Naturmetoder

Leveret af European Molecular Biology Laboratory