De eksponentielle fremskridt inden for enkeltcellede multi-omics-teknologier har ført til akkumulering af store og forskellige multi-omics-datasæt. Integrationen af enkeltcellet proteomik og transkriptomik (eller epigenomik) data udgør imidlertid en betydelig udfordring for eksisterende metoder. Adskillige transformer-baserede modeller, såsom Geneformer, har væsentligt ændret paradigmet for enkeltcellet transkriptomanalyse. Disse metoder stiller imidlertid betydelige krav til beregningsressourcer.
For at imødegå disse udfordringer har forskere ved Wuhan Botanical Garden i det kinesiske videnskabsakademi udviklet en transformer-baseret metode, kaldet scmFormer, til at integrere storskala enkeltcellet proteomik og transkriptomik data ved hjælp af en multi-task transformer. Undersøgelsen med titlen "scmFormer Integrates Large‐Scale Single‐Cell Proteomics and Transcriptomics Data by Multi‐Task Transformer" blev offentliggjort i Advanced Science .
Forskerne præsenterede en omfattende evaluering og lavede casestudier af denne metode, resultaterne viste, at scmFormer udviste bemærkelsesværdig dygtighed til at harmonisere storskala enkeltcellede omics plus proteomics datasæt på både celletype og finere skala celleniveau med begrænsede computerressourcer.
Derudover besidder scmFormer evnen til at integrere flere enkeltcellede parrede multimodale datasæt, hvilket fører til den dobbelte fordel af reducerede høje omkostninger og forbedret biologisk indsigt.
Desuden viser scmFormer en enestående evne til at eliminere tekniske forskelle mellem forskellige omics-modaliteter og samtidig bevare den underliggende biologiske information, der er iboende i dataene, der spænder over både celletyper og eksperimentelle forhold.
Anvendelsen af scmFormer til integration af to COVID-19-datasæt med 1,48 millioner celler demonstrerede yderligere den klare fordel ved scmFormer til håndtering af store datasæt på almindelige bærbare computere.
Flere oplysninger: Jing Xu et al, scmFormer integrerer storskala enkeltcellede proteomik- og transkriptomiske data af Multi-Task Transformer, Advanced Science (2024). DOI:10.1002/advs.202307835
Journaloplysninger: Avanceret videnskab
Leveret af Chinese Academy of Sciences
Sidste artikelNye strukturer giver indsigt i, hvordan en bakteriel motor driver bakteriel kemotaksi, en vigtig infektiøs proces
Næste artikelAI dechifrerer ny genregulatorisk kode i planter og laver nøjagtige forudsigelser for nyligt sekventerede genomer