Kredit:Meletios Verras/Shutterstock
Nogle gange ved du ikke, hvad du leder efter, før du finder det; og det gælder især, når det kommer til de enorme datasæt, der kan genereres ved hjælp af moderne sekventeringsteknikker. Nu rapporterer forskere fra Japan om udviklingen af en statistisk ramme, der kan udføre upartisk udvinding af biologisk relevant celle-celle-kommunikation fra et hav af rumlige genekspressionsdata.
I en undersøgelse offentliggjort i september i Bioinformatics , har forskere fra University of Tsukuba afsløret, at en ny statistisk analysemetode nøjagtigt kan identificere celle-celle-kommunikation, der påvirker genekspression på enkeltcelleniveau.
Kommunikation mellem celler regulerer genekspression på måder, der er afgørende for normal funktion såvel som sygdomsudvikling. Mens enkeltcellet RNA-sekventering og rumligt opløst transkriptomik kan give en vis indsigt i denne kommunikation, har de nuværende metoder til at analysere disse typer data nogle vigtige begrænsninger.
"De fleste eksisterende statistiske analysemetoder tager ikke højde for den rumlige organisering af celler i et organ, der er sammensat af forskellige celletyper," siger lektor Haruka Ozaki, seniorforfatter af undersøgelsen. "Men placeringen af celler, antallet af celler og celletyperne i nærheden påvirker genekspression i naboceller."
For at fange denne kompleksitet skabte forskerne en statistisk ramme kaldet CCPLS (Cell-Cell Communications Analysis by Partial Least Square regression modeling), der analyserer rumlige genekspressionsdata ved enkeltcelle opløsning. Formålet med dette system var at identificere og kvantificere indflydelsen af nabocelletyper på celle-til-celle variabilitet i genekspression.
"Vi anvendte først CCPLS på et simuleret datasæt og fandt ud af, at det nøjagtigt estimerede virkningerne af flere nabocelletyper på genekspression," siger lektor Ozaki. "Derefter anvendte vi systemet på et datasæt fra den virkelige verden og viste, at astrocytter fremmer differentiering af oligodendrocytprecursorceller til oligodendrocytter, hvilket er i overensstemmelse med tidligere museeksperimenter."
Derefter blev CCPLS anvendt på et andet datasæt fra den virkelige verden indeholdende genekspressionsdata fra ni forskellige celletyper fundet i tyktarmen. Analysen viste, at epitelcelleudvikling af umodne B-celler sker gennem kommunikation med IgA B-celler, hvilket ikke tidligere er blevet rapporteret.
"Vores resultater viser, at CCPLS kan bruges til at udtrække biologisk relevant indsigt om celle-celle-kommunikation fra komplekse datasæt," siger professor Ozaki.
I betragtning af at CCPLS udkonkurrerede en eksisterende statistisk ramme til at identificere genekspressionsvariabilitet reguleret af celle-cellekommunikation, er det sandsynligt, at det vil være et yderst nyttigt værktøj til datasætanalyse i fremtiden. Det kan være særligt effektivt til at udforske lægemiddelmål og i tilfælde, hvor cellearrangementet forårsager ændringer i genekspression. + Udforsk yderligere