- Input:Enkeltcellede RNA-seq-data (tællematrix)
- Kvalitetskontrol (QC):Fjern celler og gener af lav kvalitet
- Datanormalisering:Normaliser dataene for at korrigere for tekniske skævheder
2. Klynger
- Udfør klyngedannelse på de normaliserede data for at identificere celleklynger
- Forskellige klyngemetoder kan bruges (f.eks. k-betyder, hierarkisk klyngedannelse, Louvain)
3. Markørgen-identifikation
- For hver klynge:
- Beregn den gennemsnitlige ekspression af hvert gen på tværs af celler i klyngen
- Sammenlign den gennemsnitlige ekspression af gener i klyngen med den i andre klynger
- Identificer gener, der er højt udtrykt i klyngen sammenlignet med andre klynger
4. Markørgenvalidering
- Yderligere kriterier kan anvendes til at vælge markørgener:
- Foldændring:Overvej gener med en høj foldændring mellem klyngen og andre klynger
- Statistisk signifikans:Brug statistiske test (f.eks. t-test, Wilcoxon-test) til at vurdere signifikansen af udtryksforskelle
- Specificitet:Sørg for, at markørgener udtrykkes selektivt i klyngen af interesse
5. Fortolkning og visualisering
- Analysere funktioner og veje forbundet med de identificerede markørgener
- Generer varmekort, vulkanplot eller andre visualiseringer for at præsentere markørgenerne og deres ekspressionsmønstre
6. Validering i uafhængige datasæt (valgfrit)
- For at øge tilliden skal du validere de identificerede markørgener i et uafhængigt datasæt, hvis det er tilgængeligt.