-
single cell analysis - after cell type annotationBio-info/analysis 2025. 3. 5. 21:58
๐ Single-cell ๋ถ์์์ Cell Type Annotation ์ดํ์ ํ ์ ์๋ ์ถ๊ฐ ๋ถ์๋ค
Cell type annotation ์ดํ์๋ ์ธํฌ์ ํน์ฑ๊ณผ ๊ธฐ๋ฅ์ ๋ ๊น์ด ์ดํดํ๊ณ ,
ํน์ ์๋ฌผํ์ ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํด ๋ค์ํ ๋ถ์์ ์ํํ ์ ์์ด.
1๏ธโฃ ์ฐจ๋ฑ ๋ฐํ ์ ์ ์(DEA, Differential Expression Analysis) ๋ถ์
๐ ๊ฐ ์ธํฌ ์ ํ์์ ํน์ด์ ์ผ๋ก ๋ฐํ๋๋ ์ ์ ์ ์ฐพ๊ธฐ
- ๋ชฉ์ : ์ธํฌ ์ ํ ๊ฐ์ ์ฐจ์ด๋ฅผ ๋ํ๋ด๋ ํน์ด์ (marker) ์ ์ ์ ์ฐพ๊ธฐ
- ๋ฐฉ๋ฒ: scanpy.tl.rank_genes_groups(), Seurat::FindMarkers() ์ฌ์ฉ
- ๋ถ์ ์์ :
- ๋ฉด์ญ์ธํฌ vs. ์ข ์์ธํฌ์์ ์ฐจ๋ฑ ๋ฐํ๋๋ ์ ์ ์ ์ฐพ๊ธฐ
- ํน์ ์กฐ๊ฑด(์: ์ง๋ณ vs. ์ ์)์์ ๋ฐํ ์ฐจ์ด๊ฐ ๋๋ ์ ์ ์ ๋ถ์
sc.tl.rank_genes_groups(adata, groupby="cell_type", method="wilcoxon") sc.pl.rank_genes_groups(adata, n_genes=10, sharey=False)
2๏ธโฃ ๋ฐํ ์๊ทธ๋์ฒ ๋ถ์ (Gene Set Enrichment Analysis, GSEA)
๐ ํน์ ์ธํฌ ์ ํ์์ ํ์ฑํ๋ ์๋ฌผํ์ ๊ฒฝ๋ก(pathway) ๋ถ์
- ๋ชฉ์ : ํน์ ์ธํฌ ์ ํ์์ ์ด๋ค ๊ธฐ๋ฅ์ด ํ์ฑํ๋๋์ง ํ์
- ๋ฐฉ๋ฒ: GSEA, AUCell, GSVA, singscore ๋ฑ์ ๋ฐฉ๋ฒ ์ฌ์ฉ
- ์์ :
- T์ธํฌ์์ ๋ฉด์ญ ๋ฐ์ ๊ด๋ จ ๊ฒฝ๋ก(IFN-γ signaling)๊ฐ ํ์ฑํ๋๋์ง ๋ถ์
- ์์ธํฌ์์ ์ธํฌ ์ฆ์(growth) ๊ด๋ จ ๊ฒฝ๋ก๊ฐ ํ์ฑํ๋๋์ง ํ์ธ
import gseapy as gp gp.enrichr(gene_list=marker_genes, gene_sets='KEGG_2019_Human', organism='human')
3๏ธโฃ ์ธํฌ ์ํธ์์ฉ ๋ถ์ (Cell-Cell Communication)
๐ ์ธํฌ ๊ฐ ๋ฆฌ๊ฐ๋-์์ฉ์ฒด(ligand-receptor) ์ํธ์์ฉ ๋ถ์
- ๋ชฉ์ : ์ธํฌ ๊ฐ ์ ํธ ์ ๋ฌ ๋ฐ ์์ฌ์ํต ํ์ธ
- ๋๊ตฌ:
- CellPhoneDB (cellphonedb method statistical_analysis)
- NicheNet (ligand-target ์์ธก)
- CellChat (R ํจํค์ง)
cellphonedb method statistical_analysis your_meta.txt your_counts.txt- ์์ :
- ๋ฉด์ญ์ธํฌ(T cell)์ ์ข ์์ธํฌ ๊ฐ ์ ํธ ์ ๋ฌ ๋ถ์
- ์ฌ์ ์์ธํฌ์ ์์ธํฌ ๊ฐ ์ํธ์์ฉ ๋คํธ์ํฌ ํ์ธ
4๏ธโฃ ์์ฌ๋ฐ์ ๋ถ์ (Pseudotime Analysis)
๐ ์ธํฌ๊ฐ ๋ถํํ๋ ๊ณผ์ ์ถ์
- ๋ชฉ์ : ์ธํฌ๊ฐ ํน์ ์ํ์์ ๋ค๋ฅธ ์ํ๋ก ๋ณํํ๋ ๊ณผ์ ์ ์ฌ๊ตฌ์ฑ
- ๋๊ตฌ:
- Monocle3 (R)
- Scanpy.tl.dpt() (Python)
- Slingshot (R)
sc.tl.dpt(adata) sc.pl.dpt_groups_pseudotime(adata)- ์์ :
- ์ค๊ธฐ์ธํฌ์์ ๋ถํํ๋ ๊ณผ์ ์ถ์
- ์์ธํฌ๊ฐ ์ ์ ์ธํฌ์์ ๋ณํ๋๋ ๊ฒฝ๋ก ๋ถ์
5๏ธโฃ ์ธํฌ ์ํ(Subtype) ๋ถ์ ๋ฐ ํด๋ฌ์คํฐ ์ธ๋ถํ
๐ ์ด๋ฏธ ๋ถ๋ฅํ ์ธํฌ ์ ํ์ ๋ ์ธ๋ถํํ์ฌ ๋ถ์
- ๋ชฉ์ : ๊ฐ์ ์ธํฌ ํ์ ๋ด์์๋ ๊ธฐ๋ฅ์ด ๋ค๋ฅธ ์ธํฌ ์ง๋จ์ด ์๋์ง ํ์
- ๋ฐฉ๋ฒ:
- ํน์ ์ธํฌ ์ ํ๋ง ํํฐ๋ง ํ ๋ค์ clustering ์ํ
- ํน์ ๋ง์ปค ์ ์ ์ ๋ฐํ ํจํด ๊ธฐ๋ฐ์ผ๋ก ์ํ(subtype) ์ ์
adata_subset = adata[adata.obs['cell_type'] == 'T cell'] sc.tl.leiden(adata_subset, resolution=1.0) sc.pl.umap(adata_subset, color='leiden')- ์์ :
- CD8+ T์ธํฌ๋ฅผ ์ธ๋ถํํ์ฌ effector, memory T cell ๊ตฌ๋ถ
- ์์ธํฌ ํด๋ฌ์คํฐ๋ฅผ ๋ ์ธ๋ถ์ ์ผ๋ก ๋๋์ด ์ด์ง์ฑ ๋ถ์
6๏ธโฃ ์ ์ฌ์ธ์ ๋คํธ์ํฌ ๋ถ์ (Transcription Factor Network)
๐ ํน์ ์ธํฌ ์ ํ์์ ์ค์ํ ์ ์ฌ์ธ์ ์ฐพ๊ธฐ
- ๋ชฉ์ : ์ธํฌ ํน์ด์ ์ ์ฌ์ธ์(transcription factor, TF)๋ฅผ ๋ถ์ํ์ฌ ์กฐ์ ๋คํธ์ํฌ ํ์
- ๋๊ตฌ: SCENIC (Python & R), DoRothEA, GRNboost2
import pyscenic pyscenic.run(...)- ์์ :
- ๋ฉด์ญ์ธํฌ์์ FOXO1, T-bet๊ณผ ๊ฐ์ ์ ์ฌ์ธ์์ ์ญํ ๋ถ์
- ์์ธํฌ์์ MYC, TP53 ๋ฑ์ ์กฐ์ ๋คํธ์ํฌ ํ์ธ
7๏ธโฃ ์ธํฌ ๋ฉํ๋ณผ๋ฆฌ์ฆ ๋ถ์ (Metabolic Analysis)
๐ ์ธํฌ ์ ํ๋ณ ๋์ฌ ๊ฒฝ๋ก(metabolic pathway) ํน์ฑ ๋ถ์
- ๋ชฉ์ : ์ธํฌ ์ํ์ ๋ฐ๋ผ ๋์ฌ ํ์ฑํ ํจํด์ด ์ด๋ป๊ฒ ๋ค๋ฅธ์ง ํ์ธ
- ๋๊ตฌ:
- scFEA (single-cell flux estimation)
- MOUSE (metabolism analysis)
import scFEA scFEA.analyze(adata)- ์์ :
- ์ข ์์ธํฌ์ ์ ์์ธํฌ ๊ฐ ๋์ฌ ์ฐจ์ด ๋ถ์ (์: Warburg effect)
- ์ค๊ธฐ์ธํฌ vs. ๋ถํ๋ ์ธํฌ์ ๋์ฌ ํจํด ๋น๊ต
8๏ธโฃ ๊ณต๊ฐ ์ ์ฌ์ฒด ๋ถ์๊ณผ ํตํฉ (Spatial Transcriptomics Integration)
๐ single-cell ๋ฐ์ดํฐ๋ฅผ ๊ณต๊ฐ ์ ์ฌ์ฒด ๋ฐ์ดํฐ์ ํตํฉํ์ฌ ๋ถ์
- ๋ชฉ์ : ํน์ ์กฐ์ง ๋ด์์ ์ธํฌ๊ฐ ์ด๋ป๊ฒ ๋ถํฌํ๋์ง ์ดํด
- ๋๊ตฌ:
- Seurat v4 (R)
- stLearn (Python)
- SPOTlight (cell type deconvolution)
import stlearn stlearn.load()- ์์ :
- ์ข ์ ์กฐ์ง ๋ด ํน์ ๋ฉด์ญ์ธํฌ์ ๊ณต๊ฐ์ ์์น ๋ถ์
- ์ ๊ฒฝ์ธํฌ์์ ํน์ ์์ญ(์: hippocampus)์์ ํ์ฑํ๋ ์ ์ ์ ํจํด ํ์ธ
๐ ์ ๋ฆฌ: Cell Type Annotation ์ดํ ๊ฐ๋ฅํ ๋ถ์
๋ถ์ ์ ํ ์ฃผ์ ๋ชฉ์ ์ฌ์ฉ ๋๊ตฌ
์ฐจ๋ฑ ๋ฐํ ๋ถ์ (DEA) ์ธํฌ ์ ํ๋ณ ํน์ด ์ ์ ์ ์ฐพ๊ธฐ Scanpy, Seurat ๋ฐํ ์๊ทธ๋์ฒ ๋ถ์ (GSEA) ๊ธฐ๋ฅ์ ๊ฒฝ๋ก ํ์ฑํ ๋ถ์ GSEA, AUCell ์ธํฌ ์ํธ์์ฉ ๋ถ์ ๋ฆฌ๊ฐ๋-์์ฉ์ฒด ๋คํธ์ํฌ ๋ถ์ CellPhoneDB, CellChat ์์ฌ๋ฐ์ ๋ถ์ (Pseudotime) ์ธํฌ ๋ถํ ๊ณผ์ ์ถ์ Monocle, Scanpy ์ธํฌ ์ํ ๋ถ์ ๊ฐ์ ์ธํฌ ์ ํ ๋ด ์ธ๋ถ ํด๋ฌ์คํฐ๋ง Scanpy, Seurat ์ ์ฌ์ธ์ ๋คํธ์ํฌ ๋ถ์ ์ธํฌ ํน์ด์ ์ ์ฌ์ธ์ ์ฐพ๊ธฐ SCENIC, DoRothEA ์ธํฌ ๋ฉํ๋ณผ๋ฆฌ์ฆ ๋ถ์ ์ธํฌ ์ ํ๋ณ ๋์ฌ ๊ฒฝ๋ก ๋ถ์ scFEA, MOUSE ๊ณต๊ฐ ์ ์ฌ์ฒด ํตํฉ ๋ถ์ ์ธํฌ ์ ํ์ ๊ณต๊ฐ์ ๋ถํฌ ๋ถ์ Seurat v4, stLearn
๐ก ๊ฒฐ๋ก
Cell Type Annotation ์ดํ์๋ ๋ค์ํ ํ์ ๋ถ์์ด ๊ฐ๋ฅํ๋ฉฐ, ์ฐ๊ตฌ ๋ชฉ์ ์ ๋ฐ๋ผ ์ธํฌ ๊ฐ ์ฐจ์ด๋ฅผ ๋ถ์ํ๊ฑฐ๋, ์ ์ ์ ์กฐ์ ๋คํธ์ํฌ๋ฅผ ํ์ํ๊ฑฐ๋, ์ธํฌ ๊ฐ ์ํธ์์ฉ์ ์ฐ๊ตฌํ ์ ์์ด. ๐
ํน์ ๋ถ์์ ๋ํด ๋ ๊น์ด ์๊ณ ์ถ์ผ๋ฉด ์ง๋ฌธํด์ค! ๐
'Bio-info > analysis' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
single cell ๋ถ์ - cluster ๊ฐ์ ์ ํ๊ธฐ (1) 2025.03.05 single-cell analysis (0) 2025.03.05 single cell - spatial transcription analysis (0) 2023.03.29 GSEA ๋ถ์ (0) 2023.03.10