single cell analysis - after cell type annotation
π Single-cell λΆμμμ Cell Type Annotation μ΄νμ ν μ μλ μΆκ° λΆμλ€
Cell type annotation μ΄νμλ μΈν¬μ νΉμ±κ³Ό κΈ°λ₯μ λ κΉμ΄ μ΄ν΄νκ³ ,
νΉμ μλ¬Όνμ μ§λ¬Έμ λ΅νκΈ° μν΄ λ€μν λΆμμ μνν μ μμ΄.
1οΈβ£ μ°¨λ± λ°ν μ μ μ(DEA, Differential Expression Analysis) λΆμ
π κ° μΈν¬ μ νμμ νΉμ΄μ μΌλ‘ λ°νλλ μ μ μ μ°ΎκΈ°
- λͺ©μ : μΈν¬ μ ν κ°μ μ°¨μ΄λ₯Ό λνλ΄λ νΉμ΄μ (marker) μ μ μ μ°ΎκΈ°
- λ°©λ²: scanpy.tl.rank_genes_groups(), Seurat::FindMarkers() μ¬μ©
- λΆμ μμ :
- λ©΄μμΈν¬ vs. μ’ μμΈν¬μμ μ°¨λ± λ°νλλ μ μ μ μ°ΎκΈ°
- νΉμ 쑰건(μ: μ§λ³ vs. μ μ)μμ λ°ν μ°¨μ΄κ° λλ μ μ μ λΆμ
sc.tl.rank_genes_groups(adata, groupby="cell_type", method="wilcoxon")
sc.pl.rank_genes_groups(adata, n_genes=10, sharey=False)
2οΈβ£ λ°ν μκ·Έλμ² λΆμ (Gene Set Enrichment Analysis, GSEA)
π νΉμ μΈν¬ μ νμμ νμ±νλ μλ¬Όνμ κ²½λ‘(pathway) λΆμ
- λͺ©μ : νΉμ μΈν¬ μ νμμ μ΄λ€ κΈ°λ₯μ΄ νμ±νλλμ§ νμ
- λ°©λ²: GSEA, AUCell, GSVA, singscore λ±μ λ°©λ² μ¬μ©
- μμ :
- TμΈν¬μμ λ©΄μ λ°μ κ΄λ ¨ κ²½λ‘(IFN-γ signaling)κ° νμ±νλλμ§ λΆμ
- μμΈν¬μμ μΈν¬ μ¦μ(growth) κ΄λ ¨ κ²½λ‘κ° νμ±νλλμ§ νμΈ
import gseapy as gp
gp.enrichr(gene_list=marker_genes, gene_sets='KEGG_2019_Human', organism='human')
3οΈβ£ μΈν¬ μνΈμμ© λΆμ (Cell-Cell Communication)
π μΈν¬ κ° λ¦¬κ°λ-μμ©μ²΄(ligand-receptor) μνΈμμ© λΆμ
- λͺ©μ : μΈν¬ κ° μ νΈ μ λ¬ λ° μμ¬μν΅ νμΈ
- λꡬ:
- CellPhoneDB (cellphonedb method statistical_analysis)
- NicheNet (ligand-target μμΈ‘)
- CellChat (R ν¨ν€μ§)
cellphonedb method statistical_analysis your_meta.txt your_counts.txt
- μμ :
- λ©΄μμΈν¬(T cell)μ μ’ μμΈν¬ κ° μ νΈ μ λ¬ λΆμ
- μ¬μ μμΈν¬μ μμΈν¬ κ° μνΈμμ© λ€νΈμν¬ νμΈ
4οΈβ£ μμ¬λ°μ λΆμ (Pseudotime Analysis)
π μΈν¬κ° λΆννλ κ³Όμ μΆμ
- λͺ©μ : μΈν¬κ° νΉμ μνμμ λ€λ₯Έ μνλ‘ λ³ννλ κ³Όμ μ μ¬κ΅¬μ±
- λꡬ:
- Monocle3 (R)
- Scanpy.tl.dpt() (Python)
- Slingshot (R)
sc.tl.dpt(adata)
sc.pl.dpt_groups_pseudotime(adata)
- μμ :
- μ€κΈ°μΈν¬μμ λΆννλ κ³Όμ μΆμ
- μμΈν¬κ° μ μ μΈν¬μμ λ³νλλ κ²½λ‘ λΆμ
5οΈβ£ μΈν¬ μν(Subtype) λΆμ λ° ν΄λ¬μ€ν° μΈλΆν
π μ΄λ―Έ λΆλ₯ν μΈν¬ μ νμ λ μΈλΆννμ¬ λΆμ
- λͺ©μ : κ°μ μΈν¬ νμ λ΄μμλ κΈ°λ₯μ΄ λ€λ₯Έ μΈν¬ μ§λ¨μ΄ μλμ§ νμ
- λ°©λ²:
- νΉμ μΈν¬ μ νλ§ νν°λ§ ν λ€μ clustering μν
- νΉμ λ§μ»€ μ μ μ λ°ν ν¨ν΄ κΈ°λ°μΌλ‘ μν(subtype) μ μ
adata_subset = adata[adata.obs['cell_type'] == 'T cell']
sc.tl.leiden(adata_subset, resolution=1.0)
sc.pl.umap(adata_subset, color='leiden')
- μμ :
- CD8+ TμΈν¬λ₯Ό μΈλΆννμ¬ effector, memory T cell ꡬλΆ
- μμΈν¬ ν΄λ¬μ€ν°λ₯Ό λ μΈλΆμ μΌλ‘ λλμ΄ μ΄μ§μ± λΆμ
6οΈβ£ μ μ¬μΈμ λ€νΈμν¬ λΆμ (Transcription Factor Network)
π νΉμ μΈν¬ μ νμμ μ€μν μ μ¬μΈμ μ°ΎκΈ°
- λͺ©μ : μΈν¬ νΉμ΄μ μ μ¬μΈμ(transcription factor, TF)λ₯Ό λΆμνμ¬ μ‘°μ λ€νΈμν¬ νμ
- λꡬ: SCENIC (Python & R), DoRothEA, GRNboost2
import pyscenic
pyscenic.run(...)
- μμ :
- λ©΄μμΈν¬μμ FOXO1, T-betκ³Ό κ°μ μ μ¬μΈμμ μν λΆμ
- μμΈν¬μμ MYC, TP53 λ±μ μ‘°μ λ€νΈμν¬ νμΈ
7οΈβ£ μΈν¬ λ©νλ³Όλ¦¬μ¦ λΆμ (Metabolic Analysis)
π μΈν¬ μ νλ³ λμ¬ κ²½λ‘(metabolic pathway) νΉμ± λΆμ
- λͺ©μ : μΈν¬ μνμ λ°λΌ λμ¬ νμ±ν ν¨ν΄μ΄ μ΄λ»κ² λ€λ₯Έμ§ νμΈ
- λꡬ:
- scFEA (single-cell flux estimation)
- MOUSE (metabolism analysis)
import scFEA
scFEA.analyze(adata)
- μμ :
- μ’ μμΈν¬μ μ μμΈν¬ κ° λμ¬ μ°¨μ΄ λΆμ (μ: Warburg effect)
- μ€κΈ°μΈν¬ vs. λΆνλ μΈν¬μ λμ¬ ν¨ν΄ λΉκ΅
8οΈβ£ κ³΅κ° μ μ¬μ²΄ λΆμκ³Ό ν΅ν© (Spatial Transcriptomics Integration)
π single-cell λ°μ΄ν°λ₯Ό κ³΅κ° μ μ¬μ²΄ λ°μ΄ν°μ ν΅ν©νμ¬ λΆμ
- λͺ©μ : νΉμ μ‘°μ§ λ΄μμ μΈν¬κ° μ΄λ»κ² λΆν¬νλμ§ μ΄ν΄
- λꡬ:
- Seurat v4 (R)
- stLearn (Python)
- SPOTlight (cell type deconvolution)
import stlearn
stlearn.load()
- μμ :
- μ’ μ μ‘°μ§ λ΄ νΉμ λ©΄μμΈν¬μ 곡κ°μ μμΉ λΆμ
- μ κ²½μΈν¬μμ νΉμ μμ(μ: hippocampus)μμ νμ±νλ μ μ μ ν¨ν΄ νμΈ
π μ 리: Cell Type Annotation μ΄ν κ°λ₯ν λΆμ
λΆμ μ ν μ£Όμ λͺ©μ μ¬μ© λꡬ
μ°¨λ± λ°ν λΆμ (DEA) | μΈν¬ μ νλ³ νΉμ΄ μ μ μ μ°ΎκΈ° | Scanpy, Seurat |
λ°ν μκ·Έλμ² λΆμ (GSEA) | κΈ°λ₯μ κ²½λ‘ νμ±ν λΆμ | GSEA, AUCell |
μΈν¬ μνΈμμ© λΆμ | 리κ°λ-μμ©μ²΄ λ€νΈμν¬ λΆμ | CellPhoneDB, CellChat |
μμ¬λ°μ λΆμ (Pseudotime) | μΈν¬ λΆν κ³Όμ μΆμ | Monocle, Scanpy |
μΈν¬ μν λΆμ | κ°μ μΈν¬ μ ν λ΄ μΈλΆ ν΄λ¬μ€ν°λ§ | Scanpy, Seurat |
μ μ¬μΈμ λ€νΈμν¬ λΆμ | μΈν¬ νΉμ΄μ μ μ¬μΈμ μ°ΎκΈ° | SCENIC, DoRothEA |
μΈν¬ λ©νλ³Όλ¦¬μ¦ λΆμ | μΈν¬ μ νλ³ λμ¬ κ²½λ‘ λΆμ | scFEA, MOUSE |
κ³΅κ° μ μ¬μ²΄ ν΅ν© λΆμ | μΈν¬ μ νμ 곡κ°μ λΆν¬ λΆμ | Seurat v4, stLearn |
π‘ κ²°λ‘
Cell Type Annotation μ΄νμλ λ€μν νμ λΆμμ΄ κ°λ₯νλ©°, μ°κ΅¬ λͺ©μ μ λ°λΌ μΈν¬ κ° μ°¨μ΄λ₯Ό λΆμνκ±°λ, μ μ μ μ‘°μ λ€νΈμν¬λ₯Ό νμνκ±°λ, μΈν¬ κ° μνΈμμ©μ μ°κ΅¬ν μ μμ΄. π
νΉμ λΆμμ λν΄ λ κΉμ΄ μκ³ μΆμΌλ©΄ μ§λ¬Έν΄μ€! π