Bio-info/analysis

single cell analysis - after cell type annotation

z_e 2025. 3. 5. 21:58

πŸ“Œ Single-cell λΆ„μ„μ—μ„œ Cell Type Annotation 이후에 ν•  수 μžˆλŠ” μΆ”κ°€ 뢄석듀

Cell type annotation μ΄ν›„μ—λŠ” μ„Έν¬μ˜ νŠΉμ„±κ³Ό κΈ°λŠ₯을 더 깊이 μ΄ν•΄ν•˜κ³ ,
νŠΉμ • 생물학적 μ§ˆλ¬Έμ— λ‹΅ν•˜κΈ° μœ„ν•΄ λ‹€μ–‘ν•œ 뢄석을 μˆ˜ν–‰ν•  수 μžˆμ–΄.


1️⃣ μ°¨λ“± λ°œν˜„ μœ μ „μž(DEA, Differential Expression Analysis) 뢄석

πŸ‘‰ 각 세포 μœ ν˜•μ—μ„œ 특이적으둜 λ°œν˜„λ˜λŠ” μœ μ „μž μ°ΎκΈ°

  • λͺ©μ : 세포 μœ ν˜• κ°„μ˜ 차이λ₯Ό λ‚˜νƒ€λ‚΄λŠ” 특이적(marker) μœ μ „μž μ°ΎκΈ°
  • 방법: scanpy.tl.rank_genes_groups(), Seurat::FindMarkers() μ‚¬μš©
  • 뢄석 예제:
    • 면역세포 vs. μ’…μ–‘μ„Έν¬μ—μ„œ μ°¨λ“± λ°œν˜„λ˜λŠ” μœ μ „μž μ°ΎκΈ°
    • νŠΉμ • 쑰건(예: μ§ˆλ³‘ vs. 정상)μ—μ„œ λ°œν˜„ 차이가 λ‚˜λŠ” μœ μ „μž 뢄석
sc.tl.rank_genes_groups(adata, groupby="cell_type", method="wilcoxon")
sc.pl.rank_genes_groups(adata, n_genes=10, sharey=False)

2️⃣ λ°œν˜„ μ‹œκ·Έλ‹ˆμ²˜ 뢄석 (Gene Set Enrichment Analysis, GSEA)

πŸ‘‰ νŠΉμ • 세포 μœ ν˜•μ—μ„œ ν™œμ„±ν™”λœ 생물학적 경둜(pathway) 뢄석

  • λͺ©μ : νŠΉμ • 세포 μœ ν˜•μ—μ„œ μ–΄λ–€ κΈ°λŠ₯이 ν™œμ„±ν™”λ˜λŠ”μ§€ νŒŒμ•…
  • 방법: GSEA, AUCell, GSVA, singscore λ“±μ˜ 방법 μ‚¬μš©
  • 예제:
    • Tμ„Έν¬μ—μ„œ λ©΄μ—­ λ°˜μ‘ κ΄€λ ¨ 경둜(IFN-γ signaling)κ°€ ν™œμ„±ν™”λ˜λŠ”μ§€ 뢄석
    • μ•”μ„Έν¬μ—μ„œ 세포 증식(growth) κ΄€λ ¨ κ²½λ‘œκ°€ ν™œμ„±ν™”λ˜λŠ”μ§€ 확인
import gseapy as gp
gp.enrichr(gene_list=marker_genes, gene_sets='KEGG_2019_Human', organism='human')

3️⃣ 세포 μƒν˜Έμž‘μš© 뢄석 (Cell-Cell Communication)

πŸ‘‰ 세포 κ°„ λ¦¬κ°„λ“œ-수용체(ligand-receptor) μƒν˜Έμž‘μš© 뢄석

  • λͺ©μ : 세포 κ°„ μ‹ ν˜Έ 전달 및 μ˜μ‚¬μ†Œν†΅ 확인
  • 도ꡬ:
    • CellPhoneDB (cellphonedb method statistical_analysis)
    • NicheNet (ligand-target 예츑)
    • CellChat (R νŒ¨ν‚€μ§€)
cellphonedb method statistical_analysis your_meta.txt your_counts.txt
  • 예제:
    • 면역세포(T cell)와 쒅양세포 κ°„ μ‹ ν˜Έ 전달 뢄석
    • μ„¬μœ μ•„μ„Έν¬μ™€ 암세포 κ°„ μƒν˜Έμž‘μš© λ„€νŠΈμ›Œν¬ 확인

4️⃣ μ˜μ‚¬λ°œμƒ 뢄석 (Pseudotime Analysis)

πŸ‘‰ 세포가 λΆ„ν™”ν•˜λŠ” κ³Όμ • 좔적

  • λͺ©μ : 세포가 νŠΉμ • μƒνƒœμ—μ„œ λ‹€λ₯Έ μƒνƒœλ‘œ λ³€ν™”ν•˜λŠ” 과정을 μž¬κ΅¬μ„±
  • 도ꡬ:
    • Monocle3 (R)
    • Scanpy.tl.dpt() (Python)
    • Slingshot (R)
sc.tl.dpt(adata)
sc.pl.dpt_groups_pseudotime(adata)
  • 예제:
    • μ€„κΈ°μ„Έν¬μ—μ„œ λΆ„ν™”ν•˜λŠ” κ³Όμ • 좔적
    • 암세포가 정상 μ„Έν¬μ—μ„œ λ³€ν˜•λ˜λŠ” 경둜 뢄석

5️⃣ 세포 μ•„ν˜•(Subtype) 뢄석 및 ν΄λŸ¬μŠ€ν„° μ„ΈλΆ„ν™”

πŸ‘‰ 이미 λΆ„λ₯˜ν•œ 세포 μœ ν˜•μ„ 더 μ„ΈλΆ„ν™”ν•˜μ—¬ 뢄석

  • λͺ©μ : 같은 세포 νƒ€μž… λ‚΄μ—μ„œλ„ κΈ°λŠ₯이 λ‹€λ₯Έ 세포 집단이 μžˆλŠ”μ§€ 탐색
  • 방법:
    • νŠΉμ • 세포 μœ ν˜•λ§Œ 필터링 ν›„ λ‹€μ‹œ clustering μˆ˜ν–‰
    • νŠΉμ • 마컀 μœ μ „μž λ°œν˜„ νŒ¨ν„΄ 기반으둜 μ•„ν˜•(subtype) μ •μ˜
adata_subset = adata[adata.obs['cell_type'] == 'T cell']
sc.tl.leiden(adata_subset, resolution=1.0)
sc.pl.umap(adata_subset, color='leiden')
  • 예제:
    • CD8+ T세포λ₯Ό μ„ΈλΆ„ν™”ν•˜μ—¬ effector, memory T cell ꡬ뢄
    • 암세포 ν΄λŸ¬μŠ€ν„°λ₯Ό 더 μ„ΈλΆ€μ μœΌλ‘œ λ‚˜λˆ„μ–΄ μ΄μ§ˆμ„± 뢄석

6️⃣ μ „μ‚¬μΈμž λ„€νŠΈμ›Œν¬ 뢄석 (Transcription Factor Network)

πŸ‘‰ νŠΉμ • 세포 μœ ν˜•μ—μ„œ μ€‘μš”ν•œ μ „μ‚¬μΈμž μ°ΎκΈ°

  • λͺ©μ : 세포 특이적 μ „μ‚¬μΈμž(transcription factor, TF)λ₯Ό λΆ„μ„ν•˜μ—¬ 쑰절 λ„€νŠΈμ›Œν¬ νŒŒμ•…
  • 도ꡬ: SCENIC (Python & R), DoRothEA, GRNboost2
import pyscenic
pyscenic.run(...)
  • 예제:
    • λ©΄μ—­μ„Έν¬μ—μ„œ FOXO1, T-betκ³Ό 같은 μ „μ‚¬μΈμžμ˜ μ—­ν•  뢄석
    • μ•”μ„Έν¬μ—μ„œ MYC, TP53 λ“±μ˜ 쑰절 λ„€νŠΈμ›Œν¬ 확인

7️⃣ 세포 λ©”νƒ€λ³Όλ¦¬μ¦˜ 뢄석 (Metabolic Analysis)

πŸ‘‰ 세포 μœ ν˜•λ³„ λŒ€μ‚¬ 경둜(metabolic pathway) νŠΉμ„± 뢄석

  • λͺ©μ : 세포 μƒνƒœμ— 따라 λŒ€μ‚¬ ν™œμ„±ν™” νŒ¨ν„΄μ΄ μ–΄λ–»κ²Œ λ‹€λ₯Έμ§€ 확인
  • 도ꡬ:
    • scFEA (single-cell flux estimation)
    • MOUSE (metabolism analysis)
import scFEA
scFEA.analyze(adata)
  • 예제:
    • 쒅양세포와 정상세포 κ°„ λŒ€μ‚¬ 차이 뢄석 (예: Warburg effect)
    • 쀄기세포 vs. λΆ„ν™”λœ μ„Έν¬μ˜ λŒ€μ‚¬ νŒ¨ν„΄ 비ꡐ

8️⃣ 곡간 전사체 뢄석과 톡합 (Spatial Transcriptomics Integration)

πŸ‘‰ single-cell 데이터λ₯Ό 곡간 전사체 데이터와 ν†΅ν•©ν•˜μ—¬ 뢄석

  • λͺ©μ : νŠΉμ • 쑰직 λ‚΄μ—μ„œ 세포가 μ–΄λ–»κ²Œ λΆ„ν¬ν•˜λŠ”μ§€ 이해
  • 도ꡬ:
    • Seurat v4 (R)
    • stLearn (Python)
    • SPOTlight (cell type deconvolution)
import stlearn
stlearn.load()
  • 예제:
    • μ’…μ–‘ 쑰직 λ‚΄ νŠΉμ • λ©΄μ—­μ„Έν¬μ˜ 곡간적 μœ„μΉ˜ 뢄석
    • μ‹ κ²½μ„Έν¬μ—μ„œ νŠΉμ • μ˜μ—­(예: hippocampus)μ—μ„œ ν™œμ„±ν™”λœ μœ μ „μž νŒ¨ν„΄ 확인

πŸ“Œ 정리: Cell Type Annotation 이후 κ°€λŠ₯ν•œ 뢄석

뢄석 μœ ν˜• μ£Όμš” λͺ©μ  μ‚¬μš© 도ꡬ

μ°¨λ“± λ°œν˜„ 뢄석 (DEA) 세포 μœ ν˜•λ³„ 특이 μœ μ „μž μ°ΎκΈ° Scanpy, Seurat
λ°œν˜„ μ‹œκ·Έλ‹ˆμ²˜ 뢄석 (GSEA) κΈ°λŠ₯적 경둜 ν™œμ„±ν™” 뢄석 GSEA, AUCell
세포 μƒν˜Έμž‘μš© 뢄석 λ¦¬κ°„λ“œ-수용체 λ„€νŠΈμ›Œν¬ 뢄석 CellPhoneDB, CellChat
μ˜μ‚¬λ°œμƒ 뢄석 (Pseudotime) 세포 λΆ„ν™” κ³Όμ • 좔적 Monocle, Scanpy
세포 μ•„ν˜• 뢄석 같은 세포 μœ ν˜• λ‚΄ μ„ΈλΆ€ ν΄λŸ¬μŠ€ν„°λ§ Scanpy, Seurat
μ „μ‚¬μΈμž λ„€νŠΈμ›Œν¬ 뢄석 세포 특이적 μ „μ‚¬μΈμž μ°ΎκΈ° SCENIC, DoRothEA
세포 λ©”νƒ€λ³Όλ¦¬μ¦˜ 뢄석 세포 μœ ν˜•λ³„ λŒ€μ‚¬ 경둜 뢄석 scFEA, MOUSE
곡간 전사체 톡합 뢄석 세포 μœ ν˜•μ˜ 곡간적 뢄포 뢄석 Seurat v4, stLearn

πŸ’‘ κ²°λ‘ 

Cell Type Annotation μ΄ν›„μ—λŠ” λ‹€μ–‘ν•œ 후속 뢄석이 κ°€λŠ₯ν•˜λ©°, 연ꡬ λͺ©μ μ— 따라 세포 κ°„ 차이λ₯Ό λΆ„μ„ν•˜κ±°λ‚˜, μœ μ „μž 쑰절 λ„€νŠΈμ›Œν¬λ₯Ό νƒμƒ‰ν•˜κ±°λ‚˜, 세포 κ°„ μƒν˜Έμž‘μš©μ„ 연ꡬ할 수 μžˆμ–΄. πŸš€

νŠΉμ • 뢄석에 λŒ€ν•΄ 더 깊이 μ•Œκ³  μ‹ΆμœΌλ©΄ μ§ˆλ¬Έν•΄μ€˜! 😊