Bio-info/analysis
-
single cell analysis - after cell type annotationBio-info/analysis 2025. 3. 5. 21:58
📌 Single-cell 분석에서 Cell Type Annotation 이후에 할 수 있는 추가 분석들Cell type annotation 이후에는 세포의 특성과 기능을 더 깊이 이해하고, 특정 생물학적 질문에 답하기 위해 다양한 분석을 수행할 수 있어.1️⃣ 차등 발현 유전자(DEA, Differential Expression Analysis) 분석👉 각 세포 유형에서 특이적으로 발현되는 유전자 찾기목적: 세포 유형 간의 차이를 나타내는 특이적(marker) 유전자 찾기방법: scanpy.tl.rank_genes_groups(), Seurat::FindMarkers() 사용분석 예제:면역세포 vs. 종양세포에서 차등 발현되는 유전자 찾기특정 조건(예: 질병 vs. 정상)에서 발현 차이가 나는 유전자..
-
single cell 분석 - cluster 개수 정하기Bio-info/analysis 2025. 3. 5. 20:48
참고 : scanpy - preprocessing & clusteringhttps://scanpy.readthedocs.io/en/stable/tutorials/basics/clustering.html#manual-cell-type-annotationwritten by chatGPT 4o🔍 클러스터 개수를 정하는 가장 근거 있는 방법클러스터 개수(Optimal Number of Clusters)를 정하는 방법은 데이터의 구조와 분석 목적에 따라 다르지만, 일반적으로 다음과 같은 방법들이 신뢰할 수 있습니다.📌 1. 데이터 기반의 정량적 방법1️⃣ Elbow Method (엘보우 방법)클러스터 개수 k를 변화시키면서 클러스터 내 응집도(SSE, Within-cluster sum of squares, W..
-
single-cell analysisBio-info/analysis 2025. 3. 5. 13:39
- var index로 유전자 이름 설정->> anndata concat- nan 값을 0으로 변환 -> 나중에 count 셀 때 인식 가능- obs 인덱스 재설정 anndata.concatadata = anndata.concat(filtered_ann_list.values(), label='batch', join='outer') # var의 합집합 사용 (var_names 기준)-여러 개의 anndata 합침-row (cell) 단위로 stack 함-label : obs에 새로운 그룹 지정-index_unique : 중복 유전자 이름을 처리*var의 index로 유전자 이름이 들어가 있어야 함UserWarning: Observation names are not unique. To make ..
-
single cell - spatial transcription analysisBio-info/analysis 2023. 3. 29. 22:58
이전에는 Bulk RNA sequencing 으로 여러 cell을 다 갈아서 그의 '평균이 되는' gene expression level을 확인하였다. 하지만 생각해보면 cell-type specific하게 gene expression level도 다를 것이다. 특정 type의 cell에서 월등히 많이 발현되는 gene도 있을 것이고.. 이러한 세포 유형별 차이를 반영하지 못하는 단점이 있기 때문에 single cell rna seq이 필요하게 되었다. 개념은 'single cell'을 떼어내어 cell 각각에서의 유전자 발현 수준을 확인하는 것. 이렇게 되면 cell 유형 별로의 유전자 발현 패턴도 확인 가능해진다. 문제는 single cell로 분리하면서 각 세포의 spatial한 data를 잃어버린..
-
GSEA 분석Bio-info/analysis 2023. 3. 10. 01:06
GSEA (Gene Set Enrichment Analysis) -내가 관심있는 Gene Set이 어떤 Pathway에 Enrich하게 존재하는지를 파악하고 싶을 때 사용하는 분석 -내가 관심있는 Gene Set이 이미 알려진 Gene set에 얼마나 enrich하게 overrepresented 되는지를 파악하고 싶을 때 사용 * 일단 나의 Gene set을 ranked 하게 sort 진행 : 특정 cutoff를 만족시키는 gene list를 가지고, 이 list의 유전자들이 known gene과 겹치는가? > Hypergeometric Test : 모든 rank에서, known gene sets에 있는유전자들이 non-random한 방식으로 ranked list에서 발견되는가? > Kolmogorov-..