Bio-info
-
single cell analysis - after cell type annotationBio-info/analysis 2025. 3. 5. 21:58
📌 Single-cell 분석에서 Cell Type Annotation 이후에 할 수 있는 추가 분석들Cell type annotation 이후에는 세포의 특성과 기능을 더 깊이 이해하고, 특정 생물학적 질문에 답하기 위해 다양한 분석을 수행할 수 있어.1️⃣ 차등 발현 유전자(DEA, Differential Expression Analysis) 분석👉 각 세포 유형에서 특이적으로 발현되는 유전자 찾기목적: 세포 유형 간의 차이를 나타내는 특이적(marker) 유전자 찾기방법: scanpy.tl.rank_genes_groups(), Seurat::FindMarkers() 사용분석 예제:면역세포 vs. 종양세포에서 차등 발현되는 유전자 찾기특정 조건(예: 질병 vs. 정상)에서 발현 차이가 나는 유전자..
-
single cell 분석 - cluster 개수 정하기Bio-info/analysis 2025. 3. 5. 20:48
참고 : scanpy - preprocessing & clusteringhttps://scanpy.readthedocs.io/en/stable/tutorials/basics/clustering.html#manual-cell-type-annotationwritten by chatGPT 4o🔍 클러스터 개수를 정하는 가장 근거 있는 방법클러스터 개수(Optimal Number of Clusters)를 정하는 방법은 데이터의 구조와 분석 목적에 따라 다르지만, 일반적으로 다음과 같은 방법들이 신뢰할 수 있습니다.📌 1. 데이터 기반의 정량적 방법1️⃣ Elbow Method (엘보우 방법)클러스터 개수 k를 변화시키면서 클러스터 내 응집도(SSE, Within-cluster sum of squares, W..
-
single-cell analysisBio-info/analysis 2025. 3. 5. 13:39
- var index로 유전자 이름 설정->> anndata concat- nan 값을 0으로 변환 -> 나중에 count 셀 때 인식 가능- obs 인덱스 재설정 anndata.concatadata = anndata.concat(filtered_ann_list.values(), label='batch', join='outer') # var의 합집합 사용 (var_names 기준)-여러 개의 anndata 합침-row (cell) 단위로 stack 함-label : obs에 새로운 그룹 지정-index_unique : 중복 유전자 이름을 처리*var의 index로 유전자 이름이 들어가 있어야 함UserWarning: Observation names are not unique. To make ..
-
[논문 초록 읽기 8] Generative modeling of single-cell gene expression for dose-dependent chemical perturbationsBio-info/paper 2024. 2. 6. 10:38
용량 의존적 (dose-dependetn)인 화학적 변동 (chemical perturbations)에 대한 단일세포유전자발현의 생성 모델링 화학적 섭동 (chemical perturbation)에 대한 세포의 반응은 매우 이질적이고 (heterogeneous) 용량 의존적(dose dependent)이다. 모든 관련 세포 유형, 화합물, 그리고 용량의 조합에 걸친 화학물질 또는 약물 노출의 위험을 실험적으로 완전하게 특성화하는 것은 불가능할 것이다. 이 논문에서는 scVIDR (single-cell variational inference of dose-response) 을 소개하는데, 이는 앞서 말한 문제를 generative deep learning 으로 해결하기 위한 computational met..
-
[논문 초록 읽기 7] scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell RNA-seq dataBio-info/paper 2024. 1. 25. 15:24
단일세포전사체 데이터의 세포 유형 주석을 위한 대규모 사전 훈련된 심층 언어 모델인 scBERT 단일 세포 전사체 (single cell RNA-seq) 데이터를 기반으로 세포 유형에 주석을 다는 것 (cell type annotation)은 질병 진행 (progress) 및 종양 미세 환경 (tumor microenvironment) 과 관련된 연구를 위해 필수적이다. 연구자들은 기존의 annotation 방법이 일반적으로 선별된 마커 유전자 목록의 부족, 배치 효과의 부적절한 처리, 잠재된 유전자-유전자 상호 작용 정보 활용의 어려움으로 인해 일반화 및 견고성 (robustness) 의 문제가 있다고 생각했다. 이 연구에서는 이러한 문제를 극복하기 위해 사전 훈련된 심층 신경망 기반 모델 (pre-t..
-
[논문 초록 읽기 6] RENGE infers gene regulatory networks using time-series single-cell RNA-seq data with CRISPR perturbationsBio-info/paper 2024. 1. 22. 13:34
RENGE는 CRISPR perturbations에 의한 타임시리즈의 단일 세포 전사체 데이터를 사용하여 유전자 조절 네트워크를 추론한다 CRISPR-based perturbation과 결합된 단일 세포 전사체 데이터 (single-cell RNA-seq)는 인과관계가 있는 유전자 조절 네트워크의 추론을 가능하게 한다. 그러나 단일세포 CRISPR 데이터의 snapshot은 정확한 추론으로 이어지지 않을 수도 있는데, 유전자 knockout 은 시간이 지남에 따라 multi0layered downstream 에 영향을 미칠 수 있기 때문이다. 연구자들은 RENGE라는, time-series 단일세포 DRISPR 데이터셋을 이용하여 유전자 조절 네트워크를 추론하는 computational methods를 ..
-
[논문 초록 읽기 5] Discovery of a structural class of antibiotics with explainable deep learningBio-info/paper 2024. 1. 22. 11:55
설명가능한 인공지능 딥러닝(explainable deep learning) 모델로 항생제의 구조적인 클래스, 분류를 발견하기 항생제의 새로운 구조적 분류를 발견하는 것은, 항생제 저항성 위기를 해결하는 데 도움이 된다. 딥러닝 접근법은 화학적 구조를 탐구하는 데 도움이 되어왔고, 블랙박스 모델을 사용하며 화학적 통찰력을 제공하지는 않는다. 이 논문에서는 신경망 모델 (Neural network moel)에 의해서 학습된 항생제 활동성 (antibiotic activity)와 관련된 화학적 하위구조 (substructure)를 식별하고, 항생제의 구조적 클래스를 예측하는 데 사용할 수 있다고 추론했다. 연구자들은 이 가설을 화학 공간의 효율적인 딥러닝 기반 탐색을 위해, 설명가능한 (explainable)..
-
[논문 초록 읽기 4] BIDCell: Biologically-informed self-supervised learning for segmentation of subcellular spatial transcriptomics dataBio-info/paper 2024. 1. 15. 14:47
BIDCell : 생물학적 정보를 활용한 자기지도학습을 통한, subcellular 공간 전사체 데이터의 세분화 Subcellular imaging transcriptomics platforms의 최근 발전은, 고해상도의 유전자 mapping이 가능하게 했으며 동시에 정확하게 세포를 식별하고 transcripts를 할당하는 것에 대한 중요한 분석적 도전을 만들어냈다. 기존의 메소드들은 cell fragmentation과 관련된 어려움인데, 주로 조각난 세포 혹은 오염된 발현을 포함하는 oversized된 세포들이 해당된다. 이 논문에서는 BIDCell을 소개하는데, 이는 공간적으로 resolved 된 유전자 발현과 cell morphology 간의 관계를 학습하는 생물학적으로 유의미한 손실함수를 갖춘 s..