0
点赞
收藏
分享

微信扫一扫

基因型-表型关联数基因/蛋白质/大分子相关经典生物信息数据集汇总 ,癌症体细胞突变,公共数据、药敏、多组学数据,找靶点、筛药物的“试药场”


数据集

官方下载首页(直接可用)

一句话简介(2024 版)

dbSNP build 156

https://ftp.ncbi.nlm.nih.gov/snp/latest_release/

人类与多物种单核苷酸变异、Indel、多态性位点的“总账本”,突变研究第一步。

gnomAD v4.1

https://gnomad.broadinstitute.org/downloads

来自 120 万人 WGS/WES 的群体频率库,评估罕见突变致病性的“黄金标尺”。

ClinVar

https://ftp.ncbi.nlm.nih.gov/pub/clinvar/

基因变异-临床表型关联的公开“裁判书”,收录 130+ 万条专家注释。

COSMIC v99

https://cancer.sanger.ac.uk/cosmic/download

癌症体细胞突变“百科全书”,覆盖 3 700 万个突变位点与功能注释。

GTEx v9

https://gtexportal.org/home/datasets

正常人群 54 种组织表达谱 + eQTL,研究“基因如何在健康组织里工作”的基准。

ENCODE

https://www.encodeproject.org/search/

人类与小鼠基因组所有“功能元件”——增强子、启动子、结合位点——的系统目录。

TCGA (GDC)

https://portal.gdc.cancer.gov/repository

1.1 万肿瘤多组学(WGS、RNA、蛋白、影像)全景图谱,癌症研究“老大哥”。

CCLE / DepMap

https://depmap.org/portal/download

1 700+ 癌细胞系基因必需性、药敏、多组学数据,找靶点、筛药物的“试药场”。

Human Protein Atlas

https://www.proteinatlas.org/about/download

2.6 万抗体、6 100 万张图像,展示蛋白在人体组织与细胞中的“定位地图”。

PDB

https://files.rcsb.org/download/

21.9 万个实验解析/预测生物大分子 3D 结构,结构生物学与 AI 折叠的共同坐标系。

GEO

https://www.ncbi.nlm.nih.gov/geo/browse/

156 万条芯片/测序表达记录,科研人“挖公共数据”第一站。

EGA

https://ega-archive.org/download

欧盟“受控访问”人类遗传数据仓库,2.7 PB 罕见病、癌症、队列原始文件。

dbGaP

https://dbgap.ncbi.nlm.nih.gov/dbgap-study-downloads

NIH 旗下基因型-表型关联数据库,2 800+ 研究项目,需审批下载。


举报

相关推荐

0 条评论