| 数据集 | 官方下载首页(直接可用) | 一句话简介(2024 版) | 
| dbSNP build 156 | https://ftp.ncbi.nlm.nih.gov/snp/latest_release/ | 人类与多物种单核苷酸变异、Indel、多态性位点的“总账本”,突变研究第一步。 | 
| gnomAD v4.1 | https://gnomad.broadinstitute.org/downloads | 来自 120 万人 WGS/WES 的群体频率库,评估罕见突变致病性的“黄金标尺”。 | 
| ClinVar | https://ftp.ncbi.nlm.nih.gov/pub/clinvar/ | 基因变异-临床表型关联的公开“裁判书”,收录 130+ 万条专家注释。 | 
| COSMIC v99 | https://cancer.sanger.ac.uk/cosmic/download | 癌症体细胞突变“百科全书”,覆盖 3 700 万个突变位点与功能注释。 | 
| GTEx v9 | https://gtexportal.org/home/datasets | 正常人群 54 种组织表达谱 + eQTL,研究“基因如何在健康组织里工作”的基准。 | 
| ENCODE | https://www.encodeproject.org/search/ | 人类与小鼠基因组所有“功能元件”——增强子、启动子、结合位点——的系统目录。 | 
| TCGA (GDC) | https://portal.gdc.cancer.gov/repository | 1.1 万肿瘤多组学(WGS、RNA、蛋白、影像)全景图谱,癌症研究“老大哥”。 | 
| CCLE / DepMap | https://depmap.org/portal/download | 1 700+ 癌细胞系基因必需性、药敏、多组学数据,找靶点、筛药物的“试药场”。 | 
| Human Protein Atlas | https://www.proteinatlas.org/about/download | 2.6 万抗体、6 100 万张图像,展示蛋白在人体组织与细胞中的“定位地图”。 | 
| PDB | https://files.rcsb.org/download/ | 21.9 万个实验解析/预测生物大分子 3D 结构,结构生物学与 AI 折叠的共同坐标系。 | 
| GEO | https://www.ncbi.nlm.nih.gov/geo/browse/ | 156 万条芯片/测序表达记录,科研人“挖公共数据”第一站。 | 
| EGA | https://ega-archive.org/download | 欧盟“受控访问”人类遗传数据仓库,2.7 PB 罕见病、癌症、队列原始文件。 | 
| dbGaP | https://dbgap.ncbi.nlm.nih.gov/dbgap-study-downloads | NIH 旗下基因型-表型关联数据库,2 800+ 研究项目,需审批下载。 | 
                

