NCBI上有一个综合各类人类数据库的网页:
Human Genome Resources at NCBI: https://www.ncbi.nlm.nih.gov/genome/guide/human/
各大浏览器资源:
一、临床或者变异数据资源 ClinVar & Variation Resource:
1. ClinVar
Information about genomic variation and its relationship to human health
2.Genetic Testing Regidtry (GTR)
Description of genetic tests, submitted by test providers
3. MedGen
Information about medical conditions with a genetic contribution
4. Genetics Home Reference
Consumer-friendly information about the effects of genetic variation on human health
5. RefSeqGene
Gene-focused genomic reference standard sequences that support reporting sequence variation
6. dbSNP
Database of small-scale sequence variations
7. dbVar
Database of genomic structural variation
8. DGV (Database of genomic variants)
提供人类染色体结构变异的概况信息,数据库记录了一系列基因变异与表型相关的信息,数据库信息持续更新中。
链接:http://dgv.tcga.ca/dgv/app/home
9. OMIM (Online Medelian Inheritance in Man)
在线人类孟德尔遗传数据库,是目前分子遗传学中最重要的生物信息学数据库之一。主要为可遗传的或遗传性基因疾病,包括文本信息、相关参考信息、序列记录、图谱和相关其他数据库。
链接:http://www.omim.org/
10. DECIPHER (Database of Chromosomal Imbalance and Phenotype in Human using Ensembl Resource)
也是目前分子遗传学中最重要的生物信息学数据库之一。可通过检索数据库,发现一系列相关的遗传疾病信息,包括变异位点、临床表型等,提高临床诊断效能。包含了全球200多加研究中心上传的10000例的案例信息。
链接:https://decipher.sanger.ac.uk/index
11. Orphanet
该数据库为所有用户提供罕见病和罕见病药物信息的开放门户,目的在于提高罕见病的诊断和护理治疗效果。
链接:http://www.orpha.net/consor/cgi-bin/index.php?Ing=EN
注:其中8-11数据库为遗传疾病公共数据库
12. EGA (European Genome-phenome Archive)
二、Assemblies & Annotations
1, Genome Reference Consortium (GRC)
Information on assembly updates and issues from the international collaboration maintaining the human reference genome accembly
2. Assembly
Human genome assemblies, organization, statistics, and meta-data
3. Genome
Summary of genome-scale human data
4. Blast Human
Align data to the human reference assembly, RefSeq, and more with BLAST
5. Gene
Aggregated information about genes and genome annotation
6. NCBI Genome Remapping Service
Remap annotation data between different coordinate systems, including different assemblies and RefSeqGenes
三、相关资源 (Related-Source)
1. GEO (Gene Expression Omnibus)
基因表达库, 是一个支持微阵列实验的最小信息兼容数据提交的公共功能基因组数据存储库,可接受基于数组或序列的数据。提供相关工具帮助用户查询和下载实验和管理基因表达谱。
2. NCDB(National Cancer Database)
美国国家癌症数据库,基于医院登记数据的临床肿瘤学数据库,可用于分析和追踪恶性肿瘤患者的治疗过程和结局。
3. SEER(Surveillance,Epidemiology, and EndResults Program)
美国癌症统计的权威来源
4. TCGA (The Cancer Genome Atlas)
由美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)合作开发,目前包含33种癌症的数据,每种癌症都涉及关键基因组变化的全面、多维的图谱。有2.5PB的数据,超过1.1万多名患者的肿瘤组织及配对正常组织进行描述。
从TCGA中下载数据比较麻烦,有多个网站整理了TCGA数据,以下网址最完善可靠:
GDAC: http://gdac.broadinstitute.org/Cancer Browser: https:genome-cancer.ucsc.edu/cBioportal
5. Ensemb
提供了一个全面的基因组信息库,包括基因组数据存储、信息整合、数据分析以及生物信息可视化处理等功能。
6.GenBank
7. RefSeq
Reference sequences for genomes, transcripts, proteins and more
8. Sequence Read Archive (SRA)
Human next genration sequence (NGS) transcriptome and genomic datasets
9.GEO DataSets
Curated human gene expression datasets
10. UniGene
Clustered transcripts and expression data
11. CCDS
Information on an international collaboration to consistently annotate human protein-coding genes
12. GeneReviews
An international point-of-care resource that provides clinically relevant and medically actionable information for inherited conditions.