通过大量样本构建高密度的SNP图谱,可以得到更为可靠的关联分析结果,为人类的分子遗传机制和疾病相关研究选提供了数据基础,对于人类基因组的研究具有里程碑式的意义,开启了群体遗传研究的新纪元。
这个计划共分成了3个阶段,2005年的时候,发布了第一阶段的数据,提供270个样本的SNP分型结果,这些样本来自四个不同的人群,分别为CEU
, CHB
,JPT
, YRI
, ;在2007年的时候,发布了第二阶段的数据,在第一阶段发现的SNP位点的基础上,新增了210多万个SNP位点,提供了更高密度的SNP图谱;第3阶段对更多的人群和样本进行测序,同时还提供了大量的低频SNP位点。
HapMap 计划中,所有的样本来源于以下11个人群
目前HapMap 网站已经关闭了,因为有了更好的替代品,但是数据还是可以在NCBI上下载得到,网址如下
ftp://ftp.ncbi.nlm.nih.gov/hapmap/
如果需要VCF格式的数据,还可以从GATK提供的网址下载
ftp://ftp.broadinstitute.org/bundle/
随着1000 Genome数据库的出现,HapMap已经退出了历史舞台,但是了解这个计划的作用和意义还是很有必要的。