DNA上承载了关于我们的太多信息:发展史、祖先、特征、疾病易感性、甚至性格和命运。因此很多人迫不及待地想将DNA看得一清二楚。解码人类基因组的第一次郑重尝试是始于1990年的人类基因组计划。尽管合作和艰苦工作无疑扮演了重要角色,但一系列工程上的突破推动了这个项目,以前所未有的速率收集并核对数据。今天,那些方法已经被大大超越。
今年距离人类基因组计划启动已整整二十年。这些年,测序技术经历了怎样的突飞猛进,有哪些里程碑事件出现?现在就让生物通来为您盘点一下。
1975-1977年
DNA测序时代来临:Sanger提出酶法测序,Maxam和Gilbert提出化学降解法测序,。尽管这么多年一直是Sanger测序的天下,但是在刚刚问世时,Maxam–Gilbert测序更受欢迎。
1977年
第一个基因组测序完成,那就是phi X174噬菌体的基因组。这项工作是由Sanger及其同事完成的。phi X174噬菌体的基因组为单链环状,共有5836个碱基。
1980年
“鸟枪法测序”诞生,这是Sanger的又一大革命性发现。他和同事使用这种技术来测序和拼接重叠的读数。从那时起,一些病毒基因组就陆续完成,包括229 kb的巨细胞病毒基因组,186 kb的天花基因组。
1981年
Akiyoshi Wada与日本日立(Hitachi)公司合作开发出一种高通量的自动测序仪;稍后整合到ABI的测序产品中。
1986年
第一台商业化的DNA测序仪(ABI Prism 370A)由Applied Biosystems推出;产量为1,000个碱基/天。
1990年
人类基因组计划(HGP)启动。此计划由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。按照这个计划的设想,在2005年,要揭开组成人体4万个基因的30亿个碱基对的秘密。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。
1995年
Amersham推出循环测序Thermo Sequenase
Applied Biosystems推出第一台毛细管电泳测序仪(Prism 310)。它采用毛细管电泳技术取代传统的聚丙烯酰胺电泳,通过单引物PCR测序反应,生成的PCR产物是相差1个碱基的3'末端为4种不同荧光染料的单链DNA混合物,使得四种荧光染料的测序PCR产物可在一根毛细管内电泳,从而避免了泳道间迁移率差异的影响,大大提高了测序的精确度。它的产量为5,000-15,000个碱基/天
第一个活生物流感嗜血杆菌(Haemophilus influenzae)的基因组测序完成。当初挑选它是因为项目领导人之一Hamilton Smith(1978年的诺贝尔生理学/医学奖得主)一直在研究它,能够提供高质量的DNA文库。它的基因组有1.83 Mb个碱基对,当时使用的测序方法是全基因组鸟枪法。
1996年
第一个真核生物—酿酒酵母(Saccharomyces cerevisiae)的基因组测序完成。它的基因组大约有12.5 Mb和6275个基因,其中约5800个基因被认为是有功能的基因。
1997年
Molecular Dynamics推出MegaBACE 1000毛细管电泳测序仪;产量为250,000-500,000个碱基/天。该公司2003年被GE收购。
1998年
焦磷酸测序被开发出。与Sanger测序不同的是,它依赖核苷酸掺入时焦磷酸的释放,而不是双脱氧核苷酸的链终止。该技术无需电泳,操作极为简便。
PE Biosystems推出Prism 3700毛细管测序仪;产量为 500,000-1,000,000个碱基/天。后来PE被Applied Biosystems Inc.(ABI)公司收购、分拆、再转卖。
第一个多细胞真核基因组被测序:线虫(Caenorhabditis elegans)。线虫基因组计划是由Sanger研究院和华盛顿大学的基因组测序中心合作完成的。1998年12月,几近完整的线虫序列发表在《Science》杂志上,序列中最后余下的缺口是在2002年10月完成的。
1999年
12月1日,英国科学家宣布,人类重大科学研究项目之一——人类基因组计划取得突破性成果,第22号染色体全部破译。这项工作完成了对第22号染色体上的3350万个碱基对的测序,共发现了679个基因,其中有55%是人们以前不知道的。
2000年
第一个植物基因组被测序:拟南芥(Arabidopsis thaliana)。12月4日出版的《Nature》杂志报道了拟南芥完整基因组测序工作完成并首次发表了其完整基因组序列。这成为植物科学史上的一个重要里程碑。科学家已经绘制出拟南芥的基本基因图谱,其中包含11600万个碱基对,编码大约26000个基因。
2001年
人类基因组序列的草图公布——31,000个预测基因,基因组的95%是非编码的。人类基因组测序公共组在2001年2月15日的《nature》杂志上公开发表了人类基因组计划的拼接和分析结果,同时,Celera公司在2月16日的《science》杂志上发表了他们的结果。
2004年
人类基因组的常染色质序列完成;预测的基因数量降至24,000。2004年10月,人类基因组测序公共组在《自然》周刊上发表了人类基因组常染色质全序列测定的论文,宣布人类基因组的常染色质部分中99%的序列已经被测定,其精度达到每10万个碱基中只有一个测量误差。
2005年
454 Life Science推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序的先河,也成为第二代测序的先锋。它的产量为20,000,000个碱基/天。
2006年
美国和英国科学家于5月18日在英国《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序。这标志着历时16年的人类基因组计划书写完了最后一个章节。
2007年
美国贝勒医学院和454 Life Science共同完成了DNA双螺旋发现者之一沃森的个人基因组的测序工作,并将图谱数据免费赠予沃森。这项工作历时4个月,大约花费150万美元。
10月,Applied Biosystems公司推出SOLiD系统,每轮运行可产生超过40亿碱基的可定位数据,原始碱基数据的准确度大于99.94%,而在15×覆盖率时的准确度更达到99.999%。
2008年
10月11日深圳华大基因对外宣布,他们已经成功绘制完成第一个完整中国人基因组图谱(又称“炎黄一号”),这也是第一个亚洲人全基因序列图谱。这个研究成果登上了11月6日的《nature》杂志封面。其中所用的基因组DNA来自杨焕明院士,前北京基因组研究所所长,也是文章的作者之一。研究人员利用Illumina公司的Genome Analyzer测序仪对整个基因组进行测序,测序数据总量达到1177亿碱基对,基因组平均测序深度达到36倍,有效覆盖率高达99.97%,变异检测精度达99.9%以上。
同年,第一张女性个人基因组图谱、第一张癌症基因组图谱、第一张非洲人基因组图谱也陆续出炉。
2009年
第三代测序风起云涌。多家第三代测序公司如Complete Genomics、Pacific Biosciences和Helicos Biosciences纷纷计划推出自己的测序系统或服务,欲与第二代测序一争高下。
更多物种的基因组图谱出炉。