DNA元件百科全书计划(ENCODE,the Encyclopedia of DNA Elements)是全球科学家们不断努力进行的一项研究计划,旨在理解人类基因组的功能,随着这一计划最新研究阶段的完成,该计划已经从人类和小鼠基因组中加入了数百万个候选的DNA开关,这些DNA开关似乎能调节基因表达的时间和位点,同时一个新的“注册表”也将会将一部分DNA开关分配到游泳的生物类别中去,该研究计划还提供了新的可视化的工具来帮助利用ENCODE计划的大型数据库。
图片来源:Pixabay/CC0 Public Domain
近日,一项刊登在国际杂志Nature上题为“Perspectives on ENCOD”的研究报告中,来自美国国家人类基因组研究所等机构的科学家们完成了另外13项深度的研究,研究者Eric Green博士表示,ENCODE 3计划的一个主要优先任务就是寻找方法来与更广泛的研究群体共享数千个ENCODE实验数据,从而帮助扩展科学家们对基因组功能的理解,ENCODE 3计划中搜索和可视化的工具就能适当这些数据能被访问,从而就能推动科学家们在开放科学上的努力。
为了评估不同DNA区域的潜在功能,研究人员研究了与调节基因表达开关相关的生化过程,这种生化方法就是一种有效的方法,其能帮助快速深入全面地剖析完整的基因组,此外,这种方法还能帮助在DNA中锁定能预测元件功能的区域(基于这些生化特性),随后研究者就能对候选区域进行深入研究来识别其在基因调节中的功能性角色和特性。研究者Elise Feingold博士说道,ENCODE计划的一个关键挑战是,不同的基因和功能性区域在不同的细胞类型中处于活跃状态,这就意味着,研究人员需要对大规模多样化的生物样本进行监测来绘制出基因组中候选功能元件的目录;如今研究人员在对蛋白编码基因的特性研究上取得了一定的进展,这些基因在基因组中占比不到2%,而它们对其余98%的基因组却知之甚少,而这项研究计划就能帮忙填补其中的研究空白。
人类机体由数万亿个细胞组成,细胞的种类就高达几千种,尽管这些细胞共享有相同的一套DNA指令,但不同类型的细胞却会通过以不同方式利用DNA编码的信息来发挥不同的功能,特殊的DNA区域就能扮演开关的角色来开启/关闭基因的表达,或者调解基因活性的具体水平,并能帮助驱动机体中不同细胞类型的形成,也能指导其在健康机体和患病个体中的功能。
在最近完成的ENCODE第三阶段研究计划中,研究人员进行了近乎6000次试验(人类中4834次,小鼠中1158次)来阐明各自基因组中基因及其潜在调节子的细节信息;进行第三阶段研究的科学家们对发育中的胚胎小鼠组织进行研究揭示了小鼠在发育过程中所发生的多种基因组和生化改变,因基因组和生物学与人类极为相似,对小鼠进行研究或能帮助理解人类机体的生物学特性和疾病发生的机制。研究人员在多种生物学背景下对人类和小鼠进行了相关实验,他们分析了对DNA化学修饰、与DNA结合的蛋白质、以及RNA之间的相互作用 如何调节基因的表达,ENCODE第三阶段的研究成果或能帮助研究人员理解蛋白质编码区域外DNA元件的变化如何影响基因的表达,甚至是远离特殊突变本身的基因的表达等。
研究者Brenton Graveley教授说道,ENCODE 3计划所产生的数据或能帮助我们更加深入地理解人类基因组,同时该计划还能为此前的数据类型(DNA结合蛋白和染色质标记)和新的数据类型(长程DNA相互作用和蛋白质-RNA相互作用)增加巨大的分辨率和清晰度,此外,研究人员还创建了一个新型的资源库,其详细介绍了不同种类的DNA区域和相应的候选功能,其中一种名为SCREEN的网络工具就能帮助用于清楚观察到支持相关解释的数据。
ENCODE计划开始于2003年,其是一项涵盖美国和全球等多个国家研究人员的一项广泛的合作计划,由500多名具有不同专业指示的研究者组成;随着该计划的持续深入进行,研究人员获得的相关研究数据或能帮助开发治疗多种人类疾病的新型疗法,同时也能将基础生物学知识与人类的大健康联系起来。
参考资料:
【1】ENCODE: Encyclopedia of DNA Elements
【2】Abascal, F., Acosta, R., Addleman, N.J. et al. Perspectives on ENCODE. Nature 583, 693–698 (2020). doi:10.1038/s41586-020-2449-8
【3】ENCODE 3 project details the inner workings of the human and mouse genome