陈润生院士:精准医学才刚刚上路
自从精准医学成为大众热词以后,大家认为我们现在什么都可以精准,医学很容易精准了,但是我个人的观点是,精准医学虽然从本质上可能带来变革,可能引导新的产业的发展,也许产业规模是巨大的,但是现在才刚刚上路,才刚刚开始。因为在精准医学的概念下,我们目前依然存在着巨大的挑战,依然存在着巨大的困难。
为什么说精准医学才刚刚上路呢?我们的创新的机遇在哪里?我们的挑战在哪儿?拿组学来举一个例子。当前,在我们人类的遗传密码当中,还存在着大量的“暗信息”,即人类的遗传密码目前我们能够从规律上分析的只有一小部分,其他还不能分析的就是基因组当中的所谓暗信息。人类的基因组有约30亿个碱基对,即大概有30亿个遗传密码。如果在一页纸上打印3000个遗传密码,100页装订成册,会有1万本书;如果一万册书每本厚1厘米,那么我们的基因密码书就是100米高。如果你全都读懂了,你就能做到完全精准。但此前,集全世界的科学家之力,我们完成了人类基因组测序计划。但人类基因组的编码序列约1亿碱基对,只占到3%,而非编码序列,除已知对基因起调节作用或参与染色体构建和功能活动的小部分外,大多数序列还不清楚。也就是说,迄今为止我们的遗传密码97%是暗的。因此,对整个非编码RNA的研究,是基因组学当中的一个巨大的障碍。
进入21世纪,科学家提出问题,说这些我们还不了解的、占人类基因组97%的暗物质遗传密码,那是否有转录产物,是否有信息发放?这个结果是100%肯定的,这些非编码序RNA和我们制造蛋白的那些基因一样,每时每刻都在表达,每时每刻都在起作用。以肿瘤发病为例来说,现在临床医学用的所谓分子标记以及肿瘤所谓“靶向治疗”的靶点,全是来自那3%,但有很多例子证明,非编码RNA也和肿瘤的发病有关。就是说,我们还有一个97%与疾病情况有关的东西,迄今没有那么融入到我们诊断治疗的视野当中,这就是精准医学面临着组学的所谓的暗信息的巨大挑战。
此外,精准医学的基础是组学大数据,包括组学和大数据都存在着挑战。比如组学,我们很容易测量得到数据,但对数据的内涵大部分我们并不知道;同时,从大数据的挖掘本身也有很多问题,包括数据本身生物学含义的挖掘,包括数据样本、数据集本身的缺陷等等,都依然存在很多问题。但从另外一方面讲这也是一个机会,我们对于未知数据的研究,了解一点,我们就可以推进一点,然后应用一点,从而推动整个精准医学的发展。