廖奇博士最新文章首次长非编码RNA大规模功能预测

来源:生物通 发布时间:2011年04月02日 浏览次数: 【字体: 收藏 打印文章

近日中科院计算所生物信息学研究组在长非编码RNA(lncRNAs)功能研究中取得新进展,首次利用生物信息学分析方法对小鼠的长非编码RNA进行大规模的功能预测。相关成果论文在线发表在2011年1月18日的《核酸研究》(Nucleic  Acids  Research)杂志上。

目前,很多研究表明哺乳动物中存在非编码RNA,随着二代测序技术的发展,大量的长ncRNAs在人和小鼠中被发现,并可能与许多重要的生物学过程相关(如基因组印记、细胞分化、免疫反应等)。探索lncRNAs的功能已经成为当前的一个研究热点,但是由于实验数据的不足,目前对于lncRNAs的功能研究进展缓慢,因此挖掘lncRNAs可能的功能已成为了生物信息科学家们迫切研究的、具有挑战的问题之一。

Affymetrix芯片作为一种广泛应用的主流基因芯片,至今已积累了大量公共的基因表达谱数据。随着基因组信息的快速更新,Affymetrix芯片的探针序列对应基因组的注释的准确度也在不断提高。Affymetrix芯片部分探针序  列设计来源于表达短序列标签(ESTs),随着基因组、转录组数据的更新,许多ESTs其实对应到转录出的非编码RNA。通过对芯片探针序列重注释从现有的Affymetrix芯片数据中挖掘出大规模的lncRNAs的表达谱数据,将为lncRNAs的研究提供重要的资源。

在这篇文章中,作者首次重注释Affymetrix小鼠基因组430  2.0芯片平台的探针,得到蛋白编码基因和lncRNA的表达谱数据,并根据这些表达谱数据构建出蛋白编码基因和lncRNAs的双色共表达网络,基于该网络的拓扑结构,利用中心节点(Hub)、网络模块以及基因组共定位的方法对lncRNAs进行大规模的功能预测。共有340个lncRNAs被预测出功能,这些功能主要集中在神经元、眼、肌肉发育,神经递质转运以及代谢过程等。

该研究提出的基因芯片探针重注释策略为lncRNAs的功能研究提供了新线索和研究方法。通过基因芯片探针重注释策略重新挖掘已有的基因表达谱信息,得到lncRNAs的表达谱数据,为lncRNAs的研究提供了大量的数据资源;基于此方法对小鼠lncRNAs进行大规模的功能预测,为分子生物学实验提供了重要的线索。同时该研究组提供了长非编码RNA功能预测的在线服务:ncFANs(ncRNA  Function  ANnotation  Server),为广大科学工作者提供小鼠和人的lncRNAs功能预测服务(<http://www.ebiomed.org/ncFANs>)。

论文的通讯作者为中国科学院计算技术研究所赵屹副研究员与中山大学吴忠道教授,论文第一作者为廖奇博士及刘长宁博士。该研究得到国家863计划、中科院北京生命科学研究院创新方向项目的基金支持。赵屹副研究员一直致力于生物网络及非编码RNA的生物信息学研究,其研究组与生物物理所陈润生院士实验室共同开发维护的非编码RNA数据库:NONCODE在国内外非编码RNA研究领域中有较高的影响力,Science杂志曾对该数据库进行了专门的报道。

Baidu
map