家犬作为人类生活和工作中的伙伴,其进化研究一直是遗传学研究中的一个热点。然而目前使用的家犬参考SNP数据集,不仅数量少,采样地不够广泛,而且测序覆盖度差异大,SNP数据主要只来源于两个品种的两个犬只,并不利于家犬的群体遗传研究。
目前,二代测序产生了大量高质量的家犬和其祖先物种灰狼的全基因数据。为了弥补参考SNP数据集的不足及满足大数据复用的需求,在中国科学院昆明动物研究所张亚平院士和王国栋博士的指导下,云南大学白冰博士联合中国科学院北京基因组研究所赵文明老师和唐碧霞博士,建立了第一个犬类SNP数据库——DoGSD。该数据库中包含了参考SNP数据集,69个家犬及8个灰狼的全基因组SNP数据, 所包含的SNP数量是原参考数据集的7倍。DoGSD弥补了原数据集采样地少,覆盖度差异大的问题,并且第一次在SNP数据集加入了中国土狗的数据。DoGSD为用户提供了友好的检索、查询及下载页面, 其中的同义/非同义SNP检索页面,比较查询功能将为用户检索基因相关SNP及观察个体间SNP的差异提供很大的方便。此外,DoGSD第一次在数据库中提供了重要的群体遗传学参数的计算结果:Fst和等位基因频率,方便用户筛选和进一步分析有选择信号的SNP。
该研究结果(DoGSD: the dog and wolf genome SNP database)近期在Nucleic Acids Research 在线发表。白冰、赵文明和唐碧霞为并列第一作者,张亚平院士与王国栋博士为共同通讯作者。