小鼠由于遗传背景清楚、品系较齐全,一直被捉为遗传学分析首选的实验动物。在人来基因组计划中,小鼠也被作为重要的模式动物。小鼠基因组作图、改造和控制,对疾病相关基因的识别、克隆功能分析以及人类疾病模型的建立及研究具有重要意义,已成为当今实验动物学的前沿领域。本届将介绍小鼠基因组作图及其应用。
(一)小鼠基因组作图
所谓基因组作图(genome mapping),就是先后绘制出遗传图谱(genetic map)、物理图谱(physical map)和转录图谱(transcription map)以及序列图谱(sequence map),以弄清整个基因组的结构与功能。这些图谱都反映出一定的遗传涵义,但所用尺度不同。遗传图谱为大尺度图谱,图距单位为 cM(毫摩);物理图谱为中等尺度图谱,图距单位为Kb(千碱基对)。遗传图谱是整个基因组研究的基础,只有绘制出遗传图谱后才能进一步绘制出物理图谱和转录图谱(如图)。
图:基因组研究步骤
1、遗传图谱 又称连锁图谱(linkage map),是以具有多态性的遗传标记为路标,以两个位点的交换率为图距的图谱。绘制遗传图谱的方法,过去主要是通过将携带有突变基因的近交系小鼠与带有数个遗传标记(通常为已定位的生化位点和突变所致的生理缺陷)的特殊连锁测试群互交,再回交,然后计算互换率来进行。但这种方法因可选择的遗传标记少,效率极低,花了75年所绘制的连锁图仅包括965个位点。近年来,采用种间杂交、亚种间杂交,特别是简单序列长度多态性标记(simple sequence length polymorphism SSLP)等分子标记技术,加快了小鼠遗传图谱绘制的进程。
(1)种间杂交:是将携带有突变基因的近交系小鼠与Mus属种的远缘鼠种交配,再回交来进行基因定位。如(C57BL/6JXMus spretus)F1*C57BL/6J。由于杂交亲本遗传多态程度高,单一种间交配即能获得足够的信息进行分析。
(2)SSLP标记 在小鼠基因组中已鉴定出数量众多(5 000多个)的SSLP标记(也称卫星DNA),它们多为2~4个核苷酸序列重复。这种简单序列重复在品系之间具有约50%的多态性,在种间或亚种间具有约95%的多态性。因此,把它们作为遗产标记,通过PCR检测,可以快速绘制出任何杂交形式(无论是种间还是品系间)的小鼠遗传图谱。通过此方法绘制出小鼠遗传图谱,1993年报道为1 518个位点,1994年达到4 006 哥,1995增至6 200 个,平均图距达0.24cM,相当于500Kb。1996年又很快增加到7 377个位点,图距缩小到0.2cM,相当于400Kb。
2、物理图谱 是以已定位的DNA序列标记位点(sequencing tagged sites,STS,其定义是染色体定位明确,而且可用PCR扩增的单靠被序列)为路标,以DNA的实际长度bp(碱基对)、Kb、Mb为图距的基因图谱。其方法是利用限制性内切酶将小鼠切割不同大小片断,再根据重叠序列把片断连接起来。第一步是将获得的目的基因的cDNA克隆,进行测序,确定两端的cDNA序列,约200bp,设计合成引物,并分别利用cDNA和基因组DNA作为模板扩增,比较并纯化特异带,利用STS制备放射性探针与基因组进行原位杂交,确定间隔约为100Kb的标记。第二步是在此基础上构建覆盖每条染色体的大片段DNA。先对数百个Kb酵母人工染色体(yeast artificial chromosome ,YAC)进行作图,得到重叠的YAC连续克隆系(即低精度物理作图);然后再及是个Kb的DNA片段上进行作图,将YAC随机切割后装入粘粒(即高精度物理作图)。目前,以构建了小鼠YAC文库,并标出了9787个标记位点,相邻位点间的距离为300Kb,每个YAC克隆平均含有820Kb小鼠染色体DNA,所有YAC共覆盖了小鼠基因组的92%。
3、转录图谱 又称表达图谱(expression map)或外显子图谱(exon map),是基因图(gene map)的雏形。其技术路线是,先将基因转录产物(mRNA)进行反转录,构建cDNA文库,文库中的cDNA绝大部分是短的片段,称之为表达序列表千(expressed sequence tag, EST),再利用全套EST与YAC文库杂交,确定已被定位于染色体的相应位置。
4、基因组测序 为最精细的作图,即通过序列测定,绘制出基因组的全部核苷酸序列。小鼠基因组测序(genomic sequencing)目前正在积极展开,预计2003年可完成全序列图。
(二) 小鼠基因图谱的应用
小鼠基因图谱的应用广泛,这里只介绍在基因组比较研究、突变基因的定位与克隆、人类疾病动物模型的建立等方面的应用。
1、基因组的比较研究 由于同源基因在进化上的保守性,小鼠和人类等生物的基因组可以互相参照。一个基因一旦在一种生物定位后,就可能很容易地在另一种生物钟定位。有人发现,定位于小鼠2号染色体上的59个位点,有29个能在人类染色体上定位,且在小鼠连锁的基因,在人类也连锁。这样,作为一种比较图谱,可以加快其他生物包括人类的基因组研究。
2、突变基因的定位与克隆 突变基因一直是基因结构与功能分析的有用工具。但过去发现得多,定位与克隆得少,原因是不清楚突变基因的连锁关系。利用已绘制的小鼠高密度基因遗传图谱,将突变基因定位和克隆就容易多了。方法是将一个突变基因在小鼠图谱中定位后,可以观察定位在附近的表型异常是否有一种表型与定位基因引起的缺陷一致。如果发现合理的联系,就可以对有问题的基因进行分子鉴定以识别突变。通过这种方法,已定位和克隆了小鼠近百种人类疾病相关基因。
3、建立人类遗传疾病的小鼠模型 对小鼠基因组研究的目的不仅在于了解小鼠本身的基因结构,更主要的是为人类基因组研究、人类遗传疾病研究提供动物模型。小鼠基因组的大小与人类的相同,均含有约50 000个基因。这些基因有许多又都是同源的。所以,小鼠一直是人类遗传疾病研究首选的实验动物。如前所述,小鼠基因图谱的建立有利于人类遗传疾病基因的定位和克隆。例如:新的基因被定位在小鼠的高密度遗传图谱上,可以获得人、鼠比较图谱种的相当多的信息,由此预测该基因在人类基因组中的位置,比直接在人类基因组中定位该基因要容易得多。如果被定位的基因正是人类某遗传疾病基因,那么这只小鼠就成了研究该基因及其引起的遗传疾病的良好动物模型。
建立人类遗传疾病小鼠模型的主要方法,一是直接利用同源基因或将与人类遗传疾病基因连锁的探针定位于小鼠染色体上,寻找与人类遗传病表型相似的突变;二是利用基于同源重组原理的基因打靶(gene targeting)技术将小鼠相关基因剔除,制作基因剔除小鼠;三是制作转基因小鼠;四是制作基因替换小鼠。
小鼠基因图谱也为人类复合性状疾病(多基因遗传疾病)研究提供了便利。在人类确定引起复合性状疾病的多基因位点非常难,但在小鼠种容易做到。即通过比较人和小鼠基因图谱,鉴别同与该疾病有关的区域,然后克隆该区域的有关基因建立转基因小鼠,用于表型分析,直至逐步缩小区域范围,从中找到易感基因。目前,已在小鼠中鉴定出多种复合性状疾病的相关基因,如动脉粥样硬化、癫痫、糖尿病、肥胖症等。
与小鼠疾病模型相关的一系列生物信息数据库已经建立。它们作为重要的资源,可被用作相关的研究。可以说,现在有很多工作只要在互联网上就可进行,这类研究的对象就叫做“电子小鼠”。进行“电子小鼠”研究的数据库不少。例如:美国Jackson实验室的“小鼠基因组数据库”、“小鼠基因表达数据库”、“小鼠基因组百科全书”、“小鼠位点基遗传标记目录”、“小鼠突变体资源库”等,英国的“啮齿类基因组数据库”、“小鼠细胞遗传图谱”、“畸形人鼠同源性数据库”等。