目的基因序列优化设计

来源:《基因修饰小鼠制备常用技术》 发布时间:2016年03月18日 浏览次数: 【字体: 收藏 打印文章

目的基因(target gene)的编码序列含有遗传信息。有时为了优化编码序列,提高翻译的效率,还需要加入其他序列(如Kozak序列)到起始密码子附近。在载体设计中引入各种附加元件有助于精确控制外源基因编码序列的高表达。

1.内含子序列

可以正向或反向地影响到基因的表达,这取决于这些序列是否含有UTR或者转录调控元件以及酶切位点等。大多数真核生物的基因都含有内含子将外显子分隔开。内含子(intron)由若干元件构成:5'剪接位、分支点序列、富含嘧啶序列、3'剪接位以及剪接增强子和沉默子。绝大多数内含子都有两个高度保守的双核苷酸。比如在供体位,其5'端有一个GU刚好位于切割位置后,而内含子的末端特征是有一个AG。供体和接入位点的共同识别序列分别是CAG,GUA/

GAGUA/UGGG和nCAGG。内含子接入位点位于富含嘧啶序列之前,其上游为共识序列C/UNCUGAC的分支点序列。在前一个接入位点上的外显子下游也有一个富含GAA/G的区域。外显子中剪接增强子的存在能极大地促进内含子的切除和成熟mRNA向细胞质的外送。

在载体设计中,在cDNA前至少加入1个内含子会促进cDNA的表达。而为了切除内含子,则需要在第一个和最后一个外显子中包含剪接增强子序列。由于某些内含子含有转录因子结合位点,为了提高转录效率,往往在载体构建时加入目的基因的第一个或者前几个内含子或转录因子结合位点序列。

2.Kozak序列

Kozak等发现在许多基因的AUG区域翻译起始位点上游都含有一段通用序列,GCCA/GCCAUGG。尽管该序列对于翻译的起始不是必需的,但为了稳妥起见,cDNA中还要包括围绕翻译起始位点(AUG)的序列以增强其翻译水平。

3.MARs(核基质附着区)序列

有些内含子的加入有利于mRNA从细胞核的转出,这些内含子含有富含AT的MARs。本序列的加入对于保护转基因表达不受整合位点的正或反向影响有帮助。

4.Insulator序列

为长约几百个bp的DNA序列,它位于启动子与正调控元件(增强子)或负调控因子(异染色质)之间,负责隔绝插入位点两侧的染色体序列对该启动子可能的激活或者沉默影响。因为转基因往往有多个拷贝,容易形成外源基因的直接重复形式。如果在载体的末端加入绝缘子序列,就能遏制绝大部分转基因转录。比如鸡β-珠蛋白基因座5'HS4区域可以防止该基因座对位于附近的该基因启动子的干扰,具有抑制增强子效应和防止转基因消失效能。

5.IRES序列

该序列允许mRNA上的某段序列启动翻译过程。可以用于实现多顺反子转录。在各个顺反子间加入IRES,往往代表着各个顺反子的翻译效率会出现差异。操作时,切记使目的转录本的3'编码序列的翻译效率低于5'端序列。一般第一个顺反子的终止密码子与IRES的起始序列间隔80 bp左右时,IRES能发挥最佳的效果。

6.信号肽

考虑到翻译蛋白的最终去向,对于分泌性蛋白或者核(NLS)、内质网(KDEL)或者线粒体定位蛋白等,需要在其cDNA的3'或者5'OH端上加上/剔除编码信号肽的序列。比如,可以将人生长激素通过3'端加上膜定位序列,靶向转运到细胞膜上。此外,胞质膜中有些蛋白与锚定在胞膜上的葡萄糖磷脂酰肌醇(GPI)结构共价连接。将分泌性真皮蛋白A(hypodermin A)通过GPI连接,即可使其形成结合型蛋白,而不丧失其抗补体的活性。还比如,通过将微管的组分蛋白Tau的调控元件与GFP融合,即可实现将GFP靶向到特定的细胞区域。

7.终止密码子

对于终止密码子,天然的mRNA的终止密码子一般存在于最后1个外显子或距离后面的剪接供体位不到50 bp的位置。在序列中过早出现终止密码子会影响对密码子前面的内含子的正常剪切。

8.E2A序列

其所对应的RNA序列可以介导翻译时核糖体的跳跃,实现从同一转录本中获得两段连续的多肽的目的。从E2A框上游翻译获得的多肽会保留E2A序列作为其C末端标签。

Baidu
map