CRISPR的原理
多种CRISPR系统,其原理你真的造么?
CRISPR/Cas技术是一种最新涌现的基因组编辑工具,能够完成RNA导向的DNA识别及编辑。这对比依赖于DNA序列特异性结合蛋白模块的TALEN及ZFN技术,更显简便快捷。CRISPR/Cas技术使用一段序列特异性向导RNA分子(sequence-specific guide RNA)引导核酸内切酶到靶点处,从而完成基因组的编辑。其开发更是为构建更高效的基因定点修饰技术提供了全新的平台。
CRISPR/Cas系统元件与特征
CRISPR/Cas系统最早是在细菌的天然免疫系统内发现的,其主要功能是对抗入侵的病毒及外源DNA。1987年大阪大学的研究人员在E.coli K12 的碱性磷酸酶基因附近发现了成簇的规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeat, CRISPR),其结构如图所示,目前普遍认为有40%的细菌基因组具有这样的结构。
CRISPR/Cas系统由CRISPR序列元件与Cas基因家族组成。其中CRISPR由一系列高度保守的重复序列与同样高度保守的间隔序列相间排列组成。而在CRISPR附近区域还存在着一部分高度保守的CRISPR相关基因(CRISPR-associated gene, Cas gene),这些基因编码的蛋白具有核酸酶活性的功能域,可以对DNA序列进行特异性的切割。
CRISPR的结构(以嗜热链球菌LMD-9基因组CRISPR系统的位点为例)
(上)Cas基因由蓝色表示,包括cas1和cas2,II类系统特征基因cas9和csn2。CRISPR由黑色表示。
(下)CRISPR的重复序列和间隔物序列分别用黑色菱形、灰色长方形表示。L,前端;T,末端重复;数字代表间隔物序列被获取的顺序。
CRISPR/Cas系统工作原理
CRISPR/Cas作为原核生物中普遍存在的一种系统,最初的功能就是识别外源性入侵的核酸序列,并对其进行特异性降解,以达到抗病毒的作用。这一过程分两步进行——crRNA的合成 及 在crRNA引导下的RNA结合与剪切,具体机制如图所示。
1)crRNA的生物学合成
CRISPR区域第一个重复序列上游有一段CRISPR的前导序列,该序列作为启动子来启动后续CRISPR序列的转录,转录生成的RNA被命名为CRISPR RNA(简称crRNA)。
2)RNA的结合与剪切
CRISPR/Cas系统中crRNA与tracrRNA(反式激活的crRNA)形成嵌合RNA分子,即单向导RNA(Single guide RNA, sgRNA)。sgRNA可以介导Cas9蛋白在特定序列处进行切割,形成DNA双链断裂,完成基因定向编辑等的各类操作。
不同类型的CRISPR/Cas系统
根据功能元件的不同,CRISPR/Cas系统可以分为I类系统、II类系统和III类系统。这三类系统又可以根据其编码Cas蛋白的基因不同而分为更多的亚类。不同类型CRISPR/Cas系统完成干扰的步骤也有所不同。
三种不同的CRISPR/Cas干扰系统作用步骤
共分三种,共同点是都具有DNA区域(蓝色)、靶向crRNA(红色)和原间隔物模块(PAM,绿色)。
在I类系统(A)中,入侵的DNA有Cascade:crRNA复合体识别,PAM模块则能促进外源性DNA的识别,随后核酸酶Cas3被募集并将目标DNA降解。
在II类系统(B)中,只需要单独的Cas9蛋白即可完成干扰,并不依赖一个多蛋白复合体,Cas9和反式激活的crRNA(tracrRNA)、前crRNA(pre-crRNA)形成复合体,该复合体促使RNA酶III将前crRNA加工为成熟的crRNA。
在III类系统(C)中,一个多蛋白复合体(Csm或Cmr)或Cas6促进前crRNA转化为成熟的crRNA,最终导致目标DNA的降解。
I类和III类CRISPR/Cas系统进行干扰时只需要crRNA和Cas蛋白两种元件的参与,而II类CRISPR/Cas系统包括crRNA、tracrRNA和Cas蛋白三种元件。根据Cas蛋白的类型不同分为三个亚类:II-A类含有Cas1、Cas2、Cas9和Csn2样蛋白;II-B类含有Cas1、Cas2、Cas4和Csx12样Cas9四种蛋白;II-C类则有Cas1、Cas2及Cas9三种蛋白。
II类CRISPR/Cas系统最先在改造后用于小鼠和人类基因组编辑,同时也是目前研究最为充分的系统,其靶向基因组编辑的步骤如图所示。
Cas复合体系统靶向基因组编辑的步骤
将编码密码子优化的Cas9(红色)序列、一段核定位序列(NLS)和一段包括目标靶序列的小向导RNA(sgRNA,黄色)序列同时构建在一个质粒中,再将质粒转染进目标细胞。一个有功能的sgRNA:Cas9干扰复合体会在细胞内完成组装,该复合体会在PAM结构的上游目标DNA序列上诱导产生一个双链断裂(DSB),而DSB则能被宿主细胞的DNA修复系统、同源重组系统(HR)和非同源末端连接途径(NHEJ)修复。HR系统以宿主的等位基因为模板复原野生型序列,将序列恢复为断裂前的状态;而容易出错的NHEJ系统则会在目标位点(灰色)引入插入和删失。使用一段合成的供体DNA模板与Cas系统质粒共转染,可以诱导HR(蓝色),提高编辑效率。