2020年10 月 7 日,瑞典皇家科学院宣布,将诺贝尔化学奖授予法国埃马纽埃尔·卡彭蒂耶(Emmanuelle Charpentier)和美国詹妮弗·杜德纳(Jennifer A. Doudna)以表彰她们开发出一种基因组编辑的方法——CRISPR/Cas9,再次将基因编辑推入大众视野。其实从基因编辑方法被提出以来此领域就不乏热点,那么今天小编就带大家一起来探索一下基因魔剪的前世今生,以及时下的研发热点,看看什么方向适合你。
基因编辑技术是一种通过使用靶序列特异性工程核酸酶来操纵真核基因组的新兴治疗手段,包括模型细胞系的开发、疾病机理的发现、疾病靶标的确定、转基因动植物的开发和转录调节。由于基因编辑技术在促进基因组中序列的正确校正方面所具有的特殊优势,基于基因编辑的疗法正被积极地开发为治疗多种疾病的下一代治疗方法。到目前为止基因编辑系统历经3代,包括锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)和CRISPR/Cas9。
NO.1 锌指核酸酶
Zinc-finger Nuclease (ZFN)
通常基因插入/删除步骤包括(1)基因组的某确定区域双链断裂(DSB),(2)修正缺陷内源基因或引入外源基因,(3)DSB修复。真核生物中的DSB修复有两种内源性修复机制:非同源末端连接(NHEJ)或同源直接修复(HDR)。NHEJ在生物体内发生频率高,但准确性低。为了降低非特异性突变,提高基因编辑保真度,研发人员开发了一种工程核酸酶——锌指核酸酶(ZFN)。
ZFN技术诞生于1996年,直到2002年,Bibikova等第一次用ZFN的方法通过在果蝇中成功突变了yellow基因。ZFN是Cys2-His2锌指蛋白(ZFP)和衍生自FokI核酸内切酶的非特异性DNA限制酶的融合蛋白,可靶向的DNA裂解试剂,已被用作基因靶向工具,ZFPs在真核细胞中很常见,并与转录调控和蛋白质-蛋白质相互作用相关。ZFN的DNA结合域通常含有3个独立的ZF重复结构,每个ZF结构能够识别3个碱基,因而一个锌指DNA结合域可以识别9bp特异性序列,ZFN二聚体(含6个锌指)可以识别18bp长度的特异性序列。ZFN诱导的双链断裂易受细胞DNA修复过程的影响,从而导致靶向诱变和靶向基因的替换均以非常高的频率进行。目前最常用的ZF结构为Cys2His2锌指。
美国Sangamo公司在ZFN技术上一直全球领先,多项基于此技术的疾病疗法都进入了临床试验阶段,例如与Sanofi子公司Bioverativ合作推进的血红蛋白病基因疗法。ZFN技术虽然实用,但易产生脱靶现象,因为ZFN作用需要两个FokI切割区域的二聚化,且至少需要一个识别单元结合DNA,一旦形成异源二聚体,就很可能造成脱靶效应,并最终导致DNA错配和序列改变,当断裂的数目超过了DNA的修复能力会产生较强的细胞毒性。ZFN另外一个缺点是亲和力不高,虽然Sangamo和Sigma-Aldrich优化设计用较短接头连接ZF模块可以提高其特异性,但利用此技术来获得高质量基因编辑产品还有较长路要走。
▲ ZFN诱导双链断裂修复示意图[1]
NO.2 转录激活子样效应子核酸酶
Transcription Activator-Like Effector Nuclease (TALEN)
继ZFN后,第二代人工核酸酶技术——转录激活子样效应子核酸酶(TALEN)于2009年诞生。TALEN作为ZFN的替代品与ZFN类似,包含与目的DNA结合域融合的非特异性FokI核酸酶域,该DNA结合结构域由高度保守的氨基酸重复序列组成,这些重复序列来自由黄单胞菌细菌分泌的蛋白——转录激活子样效应物(TALE),包含33-35个氨基酸。该技术利用TALE重复结构域中氨基酸序列与其靶位点核酸序列之间有着对应的“氨基酸—DNA”关系,从而能快速设计出特异性结合目的DNA的蛋白模块。目前,几乎所有工程TALE重复序列都使用四个具有高变残基NN、NI、HD、NG的域,分别识别G、A、C、T。
与ZFN相比,两者的成本都较高,TALEN的设计和使用相对简单,用时更短,虽然也存在脱靶效应,但TALENs比ZFNs特异性更高且细胞毒性更小。但值得一提的是,TALEN比ZFN大,大概3 kb的cDNA编码一个TALEN,而编码单个ZFN仅需1 kb,这使得TALEN的递送更具挑战性。
▲ a. TALEN示意图;
b. TALEN结合并切割为目标DNA位点上的二聚体[2]
NO.3 规律间隔成簇短回文重复序列
Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)
CRISPR/Cas系统是第三代基因编辑工具,是一种原核生物的适应性免疫系统,是细菌和病毒进行斗争产生的免疫武器,用来抵抗外源遗传物质的入侵,如噬菌体病毒和外源质粒等。简单来说,病毒感染细菌后将自己的基因整合到细菌基因组内用以繁殖,并通常在复制完成后杀死宿主细胞,为了回避这个致命的威胁,细菌进化出了强大的适应性免疫系统—CRISPR/Cas,它由一系列高度保守的短DNA重复序列组成,通常为21–48 bp的回文序列或短的反向重复序列,这些序列之间被称为间隔子的可变序列片段间隔开,通常介于26-72 bp之间,CRISPR阵列的第三部分是前导序列,其位于第一个重复序列上游,富含AT,约为200-500bp,包括必需的启动子序列。Cas的全称是CRISPR associated,是CRISPR基因座相邻基因,编码Cas蛋白,Cas蛋白提供了从入侵元件中获取新间隔子并靶向入侵元件所需的酶促机制。
基于系统发生机制和特定Cas蛋白,CRISPR/Cas系统目前分为六种类型,I–III型是研究最多的。每种类型可进一步细分为不同子类型,如类型I由IA到IF类型组成。每种类型都由所谓的特征蛋白指定,该蛋白以特定类型保守,但 cas1和cas2基因似乎是通用的,被发现存在于大多数CRISPR/Cas系统中。Cas3、Cas9和Cas10分别充当I,II和III型的标志蛋白。CRISPR/Cas9是目前研究得最多也是应用最成熟的基因编辑工具。下面小编以CRISPR/Cas9为例,介绍一下CRISPR/Cas系统的防御机制。
NO.4 CRISPR/Cas系统防御机制
4.1 外源DNA捕获
当病毒首次入侵宿主细菌并将DNA组注入细胞内部后,Cas1和Cas2蛋白将扫描这段外源DNA,识别DNA中的原间隔序列临近基序(protospacer adjacent motif,PAM),并截取原间隔序列(protospacer)整合到CRISPR序列前导区的 下游,随后DNA进行修复。
▲ CRISPR/Cas系统捕获外源DNA[3]
4.2 crRNA合成
CRISPR基因组由三个部分组成:tracrRNA基因、Cas基因、CRISPR重复序列和间隔区序列。当病毒再次入侵时,这些三部分被转录为tracrRNA,Cas蛋白和pre-crRNA。tracrRNA具有发卡结构,pre-crRNA是由整个CRISPR序列转录而成的大型RNA分子。随后,tracrRNA、pre-crRNA和Cas9形成复合物,并且由RNase III在重复序列处切割将pre-crRNA加工成crRNA,从而形成由crRNA引导的crRNA:tracrRNA:Cas9核酸内切酶复合物。
4.3 靶向干扰
随后,Cas9/RNA复合物随机扫描细胞中的DNA,首先寻找合适的PAM,识别出PAM序列后,如果被扫描的DNA序列与crRNA靶序列匹配,则Cas9/RNA复合体将从PAM序列后的前10–12个核苷酸解开DNA形成R-Loop。随后,Cas9的HNH核酸酶活性将切割crRNA互补的DNA链,而RuvC活性将切割非靶链,从而沉默外源DNA。
NO.5 CRISPR/Cas9系统的应用
第三代基因编辑技术CRISPR/Cas的出现为人类基因编辑提供了新的可能性,随着近年来分子生物学的快速发展,它已广泛应用于许多领域,特别是在遗传疾病治疗、疾病相关基因的筛选和检测、肿瘤治疗、动植物转化以及病原微生物的预防等领域具有巨大的潜力,可以有效改善人类的生活质量。
5.1 遗传疾病的矫正
CRISPR/Cas9最受关注的应用之一是其在治疗由单基因突变引起的遗传性疾病中有巨大潜力。如囊性纤维化(CF)、杜兴氏肌营养不良症(DMD)和血红蛋白病等。Tabebordbar等人使用腺相关病毒(AAV)递送CRISPR/Cas9系统,通过删除含有原始突变的外显子来恢复DMD小鼠模型中的肌营养不良蛋白表达,显示治疗的小鼠可部分恢复肌肉功能缺陷。Canver及其同事的研究表明CRISPR/Cas9破坏BCL11A增强子可在小鼠和原代人成红细胞中诱导胎儿血红蛋白,这种方法可使胎儿血红蛋白在血红蛋白异常的成人患者中表达,为镰状细胞病或地中海贫血等疾病的提供了新的治疗策略。
5.2 艾滋病毒的治疗
CRISPR/Cas9的另一个潜在临床应用是治疗感染性疾病,如HIV。尽管抗逆转录病毒疗法为HIV提供了有效的治疗方法,但由于病毒永久整合到宿主基因组中,目前尚无治愈方法。研究表明CRISPR/Cas9系统可靶向HIV-1基因组活性,使HIV基因的表达和复制失活,从而使其可以在多种细胞中潜伏感染,而没有任何毒性作用。
5.3 癌症治疗
CRISPR系统可结合CAR-T进行癌症治疗。CAR-T细胞疗法是一种利用CRISPR/Cas9技术将CAR基因递送至T细胞基因组特定部位的疗法。研究人员使用CRISPR敲除参与免疫排斥的两个基因:T细胞受体和Beta-2-微球蛋白可降低同种异体反应性,并降低CAR-T的抗原性,获得通用T细胞。
5.4 RNA编辑
张锋等人发现了两种靶向RNA的新型CRISPR系统。这些新系统利用具有类似特性的Cas酶,如Cas13a和Cas13b。Cas13a,以前称为C2c2,是一种RNA靶向酶。Cas13b具有靶向和编辑RNA的能力,仅需一个指导RNA即可找到靶标,并可靶向多个RNA转录本。该系统将使研究人员可以特异性地操纵RNA,并以高通量的方式使用CRISPR研究广泛的生物学过程。目前,已发现于2018年发现的Cas13d家族可干扰哺乳动物细胞系中的RNA以实现基因沉默。与RNA干扰技术相比,cas13d介导的基因沉默具有更高的特异性和敲除效率。与cas9介导的基因敲除技术相比,cas13d介导的基因沉默不会改变基因组DNA,因此这种基因沉默具有可逆性,在治疗某些后天代谢疾病方面具有显着优势。与其他Cas13家族蛋白相比,CasRx具有最高的RNA切割活性和最小的体积,使其更易于包装到AAV中以进行体内递送。
5.5 分子诊断
CRISPR系统还可用于分子诊断领域,通常使用四种Cas系统:Cas9,Cas12,Cas13和Cas14。张锋等人在Cas13a系统中引入了常温扩增DNA的RPA技术,并创建了一个新的技术平台——SHERLOCK,其技术的核心原理包括位点特异性扩增:若检测到DNA,则通过RPA扩增;若检测到RNA,则通过RT-RPA扩增。然后将扩增的DNA产物转录成RNA分子。靶RNA通过Cas13a-crRNA和报告RNA检测。由于其高灵敏度和特异性,这种CRISPR诊断技术具有巨大应用前景。
另外,有研究人员将CRISPR和石墨烯膜场效应晶体管技术相结合,创建了CRISPR-Chip技术。基于石墨烯的晶体管包含dCas9(仅可识别,无剪切)和sgRNA的复合物。将样品运到石墨烯膜上时,dCas9-sgRNA识别并结合到相应的靶DNA分子,晶体管发出电信号。在SHERLOCK和DETECTR中,“剪切”生成信号;在CRISPR-Chip中,结合会产生信号。
▲ CRISPR分子诊断技术中常用的四个Cas系统[6]
NO.6 CRISPR/Cas系统的递送方法
迄今为止,已有3000多个基因与致病突变相关,基因疗法治疗因基因突变导致的基本虽然普遍成功,但也受到了几次悲剧。在利用CRISPR/Cas治疗患有X连锁免疫缺陷症(SCID X-1)的儿童时,校正基因构建体被非特异性地插入部分患者的基因组中,导致5名儿童发展为T细胞白血病,其中1名儿童死于化疗难治性白血病。在另一场悲剧中,一名患有鸟氨酸转氨甲酰酶(OTC)部分缺乏症的18岁男性在接受治疗四小时后,对腺病毒载体产生了大规模的炎症反应而死亡,这两个悲剧都源于治疗性递送方法。所以,CRISPR/Cas系统的递送方法的选择对于基因治疗十分重要。
CRISPR/Cas9系统包装通常采用三种方法:(1)同时编码Cas9蛋白和sgRNA的DNA质粒,(2)用于Cas9翻译的mRNA和单独的sg RNA,(3)Cas9蛋白和sgRNA(核糖核蛋白复合体)。所使用的运送工具通常将决定采用哪种包装方式,以及该系统在体外和体内是否可用。例如,Cas9蛋白带正电,而寡核苷酸和Cas9:sgRNA带负电。另外,还须考虑如何严格控制Cas9的总体浓度。目前递送方式可分为三类:物理方法、病毒载体和非病毒载体。
6.1 物理方式
显微注射通常被认为是CRISPR系统递送的``金标准'',效率接近100%。此方法可将上述三种包装方式直接注射到单个细胞中,该过程绕过了与通过细胞外基质、细胞膜和细胞质成分递送相关的障碍。此外,显微注射不像病毒载体递送系统受载量限制。但此方法无法用于体内环境,而且显微注射在技术上是一项艰巨而费力的过程。
电穿孔技术利用脉冲高压电流瞬时打开悬浮在缓冲液中细胞的细胞膜,形成纳米级孔,从而使流体动力学直径为数十纳米的成分流入细胞。与其他递送技术相比,电穿孔对细胞类型的依赖性较小,并且可以有效地将组件转移到细胞中。同样,此方法无法用于体内环境。
流体动力传递可迅速且大量的(8-10%体重)将含有组件的溶液推入动物的血液,通常使用小鼠的尾静脉,大量液体会导致流体动力压增加,从而暂时增强对细胞的渗透性,使通常无法穿过细胞膜的组件进入细胞,如DNA质粒和蛋白质。使用这种方法递送的组件在肝脏中明显富集。此方法在技术上很简单且不需要任何外源传递组件即可成功地将基因编辑组件引入细胞。研究人员证使用流体动力学递送成功将编码Cas9和sgRNA的DNA质粒递送至肝细胞,从而在体内对遗传性酪氨酸血症小鼠肝细胞中的Fah突变进行了校正。尽管此方法取得了一些成功,但目前尚未临床应用,流体动力传递的过程是具有较大创伤性的,可能导致潜在的生理并发症,包括心脏功能障碍、血压升高和肝脏扩张,极易造成意外死亡,而且转染率非常低,并且仅适用于某些细胞类型的递送。
6.2 病毒载体的递送方法
➤ 腺相关病毒(AAV)
AAV是一种单链DNA病毒,已被广泛用于基因治疗,AAV存在多种已知血清型,能感染具有不同特异性的多种细胞。CRISPR/Cas9 AAV颗粒通常在HEK 293 T细胞中产生,合成的AAV可感染靶细胞系,使被感染的细胞能持续存在CRISPR/Cas9组件,基于AAV的基因传递方法可将传递的CRISPR基因整合到哺乳动物细胞的AAVS1基因座中。Tabebordbar等人使用两种不同的AAV载体分别通过肌内、眼眶后和腹膜内(IP)注射将sp Cas9和sgRNA递送至DMD模型出生后的mdx小鼠中,通过靶向敲除有缺陷的第23外显子以纠正DMD小鼠模型中突变的肌营养不良蛋白基因。但由于AAV的容量仅4.7 kb,Cas9基因的大小为4.3kbp。因此,必须使用两个单独的AAV载体分别递送Cas9基因和sgRNA。为了克服这种的限制,研究人员发现了较小的Cas9变体(如金黄色链球菌Cas9,Sa Cas9),可以将编码Cas9和sgRNA的基因插入到单个载体中,但有研究发现Sa Cas9具有较高的免疫原性。
➤ 腺病毒(AdV)和慢病毒(LV)
AdV和LV是基因递送有效和广泛研究的载体,目前有超过2000例相关的临床试验被批准。这两类病毒递送方式与AAV类似,其区别在于载体的大小。LV和AdV的直径均约为80-100 nm。与AAV的直径约20 nm相比,荷载量更大。目前,许多研究使用AdV或LV载体来递送CRISPR/Cas9组件。有研究人员创建了独特的慢病毒CRISPR/Cas9系统,能使一个Cas9和四个不同的sgRNA在不同的启动子的控制下表达,以允许编辑几种不同类型的细胞。然而,AdV和LV容易引起强烈的免疫应答。有研究人员使用Cas9和sgRNA的AdV递送一种参与肝脏疾病的非酒精性脂肪性肝炎(NASH)基因,Pten。作用四个月后,经Pten基因编辑的小鼠表现出巨大的肝肿大和NASH特征。但是,除了在肝脏中显示与AdV载体相关的免疫毒性外,还检测到针对SpCas9的体液免疫,以及潜在的SpCas9特异性细胞免疫应答。
6.3 非病毒载体递送
➤ 脂质纳米颗粒
脂质纳米颗粒已经被广泛用于输送载体,特别是递送核酸。核酸通常在细胞外部不稳定,并且由于它们带负电,不易穿过细胞膜。通过将核酸包裹在阳离子脂质体内,可以相对容易地被递送至细胞。脂质纳米颗粒可以最大程度地减少免疫原性,也可以像病毒颗粒一样,在体外,离体和体内使用。传递CRISPR/Cas9系统时,有两种方法:传递Cas9和sgRNA遗传物质(质粒DNA或mRNA)或传递Cas9:sgRNA RNP复合物。但是脂质纳米颗粒递送CRISPR / Cas9系统也存在一定缺陷。首先,纳米颗粒一旦通过细胞表面,通常将其包裹在内体中。继而被细胞引导进入溶酶体降解。PEI聚合物也已单独使用或与脂质体结合用于体内Cas9蛋白递送,以帮助诱导内体逃逸。同样,如果Cas9:sgRNA复合物可以逃脱内体,但也很难进入细胞核,因此,此方法的效率不高。
➤ 无机纳米粒子
无机纳米粒子是天然的潜在CRISPR载体,包括AuNP、CNT、MSNP、SiNP。与病毒和脂质/聚合物的载体相比,无机纳米粒子更易于大规模生产,更易于表征和化学功能化,并且随时间推移更稳定。此外还有很多其他方法,如CPP、DNA纳米线等都已经用于CRISPR系统的递送。
近年来,CRISPR/Cas基因编辑技术得到了飞速发展,并已广泛应用于许多领域,特别是在具有巨大潜力的医学领域。毫无疑问,将基于CRISPR/Cas的基因组编辑技术转化为医学应用会对人类健康产生重大影响,而此技术也引领了分子生物学工具的一场革命。虽然CRISPR/Cas基因编辑技术存在一定局限性,但随着不同领域的大量研究人员积极投身该领域,势必在不久的将来CRISPR/Cas技术会发挥出它应有的光芒,服务人类健康。
参考资料: