RSS订阅

病原学&相关数据分析

序列同源性和生物信息学方法可以预测SARS-CoV-2免疫应答的候选靶点

2020年03月18日 浏览量: 评论(0) 来源:中国实验动物信息网 作者:李晓菲译 责任编辑:admin
摘要:要有效应对近期出现和迅速蔓延的2019年新型冠状病毒(SARS-CoV-2),需要开发数据和工具,以了解和监测其传播和免疫反应。然而,关于SARS-CoV-2免疫应答靶点的信息却很少。我们使用了免疫表位数据库和分析资源(IEDB)对与其他冠状病毒相关的可用数据进行分类。

摘要:要有效应对近期出现和迅速蔓延的2019年新型冠状病毒(SARS-CoV-2),需要开发数据和工具,以了解和监测其传播和免疫反应。然而,关于SARS-CoV-2免疫应答靶点的信息却很少。我们使用了免疫表位数据库和分析资源(IEDB)对与其他冠状病毒相关的可用数据进行分类。这包括SARS-CoV,它与SARS-CoV-2具有高度的序列相似性,并且就表位反应而言是最典型的冠状病毒。我们在SARS-CoV-2中发现了与SARS-CoV病毒高度同源的多个特异区域。平行的生物信息学预测确定了SARS-CoV-2的先天性潜在的B和T细胞表位。两种方法对同一区域的独立识别反映了这些区域很有可能成为SARS-CoV-2免疫识别的靶点。这些预测有助于针对这种高度优先的病毒进行有效的疫苗设计。


关键词:SARS-CoV  COVID-19  SARS-CoV-2  冠状病毒  T细胞表位  B细胞表位 传染病


简介:2019年12月31日,中国疾病预防控制中心(China CDC)报告了一组在中国湖北省武汉市病因不明的严重肺炎病例。此后不久,公共卫生专业人员发现可能的病原体是一种新型β-冠状病毒(SARS-CoV-2)。免疫表位数据库和分析资源(IEDB)是一个表位相关信息的存储库,从传染病、过敏和自身免疫的科学文献中收集。病毒病原体资源(ViPR)是一个关于人类致病性病毒信息的补充存储库,它将基因组、基因和蛋白质序列信息与免疫表位、蛋白质结构和宿主对病毒感染反应的数据集成在一起。目前,关于SARS-CoV-2序列中哪些部分被人类免疫反应识别的信息有限。这些知识具有直接的相关性,将有助于疫苗设计,并有助于评估候选疫苗的免疫原性,以及监测病毒通过人类传播时突变事件和表位逃逸的潜在后果。虽然目前还没有SARS-CoV-2的表位数据,但关于冠状病毒的表位,特别是对SARS-CoV和MERS-CoV等引起人类呼吸系统疾病的β-冠状病毒,有大量的信息。在这里,我们利用IEDB和ViPR资源从其他冠状病毒中收集已知的表位位点,绘制SARS-CoV-2序列的相应区域,并预测可能的表位。我们还使用经过验证的生物信息学工具预测可能在人类中识别的B和T细胞表位,并评估这些表位在不同冠状病毒物种中的保守性。

结果:IEDB中有大量与冠状病毒有关的数据

冠状病毒属于冠状病毒科,可以进一步细分为四个主要属(α,β,γ和δ)。几种α和β冠状病毒在人类中引起轻微的呼吸道感染和常见的感冒症状,而另一些则是人畜共患,感染鸟类、猪、蝙蝠和其他动物。除了SARS-CoV-2外,另外两种冠状病毒SARS-CoV和MERS-CoV引起了大规模的疾病暴发,致死率很高(10%–30%)。

图1. SARS-CoV-2(Wuhan-Hu-1)基因组结构与其最近的蝙蝠基因(bat-SL-CoVZXC21),Tor2 SARS-CoV和HCoV-EMC MERS-CoV的比较

上图:与四种病毒之间的同源蛋白相对应的编码序列(CDS)区在基因组示意图中用相同的颜色填充,以指示同源性; 与预测的SARS-CoV-2蛋白无同源性的区域呈白色。下图:SARS-CoV-2与其他三种病毒的成对蛋白相似性(以%同源性表示)。


人类对SARS-CoV-2的免疫反应尚待鉴定,但人类对其他冠状病毒的免疫反应已被研究。这些表位的绝大部分来自β冠状病毒,更具体地说来自SARS-CoV,仅后者就占了60%以上。在宿主中,各种B和T细胞表位被识别。大多数表位(B或T)在人类或小鼠系统中定义。值得注意的是,在人类所描述的417个B和T细胞表位中,除了2个外,其余都来自于β冠状病毒,其中398个来自SARS-CoV。


表1. 冠状病毒B和T细胞表位的IEDB清单

表2.冠状病毒B和T细胞表位的IEDB清单

a、B细胞包括构象表位和线性表位。B、表1和表2之间的总数可能不相等,因为在多个物种中识别出多个表位。


SARS-CoV-2与其他β-冠状病毒的相似性

将SARS-CoV-2蛋白序列与SARS-CoV、MERS-CoV和bat-SL-CoVZXC21的序列进行比较,发现SARS-CoV-2、bat-SL-CoVZXC21与SARS-CoV具有高度的相似性(以%的同源性表示),但与MERS-CoV的相似性有限。此外,SARS-Cov是与SARS-Cov-2最密切相关的病毒,在人类(和其他物种)中已经定义了大量的表位,它也会导致人类疾病并导致致命后果。因此,在接下来的分析中,我们重点比较已知的SARS-CoV表位序列和SARS-CoV-2序列。


我们首先评估了SARS-CoV抗原表位的分布与来源蛋白的关系。在B细胞应答的背景下,SARS-CoV蛋白质组中的12种抗原大部分与表位相关,其中来源最多的是棘突糖蛋白、核蛋白和膜蛋白。与其他蛋白质相关的B细胞表位的缺乏可能是因为,平均而言,迄今为止,B细胞抗原决定簇筛选研究的探测不到每个序列的20%,包括<1%的Orf-1ab多蛋白。相比之下,在B细胞探测中,棘突糖蛋白、核蛋白和膜蛋白序列的完整跨度至少在一定程度上得到了探讨。在T细胞表位中也观察到类似的情况。在这里,我们仅考虑那些受人类白细胞抗原(HLA)主要组织相容性复合物(MHC)限制的抗原决定簇,因为MHC多态性通常会导致在人类和小鼠中识别出不同的抗原决定簇。


使用IEDB的Immunobrowser工具将源自SARS-CoV的B细胞表位映射回SARS-CoV参考序列。该工具结合了参考序列中的所有记录,并产生一个反应因子(RF)分数,该分数说明了阳性率(在阳性表位中发现残基的频率)和记录数(报告了多少独立测定)。考虑到残基延伸,确定了主要区域,RF得分≥0.3。


棘突糖蛋白、膜蛋白和核蛋白的分析如图2所示。在棘突糖蛋白的情况下(图2A),我们确定了5个可能感兴趣的区域(残基274–306、510–586、587–628、784–803和870–893),所有这些区域都代表与高免疫应答率相关的区域。其中三个免疫显性区位于CTD2和CTD3(C-末端结构域)的S1亚单位,而另外两个位于S2亚单位的HR1结构域。

图2。基于SARS特异表位定位的B细胞免疫显性区

计算每个氨基酸位置的RF评分(见STAR方法),标绘棘突糖蛋白(A)、膜蛋白(B)和核蛋白(C)

接下来,我们将SARS-CoV B细胞表位区域序列与SARS-CoV-2序列进行比对,以计算每个SARS-CoV显性区域与SARS-CoV-2之间的百分比同源性。在确定的10个区域中,有6个与SARS-CoV-2具有90%或更高的同源性,其中2个具有80%至89%的同源性,而2个具有较低但仍可观的同源性(69%和78%)。在类似的分析中,还发现T细胞表位主要与棘突糖蛋白和核蛋白相关。我们还对SARS-CoV T细胞表位序列进行了比对,并计算了每个表位与SARS-CoV-2的百分比一致性。总体而言,核衣壳磷蛋白和膜衍生表位最保守(分别为8/10和2/3,与SARS-CoV-2的同源性≥85%)。Orf1ab表位和表面糖蛋白表位是中度保守的(分别为3/7和10/23,与SARS-CoV-2的同源性≥85%),Orf 3a表位是最不保守的。


SARS-CoV-2   B细胞表位的预测:

为了用另一种方法定义潜在的B细胞表位,我们使用IEDB提供的预测工具。利用SARS-CoV-2表面糖蛋白、核衣壳磷酸蛋白和膜糖蛋白序列对B细胞表位进行预测,如前所述,它们是B细胞对其他冠状病毒应答的主要蛋白靶点。同时,我们还预测了线性B细胞表位与Bepipred2.0和构象表位与Distope2.0的关系。两种预测算法都可以在IEDB B cell prediction tool页面上找到。


表面糖蛋白预测的B细胞表位最多,其次是膜糖蛋白和核衣壳磷酸蛋白。为了预测和绘制构象B细胞表位,我们使用了最近提交的SARS-CoV-2棘突糖蛋白结构。

然后我们将相关的氨基酸位置定位在模型结构上,从而可以识别表面糖蛋白中七个预测的表位残基/区域(491-505、558-562、703-704、793-794、810、914和1140-1146)。


图3、SARS-CoV-2尖峰糖蛋白

以红色显示基于已计算的基于Discotope 2.0排序的B细胞抗原决定簇的前13个氨基酸残基的计算表面。。单体显示在左上方。 右上和右下中心以两个不同的方向显示三聚体。 使用YASARA进行3D渲染。


SARS-CoV-2  T细胞表位的预测

为了预测CD4 T细胞表位,我们使用了Paul和合著者描述的方法,该方法在IEDB的Tepitool资源中实现。该方法经过设计和验证,可以利用不同的HLA II类基因座和等位基因变异之间广泛的交叉反应性和全谱重叠来预测独立于种族和HLA多态性的显性表位。我们选择了一致性百分位数小于等于20的肽,一个与抗原决定簇相关的阈值,负责约50%的靶向特异性反应。使用此阈值,我们确定了SARS-CoV-2序列中的241个候选对象。这些肽库(或megapools)包含预测或实验验证的表位,并允许在诸如百日咳博德杆菌、结核分枝杆菌、登革热和寨卡病毒等传染病适应症中测量人类T细胞反应的大小和表型特征。SARS-CoV-2 CD4 megapool覆盖了所有10种预测的蛋白质,潜在表位的数量与每种蛋白质的大小成正比。同时,我们还试图定义可能的CD8表位。 在这里,需要一种不同的方法,因为不同的HLAⅠ类等位基因变异和位点之间的重叠更多地局限于特定的等位基因群或超型。按照先前验证的方法,我们组装了一组12个最显著的HLAⅠ类等位基因,这些等位基因已经被证明可以广泛覆盖一般人群。然后,我们使用IEDB上可用的Net MHC pan 4.0 EL算法执行了HLA I类结合预测。对于每个等位基因,我们根据预测对SARS-CoV-2序列中得分最高的1%肽段进行了排名。 消除冗余和嵌套肽后,我们获得了628个独特的预测表位的最终“计算机模拟”数据。


结论:与SARS-CoV表位有关的可用信息与生物信息学预测的结合使用,指出SARS-CoV-2的特定区域很可能被人类免疫应答识别。观察到SARS-CoV-2和SARS-CoV之间许多B和T细胞表位高度保守是很重要的。旨在针对这些保守表位区域进行免疫反应的疫苗接种策略可以产生免疫力,这种免疫力不仅对β-冠状病毒具有交叉保护作用,而且对正在进行的病毒进化具有相对的抵抗力。


原文出自:https://www.sciencedirect.com/science/article/pii/S1931312820301669

更多新型冠状病毒肺炎内容点击如下专题

相关文章
  • 没有相关内容!
对不起,暂无资料。
点击这里给我发消息 点击这里给我发消息 点击这里给我发消息
Baidu
map