27医学论文范文网

主页
分享医学论文范文

高通量测序在抗体组学中的应用与展望

更新时间:2020-07-13 09:42点击:

    摘要:抗体是获得性免疫系统的主要组分,在防御性及致病性免疫反应中起着关键作用。对抗体发生、发展和成熟过程的解析,对研究传染性疾病致病机制、疫苗设计、自免疫疾病发生及进展等有着重要意义。随着高通量测序技术的发展和成熟,抗体研究进入了组学时代。通过对艾滋病患者外周血抗体谱的高通量测序及后续大数据分析挖掘已经在HIV- 1广谱抗体研究中取得了丰硕的成果。随着测序技术的进一步发展 、测序长度的增加及精度的提高、实验体系的优化、分析流程标准的建立及单细胞抗体测序技术的应用,抗体组学研究前景广阔。本文就抗体组学的技术、发展、应用及问题作简要综述。
 
    关键词:高通量测序;抗体谱;获得性免疫;组学分析
 
前言
 
  抗体是指机体的获得性免疫系统在抗原刺激下,由B淋巴细胞经历产生、成熟、增殖、分化并分泌的可与相应抗原发生特异性结合的一类免疫球蛋白[1].抗体是由两条完全相同的重链和两条完全相同的轻链由二硫键和非共价键结合[2]形成的“Y”形对称结构的复合物[3].根据理化性质和生物学功能不同,抗体分为IgG、IgM、IgA、IgD、IgE五类(表1)。IgG抗体占血清Ig总量的80%,分为 IgG1、IgG2、IgG3、IgG4四个亚类,是机体抗感染的“主力军”[4-5].IgG在血清中持续的时间长,半衰期为20~23 d,是唯一能在母亲妊娠期穿过胎盘的抗体。IgM占血清Ig总量的5%~10%,是免疫应答中最先分泌的抗体,是机体抗感染的“先头部队”,可用于感染的早期诊断[4-5].IgA抗体占血清Ig总量的10%~15%,分为单体型IgA和分泌型IgA.分泌型IgA主要分布于呼吸、消化、生殖等管道的粘膜表面和乳汁、唾液、泪液中,可中和感染因子,参与局部粘膜免疫,是机体抗感染的“边防军”[4-5].IgD抗体占血清Ig总量的0.2%,主要出现在成熟的B淋巴细胞表面上,与B细胞的分化相关[4].
 
  IgE抗体是血清中含量最少的抗体,约占血清Ig总量的0.003%,主要由粘膜下淋巴组织中的浆细胞分泌,参与超敏反应,与机体抗寄生虫免疫相关[4-5].
 
  抗体是 B 淋巴细胞抗原受体(B cell antigenreceptor, BCR)的分泌形式,抗体的产生和成熟过程也就是B细胞的产生、发育、增殖和分化的过程[2,3,5].其重链由V、D、J、C四个基因片段编码的,轻链由V、J、C三个基因片段编码。成熟的B细胞从骨髓释放到外周血中,经过特异性抗原的刺激后会进入淋巴结的生发中心,在生发中心中经过细胞增殖、体细胞超突变、亲和力成熟、抗原受体编辑、种型转化等复杂事件,分化成能分泌特异性抗体的浆细胞和少数的记忆性B细胞[2, 3, 5].经过生发中心的体细胞超突变和亲和力成熟过程,进一步增加了抗体谱(Antibody repertoire)的多样性,使抗体的数量达到了1013的天文数字,并提高了抗体对特异性抗原的亲和力[2, 5].
抗体是获得性免疫的主要组分,在防御性及致病性的免疫反应中起关键的作用。通过对抗体发生、发展和成熟过程的解析,促进了对传染性疾病病理机制、疫苗设计、自免疫疾病治疗等免疫学相关的研究。例如,通过对HIV-1缓慢进展患者体内中和广谱抗体产生及成熟通路的解析,以获得具有高效中和效应的HIV-1特异抗体,并开始应用于HIV-1疫苗的研发[3, 6-10].在类风湿性关节炎自免疫疾病中,自身抗体基因IGHV4-34明显富集,可以作为类风湿性关节炎检测的分子标记和免疫治疗的靶点[11].通过对抗体发生、发展的深入及全面解析,不仅能增加我们对免疫调节的认识,而且为疾病的治疗和疫苗的研发等临床应用提供新的技术与方案,引领新型治疗性抗体研究的时代。
 
  低通量测序在抗体研究中的应用随着测序技术的发展,抗体组学的研究经历了从低通量到高通量的时代变革。在1990~2000年时,主要利用RT-PCR扩增和Sanger测序技术研究少量B细胞的抗体特征[12].应用这一技术,人们开展了致病病毒如HIV-1、流感病毒的单克隆抗体和自免疫疾病相关自身抗体的研究。通过抗体测序结合克隆表达,人们获得了第一代HIV-1的广谱抗体如b12、4E10、2G12等抗体[13-17],解析了它们的抗原识别位点,为HIV-1疫苗的研发提供了指导[18-19].运用这一技术,Wardemann等[20]阐明骨髓中产生自身抗体及多效抗体的B细胞至少经过2步独立的自体耐受性的检测,当这一过程发生异常时会导致产生分泌自身抗体的浆细胞,诱发自身免疫疾病如系统性红斑狼疮和风湿性关节炎[21].
 
  由于技术的低通量性,每次实验只能分析几十到几百个B细胞的抗体特性,与抗体谱的巨大数据相比,低通量技术只为我们揭示了冰山的一角。
 
  高通量测序在抗体组学中的应用对免疫系统的认识及对抗体的挖掘及应用需要人们能全面深入的了解抗体谱的整体特征,因通量限制,这个目标是传统技术无法实现的。罗氏 454 和Illumina Miseq为代表的下一代测序技术的应用,一次测序即可获得数以百万计的B细胞的抗体可变区域序列。结合分子标记与细胞标记技术,NGS为人们展示了更广阔的抗体谱特性,数据量更加接近人体抗体谱真实数量,使抗体的研究进入了大数据的时代。高通量数据的捕获也使得研究抗体家系及抗体的成熟途径成为现实。以下将从实验的操作、测序平台的选择、数据的分析三个方面详细介绍高通量测序在抗体组学中的进展与应用(图1)。
 
  2009年Weinstein等[22]首次应用高通量测序技术全面研究了斑马鱼的抗体库特征,揭示不同斑马鱼个体间重链VDJ基因的使用频率存在相似性,促进了高通量测序技术在人抗体组分析中的应用。抗体的高通量测序需要考虑实验设计、重链与轻链配对、数据的分析、挖掘及可视化等问题。近5年高通量测序技术在抗体组学的应用可以分为2个时期:第一个时期为2009~2013年,利用抗体可变区与恒定区的混合引物,通过巢式PCR从外周血单个核细胞cDNA中分别扩增抗体重链与轻链基因,然后通过罗氏454测序平台测序(图1A)。
 
  应用这一技术从HIV-1患者中分离出了中和力更强的第二代广谱中和抗体,如 VRC01、VRC03、CH103-CH106、CH01-CH04、10E8等。结合结构生物学研究者解析出了HIV-1病毒4个重要的保守表位结构域,分别是CD4结合表位、V1/V2区、V3区、gp41蛋白近膜外周区[23-28].对这些抗体成熟通路的解析及HIV-1保守表位的分析,可以指导HIV-1疫苗的设计和生产,从而为预防HIV-1提供了新的思路。尽管这些方法发展迅速,但仍存在诸多问题:如混合B细胞样本增加了特异性增殖B细胞克隆分析的难度;设计在V区的正向引物并不能覆盖所有的抗体基因片段,多个正向引物的混合增加了PCR 的偏好性;尽管可以从混合的 mRNA 样本中同时测出抗体的重链与轻链,但失去了体内重链与轻链的配对信息;454测序平台容易引入碱基缺失与插入,增加了后续分析的难度。
 
  针对以上问题,新的技术被开发并成功应用到抗体测序中(图1B-D)。DeKosky等[29]通过物理方法将单个B细胞中的重链与轻链基因连结在一起,实现了内源重链与轻链的配对测序(图1B)。Robinson[30-32]实验室通过细胞标记的方法,在反转录过程中对不同的B细胞cDNA产物5`端引入特异性的标记,有利于纠正PCR过程及测序过程中的错误,并保证了内源重链与轻链的配对(图1C)。最近Georgiou[33]实验室开发了一套新的低花费、单细胞的油滴PCR技术,既可以保持体内重链与轻链的配对又实现了高通量,每次实验可以分析多达2×106个B细胞,提高了测序的广度与深度度(图1D)。
 
  5'RACE技术的应用,解决了混合引物扩增的偏好性问题,能够更全面的扩增到抗体基因,结合 PGM 与Illumina MiSeq平台提高了读段的长度、测序的深度与数据量,更利于抗体组的高通量分析[34].因此,单细胞测序、重链与轻链配对、5'RACE、PGM 与 IlluminaMiSeq平台应用,将进一步推动抗体组学在抗体生产、自免疫疾病诊断、疫苗生产及癌症相关疾病的研究。
 
  抗体组学的生物信息分析如何从数据的海洋中挖掘出有用的信息,用于指导抗体的生产和疫苗的设计,是抗体组学工作中面临的巨大挑战。目前抗体分析中常用的软件及工具如图2所示。其中包括的主要步骤如下:对测序得到的原始数据(Raw reads)进行质量控制,滤掉质量低与长度短的读段并获得干净的数据(Clean reads);利用 IgBlast 和IMGT 对抗体的可变区进行 V(D)J 生殖系基因定位(VDJ annotation)[35-36];根据生殖系基因定位将每个合并的读段剪切至恰好包含整个可变区域;去除冗余数据,对于每个唯一读段(Unique reads)记录其总数量;系统化注释获得 reads 的可变区域并提取 CDR3 区域;分析 CDR3 区域并获得抗体的家系信息(Clone orlineage);获得每个家系中轻重链可变区域的序列特性,并利用重链和轻链各家系的 reads 数量进行轻重链配对;对配对好的抗体序列通过实验验证功能。
 
  利用上述分析软件与流程,人们开展了大量的抗体相关工作的分析,促进了数据的分析与挖掘并加快了免疫学的进展。例如我们课题组最近参与的HIV-1中和抗体的研究,通过连续15年样本的大数据量的分析,解析了HIV-1广谱中和抗体VRC01的成熟与变异速率,结合结构生物学的分析,揭示了VRC01抗体的进化机制,对开发HIV-1疫苗具有重大的意义[37].同时通过对免疫反应中抗体谱数据特征的分析,揭示了年龄、遗传等因素对抗体产生与成熟的影响,为开发相应的针对不同人群的有效疫苗提供了指导[38-39].然而,相对于高通量数据的快速发展,目前还没有一个统一的分析流程,所有的分析软件主要是借助了一些免费的公用软件,针对抗体分析的专一性软件还没有开发出来。现有的分析流程也存在一些问题,如:IgBlast和IMGT对抗体序列进行比对时,不能纠正序列中的错误,导致比对的不准确性;由于D基因较短,IgBlast和IMGT不能准确地定位D基因;抗体成熟过程中AID酶会引入新的突变,增加了抗体的多样性并提高了抗体的亲和力,然而目前的分析不能区分出AID所介导的突变热点;家系进化树的构建完全依赖于序列相似性,没有考虑原始的生殖基因及AID突变的偏好(Hotspot),会遗漏掉许多基因并使得进化树不能完全反映细胞内重链与轻链的配对情况。所有这些问题是需要下一步抗体数据分析中得到解决。
 
  展望
 
  从以上对抗体组学的发展及应用简述中可以看到,结合高通量测序的抗体组学具有效率高、深度大、基因多样性更丰富、数据反映更准确等优势。最近5年里,高通量测序的抗体组学分析已经成为免疫学的热门方法,促进了包括抗体发生、疫苗研发、肿瘤发生及自免疫疾病等相关免疫学的研究并取得了众多创新性的成果。但到目前为止,抗体组学分析的应用潜力还远未发挥出来,其技术仍受到一些现实条件的约束,如高通量PCR抗体基因扩增技术仍不够完善、测序读段长度与准确性还有待进一步提高、标准的分析流程有待开发完善。随着单细胞分选及测序的应用、PCR扩增基因方法的改善、细胞标记的应用、分析标准的开发,未来抗体组学将在诊断、药理学、疫苗设计及临床应用中发挥前所未有的重大作用,引领新型治疗性抗体研究的时代。
 

推荐文章

在线客服系统