1. 前言
毫不夸张地说,下一代DNA和RNA测序已经彻底改变了生物学的研究。在许多不同的细胞环境中对DNA和RNA进行排序可以发现关于遗传病、生物发育和细胞谱系追踪等的潜在原因。这些方法的发明是为了在整体和单分子水平上对核酸进行测序,并利用了许多先进的技术,从用聚合酶以提供荧光读数的方式复制核酸,到将核酸穿过纳米孔并测量由此产生的电流扰动。这些新方法不仅提高了核酸测序的通量和准确性,而且大大降低了成本。虽然核酸测序方法的增长速度很快,但蛋白质的测序方法,特别是单分子水平的测序方法,在很大程度上落后了。因此,有关蛋白质丰度、加工、修饰、定位和相互作用的知识并没有像对核酸的平行知识那样受益,这促使研究人员最近大力推动开发全新的蛋白质测序模式。
20世纪50年代初, Frederic Sanger和他的同事首次使用二氟硝基苯、蛋白质水解和纸层析相结合的方法获得了蛋白质的初级氨基酸序列。这项早期的工作很快被Pehr Edman提出的一种方法所取代,该方法使用苯基异硫氰酸酯(PITC)作为一种蛋白质逐步降解的试剂,同时对随后分离的每一种氨基酸衍生物进行色谱检测。尽管这里有几个问题,如需要一个游离的氨基末端。自动Edman测序仪是蛋白质组学的黄金标准,直到20世纪90年代,基于质谱的蛋白质组学的兴起才使得Edman测序仪被淘汰。蛋白质组学的早期质谱实验严重依赖自下而上的方法,这需要将蛋白质水解成较短的肽,并使用串联质谱(即液相色谱-串联质谱)鉴定它们。到目前为止,质谱仍然是蛋白质鉴定和定量的标准方法,近年来,它的灵敏度和应用都有了显着的提高。然而,与核酸测序方法相比,传统蛋白质质谱在动态范围和灵敏度方面有局限性,因此人正在努力发明新的蛋白质测序方法。单分子蛋白质测序(SMPS)已经成为一种可行的方法,可以在极低的 (单分子)灵敏度下鉴定和定量蛋白质。即使在获得部分序列信息的情况下,依赖于与参考序列数据库匹配的两种方法和蛋白质测序的从头(即无参考)方法也足以鉴定许多蛋白质。
表1 现有核酸测序技术与单分子蛋白质测序方法之间的对比
缩写:DNA-PAINT,纳米级拓扑中的DNA点积累; FRET X,使用 DNA 交换的荧光共振能量转移; NAAB,N 末端特异性氨基酸结合剂。
尽管这一领域还处于初级阶段,但SMPS的研究人员已经取得了重大成就,并开发出了各种各样的技术。有些结合了蛋白质组学或核酸测序的方法,例如Pehr Edman的化学测序或类似于用于DNA测序的纳米孔。另一些则从根本上背离传统,利用全新的检测方式,例如基于DNA杂交的方法。尽管如此,它与核酸测序的方法有明显的相似之处,并且通过类比四大类 DNA 测序方法来考虑正在发展的蛋白质组学技术是有帮助的:合成测序、降解测序、运输测序和亲和测序。特别值得注意的是,核酸的主要技术(合成测序)–例如,Illumina、Sanger和Pacific Biosciences的测序方法在蛋白质方面没有明显的相似之处。到目前为止,还没有实用的方法可以以单分子形式复制氨基酸聚合物。例如,在没有蛋白质依赖性蛋白质聚合酶、反向核糖体或蛋白质聚合酶链反应的情况下,合成测序作为一种可行的单分子蛋白质组学技术仍有待探索。
因此在这篇综述中,我们将探讨目前看来可行的方法,并描述SMPS方法的最新发展。越来越多的人提议在单分子水平上对蛋白质和多肽进行测序,其中一些仍然是推测性的。人们只有在专利申请中才能找到相关数据。为了集中讨论这篇综述,我们选择将讨论限制在预先印刷或出版的理论论证或原理证明实验的方法上,并重点讨论每种技术的最新发展。
2. 降解测序
与核酸不同,蛋白质组学原理上是来源于降解测序方法,从Frederick Sanger及其同事用于确定胰岛素A和B链初级序列的降解方法,到随后的Edman降解和串联质谱方法。本节介绍的每一种SMPS方法都借鉴了这些久经考验的蛋白质组学方法,通过考察单个分子的灵敏度,着并着眼于扩展到完整的蛋白质组来实现准确测序。
2.1 荧光测序
最早开发的高通量SMPS方法之一,称为荧光测序,它将荧光肽的单分子显微镜与Pehr Edman的降解化学相结合,使许多单独的肽分子能够在测序流动池中被平行监测,因为它们的N端氨基酸以循环方式被移除(图1a)。Edman降解依赖于PITC与蛋白质或肽的α-氨基的反应性。在这个反应之后,第一个氨基酸可以在强酸存在的情况下从蛋白质中去除,留下一个新的氨基酸末端的蛋白质,其长度比原来短一个氨基酸(图1a)。在历史上Edman测序仪只适用于纯化的(均质)蛋白质,因此分离的氨基酸衍生物可以通过层析法进行鉴定。人们通过以循环方式重复该化学过程和随后的层析步骤,最终获得蛋白质的初级序列。Swminathan等人报道的荧光测序法依赖于蛋白质的水解,然后用氨基酸特异性荧光团在多肽上选择氨基酸类型进行化学标记,并对标记的肽段进行连续几轮Edman降解。荧光测序不是监测释放的氨基酸衍生物,而是分析保留的母肽,从而能够分析蛋白质混合物,每个分子的序列由全内反射率荧光显微镜在整个Edman降解周期中独立记录。每个多肽分子的荧光序列显示出荧光标记氨基酸被移除的序列位置(图1b)。
图1 降解测序的方法
a,荧光测序示意图,使用单分子显微镜监测连续几轮埃德曼降解后固定化荧光标记肽的荧光减弱情况。b,显示了具有标记半胱氨酸(蓝星)的多肽正在进行荧光测序。(上图)每个连续的Edman循环后的多肽序列。(中图)一个肽分子在Edman循环中发出的荧光。(下图)675个分子的荧光定量,荧光标记的半胱氨酸的位置呈阶梯状下降。c,一种将Edman降解与N-末端特异性氨基酸结合剂(NAABs)检测相结合的策略。在该方法中,人们可以选择对不同氨基酸具有弱亲和力的NAABs,从而可以结合动力学进行肽测序。d,Stein及其同事正在开发的纳米孔质谱仪示意图。当单肽或蛋白质通过孔道进入时,裂解源释放出每一种氨基酸,最终将由离子检测器识别。据推测,紫外光激光碎裂源可用于解离氨基酸。
荧光测序是自下而上的蛋白质组学方法的一个例子,利用已知的蛋白质组或基因组序列,确定单个蛋白水解肽或蛋白质片段的部分序列,然后将其与用于蛋白质鉴定的参考数据库相匹配。人们已经证明了不需要对蛋白质上的每个氨基酸进行从头鉴定,而是鉴定几个氨基酸的序列位置(指纹法)通常就足以从参考蛋白质组中鉴定出蛋白质。在实践中,荧光测序是一种混合方法,识别标记氨基酸从头开始的序列位置,然后将这些部分序列与参考数据库进行匹配,以识别蛋白质。该小组的一项模拟研究表明,最小的标记方案(包括2-4种标记的氨基酸类型)与各种内切蛋白酶选择相结合,原则上可以用于鉴定大部分的蛋白质组。
因此,具有高度特异性的生物偶联策略对于许多SMPS指纹技术成功鉴定蛋白质是非常重要的。赖氨酸和半胱氨酸都已经高效地与荧光团共价标记,因此人们也通过DNA交换(FRET X)和ClpXP FRET使用荧光(也称为Förster)共振能量转移(FRET)检测赖氨酸和半胱氨酸,这些技术将在下文进一步讨论。更多的标记策略已经被证明可以标记多达六种氨基酸(KDYWEC),而谷氨酸和天冬氨酸是无法区分的。结合侧链标记,SMPS可能需要可逆地阻断N末端的N-末端标记策略(赖氨酸标记所需)和C-末端标记策略。在最近的一项研究中Howard等人将试剂2-吡啶基甲醛(PCA)应用于荧光测序,该试剂以前已被证明能与蛋白质的N末端形成稳定的共价连接。他们表明,捕获到包裹有PCA珠子上的多肽可以用从固体载体释放的荧光染料进行标记,并通过荧光法进行测序,其效率与普通保护基芴甲氧羰基用于液相标记时观察到的效率相当。对于C-末端标记,Bloom等人发现了一个共价反应,它成功地区分了天冬氨酸和谷氨酸的C末端和侧链。Zhang等人在蛋白质组学研究中优化了这一方法,并发现对人细胞提取物胰蛋白酶多肽的标记效率为76%。此外,人们利用这种方法在将炔基连接到肽的C末端之后,成功地将多肽固定并进行了荧光测序。
虽然荧光测序已经成功地用于确定数千至数百万个蛋白质分子的氨基酸序列信息,但人们要采用这种测序方法,仍有几个技术障碍需要克服。第一个是用作标记的荧光团的稳定性。苛刻的Edman试剂使肽上荧光团失活的倾向需要一种化学稳定性很高的荧光基团。Edman循环的长度(大约1小时/周期)也引起了一些关注,特别是当考虑对较长长度的肽进行测序时,该方法在本质上与许多DNA测序方法没有什么不同。Borgo等人提出了一种替代方法,即使用设计的半胱氨酸蛋白酶(称为Edmanase),它将裂解N-末端氨基酸,并将减少对用于Edman降解反应的苛刻试剂的需求。无论如何,虽然全蛋白质的测序难度较大,但目前应该可以用这种方法对复杂性较低的样本多肽进行定量。
最后,除了蛋白质鉴定,SMPS技术的另一个目标是识别翻译后修饰(PTM),如磷酸化和糖基化。使用串联质谱鉴定PTM通常需要从大量起始样品中富集修饰肽,这一过程会导致检测到的PTM产生偏差。SMPS方法为直接通过测序鉴定和定量PTM提供了一种潜在的有效方法。初步实验已经证实了单分子方法定位PTMS的能力:磷丝氨酸在与荧光团共价标记后进行荧光测序,正如下面进一步讨论的那样,电子隧道和纳米孔都已成功地用于区分磷酸化的蛋白形式。
2.2 N-末端特异性氨基酸结合物的结合
另一种通过降解测序多肽的潜在策略是考虑N-末端特异性氨基酸结合物(NAABs)作为化学标记的替代方法。NAABs是一类亲和力取决于N-端氨基酸的蛋白质。因此,基于NAABs的测序法依赖于N端氨基酸的顺序移除来获得序列信息,并与基于NAABs的新末端氨基酸的鉴定交替进行(图1c)。这种方法的一个问题是如何产生对大多数衍生氨基酸具有高度特异性的NAABs基团。T Ullman等人提出的一种策略是利用酶的定向进化,在这种情况下底物识别蛋白CLpS,以产生对特定N端氨基酸具有高度特异性的蛋白质。他们能够获得与Phe、Tyr或Trp具有更高结合亲和力的多个变异体。虽然对野生型偏倚(Phe,Trp,Tyr,Leu)的背景亲和力仍然存在,但增加这些氨基酸对背景氨基酸的亲和力是未来应用于测序方法的关键一步。为了展示基于NAABs的SMPS平台如何在实践中工作,Rodrique等人研究了NAABs的弱结合亲和力是否能为蛋白质鉴定提供足够的信息。他们提出对一组NAABs进行动力学测量,测量它们在单分子水平上的结合和离解速率,以确定固定肽的N端氨基酸信息。在解释各种错误模式的一系列模拟中,他们发现,原则上这种方法可以实现高精度的氨基酸识别。NAABs在蛋白质测序实践中的使用还没有实验证明,但它是一种替代共价标记的策略,例如那些在荧光测序中,人们已经观察到了染料被化学破坏的现象。
2.3 单分子质谱
至少在过去20年里,质谱一直是蛋白质鉴定的金标准。多年来,改进后的仪器和采样方式提高了质谱仪的灵敏度,使得通过质谱法进行单细胞蛋白质组学实验成为可能。质谱法利用多肽或蛋白质的电荷来检测(通常通过电喷雾电离)和识别离子,原理上是基于离子的质荷比(m/z)。单离子质谱最初是通过傅立叶变换离子回旋共振仪器实现的,但它仅限于对感兴趣的分子进行表征,而不是进行测序。有人认为,放置纳米孔作为离子源将可以使用质谱对单个蛋白质进行测序。这种方法将依赖于在孔的出口处解离单个氨基酸,这将释放出一种氨基酸用于检测(图1d)。游离氨基酸的顺序读出将可通过传代对蛋白质进行测序。虽然这种方法的解离方法尚未被证明,但人们已经提出了一种方法(如紫外诱导解离),可以完成这一任务。由于纳米孔质谱仪的顺序性质,通量可能是一个潜在的挑战,因此它的测序性能实际上还有待观察。
3. 运输测序
运输测序已经成为单分子核酸测序中越来越流行的方法,这在很大程度上要归功于纳米孔测序技术的不断进步。由牛津纳米孔技术公司商业化的纳米孔DNA测序仪已被证明是一个强大的单分子DNA测序平台,同时还提供了高便携性。不足为奇的是,纳米孔测序也有希望应用于SMPS,就像其他的运输测序方法一样,如电子隧道和基于蛋白酶的FRET测序方法。这些方法中的每一种都通过传感器来处理感兴趣的蛋白质或多肽,传感器根据具体方法的差异性而不同,例如纳米孔、金电极或荧光标记的AAA+蛋白酶。这一部分探讨了蛋白质测序中每一种不同的运输测序方法的最新发展和应用。
3.1 纳米孔测序
在过去的25年里,牛津纳米孔技术公司通过电流检测到DNA等生物聚合物通过纳米孔的技术,已经从实验室迅速转变为成功的商业化模式。纳米孔测序的工作原理是将含有离子缓冲液的两个隔室与有机、无机或混合孔分开。在包含分离的隔室和孔的电池上建立电流。分子通过跨隔室时,会产生与分子体积相对应的阻塞电流。在DNA测序的情况下,当前的阻塞与单个碱基的体积相对应,碱基可以穿过纳米孔并得到DNA序列。
纳米孔测序仪的长读取能力和便携性的结合目前正在给基因组学领域注入活力,并大力推动了蛋白质测序。然而,将这项技术应用于蛋白质测序面临一些挑战。首先,蛋白质和多肽在组成上比核酸多得多,一些氨基酸,如亮氨酸和异亮氨酸,很大程度上无法通过电荷或封闭体积来区分。此外,与DNA不同的是,蛋白质没有均质电荷,这使得蛋白质的捕获和跨孔的转移变得复杂。基于纳米孔的蛋白质测序的许多技术挑战已经得到了很好的回顾,因此这一部分主要集中在将该技术应用于蛋白质测序方面的最新进展。该领域的一些主要挑战包括如何构建孔隙来支持多肽和蛋白质的有效捕获和移位,如何在蛋白质通过孔隙之前展开蛋白质,以及如何从过渡蛋白质中读出氨基酸序列。
3.1.1 捕获和易位
纳米孔蛋白质测序的主要要求之一是捕获蛋白质并通过孔道移位。在使用氮化硅孔隙的早期纳米孔测序实验中,人们在几天的时间里只记录了几十个易位事件,表明蛋白质的捕获和通过方面存在挑战。这些观察到的通过速率既会严重阻碍阅读深度,又会增加实验运行时间,因此人们投入了大量的精力来开发新的方法来捕获和转移蛋白质通过孔隙。与DNA测序不同的是,人们可以使用电泳力将分子从顺式吸引到纳米孔的反式侧,而蛋白质的不均匀电荷分布使这种方法在未经修饰的蛋白质上站不住脚。为解决这一易位问题而开发的最初方法之一是将高电荷聚合物(如DNA或由带电氨基酸(如谷氨酸或精氨酸)组成的肽)连接到蛋白质的一个或两个末端,以支持电泳驱动的易位=。这种方法可能会影响整个蛋白质组,因为它需要广泛的化学修饰或基因标记,促使研究人员寻找其他方法来跨孔转移蛋白质。
一种有希望的替代方法是使用电渗流(EOF)作为一种捕获和转移机制,可以克服多肽的不均匀电荷分布。EOF是离子在电场的影响下在溶液中运动时产生的流动,导致周围的水分子也向阴极或阳极移动。在使用EOF捕获肽的早期研究中,α-溶血素孔隙中的电流堵塞速率与较低的缓冲液pH直接相关,原因是较低pH缓冲液中阳离子增加,提供更多的离子来驱动液体向跨阳极移动。在一项使用pH2.8的α-溶血素小孔的后续研究中,EOF可以克服阳离子多肽的电泳效应,支持这种易位方法的可行性。利用这种方法,多肽可以被保留并重新捕获到纳米孔的中心或管腔中,从而提供了一种用纳米孔重复对肽进行重新采样的方法。最近,人们证明了设计纳米孔来产生EOF并捕获折叠蛋白的可行性。本研究不依赖于低pH缓冲液产生的流量,而是使用定点突变在孔隙中加入带正电荷的残基,以帮助产生pH7.5的EOF。Ren和他的同事还开发了与纳米孔耦合的场效应晶体管(FET),其中FET的栅极介质控制离子的流动,从而增加了蛋白质捕获和移位的选择性。
在后续研究中,人们将蛋白质特异性(凝血酶结合)适配子添加到用于FET的纳米管的外壳中,进一步提高了采样的选择性。虽然EOF已经被证明可以通过孔隙转移多肽和折叠蛋白,但还没有确定全长蛋白是否可以仅使用这些力达到在纳米孔腔中的线性化。为了克服蛋白质展开的熵障碍,人们可能需要一种洗涤剂或额外的酶,如去折叠酶。
因此,酶驱动的去折叠和移位被认为是克服纳米孔技术障碍的方法。对于DNA测序,人们使用改良的聚合酶phi29作为马达,以受控的方式使DNA链穿过纳米孔,大大提高了碱基调用的准确性。故意减慢纳米孔穿越也可能有利于蛋白质测序,而使用外源蛋白酶的方式被认为是一种可行的策略。在用蛋白质进行纳米孔测序的最早例子之一中,Nivala等人使用了依赖三磷酸腺苷的伴侣分子ClpX的变体来去折叠并将含有ssrA标签的蛋白质穿过孔。在一项后续研究中,Akeson研究小组表明,与ClpXP(包含ClpX和蛋白水解ClpP组件)结合使用的纳米孔可以区分修饰蛋白中包含的Titin片段变体。应该注意的是,这些研究中的运动酶都被放置在孔的横侧,所以蛋白质通过孔的步长由运动酶的活性和结构决定。这种使用酶的做法表明为下一代蛋白质组学平台探索DNA测序方法的类似方法是有可能的。
3.1.2 利用纳米孔鉴定氨基酸
人们在使用纳米孔测序识别氨基酸方面已经取得了很大进展,有例子表明,纳米孔能够区分目前Ouldali描述的蛋白源性氨基酸的阻塞。人们使用具有可变C-末端氨基酸的聚精氨酸肽,根据野生型气溶素孔中的残余电流和堵塞体积,可以区分20种典型氨基酸中的大多数(图2a-c)。这些结果与先前研究中记录的多肽长度结合,在很大程度上证明了纳米孔可以用于区分多肽序列。到目前为止,纳米孔蛋白测序实验主要使用野生型α-溶血素纳米孔,但也有人在推动生物孔的设计。Cao等人结果表明,合理设计气溶素的载药和直径可以提高气溶素的孔隙敏感性。Zhang等人构建了一个蛋白酶体偶联的纳米孔,当蛋白酶体成分不活跃时,该纳米孔能够转移未折叠的蛋白质。作为thread-read的替代方法,当蛋白酶体成分活跃时,这个孔可以将蛋白质水解成6-10个氨基酸的长肽,这些肽段可以在纳米孔中通过一种剪切-滴定的方法被识别出来。Wei等人证明了一种与识别单个氨基酸相关的策略。通过使用芳香族试剂2,3-萘二甲醛和2-萘基异硫氰酸酯作为游离氨基酸N端的偶联剂,他们发现这些额外的标记提高了被测氨基酸穿过α-溶血素孔道时的分辨能力。由于用这种方法鉴定需要游离氨基酸,实际应用中人们可能需要一种蛋白酶或化学试剂,这种酶或化学试剂可以不断地裂解氨基酸,这样它们就可以被连续鉴定;这种组合方法尚未没有付诸实践。
图2 运输测序法
a,纳米孔多肽测序实验示意图。外部电压(V)施加在孔的横侧,电压地施加在顺侧,用图左上角的符号表示。b,经典屏障的描述。I0表示开孔离子流,Ib表示阻塞流。c,平均相对剩余电流(Ib/I0)及其与XR7(X为任何氨基酸)多肽测量值的标准偏差。d,ClpX单分子蛋白质测序方法示意图。将供体染料标记的ClpXP固定在载玻片表面,用受体染料标记的ssrA偶联肽穿过复合物。e,捕捉不同转位时刻的荧光时间轨迹。(i)来自Cy3标记的ClpXP的供体信号在532 nm处激发(顶部绿色迹线);(ii)在633 nm处由于受体定向激发进而出现受体信号(中间红色迹线),表明受体标记的肽与ClpXP结合;(iii)荧光共振能量转移(FRET)信号(底部蓝色迹线)表明了该肽在ClpP中的存在。(iv)荧光和FRET信号的丢失表明多肽的释放。
在一种更直接的序列读出策略中,Brinkerhoff和他的同事将肽连接到DNA链上,并通过作用于DNA片段的解旋酶的作用,将肽-DNA偶联物拉过MSPA纳米孔,结果可以发现清晰的阶梯式离子电流痕迹,就像在DNA纳米孔测序实验中更常见的那样。重要的是,Brinkerhoff和他的同事证明了不同氨基酸的多肽产生了可区分的步进痕迹,这支撑了可能实现氨基酸直接测序的设想,而且他们可以反复对多肽进行采样,这应该有助于降低测序错误率。这些方法和其他方法为指纹识别和鉴定蛋白质提供了潜在途径,这些蛋白质将利用纳米孔的能力来区分氨基酸类型,甚至是潜在的修饰。
事实上,蛋白质指纹可以通过不同的方式实现,目前的一些纳米孔实现依赖于特定残基的化学标记,如赖氨酸和半胱氨酸。Ohayon等人的模拟显示,通过监测荧光强度和通过纳米孔的蛋白质移位,三种标记可以区分高达97%的人类蛋白质组。多个小组已经证明了用纳米孔识别标记氨基酸的可行性。Wang等人的结果表明,荧光显微镜和TiO2纳米孔可以区分具有不同荧光标记的相同多肽。原则上,这种方法可以对多肽上的标记进行定量和定位。在用纳米孔进行指纹识别的另一个例子中,Restrepo-Pérez等人使用脆性毒素C纳米孔鉴定了六种不同的标记物,当这些标记物与半胱氨酸在不同的位置结合时,可以特异性地在位点上拆分。利用纳米孔对蛋白质进行指纹分析可以作为纳米孔测序的跳板,而完整的从头测序策略还在继续开发中。
利用纳米孔所做的工作也表明,人们不需要任何富集或标记步骤就可以鉴定PTM。在一项这样的研究中,Restrepo-Pérez等人发现,在偶极肽上,磷酸化和糖基化修饰的多肽可以与未修饰的多肽区分开来。重要的是,他们观察到,修饰肽在孔隙中的停留时间往往更长,这可能实现对修饰多肽更好的表征。在后来的一项研究中,Li等人使用气溶素纳米孔来识别Tau肽上的相邻磷酸化位点。值得注意的是,磷酸化Tau肽的三种变体被依次加入到同一纳米孔室中,并被巧妙地区分开来,这表明,即使在具有多种蛋白形式的样本中,仍然可以区分PTMs (至少在低复杂性的样本中是这样的)。
使用纳米孔的SMPS是这篇综述中涉及的最成熟的技术之一,但它的应用仍有难度,其中包括需要更好的计算策略来区分氨基酸。Rodriguez-Larrea训练神经网络来识别硫氧还蛋白点突变上的单一氨基酸差异。这项研究关注的是有限的9种氨基酸,但未来的研究将需要集中于区分至少20种蛋白质来源的氨基酸。氨基酸及其修饰变体的无标记识别技术对蛋白质组学的未来发展具有重要意义。除了测序,纳米孔还被用来分析折叠蛋白质,并根据蛋白质在孔中的不同取向获得其特征。可以想象,纳米孔传感器将成为单分子蛋白质分析的多功能工具。
3.2 电子隧道
基于纳米孔的测序依赖于生物分子在纵向(即沿着聚合物链)、电子或量子方向的电学特性,而隧道法则测量横向方向的电学特性。对于DNA来说,这意味着要探测垂直于DNA链的单个碱基,而对于肽和蛋白质来说,这意味着要探测垂直于肽键的氨基酸侧链。电子隧道的测量包括测量夹在两个电极(通常是金电极)之间的具有固定间隙距离的电子隧道电流。对于蛋白质和多肽,人们希望当多肽通过包含电极的孔时,每个氨基酸都能观察到明显的隧道特征。
两项开创性的研究已经证明了将电子隧道应用于SMPS的可行性。Zhao等人提出使用2 nm的电极间隙来区分相同氨基酸的修饰形式、天冬酰胺对映体、亮氨酸和异亮氨酸,以显示该方法的有效性。他们利用支持向量机分类器对每个氨基酸样本的电子特征进行训练,这种电子隧道策略可以很好地检测L-天冬酰胺和D-天冬酰胺对映体之间的不同信号。这项研究只采样了单体氨基酸,所以当考虑如何对蛋白质进行测序时,Zhao等人提出了一种带有外肽酶的微反应器,它可以释放一种末端氨基酸,然后可以进行采样。Ohshio等人在后续的研究发现电子隧道可以用来区分12种氨基酸,包括区分磷酸化形式的酪氨酸和非磷酸化形式的酪氨酸。这需要使用两种尺寸的纳米管——夹在中间的电极之间的距离:0.55 nm和0.7 nm。在12种氨基酸中,当同时使用停留时间和电导来形成电子签特征时,大约一半的氨基酸具有区分能力。此外,当使用不同比例酪氨酸和磷酸酪氨酸的混合溶液时,人们可以根据它们各自的信号来区分这两种物质。重要的是,人们通过使用除了单个残基之外具有匹配序列的两个肽,Ohshio等人的研究结果表明,人们可以使用这种方法来测量多肽。值得注意的是,酪氨酸和苯丙氨酸等残基可以定位在具有位点特异性的多肽上,并提供了一个清晰的蛋白质指纹图谱选择。
3.3 基于clpXP的荧光共振能量转移
Yao等人在一项模拟研究中首次引入了一种独特的蛋白质指纹识别方法,该方法依赖于酶ClpX来收集标记氨基酸的序列信息。ClpX是一种AAA+蛋白酶,其功能是作为一个分子马达,不断地去折叠和降解蛋白质。通过将标记有供体染料的ClpX连接到载玻片表面,载玻片表面可以展开和移位带有受体染料的半胱氨酸和赖氨酸标记的蛋白质,FRET可以观察到这些残基的线性指纹(图2d,e)。Van Ginkel及其同事证明,被一个或两个荧光团标记并含有用于识别ClpP的N端ssrA标签多肽可以根据FRET信号来区分。他们进一步表明,根据FRET信号可以区分蛋白质Titin的野生型和突变型的差异。他们指出,Titin的三级结构被标记行为破坏,表明这种标记甚至可以应用于埋藏在天然3D结构中的位点,而且,标记将充分破坏随后的CplX指纹结构。值得注意的是,通过ClpX进行易位需要一个ssrA标记,这使得在实践中人们很难将这种方法扩展到完整的蛋白质组中去。
4. 亲和力测序
几十年来,基于亲和力的策略与DNA微阵列技术等方法一起被用于鉴定和定量混合物中的DNA。DNA微阵列是将样本DNA与成千上万条DNA链杂交,并将其连接到载玻片表面,以识别样本序列。相应的荧光信号给出细胞中基因表达的粗略估计。对于蛋白质,由于抗体被广泛用作蛋白质分析和成像的工具,基于亲和力的鉴定是非常普遍的。基于抗体的蛋白质谱分析和其他基于亲和力的方法正被成功地大规模应用于复杂样本,但由于它们对蛋白质进行轮廓分析而不是对它们进行测序,因此它们被排除在本节之外。本节介绍的技术很大程度上依赖于DNA与共价连接到肽或蛋白质上的DNA链的杂交来读出氨基酸组成。
DNA纳米技术已经被应用于从药物输送到疾病诊断的各个领域,并在成像领域进行纳米级的图像绘制。DNA探针的超分辨显微镜是通过DNA-PAINT来实现的。DNA-PAINT依靠对接和成像链之间DNA链杂交的可编程特性来获得有关分子的精细空间分辨率组成信息(图3a)。这种空间分辨率可以达到5 nm以下。有人提出,如果单个蛋白链可以线性化,那么赖氨酸或半胱氨酸(或两者)的对接链标记和成像可以用来获得蛋白质指纹。据估计,在5nm成像分辨率内定位蛋白质中的赖氨酸可能会使超过一半的蛋白质组被特征性识别,如果赖氨酸和半胱氨酸被标记为独特的链并被定位,则可以扩展到四分之三。
图3 亲和力测序法
a,描述纳米级拓扑中的DNA点积累(DNA-PAINT)方法及其在蛋白质指纹分析中的应用。蛋白质首先用对接的DNA链进行共价标记,这些DNA链包含被标记的氨基酸特有序列。与荧光团结合的成像DNA链与特定氨基酸的对接链杂交,以提供关于肽或蛋白质的组成信息。原则上,通过将蛋白质线性化并用超分辨率显微镜将其可视化,还可以获得标记氨基酸的相对位置信息。b,描述DNA交换(FRET X)方法的荧光共振能量转移(FRET)以及在蛋白质指纹分析中的应用。蛋白质除了蛋白质末端的受体染料外,还通过对接DNA链进行标记,后者作为一个固定的参考点。然后将含有供体染料的成像链杂交到对接链上。由此产生的FRET信号与距离成正比,提供了蛋白质序列和折叠的距离直方图特征。c,DNA纳米显微镜蛋白质指纹分析方法。DNA链被放大,以记录寡核苷酸结合氨基酸对之间的距离,由此产生的成对距离直方图提供了有关标记氨基酸的顺序和位置的信息。
另一种使用DNA探针测量氨基酸组成和空间组织的策略被称为FRET X。FRET X不像DNA-PAINT那样直接定位DNA成像链,而是通过FRET作为读数来测量染料距离。在FRET X中,单个参考DNA链连接到蛋白质的C或N末端,多条对接链连接到可获得的反应性氨基酸,如赖氨酸或半胱氨酸。一条含有受体荧光团的成像链与参考点DNA杂交,然后,含有供体荧光团的成像链可以与其中一个氨基酸结合的DNA链杂交,参考点(C端或N端)与标记的氨基酸位置之间的距离可以根据受体-供体荧光团的效率来测量(图3b)。通过在多条这样的氨基酸共轭链上取样,人们可以收集FRET距离的直方图,并将其用作感兴趣的肽或蛋白质的指纹。De Lannoy等人通过模拟分析发现,通过半胱氨酸、赖氨酸和精氨酸标记,FRET X原则上可以用于在大约300个人类蛋白质样本中以95%的准确率识别蛋白质。这项研究还证明了FRET X能够测量氨基酸(在本例中为半胱氨酸)沿着肽链到肽N末端的可变距离。重要的是,与DNA-PAINT不同,FRET X适用于折叠的蛋白质,不需要在指纹识别之前将蛋白质线性化。
最后,DNA纳米技术代表了一种依靠DNA扩增而不是对接和成像仪链的DNA纳米技术方法。DNA纳米显微镜使用一种名为自动循环邻近记录的步骤,从本质上说是从DNA中制造出一把分子尺子,可以用来测量氨基酸等共轭分子之间的距离(图3c)。原理证明实验表明,这种方法可以重建DNA纳米结构组织,但还没有在蛋白质样本上得到证明。
5. 前景
最近SMPS技术的发展在许多方面与DNA和RNA测序技术的进展相似。除了本综述涵盖的技术外,还有许多技术的提案和专利正在申请中,但人们目前还没有公布数据或信息。事实上,似乎有一系列完美的因素推动着SMPS领域向前发展:科技界集中精力开发新的蛋白质组学方法,迄今取得的进展有助于激励新进入该领域的人,许多有趣而强大的核酸测序策略的潜在适用性,以及SMPS技术商业化的动力。我们预计,未来几年人们将见证更多样化的蛋白质测序技术,并创造一个SPMS互补技术丰富的生态系统。