蛋白质组学是什么?关于蛋白质组学的详细介绍

创闻科学2020-11-16 15:13:32

蛋白质组学,指对某一基因组所表达的所有蛋白质及其特征进行大规模、系统化地研究,以期望在蛋白质水平上解释控制复杂的生命活动的分子网络。研究的内容主要包括:组成蛋白质一级结构氨基酸的序列特征、蛋白质的丰度、蛋白质活性、蛋白质的修饰、亚细胞定位和三维结构、蛋白质之间的相互作用以及对蛋白质的高阶复合物结构。

定义

蛋白质组学(proteomics),指对某一基因组所表达的所有蛋白质及其特征进行大规模、系统化地研究,以期望在蛋白质水平上解释控制复杂的生命活动的分子网络。研究的内容主要包括:组成蛋白质一级结构氨基酸的序列特征、蛋白质的丰度、蛋白质活性、蛋白质的修饰、亚细胞定位和三维结构、蛋白质之间的相互作用以及对蛋白质的高阶复合物结构。蛋白质组学的研究方法主要有:蛋白质双向电泳、氨基酸序列测定(包括N端测序和C端测序)、质谱、生物信息学。

发展

  • 1994年澳大利亚科学家Marc Wilkins首次提出蛋白质组(Proteome)的概念:“细胞,组织或者器官内表达的全部蛋白质“。那时,即使是鉴定几十个蛋白都需要耗费研究人员数月的时间。自此,蛋白质组研究技术从样品制备、蛋白质和肽段的分离、鉴定和定量分析,一直到大规模、多层次生物信息学分析都有了很大的发展。

  • 随着这些技术的发展,2003年Tyers和Mann定义了蛋白质组学(Proteomics)的概念:“对细胞中蛋白质组的研究、对所有蛋白质同种型和修饰的研究、对蛋白质相互作用的研究和对蛋白质及其高阶复合物结构的研究”。

  • 质谱技术的发展为这些研究提供了有力的技术支撑,使得许多有实际应用的蛋白质组功能研究成为可能,包括翻译后修饰的整体分析,蛋白质相互作用网络的重建和模式生物蛋白表达谱的定量研究;在临床医学和转化医学研究中也越来越多地应用到蛋白质组学技术。

  • 2014年人类蛋白质组草图的完成,也预示着生命科学的研究逐渐由基因组学转向蛋白质组学。

与基因组学的差异

蛋白质组和基因组(genome)在概念上有相关性,某一个蛋白质组的蛋白质是由其基因组所编码的,然而蛋白质组学和基因组学在研究对象和研究方法上有很大的区别:

  • 基因组在所有的细胞中几乎都是完整的,与之不同,蛋白质组具有很高的细胞和组织特异性,不同的细胞组织表达不同的蛋白质组。

  • 蛋白质组的复杂性也远远高于基因组,这是因为一个基因≠一个转录产物≠一个蛋白质。比如据估计人的基因组由30000个基因组成,经mRNA剪切和蛋白质翻译后修饰将产生20万~200万个蛋白质。由于不同的转录起始和mRNA剪切使同一基因产生了不同的转录产物。同样由于不同的翻译起始,一个mRNA可以翻译成不同的蛋白质。

  • 即使是同样的蛋白质,由于组织细胞定位的不同也会影响蛋白质的功能。蛋白质翻译后的修饰,如磷酸化(phosphorylation)、甲基化( methylation)、泛素化( ubiquitylation) 或蛋白质降解等过程都可以影响到蛋白质的活性、细胞定位和蛋白质的稳定性。一个蛋白质翻译完成后仍可以发生一系列的变化,影响到整个细胞的生命活动。

  • 蛋白质的表达和修饰过程还受到生长发育和外界环境因素的影响,因此蛋白质组并不是静态的,而是处于高度的动态变化之中。真核生物的蛋白质表达具有很高的动态变化范围,低丰度蛋白质的含量为10~100分子/细胞,而高丰度蛋白质的量可以达到 ~ 分子/细胞,变化范围超过6个数量级。

  • 蛋白质组的高度复杂性和动态性决定了蛋白质组学研究比基因组学面临更多的困难和挑战。蛋白质的研究无论在蛋白质的提取、纯化还是结果分析都比核酸更加复杂。比如在蛋白质组的研究中不存在与PCR类似的扩增技术。再比如 microarray 技术是一种在基因组学研究中被广泛应用的高通量的研究手段,用于研究整个基因组的基因表达情况。然而就目前的技术而言,蛋白质组学的研究还不能达到基因组学研究的高通量和完整性。

蛋白质组学研究策略

蛋白质组学研究主要分为自底向上(Bottom-Up),自顶向下(Top-Down)和自中向下(Middle-Down)三种策略。

  1. “自底向上”策略是指通过分析由蛋白质酶解生成的肽段来鉴定蛋白质。当应用该策略来分析蛋白质组混合物时,因其类似于基因组测序的鸟枪法,所以又被称为鸟枪法蛋白质组学(Shotgun Proteomics),该策略依赖于蛋白酶的酶切。

  2. “自顶向下”策略并不依赖于蛋白酶的酶切,而是直接鉴定完整蛋白质,在翻译后修饰和蛋白质同素异构体鉴定方面有一些潜在的优势。可是该策略的缺陷是蛋白质在气相中分离、电离及碎裂都十分困难。而鸟枪法蛋白质组学由于将蛋白质酶解成肽段,使其在气相中更容易被分离、电离和碎裂;所以鸟枪法蛋白质组学在蛋白质组学研究中得到了最广泛的应用。

  3. “自中向下”策略也依赖于蛋白酶的酶切,但是由于采用了另外的酶,比如OmpT,只能酶切(Lys/Arg-Lys/Arg),因此酶切之后的分子量较大,更利于后续的蛋白组装环节。

蛋白质组学研究领域

亚细胞蛋白质组学

亚细胞水平的蛋白质组学研究,比如研究由外界信号引起的蛋白质转运等,是了解细胞中信号转导和调节网络的必要手段之。针对细胞器的研究有细胞壁、细胞膜、类囊体腔、类囊体膜、内质网、微管、线粒体、细胞核、过氧化物酶体和蛋白酶体等的蛋白质组,针对植物还有叶绿体膜、叶绿体核糖体相关的蛋白质组学。

发育蛋白质组学

发育蛋白质组学指在某一特定的生长发育时期,在特定的生长条件下,特定的细胞、组织或器官中所表达的所有蛋白质。发育蛋白质组学揭示了在每个特定时期所表达的蛋白质和这些不同的蛋白质在特殊的生长时期可能发挥的作用,是进一步了解和深入研究蛋白质功能的基础。

环境蛋白质组学

环境蛋白质组是在蛋白质组的水平上研究生物对这些环境因素的响应,研究在生物生长过程中受到各种外界环境刺激,包括不利于正常生长的因素。环境因素可分为非生物逆境(包括厌氧、冷、热、干旱、盐、重金属、臭氧、紫外线和机械伤害等)、生物逆境(包括细菌、真菌和病毒),对植物而言,环境因素还包含植物激素或具有植物激素活性的物质(包括生长素、赤霉素、细胞分裂素、乙烯、脱落酸和茉莉酸等)。环境蛋白质组学的研究发现了大量与逆境相关的蛋白质,这些蛋白质在逆境生长条件下表达发生变化,以抵抗外界不利的生长环境,维持细胞的生命活动。

磷酸化蛋白质组学

磷酸化蛋白质组学的研究可分为磷酸化蛋白的鉴定和磷酸化位点的鉴定两个主要部分。蛋白磷酸化是细胞将外界信号传递到细胞内的一个重要的手段。磷酸化可以改变蛋白质的生物活性、亚细胞定位,影响蛋白质之间的相互作用,更重要的是这种变化是双向的,即蛋白质的活性、细胞定位等可以通过磷酸化和去磷酸化来调节。蛋白磷酸化是最常见的也是研究最多的一种翻译后修饰,是信号转导途径上的重要组分,对信号转导存在正向和反向调节作用。

小结

蛋白质组主要通过蛋白质双向电泳、氨基酸序列测定、质谱、生物信息等方法,研究某个基因组对应的所有蛋白质特征,包括蛋白质含量、亚细胞定位、活性以及蛋白修饰等内容。近几年来发展迅速,主要归功于质谱技术的发展尤其是在蛋白质鉴定中的应用,以及各种生物信息学分析手段的发展。与哺乳动物如人类和微生物如酵母菌相比,植物蛋白质组的研究起步较晚,主要是由于缺少完整的植物基因组信息,但是最近几年也成为植物学一个重要的研究领域。