本世纪60至70年代对大肠杆菌的研究使之成为自然界中最普遍为人们所认识的生物体。
大肠杆菌具有两个显著特征:操作简单和能在廉价的培养基中高密度培养,它的这些特征加上十多年外源基因表达的经验使其在大多数科研应用中成为高效表达异源蛋白最常用的原核表达系统。尽管大肠杆菌有众多的优点,但并非每一种基因都能在其中有效表达。
这归因于每种基因都有其独特的结构、mRNA的稳定性和翻译效率、蛋白质折叠的难易程度、宿主细胞蛋白酶对蛋白质的降解、外源基因和E.coli 在密码子利用上的主要差别以及蛋白质对宿主的潜在毒性等等。但知识的大量积累还是有助于为表达方面某些特定的困难提供一般的解决方法。
大肠杆菌作为表达系统的主要障碍包括:不能象真核蛋白那样进行翻译后修饰、缺乏将蛋白质有效释放到培养基中的分泌机制和充分形成二硫键的能力。
另一方面,许多真核蛋白在非糖基化的形式下能保留其生物学活性,因而也就可以用大肠杆菌来表达。
如何实现外源基因在原核细胞中的有效表达,自60年代以来,对影响外源基因在其表达体系中表达效率的各个因素作了大量实验研究,并有多篇归纳性综述发表[1,2,3]。国内针对外源基因在原核细胞中高效表达的关键因素,构建了高效表达载体[4],并在此基础上成功表达了一系列细胞因子的基因[5,6,7]。
我们在分析了国内外有关在原核系统中表达蛋白的实验资料的基础上,对在大肠杆菌中高效表达外源蛋白的策略所涉及的内容进行全面的总结,以期有助于我国在这方面的研究。
有效表达载体的构型
构建表达质粒需要多种元件,需要仔细考虑它们的组合,以保证最高水平的蛋白质合成。E.coli 表达载体的基本结构[8]。
启动子(以杂和的tac 启动子为例)位于核糖体结合位点(RBS)上游10-100bp处,由调节基因(R)控制,调节基因可以是载体自身携带,也可以整合到宿主染色体上。E.coli 的启动子由位于转录起始位点上游约35bp的六核苷酸序列(-35区)和一短序列隔开的另一六核苷酸序列(-10区)组成[9,10,11]。
有许多启动子可用于在E.coli中的基因表达,包括来源于革兰氏阳性菌和噬菌体的启动子。理想的启动子具有以下特性:作用强;可以严格调控;容易转导入其他E.coli 以便筛选大量的用于生产蛋白的菌株,而且对其诱导是简便和廉价的[12]。
在启动子下游是RBS,其跨度约为54个核苷酸,两端限定在 -35(±2)和mRNA编码序列的+19到+22之间[13]。Shine-Dalgarno(SD)位点[14,15]在翻译起始阶段与16S rRNA的3’端相互作用[16]。SD与起始密码子间的距离约为5-13bp[17],而且此区的序列在mRNA转录物中应避免出现二级结构,否则将会降低翻译起始的效率[18]。
在RBS的5’和3’端均为A丰富区[19]。转录终止子位于编码序列的下游,作为转录终止的信号[20]和组成发卡结构的保护性元件,阻止核酸外切酶对mRNA的降解,从而延长mRNA的半衰期[21]。
除了上述对基因表达的效率有直接影响的元件以外,载体还含有抗生素抗性基因,以方便质粒的筛选和 传代。氨苄青霉素是最常用的抗性标记。但在生产人用治疗性蛋白时,最好选择其他抗性标记(如Tet)以避免可能发生的过敏反应[22]。质粒的拷贝数由复制起点决定。
在特殊情况下,选用失控复制子能够获得大量的质粒拷贝数和较高产量的质粒编码蛋白[23,24]。但在另外一些情况下,选用超过pBR322的高拷贝质粒似乎并没有好处。而且已有资料表明,增加质粒的拷贝数降低E.coli中胰酶的产量,在高拷贝质粒中,强启动子的存在严重影响了细胞的活性[25,26]。
转录水平调控
启动子
能在E.coli中发挥作用的启动子很多。这些启动子必须具有适合高水平蛋白质合成的某些特性。
首先启动子的作用要强,待表达基因的产物要占或超过菌体总蛋白的的10-30%;
第二,它必须表现最低水平的基础转录活性。若要求大量的基因表达,最好选用高密度培养细胞和表现最低活性的可诱导和非抑制启动子。
如果所表达的蛋白具有毒性或限制宿主细胞的生长,选用可抑制的启动子则至关重要[27,28]。例如,轮状病毒的VP7蛋白能有效地杀死细胞,因此必须在严格控制的条件下表达[29]。
但在某些情况下,启动子的严格性并不合理,因为即使最小量的基因产物也能由于其毒性而杀死细胞。如能灭活核糖体或破坏膜渗透压的分子对细胞来说是致死性的[30]。对宿主的毒性并不仅限于外源基因,某种自身蛋白的过量表达也能造成同样的结果。如编码外膜磷脂蛋白的traT基因[31]。
另外,不完全抑制的表达系统会造成质粒的不稳定,细胞生长速度的下降和重组蛋白产量的降低[32,33]。Lanzer和Bujard曾对常用的lac启动子-操纵子系统进行了广泛的研究,证明操纵子放在启动子序列的不同位置会造成70倍差异的抑制。将17bp的操纵子置于-10和-35六聚体区之间所形成的抑制比将其放在-35区的上游或-10区的下游要高50-70倍[34]。
启动子的第三个特性是其简便和廉价的可诱导性。大量生产蛋白质最常用的启动子是热诱导(λPL)和化学诱导(trp)启动子。异丙基硫代-β-D-半乳糖苷(IPTG)诱导的杂交启动子tac[35]或trc[36]都是强启动子,在基础研究中应用很广。但在大量生产人用治疗性蛋白时用IPTG做诱导剂是不可取的,因为IPTG具有毒性而且价格昂贵[37]。
IPTG的这些不足至今仍限制tac或trc强启动子在大量生产人用治疗性蛋白中的应用。编码热敏lac阻遏蛋白[38]的突变lacI(Ts)基因的出现使得目前能够对这些启动子进行热诱导[39,40]。
另外,还出现了一些新型载体,它们允许在30℃对trc启动子进行严紧调节。最近还报道了两种不同的lac阻遏蛋白突变体,能够同时允许热诱导和IPTG诱导[41,42]。尽管野生型lacI基因也能热诱导,但不能对其进行严紧型调节,且不能用于lacIq 菌株,因为温度的变化不能遏制由lac阻遏蛋白的过量表达所造成的严紧性抑制[43]。因此,该系统只能用用于生产对宿主菌无害的一些蛋白。
冷反应启动子尽管不象其他启动子那样得到广泛的研究,但已经被证明能在低温条件下进行有效的基因表达。噬菌体λPL启动子的活性在20℃时最高,随着温度的升高,其活性逐渐降低[44]。PL启动子的冷反应由E.coli整合宿主因子,一种与DNA结合的序列特异性多功能蛋白来正调控[45,46]。
主要冷应激基因cspA启动子同样也被证明在低温具有活性[47]。对cspA和PL启动子进行分子剖析,鉴定了在较低温度下参与增强转录的特异性DNA区域。从而开发了一系列在20℃低温具有高活性的PL衍生启动子[48]。选用冷反应启动子的基本原理是在15-20℃的条件下,蛋白质的折叠速度只受到轻微的影响,而作为生物化学反应,转录和翻译的速度将被充分降低。
这就为蛋白质折叠、产生有活性的蛋白和避免非活性蛋白聚合体即包涵体的形成提供了充足的时间,而目的蛋白的最终产量并未减少。最近新报道的一些启动子具有诸多诱人之处,为选择新的高效表达系统提供了方便。如非常强的pH启动子[49,50],重组蛋白的产量可达总蛋白的40-50%[51]。
但表达的水平会因不同的基因而有差异。因为蛋白质的合成不仅依赖于启动子的强弱,而且有赖于转录的效率。
(本文转载丁香通)