什么是 “密码子优化”?为什么在重组蛋白表达(如大肠杆菌、哺乳动物细胞)中,基因合成必须进行密码子优化?

信息来源:金开瑞 作者:genecreate_cn 发布时间:2025-08-27 13:24:42

    要理解 “密码子优化” 及其在重组蛋白表达中的必要性,需先从密码子的基本特性切入,再结合不同宿主(如大肠杆菌、哺乳动物细胞)的基因表达机制差异,分析优化的核心逻辑和价值。以下分两部分详细说明:

一、什么是 “密码子优化”?

    密码子优化是指根据特定宿主细胞的密码子使用偏好,在不改变目标蛋白氨基酸序列的前提下,对目的基因的编码区进行碱基替换,调整密码子组成,最终提升目的基因在宿主中转录效率、mRNA稳定性及翻译效率的基因工程策略。

其核心依据是密码子的简并性:

    遗传密码中,除甲硫氨酸(AUG)和色氨酸(UGG)外,其余 18 种氨基酸均由2-6 个不同密码子编码(例如丝氨酸可由 UCU、UCC、UCA、UCG、AGU、AGC 编码),这些编码同一种氨基酸的密码子被称为 “同义密码子”。

    不同物种(甚至同一物种的不同组织)对同义密码子的使用频率存在显著差异,即 “密码子使用偏好”(Codon Usage Bias)。例如:

        大肠杆菌偏好使用UUA(亮氨酸)、AGG(精氨酸) 等密码子;

        哺乳动物细胞(如 HEK293、CHO)更偏好UUG(亮氨酸)、CGG(精氨酸) 等密码子。

 

二、为什么重组蛋白表达中必须进行密码子优化?

    重组蛋白表达的核心目标是高效、稳定地合成具有正确结构和功能的目标蛋白。若直接使用天然目的基因(如从人源cDNA中克隆的基因)在异源宿主(如大肠杆菌)中表达,会因 “密码子使用偏好不匹配” 及其他序列问题,导致表达效率极低甚至不表达。具体原因可从宿主适配性、mRNA稳定性、翻译过程三个维度拆解,且不同宿主的优化侧重点存在差异。

1. 核心原因 1:解决 “密码子偏好不匹配”,避免翻译停滞

    宿主细胞内的tRNA丰度与自身密码子使用偏好高度匹配 —— 常用密码子对应高丰度tRNA,稀有密码子对应低丰度tRNA。若目的基因中包含大量宿主的 “稀有密码子”,会导致翻译过程受阻:

    翻译延伸停滞:当核糖体遇到稀有密码子时,因对应的tRNA浓度低,需等待tRNA结合,导致翻译效率下降;若稀有密码子集中出现(如连续2-3个),可能直接导致核糖体脱落,终止翻译。

    不同宿主的差异案例:

        大肠杆菌中,精氨酸的稀有密码子AGG/AGA在人源基因中出现频率较高,若直接表达人源基因,会因大肠杆菌内AGG/AGA对应的 tRNA(tRNAArg)丰度极低,导致翻译停滞,目标蛋白产量仅为优化后的10%-30%;

        哺乳动物细胞中,亮氨酸的稀有密码子CUA在植物来源基因中常见,若不优化,会因HEK293细胞中 tRNALeu(CUA)不足,导致翻译效率降低50%以上。

2. 核心原因 2:提升 mRNA 稳定性,减少降解

    目的基因的密码子组成会直接影响其转录产物(mRNA)在宿主细胞内的稳定性:

    避免 “不稳定序列基序”:不同宿主的 mRNA 降解机制不同,某些密码子组合可能形成宿主特异性的 “不稳定基序”。例如:

        大肠杆菌中,mRNA的3’- 端若存在富含AU的序列(如连续的AUA、UAU),易被核酸酶(如RNase E)识别并降解;

        哺乳动物细胞中,某些密码子组合(如CUU-CUU)可能形成茎环结构,或被miRNA非特异性结合,加速mRNA降解。

    密码子优化可通过替换碱基,消除这些不稳定基序,延长 mRNA 在宿主细胞内的半衰期(如从10分钟延长至30分钟以上),间接提升翻译模板的浓度,增加蛋白产量。

3. 核心原因 3:避免 “异常转录/翻译副产物”,提升蛋白纯度

    天然目的基因中可能存在与宿主表达系统冲突的序列,导致非预期副产物,而密码子优化可规避这些问题:

    避免宿主启动子/终止子序列:天然基因中可能包含类似宿主启动子(如大肠杆菌的-10区 “TATAAT”)或终止子(如 “TAA” 重复序列)的片段,若不优化,可能导致目的基因转录提前终止,或启动无关序列的转录,产生短片段 mRNA;

    减少翻译起始异常:原核生物(如大肠杆菌)的翻译起始依赖 mRNA 5’-端的SD 序列(Shine-Dalgarno Sequence) 与核糖体小亚基结合,若目的基因 5’- 端的密码子组成导致 SD 序列附近形成二级结构,会阻碍核糖体结合,降低翻译起始效率;密码子优化可调整 5’-端碱基,破坏二级结构,提升起始效率。

4. 不同宿主的密码子优化侧重点差异

    大肠杆菌和哺乳动物细胞的基因表达机制差异显著,因此优化策略需 “量身定制”,这也是 “必须进行优化” 的重要原因(通用序列无法适配所有宿主):

对比维度 大肠杆菌(原核宿主) 哺乳动物细胞(真核宿主,如 HEK293、CHO)
核心优化目标 消除稀有密码子(如 AGG/AGA/CCC)、避免SD序列干扰 匹配高偏好密码子(如UUG/CGG)、避免miRNA结合位点
关键序列调整 优化5’-端前10-15个密码子(提升翻译起始) 调整GC含量至45%-60%(真核mRNA optimal GC范围)
需规避的风险 避免形成rho因子依赖的终止子序列 消除潜在的内含子剪接位点(如GT-AG序列)
典型优化效果 蛋白产量提升5-50倍(从 “不表达” 到 “高表达”) 产量提升2-10倍,减少蛋白聚集/降解

 

三、不进行密码子优化的后果

    若重组蛋白表达中跳过密码子优化,可能导致以下问题,直接影响实验或生产目标:

    表达量极低或不表达:因稀有密码子导致翻译停滞,或mRNA快速降解;

    蛋白纯度差:产生短片段副产物(翻译提前终止)、错误折叠蛋白(翻译速率异常导致折叠时间不足);

    资源浪费:大量消耗培养基、宿主细胞和时间,却无法获得足量目标蛋白;

    功能异常:部分情况下,即使获得少量蛋白,也可能因翻译过程中的氨基酸掺入错误(稀有密码子导致的 tRNA 错配),导致蛋白活性降低或丧失。


    因此,密码子优化不是 “可选步骤”,而是重组蛋白表达(尤其是异源表达)中确保高效、稳定生产的 “必需步骤”,其本质是通过 “适配宿主的基因语言”,打通从 “目的基因” 到 “功能蛋白” 的转化通路。




X