DNA合成的序列设计中,为何需避免连续6个以上相同碱基(如polyA、polyT)?

信息来源:金开瑞 作者:genecreate_cn 发布时间:2025-11-17 17:22:50

    避免连续6个以上相同碱基,是为了防止合成效率下降、序列错误和产物不均一,这类序列会通过“链内二级结构”和“偶联效率衰减”阻碍偶联步骤。

 

一、避免连续长相同碱基的核心原因

    合成产物易出现缺失或插入突变,长均聚物(如polyA/T/C/G)会导致DNA聚合酶或合成酶“滑移”,比如polyA区域可能少加或多加1-2个A,造成序列不准确。

    产物纯度大幅降低,长相同碱基会让部分合成链提前终止,最终得到长短不一的混合物,后续纯化难度增加。

    影响下游实验,如PCR扩增时引物结合不稳定、测序时信号中断,或克隆时酶切效率下降。

二、对合成偶联步骤的具体阻碍

    DNA合成(固相亚磷酰胺法)的偶联步骤是“逐个添加核苷酸”,长相同碱基主要通过两点干扰该过程:

    链内二级结构形成:连续相同碱基易折叠形成发夹或茎环结构,比如polyT的胸腺嘧啶之间可形成弱氢键,让合成链的3’端被折叠隐藏,导致下一个核苷酸无法有效结合到延伸末端,直接阻断偶联反应。

    偶联效率累积衰减:每个核苷酸的偶联效率约99%,长相同碱基会放大这种衰减——连续6个相同碱基的理论偶联效率仅99%⁶≈94%,若形成二级结构,实际效率会更低,最终导致大量短链杂质产生。

    脱保护不完全干扰:长相同碱基可能影响碱基上保护基团的脱保护反应,残留的保护基团会进一步阻止下一轮核苷酸的偶联,形成“停滞链”。




X