在DNA的一级结构中,四种碱基A,T,C,G远非均匀分布,尽管双螺旋的构型大体相同,但沿着DNA链各处的物理结构不完全相同,各处双螺旋的稳定性也就显示出差别,充分体现了DNA一级结构决定高级结构的原理。其不均一性主要有:
1.反向重复序列(inverted repeats)
又称回文序列(palindrome),它能在DNA或RNA中形成发夹结构。这种回文结构通常是作为一种特别信号,如限制性核酸内切酸(restriction encl闩迥onuclease)及调节蛋白的识别位点,转录终止信号等。
2.富含A/T的序列
在高等生物中,A+T与G+C的含量差不多相等,然而在它们的染色体某一区域,A·T含量可能相当高。如在很多有重要调节功能的DNA区段都富含A·T,特别是在复制起点和启动子的Pribnow框(真核生物为TATA框)的序列中,其对于复制和起始十分重要。因为A-T对只有二条氢键,此处的双链较G-C对处易于解开,有利于起始复合物的形成。
3.嘌呤和嘧啶的排列顺序对双螺旋结构稳定性的影响。
人们考察了十种相邻的二核苷酸对(nearestneighbor doublets),发现一个非常有趣的现象,那就是碱基组成相同,但嘌呤和嘧啶的排列顺序不同,双螺旋的稳定性具有显著的差异。例如5′Gc3′ 3′G 5′和5′GC 3′ 3′GC 5′的稳定性相差很大,前者的稳定性远大于后。它们的氢键数目是相同的,它们的差别在于相邻碱基之间的堆集力不同。即从嘌呤到嘧啶的方向的碱基堆集作用显著地大于同样组成的嘧啶到嘌呤方向的碱基堆集作用。(这里的方向就是常规的从5′端到3′端的方向)。这是因为前者的嘌呤环和嘧啶环重迭面积大于后者的嘧啶环和嘌呤环的重迭面积,这在B型DNA中确是如此。
根据Gotoh 1981年的研究,十种相邻二核苷酸对的Tm值如表15?所示,单位为℃,所用离子强度为19.5mmol/l Na+。
表15-5 相邻二核苷酸对Tm值
3′ | |||||
A | T | G | C | ||
5′ | A | 54.50 | 57.02 | 58.42 | 97.73 |
T | 36.73 | 54.50 | 54.71 | 86.44 | |
G | 86.44 | 97.73 | 85.97 | 136.12 | |
C | 54.71 | 58.42 | 72.55 | 85.97 |
由表15-5可以看到,5′TA 3′ 3′AT5′的Tm值最低。在真核生物中,常可以在19到27的位置上看到一个叫做TATA框的结构(又称Hogness框),这是RNA聚合酶的结合位点。在这里RNA聚合酶和有关蛋白质因子形成转录起始复合物。
又如,生命有机体选择UAA作为最有效的终止密码子绝不是偶然的,因为64个三联体密码子中,它与反密码子(假定有的话)形成的互补产物5′UAA3′3′AUU5′的Tm值是最低的一个,即使在生理温度下也是不稳定的。当初有人花了很多工夫去寻找一个不携带氨基酸的专供肽链终止用的tRNA,其实并不存在这种tRNA。肽链的释放是由释放因子RF在起作用。在三种终止密码子中,UAG和UGA常会为突变型的tRNA无义抑制,而UAA则很少发生无义抑制也可能就是这个道理。这也就说明了为什么在肽链终止处常常会出现双重终止密码子。