一、基因探针

基因探针(probe)就是一段与目的基因或DNA互补的特异核苷酸序列,它可以包括整个基因,也可以仅仅是/基因的一部分;可以是DNA本身,也可以是由之转录而来的RNA。

1.探针的来源DNA探针根据其来源有3种:一种来自基因组中有关的基因本身,称为基因组探针(genomic probe);另一种是从相应的基因转录获得了mRNA,再通过逆转录得到的探针,称为cDNa 探针(cDNa probe)。与基因组探针不同的是,cDNA探针不含有内含子序列。此外,还可在体外人工合成碱基数不多的与基因序列互补的DNA片段,称为寡核苷酸探针。

2.探针的制备进行分子突变需要大量的探针拷贝,后者一般是通过分子克隆(molecular cloning)获得的。克隆是指用无性繁殖方法获得同一个体、细胞或分子的大量复制品。当制备基因组DNA探针进,应先制备基因组文库,即把基因组DNA打断,或用限制性酶作不完全水解,得到许多大小不等的随机片段,将这些片段体外重组到运载体(噬菌体、质粒等)中去,再将后者转染适当的宿主细胞如大肠肝菌,这时在固体培养基上可以得到许多携带有不同DNA片段的克隆噬菌斑,通过原位杂交,从中可筛出含有目的基因片段的克隆,然后通过细胞扩增,制备出大量的探针。

为了制备cDNA 探针,首先需分离纯化相应mRNA,这从含有大量mRNA的组织、细胞中比较容易做到,如从造血细胞中制备α或β珠蛋白mRNA。有了mRNA作模板后,在逆转录酶的作用下,就可以合成与之互补的DNA(即cDNA),cDNA与待测基因的编码区有完全相同的碱基顺序,但内含子已在加工过程中切除。

寡核苷酸探针是人工合成的,与已知基因DNA互补的,长度可从十几到几十个核苷酸的片段。如仅知蛋白质的氨基酸顺序量,也可以按氨基酸的密码推导出核苷酸序列,并用化学方法合成。

3.探针的标记为了确定探针是否与相应的基因组DNA杂交,有必要对探针加以标记,以便在结合部位获得可识别的信号,通常采用放射性同位素32P标记探针的某种核苷酸α磷酸基。但近年来已发展了一些用非同位素如生物素、地高辛配体等作为标记物的方法。但都不及同位素敏感。非同位素标记的优点是保存时间较长,而且避免了同位素的污染。最常用的探针标记法是缺口平移法(nicktranslation),其原理如图13-1。首先用适当浓度的DNA酶Ⅰ(DNAseⅠ)在探针DNA双链上造成缺口,然后再借助于DNA聚合酶Ⅰ(DNa poly merasⅠ)的5’→3’的外切酶活性,切去带有5’磷酸的核苷酸;同时又利用该酶的5’→3’聚酶活性,使32P标记的互补核苷酸补入缺口,DNA聚合酶Ⅰ的这两种活性的交替作用,使缺口不断向3’的方向移动,同时DNA链上的核苷酸不断为32P标记的核苷酸所取代。

缺口平移标记法粗线示标记部分

图13-1 缺口平移标记法粗线示标记部分

探针的标记也可以采用随机引物法,即向变性的探针溶液加入6个核苷酸的随机DNA小片段,作为引物,当后者与单链DNA互补结合后,按碱基互补原则不断在其3’OH端添加同位素标记的单核苷酸,这样也可以获得比放射性很高的DNA探针。

二、限制性核酸内切酶

限制性核酸内切酶(restrictionendonuclease),又简称限制酶或内切酶。它们是基因工程和基因诊断重要的一类工具酶。它们的发现和应用为从基因组中分离目的基因提供了必要的手段.限制酶能特异地识别和切割特异的核苷酸序列,将双链DNA切成较小的片段。酶切后目的基因可能完整地或部分地保存于某一DNA片段上,并被分离出来。

限制酶主要来源于原核生物,是一组能水解DNA磷酸二酯键的酶。迄今已发现的限制酶多达数百种,分为三类。在基因工程中使用的主要是第二类。限制酶根据其来源命名。例如,限制酶EcoRⅠ来源于大杆菌E.coli的RY13菌株,Ⅰ指在该菌株中分离的第一个限制酶。

第一节 基因诊断的原理(当前章节内容组合) - 图2

下面是一些最常用的限制酶的来源及其识别顺序(表13-1)

每种限制酶识别和切割的通常为4-6个核苷酸序列,称为限制性位点(restriction sites)或切点.限制酶切割双链DNA的方式有两种,产生的末端也有两种:第一种是交错切割,即两条链的切点不在同一水平而是相隔数个碱基,故断口产生两小段自身互补的单链,这种末端容易互补连接,称为粘性末端(cohesive terminus);第二种为平整切割,即两

表13-1 常用的限制酶的来源及其识别顺序列

名称 识别序列 来源
Ava C↓(C/T)CG(A/G)G Anabaena variabilis
Bam H G↓GATCC Bacillus amyloliquefaciens H
Bgl Ⅱ A↓GATCT Bacillus globigii
Eco RⅠ G↓(*/A)ATTC Escherichia coliRY13
Eco RⅡ ↓CC( A/T)GG Escherichia coliR245
HaeⅢ GG↓(*/C)C Haemophilus aegyptius
HindⅢ (*/A)↓AGCTT Hemophilus influenzae Rd
HpaⅠ GTT↓AAC Haemophilus parainfluenzae
HpaⅡ C↓(*/C)GG 同上
KpnⅠ GGTAC↓C Klebsiella pneumoniae
MboⅠ ↓GATC Moraxella bovis
PstⅠ CTGCA↓G Providencia stuartii

*被甲基化

条链在同一水平切开,得到平齐末端(blunt terminus)(图13-2)。由于具有相同粘性

限制酶的两类切割方式

图13-2 限制酶的两类切割方式

末端的DNA片段在DNA连接酶的作用下很容易共价连接,因此被广泛地应用于重组DNA操作中。具有相同平齐末端的DNA片段也可以连接,但连接效率只有粘性末端连接效率的1%。

限制酶的上述特性在基因工程和基因诊断中具有重要用途:①首先不论DNA的来源如何,用同一种内切酶切割后产生的粘性末端很容易重新连接,因此很容易将人和细菌或人和质粒任何两个DNA片段连接在一起,即重新组合,这是重组DNA技术的基础。②人类的基因组很大,不切割无法分析其中的基因。限制酶能把基因组在特异的部位切开,即切割不是随机的,因而从每个细胞的基因组得到的是相同的一组长度各异的片段。这些可能含有某一基因的片段可用电泳分离,并加以研究。③由于限制酶的特异性,如果识别位点的碱基发生了改变,限制酶将不再能切割;同样,碱基的改变也可能导致出现新的酸切位点。在人类基因组中,这两种情况是十分常见的,而切点的消失或出现将影响获得的DNA片段的长度,表现为限制性片段长度多态性(RFLP),这在基因的连锁诊断中具有极重要的意义。

三、限制性片段长度多态性

一个人的两套单倍体DNA是不完全相同的,一般每100-500个碱基对就有一个是不相同的。换言之,如果把两套基因组DNA(各3.2×109bp)排列起来,那么平均有1000万处不同,它们多位于内含子序列中。实际上,除单卵双生子外,人群中没有两个个体的基因组DNA是完全相同的。

DNA的多态性虽可通过DNA测序检出,但用限制酶消化却是最常用的检测方法。

1.RFLP由于碱基的变异可能导致酶切点的消失或新的切点出现,从而引起不同个体在用同一限制酶切时,DNA片段长度出现差异(图13-3),这种由于内切酶切点变化所导致的DNA片段长度的差异,称为限制性片段长度多态性(restriction fragmentlength polymporphism, RFLP)。RFLP反映了常见的个体间DNA核苷酸的可遗传性变异,它按照孟德尔方式遗传。RFLP可用Southern印迹杂交法(见下节)检出。用Southern杂交检出RFLP时,如探针跨越切点,则被切开的两个片段均可与探针杂交,从而显示两条杂交带(图13-4)。

RFLP示意图箭头酶切位点

图13-3 RFLP示意图箭头酶切位点;

左图:等位基因2由于出现新的切点,DNA片段缩至8kb;

右图:DNA片段电泳后杂交图

RFLP的检出等位基因

13-4 RFLP的检出等位基因1因有额外切点而导致产生

两个长短不同的DNA片段(3kb及5kb)且均能与探针杂交

2.两点RFLP

(1)点多态(point polymorphism):是由于单个或少数碱基的改变引起酶切点的出现或消失所致的RFLP。上述的RFLP即属于这一类。它们属经典的RFLP。在人类基因组中已发现数以百计的此类多态位点。

(2)数目变异的串连重复(variable number tandem repeats,VNTR):上述经典的单个碱基取代所致的RFLP一般只能检测到一种杂合性的两种形式,即“有”或“无”某个限制酶切位点,而且每个位点在人群中的杂合子频率通常不会超过50%,当被测个体为纯合状态时,利用RFLP就无法得到所需要的多态信息。此外,在整个基因组中,这类RFLP目前发现的数量还有限,并分布不匀。

但是,在人类基因组中还存在一类DNA重复序列,称为小卫星DNA。它们分布十分广泛,每一个单位通常只有16-28bp长,但其重复次数在人群中是高度变异的。当用限制酶切割VNTR区时,只要酶切点不在重复区内,就可能得到各种长度不同的片段(图13-5)

与小卫星DNA不同,另一类重复序列是卫星DNA。它们的基本序列有1-6bp,如(TA)n、(CGG)n等,通常重复10-60次并呈高度的多态性。

VNTR导致的RFLP重复次数的变异致酶切位点的移动和DNA片段长度的变异

图13-5 VNTR导致的RFLP重复次数的变异致酶切位点的移动和DNA片段长度的变异

VNTR具有高度的变异性,同时也是按照孟德尔方式遗传的,因此是很好的遗传标记,由于它们类型众多和在基因组中分布广泛,因而在基因连锁诊断中应用日益广泛。