常用的遺傳標記主要有各種血型,各種蛋白質的電泳行為,蛋白質的氨基酸組成,等位基因和特定的DNA序列等。這些遺傳標記在早期構建遺傳圖時,常用作制圖的界標。現在已有很多種作圖的界標,現分述于下:
①限制性片段長度多態性(RFLPs) 指用某一種限制性內切酶切割不同個體的DNA時,會產生長度不同的DNA片段,這反映出不同個體來源的DNA序列有差別,當這些差別發生在限制性內切酶的識別序列中時,限制酶就不能再識別這個切割位置,于是就少了一個切割點,切成的DNA片段也就少了一個,但有一個片段的長度卻增加了。同樣,當DNA的差別造成一個新的識別序列時,限制酶就多了一個切點,切成的片段也就多了一個,但有一個片段的長度縮短了。這種酶切片段數目和長度的變化,可作為一個個體的DNA序列的標記,通過家系中親代和子代的DNA分析,便可研究其RFLPs的遺傳規律,此時的RFLPs就相當于等位基因,可以分析其連鎖交換頻率而算出其遺傳距離,作為遺傳圖的作圖界標。人基因組有105以上的RFLPs界標。RFLPs是反映了基因組DNA的等位片段的多態性。將這種多態性信息與生物體的某一特定表型或性狀之間的關系進行連鎖分析,就有可能把決定該表型或性狀的基因定位在遺傳圖的某一位置上。
②微衛星DNA多態界標 在基因組DNA中廣泛分布著單位長度為6~12個核苷酸的串聯重復序列,這些重復單位以正向(頭—尾)或反向(頭—頭,尾—尾)串聯成簇。在DNA的某些位置上這種串聯成簇的重復單位數目不同。因此,用在串聯重復序列兩側切割的限制性內切酶酶切后,就會產生重復單位數目不等的片段。這種數量可變串聯重復序列(variablenumber of tandemrepeat,VNTR)的片段長度不同,可作為多態性界標。
短串聯重復序列(short tandem repeat,STR)是另一類多態性界標。STR的重復單元長度為2—6個核苷酸。在不同個體的基因組中,這種重復單元的數目變異很大,因而比RFLPs和VNTR有更高的多態性;同時,STR在基因組中的豐度很高,基本上是平均分布并便于用PCR檢測,可以大大提高遺傳制圖的精度。
③單核苷酸多態(single nucleotide polymorphism,SNP)界標 在一個群體中,基因組內某一基因座上可以有兩個或兩個以上的等位基因,這是等位基因的多態性。同樣,在基因組內某一特定核苷酸位置上,也可以有不同的核苷酸。SNP就是指基因組內特定核苷酸位置上存在兩種不同的核苷酸且其出現頻率大于1%(也有人提出為2%)。換言之,如出現頻率低于1%(或2%),則視作點突變。SNP作為單堿基的置換,在群體中只有兩種等位型可以檢出,就形成雙等位標記(biallelic marker),這種界標在人基因組中可多達300萬個,平均每1 300 bp就會有一個。因此,3到4個這種相鄰的界標構成的單倍型(haplotype)就可以有8~16種。由于兩個人的基因組作比較時,平均每1 300個核苷酸中有1個差別,所以這種界標數目極多,覆蓋密度大,由此可以大大提高基因組作圖和基因定位的精度。
SNP作為一種堿基的置換,大多數是轉換,即兩種嘌呤間和兩種嘧啶間的置換。SNP在CG序列上出現最為頻繁,而且多半是C轉換成T,因為C常自發地脫氧后成為T。SNP可以人為地劃分為兩種,一種是遍布在基因組非編碼序列中的單核苷酸變異;另一種則是分布在基因編碼序列中的SNP,稱之為cSNP(coding SNPs)。cSNP或者是“靜默的”、“同義的”不改變編碼產生的蛋白質;或者是“非同義的”,會改變編碼產生的蛋白質的序列,形成了蛋白質的多態性,在功能上有其效應。可是迄今與疾病等直接相關的SNP是很罕見的。cSNP同點突變之間的差別只在于其在群體出現的頻率,即上面提到的出現頻率大于1%(2%)的歸為多態,低于1%(2%)的則歸人點突變。
④非多態的短單一序列作為界標 在構建基因組物理圖時可以用非多態的長度為300 bp左右的單一序列作為界標。常用的有標定位置序列(sequence tagged site,STS)和表達序列標簽(expressed sequence tag,EST)。前者是基因組中的單一DNA序列,后者是某一cDNA分子所特有的一段DNA序列。這種界標可以直接標定在基因組上,并便于用PCR進行驗證。EST是代表一種cDNA分子,也就是代表一個基因,但一種cDNA分子或一個基因可以有不止一個EST。由EST構成的圖譜,有助于構建轉錄圖或基因圖。
①限制性片段長度多態性(RFLPs) 指用某一種限制性內切酶切割不同個體的DNA時,會產生長度不同的DNA片段,這反映出不同個體來源的DNA序列有差別,當這些差別發生在限制性內切酶的識別序列中時,限制酶就不能再識別這個切割位置,于是就少了一個切割點,切成的DNA片段也就少了一個,但有一個片段的長度卻增加了。同樣,當DNA的差別造成一個新的識別序列時,限制酶就多了一個切點,切成的片段也就多了一個,但有一個片段的長度縮短了。這種酶切片段數目和長度的變化,可作為一個個體的DNA序列的標記,通過家系中親代和子代的DNA分析,便可研究其RFLPs的遺傳規律,此時的RFLPs就相當于等位基因,可以分析其連鎖交換頻率而算出其遺傳距離,作為遺傳圖的作圖界標。人基因組有105以上的RFLPs界標。RFLPs是反映了基因組DNA的等位片段的多態性。將這種多態性信息與生物體的某一特定表型或性狀之間的關系進行連鎖分析,就有可能把決定該表型或性狀的基因定位在遺傳圖的某一位置上。
②微衛星DNA多態界標 在基因組DNA中廣泛分布著單位長度為6~12個核苷酸的串聯重復序列,這些重復單位以正向(頭—尾)或反向(頭—頭,尾—尾)串聯成簇。在DNA的某些位置上這種串聯成簇的重復單位數目不同。因此,用在串聯重復序列兩側切割的限制性內切酶酶切后,就會產生重復單位數目不等的片段。這種數量可變串聯重復序列(variablenumber of tandemrepeat,VNTR)的片段長度不同,可作為多態性界標。
短串聯重復序列(short tandem repeat,STR)是另一類多態性界標。STR的重復單元長度為2—6個核苷酸。在不同個體的基因組中,這種重復單元的數目變異很大,因而比RFLPs和VNTR有更高的多態性;同時,STR在基因組中的豐度很高,基本上是平均分布并便于用PCR檢測,可以大大提高遺傳制圖的精度。
③單核苷酸多態(single nucleotide polymorphism,SNP)界標 在一個群體中,基因組內某一基因座上可以有兩個或兩個以上的等位基因,這是等位基因的多態性。同樣,在基因組內某一特定核苷酸位置上,也可以有不同的核苷酸。SNP就是指基因組內特定核苷酸位置上存在兩種不同的核苷酸且其出現頻率大于1%(也有人提出為2%)。換言之,如出現頻率低于1%(或2%),則視作點突變。SNP作為單堿基的置換,在群體中只有兩種等位型可以檢出,就形成雙等位標記(biallelic marker),這種界標在人基因組中可多達300萬個,平均每1 300 bp就會有一個。因此,3到4個這種相鄰的界標構成的單倍型(haplotype)就可以有8~16種。由于兩個人的基因組作比較時,平均每1 300個核苷酸中有1個差別,所以這種界標數目極多,覆蓋密度大,由此可以大大提高基因組作圖和基因定位的精度。
SNP作為一種堿基的置換,大多數是轉換,即兩種嘌呤間和兩種嘧啶間的置換。SNP在CG序列上出現最為頻繁,而且多半是C轉換成T,因為C常自發地脫氧后成為T。SNP可以人為地劃分為兩種,一種是遍布在基因組非編碼序列中的單核苷酸變異;另一種則是分布在基因編碼序列中的SNP,稱之為cSNP(coding SNPs)。cSNP或者是“靜默的”、“同義的”不改變編碼產生的蛋白質;或者是“非同義的”,會改變編碼產生的蛋白質的序列,形成了蛋白質的多態性,在功能上有其效應。可是迄今與疾病等直接相關的SNP是很罕見的。cSNP同點突變之間的差別只在于其在群體出現的頻率,即上面提到的出現頻率大于1%(2%)的歸為多態,低于1%(2%)的則歸人點突變。
④非多態的短單一序列作為界標 在構建基因組物理圖時可以用非多態的長度為300 bp左右的單一序列作為界標。常用的有標定位置序列(sequence tagged site,STS)和表達序列標簽(expressed sequence tag,EST)。前者是基因組中的單一DNA序列,后者是某一cDNA分子所特有的一段DNA序列。這種界標可以直接標定在基因組上,并便于用PCR進行驗證。EST是代表一種cDNA分子,也就是代表一個基因,但一種cDNA分子或一個基因可以有不止一個EST。由EST構成的圖譜,有助于構建轉錄圖或基因圖。