-
SNP分型的關鍵難點:高同源區段類型解析
發布時間: 2025-11-11 點擊次數: 163次高等動植物基因組中含有大量高同源序列,例如人類基因組中高度重復序列占比就超過50%。這些序列給SNP分型帶來顯著挑戰,主要包括以下幾類高同源區段:
1.亞基因組
多倍體生物中,由不同祖先基因組分化形成的同源染色體組,保留獨立基因簇,但存在高度同源序列。植物和魚類等生物由于遠緣雜交或染色體加倍具有異源多倍體(亞基因組)。常見的小麥和鯉魚就是天然多倍體。
2.假基因
基因組中與功能基因(稱為“編碼基因")序列相似,但失去了編碼蛋白質的能力的DNA片段。如人血紅蛋白ψβ1含多個終止突變;人磷酸甘油酸激酶ψ1則是因為mRNA逆轉錄插入缺失啟動子。
3.重復序列
還有一類是重復序列(主要是轉座子)SNP變異,分析這些內部SNP可以追溯重復序列擴增的歷史時序,區分功能性拷貝與缺陷拷貝。
4.同源基因
基因家族序列同源性很高,通過常規測序或比對難以精確定位到具體哪個成員。但在進化過程中會積累成員特異性的SNP,可以用來精確區分,確定某個序列讀長或變異來源于哪個特定成員。人和小鼠的P450基因家族是直系同源(物種分化形成),而人HLA基因家族則是旁系同源(基因復制形成,功能可能分化)。
高同源區段SNP檢測存在諸多難點。如下圖所示,常見技術的PCR引物難以區分高同源區段,易出現非特異性擴增/雜交等問題。




產品分類

