QTG-Seq:QTL快速精細定位新方法

現代作物遺傳改良依賴于農藝性狀遺傳與分子機制的解析,大部分農藝性狀屬于數量性狀,并由復雜的遺傳網絡調控。數量性狀基因(QTGs)的克隆對于作物改良極為重要,傳統方法是通過圖位克隆定位基因,然而此法需要構建高世代群體,大群體篩選交換單株以及考察詳盡的田間表型,因此,比較費時、費力、費錢。雖然關聯分析也是解析QTGs的有效方法,但是很難檢測到稀有等位基因(通常優異農藝性狀所具有的),并且建立群體大小適宜與品種多樣性豐富的種質資源平臺需要耗費較大的代價。

被廣泛應用于遺傳基因定位的另一種方法,BSA,也可有效解析質量與數量性狀。高通量測序技術的快速發展使BSA在基因定位中發揮著巨大潛力,例如,MutMap,SHOREmap與MMAPPR在質量性狀定位中可取代傳統的圖位克隆。對于數量性狀,可利用QTL-seq定位QTLs,但定位區間較大很難識別候選基因,所以非常需要一種新的方法,用于快速定位數量性狀候選基因。

介于上述種種定位方法的局限性,本文介紹一種新的方法——QTG-Seq,即通過QTL分離(即,將數量性狀轉化為質量性狀),極端表型混池,高通量測序以及新算法挖掘候選基因。這一方法是由華中農業大學李林課題組、章元明課題組與中國農科院王國英課題組開發并應用成功,最后以“QTG-seq accelerates QTL fine mapping through QTL partitioning and whole-genome sequencing on bulked segregant samples”為題,在線發表在Molecular Plant上。

QTG-Seq基本原理(流程如下)——

(1)群體構建:?F1,?F2,?BC1F1群體

(2)QTL定位:F2群體定位QTL,F2:3家系證明QTL定位結果

(3)QTL分離:分子標記篩選目標QTL雜合,其它QTL純合的BC1F1單株(BC1F1數目要充足);然后自交得到BC1F1:2家系

(4)極端表型選擇:從BC1F1:2中選2個極端表型組(前20%,后20%,至少1000個單株)

(5)極端表型混池:提取DNA并混池,形成2個極端池

(6)測序并變異calling:對兩個混池測序,與參考基因組比對分析變異

(7)關聯分析:新方法smoothLOD(準確關聯靶標位點),結合其他方法,如ED(Hill et al., 2013)與G’(Magwene et al., 2011)(關聯peak位置)

?圖1.?QTG-Seq基本原理

應用——QTG-Seq快速定位玉米株高QTL,qPH7

以玉米株高為模式性狀展開QTG-seq研究:利用4代玉米群體材料,通過QTL-seq精細定位株高主效QTL,這與傳統QTL精細定位用到許多代創制高世代回交群體明顯不同。首先,利用株高差異明顯的兩個自交系HZS與1462,構建F2分離群體,個體株高變化范圍為199cm~307 cm,呈超親分離的現象,暗示株高是由多個QTLs控制;然后,利用1028個多態性標記定位主效QTLs,結果定位到4個QTL(位于Chr.1,3,6,7),PVE介于7%-17%,又利用F2:3家系驗證QTL定位結果可靠;最后,選擇Chr7.上的QTL?qPH7利用QTL-seq策略進行精細定位。

利用12個標記篩選出813個BC1F1單株(qPH7位點雜合,另外3個QTL位點純合),從中選擇15個材料,自交獲得BC1F1:2家系,并考察株高。共獲得3120個BC1F1:2單株,從中劃分出2個極端表型組,低值組580個單株,高值組567個單株,并分別組成混池(低池與高池);接著,對混池展開全基因組測序(>280×),檢測到197021個高質量SNPs。利用smoothLOD與ED4算法分析出Chr.7只有一個峰,并且峰的位置在135.3Mb。KASP標記分型也證實峰的位置處于135.1與135.2之間。有趣的是,smoothLOD法將qPH7定位在chr:135216475bp,此位點正好處在Zm00001d020874上。Zm00001d020874編碼一個NF-YC結構域蛋白,它的擬南芥同源蛋白與開花時間有關。

圖2.?qPH7精細定位與候選基因挖掘

慮到分離群體中重組blocks的存在,利用增加滑窗大小的方法識別目標區域的重組blocks。由于smoothLOD與G’為連續變量,所以采用ED/SNP的方法分析重組blocks,結果顯示候選基因與peak間距離<150kb。因此,候選基因的區間在300?kb,其中包含13個基因,也包括基因Zm00001d020874。

因為交換單株數量與定位區間大小密切相關,所以確保較大的混池規模至關重要。根據模擬數據,QTG-seq相對低的測序深度(<100×)足夠檢測出所有的重組blocks,因為每個重組block包含許多SNPs,沒必要對每個重組block的所有reads測序。因此,為了平衡定位精度與測序成本,在使用QTG-seq方法時,建議增大混池規模與相對低的測序深度。

為進一步確定候選基因,本研究又通過RNA-seq分析發現,Zm00001d020874表達量在雙親的莖頂端分生組織(SAM)與幼嫩節間組織中存在顯著性差異?;諛餑轄嬙吹鞍墜δ苡雜moothLOD定位信號,認為Zm00001d020874qPH7的候選基因,并且后續的CRISPR基因敲除,蛋白互作驗證等實驗均暗示Zm00001d020874是控制株高的基因。

圖3.?候選基因的驗證

Monte Carlo模擬支持QTG-Seq的可靠

4個Monte Carlo模擬實驗如下:

1.?PVE與QTG位置偏差大?。?%時,接近80kb;≥10%時,30-60kb

2.?取樣率與QTG位置偏差大?。旱比⊙飾?0%時,位置偏差略大;較大的取樣比例會增加群體大小,但有效重組事件數量也會增加

3.?群體大小與QTG位置偏差大?。旱比禾宕笥?000時,位置偏差小于60kb

4.?測序深度與檢測力:當測序深度大于100×時(混池超過1000個個體),檢測力達到100%

圖4.?SmoothLOD算法影響定位準確性的各種因素

QTG-Seq特點總結:

1.?省時省力省錢,不需要構建高世代復雜群體,只需F1,?F2,?BC1F1群體即可實現;

2.?將多個QTL分解為單個QTL分析(數量性狀→質量性狀),即,在每個QTL區域選擇3個(或多個)多態性標記篩選目標QTL雜合,其它QTL純合的交換單株,確保交換單株后續自交發生表型分離以對目標QTL進行解析;

3.?測序策略:高的混池個體數目(數百至上千個個體)與相對低的測序深度(~100×);相對低的測序深度,是因為每條重組block上有多個SNPs,檢測其中1個SNP就可代表;

4.?關聯分析采用新方法smoothLOD,并結合ED與G’,定位精度高,可識別候選基因;smoothLOD可準確關聯靶標位點,而ED與G’關聯peak位置;

5.?可結合KASP標記分型尋找重組斷點等,識別候選基因。

參考文獻:

Zhang H., Wang X., Pan Q., Li P., Liu Y., Lu X., Zhong W., Li M., Han L., Li J., Wang P., Li D., Liu Y., Li Q., Yang F., Zhang Y.-M., Wang G., and Li L. QTG-Seq Accelerates QTL Fine Mapping through QTL Partitioning and Whole-Genome Sequencing of Bulked Segregant Samples.?Mol Plant.?2019 Mar 4;12(3):426-437.

如果您的科研項目有問題,歡迎點擊下方按鈕咨詢我們,我們將免費為您設計文章方案。

 

 

推薦文章