ThruPLEX Tag-seq Kit是用于以cell-free DNA和片段化的雙鏈DNA起始制備Illumina NGS的DNA文庫試劑盒。ThruPLEX Tag-seq能夠生成高GC覆蓋的多種文庫,1~50 ng DNA起始可以得到再現(xiàn)性好的測序結(jié)果。
ThruPLEX Tag-seq Kit包含特別設(shè)計的ThruPLEX Stem-Loop 接頭,該接頭中含有能夠識別各起始DNA片段的分子標簽UMT。每個試劑盒包含超過1,600萬種以上的分子標簽,用于在擴增前標記每條DNA片段,可以在文庫制備、目標富集和數(shù)據(jù)分析過程中追蹤DNA片段,從而能夠高靈敏度且高特異性的檢測低頻變異。
ThruPLEX Tag-seq文庫的制備過程中,為標記識別起始的DNA片段,在連接步驟中加入分子標簽(UMT)。具有不同UMT的測序reads代表不同的原始分子,具有相同UMT的測序reads是相同原始分子經(jīng)PCR擴增的結(jié)果。后續(xù)進行數(shù)據(jù)處理時將帶有相同UMT的測序reads分為一組,每一組稱為一個擴增家族,比較各擴增家族內(nèi)部的reads能夠去除擴增錯誤和測序錯誤,得到共有序列后能夠進一步提高變異檢出的準確度。
通過ThruPLEX Stem-Loop adaptor的連接,在每個ThruPLEX Tag-seq文庫DNA片段的兩端添加6堿基的隨機序列。每個6堿基的隨機序列有46(4,096)個組合。DNA片段兩端的6堿基序列組合后,能夠得到1,600萬(4,096 × 4,096)個分子標簽,通過這些分子標簽?zāi)軌蜃R別Input DNA分子。
為實現(xiàn)所需的檢測靈敏度,需要制備含有足夠變異體拷貝數(shù)的文庫,此時適當?shù)腄NA起始量非常重要。 通常情況下等位基因存在的頻率越低,所需的起始DNA量就越多。例如,假設(shè)10 ng的DNA樣品,含有足夠檢出1%等位基因所需的拷貝數(shù)。詳細請見ThruPLEX Tag-seq Kit操作說明書的C.III部分及下述表格。由于在文庫制備及靶標富集時DNA有損失,因此能夠檢出的拷貝數(shù)低于下表所列的數(shù)值。
|
利用ThruPLEX Tag-seq文庫的分子標簽構(gòu)建共有序列,需要足夠的覆蓋度。通常情況下等位基因存在的頻率越低,檢出所需的測序深度越高。例如,目的峰擴增家族大小為每1分子10個reads,為確定變異最少需要3個分子的情況下,讀取等位基因頻率為5%的變異體至少需要600x的測序深度。同樣,等位基因變異頻率為1%突變體的確定至少需要3000x,等位基因變異頻率為0.5%則需要6000x的覆蓋度。詳細內(nèi)容請參考ThruPLEX Tag-seq Kit操作說明書的C.III部分及下表。
關(guān)于所需reads相關(guān)的內(nèi)容請見下述鏈接
https://www.takarabio.com/learning-centers/next-generation-sequencing/technology-and-application-overviews/sequencing-depth-for-smarter-thruplex-tag-seq
|
有,ThruPLEX Tag-seq kit可與Agilent SureSelect、Roche NimbleGen SeqCap EZ、IDT xGen等主要的靶標富集制品搭配使用。靶標富集的protocol請見以下鏈接內(nèi)容:
https://www.takarabio.com/learning-centers/next-generation-sequencing/dna-seq-protocols
可以,ThruPLEX Tag-seq文庫,可在同一個lane中與其他Illumina NGS用文庫一起測序。但是,需要在各樣品中預(yù)先加入不同的index,同時需要注意測序的覆蓋度要充足。利用分子標簽(UMT),ThruPLEX Tag-seq文庫經(jīng)靶標富集后通常需要使用較高的深度測序。
通過使用分子標簽(UMT)得到的ThruPLEX Tag-seq文庫的測序數(shù)據(jù),首先要按照每個擴增家族分成組, 然后構(gòu)建共有序列。針對于ThruPLEX Tag-seq文庫的數(shù)據(jù)處理推薦使用以下2個專用數(shù)據(jù)分析的平臺:
·Curio
Curio是由Curio Genomics提供的基于云計算平臺。使用時,可簡單的將ThruPLEX Tag-seq文庫的測序數(shù)據(jù)上傳、處理及可視化。該平臺具有快速、用戶友好的界面和高效的alignment viewer。同時該平臺還配有模擬變異體檢出、分析及可視化過程的模型。詳細請見以下鏈接www.curiogenomics.com
·Connor
在GitHub(https://github.com/umich-brcf-bioinf/Connor)上有Connor版塊,是可以處理ThruPLEX Tag-seq文庫數(shù)據(jù)的開放型生物信息分析工具。輸入alignment之后的BAM文件,處理UMT信息,之后生成含有共有序列的BAM輸出文件。輸出的BAM文件可用于如FreeBayes、VarScan2及GATK HaplotypeCaller等的variant caller工具。
由于每個Pipeline均不相同,因此推薦使用ThruPLEX Tag-seq文庫處理用的開放型生物信息分析工具-Connor。如果想改變您現(xiàn)有的Pipeline,下述信息可能會對您有幫助。ThruPLEX Tag-seq文庫的兩端各帶有6堿基的識別用分子標簽(UMT)。UMT無論是從Read 1開始還是從Read 2開始讀取都是最初的堿基,然后是8~11個堿基的Stem序列,接下來是template DNA序列。文庫構(gòu)造的詳細信息請參考ThruPLEX Tag-seq Kit操作說明書。
頁面更新:2019-11-12 15:38:36