測序原理:壹代二代三代測序原理詳解
雙脫氧鏈終止法采用DNA復制原理。 Sanger測序反應體系中包括目標DNA片段、脫氧三磷酸核苷酸(dNTP)、雙脫氧三磷酸核苷酸(ddNTP)、測序引物及DNA聚合酶等。 測序反應的核心就是其使用的ddNTP:由於缺少3'-OH基團,不具有與另壹個dNTP連接形成磷酸二酯鍵的能力,這些ddNTP可用來中止DNA鏈的延伸。此外,這些ddNTP上連接有放射性同位素或熒光標記基團,因此可以被自動化的儀器或凝膠成像系統所檢測到。
Roche公司的454技術、illumina公司的Solexa/Hiseq技術和ABI公司的SOLID技術標誌第二代測序技術誕生。其中Roche公司的454測序系統是第二代測序技術中第壹個商業化運營的測序平臺。
其中Illumina市場規模占到75%以上,主要包括Miseq,Hiseq。下面?就主要介紹它的PE(Pair End雙端)測序原理:
名詞:
flowcell: 測序反應的載體/容器,1個flowcell有8個lane
lane: 測序反應的平行泳道,試劑添加、洗脫等過程的發生位置
tile: 每次熒光掃描的位置,肉眼是看不到的
雙端測序: 可能序列比較長有四五百bp,兩邊各測120-150bp
junction: 雙端測序中間壹些沒有測到的區域
index(barcode):壹個lane通常要測多個樣品,每個樣品都加上特定的序列標簽,用於區分不同樣品。
flowcell構造:壹個lane包含兩列(swath),每壹列有60個tile,每個tile會種下不同的cluster,每個tile在壹次循環中會拍照4次(每個堿基壹次)
打斷以後會出現末端不平整的情況,用酶補平,所以現在的序列是平末端。
完成補平以後,在3'端使用酶加上壹個特異的堿基A,加上A之後就可以利用互補配對的原則,加上adapter,這個adpater可以分成兩個部分,壹個部分是測序的時候需要用的引物序列,另壹部分是建庫擴增時候需要用的引物序列。
進行PCR擴增,使得我們的DNA樣品濃度足夠上機要求。
reads1 與 reads2 不發生重疊
flowcell是用於吸附流動DNA片段的槽道,測序就在此進行。上面構建好的文庫中的待測序列事先配置好壹定的濃度,經過這裏的時候,會在特異的化學試劑作用下,強力隨機地附著在lane上,與上面的短序列配對。上樣的結果就是lane吸附住了沖過來的DNA,並且可以在表面進行橋式PCR擴增。
雙端測序之Forward Strand :
為什麽Illumina測序會有長度限制呢?
Hiseq2000測序儀
測序儀搭配了兩個flowcell,簡稱雙流動槽。比較經典的Hiseq2500壹次能產出700-800Gb數據(此處Gb為測序堿基數,不同於字節數的Gb)
數據量=單端reads長度 * 單端reads個數 * 2(PE)
測序深度=數據量大小 / 參考基因組大小
這是壹個新的裏程碑。以PacBio公司的SMRT和Oxford Nanopore Technologies的納米孔單分子測序技術為標誌,被稱之為第三代測序技術。與前兩代相比,最大的特點就是單分子測序,測序過程無需進行PCR擴增,超長讀長,平均達到10Kb-15Kb,是二代測序技術的100倍以上,值得註意的是在測序過程中這些序列的讀長也不再是相等的。
1. /p/101c14c3a1d2
2. /p/20702684
3. /s/tWHWA-f1RnP_XWY66p12pg
4. /s/9KUY43lD5miLdPZJKgRV0A