全長轉錄本測序的明星選手Iso-Seq請登場!
【字體: 大 中 小 】 時間:2022年04月12日 來源:基因有限公司
Q:基于NGS的轉錄組測序有什么局限?
A:傳統的轉錄組測序,往往是利用第二代高通量測序(NGS)技術對某一物種特定器官或組織在某一特定狀態下,包括生理,病理等不同狀態下,對所有RNA進行反轉錄形成的cDNA進行測序,從而全面迅速了解特定狀態下幾乎所有的轉錄本信息。目前基于NGS的轉錄組測序在基因表達量分析方面應用頗為廣泛。然而卻也存在一些局限性。
以腫瘤研究為例,腫瘤組織中一方面表現出廣泛的基因組變化,一些腫瘤基因組還出現了染色體重排,基因的融合等現象,同時也表現出了廣泛的轉錄組改變。通;蚪涍^可變剪接,可產生多個轉錄異構體,從而大大增加了基因組的蛋白編碼多樣性。但來自同一個基因的可變剪接異構體也可能有著明顯不同,甚至拮抗的功能作用。而目前癌癥中,亞型水平的可變剪接的整體情況目前也尚不清楚。
短讀長RNA-seq的原理是將RNA,或者cDNA打斷成較小的片段,完整的剪接體亞型也在這一過程中打成碎片。經過NGS測序后,利用生物信息學工具對得到的短序列進行分析,將其重新組裝。由于片段短,組裝存在的錯誤不能避免,RNA-seq幾乎無法獲得所有真實而完整的全長轉錄本信息,因而難以準確表征轉錄異構體的多樣性。
Q:全長轉錄組為什么需要PacBio Iso-Seq?
A:來自PacBio的Iso-Seq測序技術,則可以基于其長讀長(最長reads可達25 kb)和高準確度(≥Q30,即≥99.9%),為腫瘤轉錄本的多樣性提供更為完整的視角。
來自美國杰克遜醫學基因組實驗室的團隊通過Iso-Seq技術鑒定了乳腺癌樣本中數千種以前未注釋的Isoform,約30%影響了外顯子編碼蛋白,并會改變蛋白質的定位和功能。研究者確定了3059個乳腺腫瘤特異性剪接事件,其中35個與患者存活率顯著相關。在這些基因中,21個在GENCODE中缺失,10個在特定的乳腺癌亞型中富集。
總之,該研究結果證明了乳腺癌中以前未知的亞型和剪接事件的復雜性、癌癥亞型特異性和臨床相關性。并提供了豐富的免疫腫瘤學治療靶點資源。
文章中,作者也強調,這些亞型和剪接事件只能被長讀長的方式進行注釋,基于短讀長的NGS很難發現新Isoform。
該研究成果也于2022年1月刊登在了Science Advances雜志。
聚焦 重要研究結論
首先,作者通過PacBio Iso-Seq獲得了全長轉錄本測序結果。通過與參考轉錄組GENCODE v.30的對比,發現了新Isoforms占單個樣本中測序轉錄本的 17% 至 55%,基于長讀長Iso-seq獲得的乳腺癌轉錄組包含 142,514 個獨特的全長轉錄本亞型,跨越 16,772 個注釋基因和 905 個未知位點,平均亞型長度為 2.6 kb?傮w而言,基于PacBio的乳腺癌全長轉錄本測序可識別出數千種在當前轉錄本數據庫中未出現的剪接異構體。
其次,研究人員通過對這些轉錄物相關的基因表達水平和基因途徑,發現了乳腺癌相關癌基因和通路中,與大量過去未知的剪接異構體相關。
研究中,作者也發現了與存活率相關的腫瘤特異性Isoform。與腫瘤鄰近組織和正常組織相比,乳腺癌患者具有顯著獨特的可變剪接體。
總結
在該研究中,基于PacBio長讀長的Iso-Seq技術發揮了決定性的作用。為研究腫瘤相關的Isoform提供了新的方法和全面的視角。
另外,基于PacBio CCS模式的Iso-Seq技術,以其讀長的優勢,甚至還能對長達10 kb的全長轉錄本,可變剪接體,產片段非編碼RNA等序列進行全長的精準分析,更進一步的還能夠通過轉錄本上所檢測到的單堿基多態性(SNP)來對等位基因的不平衡表達進行分析。Iso-Seq這一系列的優勢,更進一步改善了基因的注釋和發掘,必將給您在基因組學,轉錄組學的研究領域,帶來更多新的發現。
參考文獻:
Veiga, Diogo FT, et al. "A comprehensive long-read isoform analysis platform and sequencing resource for breast cancer." Science advances 8.3 (2022): eabg6711.
掃描二維碼,添加企業微信聯系人HiFi reads,了解PacBio的最新資訊,還可以與我們在線聯系。
基因有限公司作為PacBio公司在中國區的獨家代理商,自2011年以來將PacBio第三代單分子實時測序技術引入國內,一直為國內用戶提供專業的三代測序系統的安裝培訓,技術支持,應用培訓與售后維護工作,贏得客戶的一致好評與信任;蛴邢薰緦⒁蝗缂韧闹С衷絹碓蕉嗟腜acBio用戶。