基因融合
基因融合在基因組中非常普遍,也是一些類(lèi)型癌癥的標志。它是由兩個(gè)不相關(guān)的基因融合形成的一種基因產(chǎn)物,具有全新的功能或與兩個(gè)融合前基因不同的功能。一個(gè)強啟動(dòng)子與一個(gè)下游功能基因(原癌基因)的融合在某些癌癥中是普遍的。創(chuàng )建融合基因的機制與生成基因的功能一樣多變。據估計半數的前列腺癌含有TMPRSS2和ETS轉錄因子家族成員之間的融合。目前有幾種測序的方法用于研究融合基因,如腫瘤的全基因組測序和mRNA-Seq。
全基因組測序研究的成功要點(diǎn):
利用Illumina的測序技術(shù)很容易檢測基因融合,其中末端配對(PE)測序的應用對成功檢測融合基因尤為關(guān)鍵。全基因組測序及末端配對序列是目前檢測所有基因融合的最準確、最全面的工具,這些基因融合包括了重復、倒位、覆蓋和單堿基插入缺失。
全基因組測序在發(fā)現全新的基因融合斷裂點(diǎn)方面更勝一籌,測序的深度和更長(cháng)的測序序列實(shí)現了在融合連接單元單堿基的分辨率,為研究產(chǎn)生融合的機制提供了線(xiàn)索。這一能力是測序所獨有的。
mRNA-Seq是一種非常高效的方法,能為大量樣品的篩查提供一種相對經(jīng)濟高效的途徑。mRNA-Seq研究一般基于高表達融合基因將有著(zhù)最大生物學(xué)影響的假設,它對檢測高表達癌基因特別有效,但僅限于有著(zhù)polyA尾巴的基因,很難獲得基因間隔區域和UTR區域上的信息。
大多數RNA-Seq分析比對的算法假設RNA序列中的所有相關(guān)序列片段均來(lái)自同一個(gè)染色體,而基因融合的兩個(gè)基因往往來(lái)自?xún)蓚€(gè)不同染色體,例如斷裂-融合-橋接循環(huán)所產(chǎn)生的基因融合對于這類(lèi)情況,傳統算法往往無(wú)法檢測或正確拼接。
許多研究使用培養的細胞系,腫瘤細胞系更是癌癥研究的常規工具,但這些細胞系能在多大程度上代表原發(fā)腫瘤仍不清楚。天生不穩定的細胞系經(jīng)過(guò)長(cháng)時(shí)間培養后可積累大量突變,而培養過(guò)程中種群減少所造成的遺傳瓶頸又會(huì )大大加速突變的累積。
目前大部分發(fā)表的研究所包含的樣品數量是非常少的,所以大部分測序研究被認為是假設推導生成的。在測序實(shí)驗的設計中,許多未解決的問(wèn)題仍然存在,例如我們還不清楚在測序實(shí)驗中如何應用多重檢驗糾正。隨著(zhù)更多的測序信息出現,大部分癌癥類(lèi)型可根據其分子表型劃分為幾種亞型,這使得實(shí)驗本身的作用嚴重降低,而可靠分析所需的樣品數量卻大大增加。我們預計未來(lái)為獲得統計學(xué)上可靠的的結果,測序實(shí)驗的樣本量會(huì )非常大,達到成千上萬(wàn)。
基因組突變
所有癌癥在發(fā)展過(guò)程中都會(huì )積累大量體細胞突變,其中司機突變是對癌癥發(fā)展很關(guān)鍵的體細胞改變,而剩下的就被稱(chēng)為乘客突變。目前研究人員已經(jīng)編制出一些癌癥類(lèi)型的體細胞突變綜合目錄。
這篇文章展示了一些原發(fā)性人類(lèi)前列腺癌及其配對正常組織的完整基因組序列。一些腫瘤包含復雜的平衡重排鏈(拷貝數中性),它們發(fā)生在已知癌基因中或附近。一些斷裂點(diǎn)發(fā)生在基因間區域,可能會(huì )被靶定外顯子測序的方法錯過(guò)。在88%的病例中,融合點(diǎn)可定位到單堿基分辨率。最常見(jiàn)的融合類(lèi)型涉及到一個(gè)精確連接,其重排連接處既無(wú)重疊也無(wú)插入序列。這一結果與乳腺腫瘤中所發(fā)現的模式不同,后者最常見(jiàn)的連接涉及到一個(gè)2-3 bp的微同源序列,這表明前列腺癌和乳腺癌負責產(chǎn)生這些融合的機制是不同的。這篇文章例證了有些突變只有通過(guò)全基因組測序才能檢測出來(lái)。