廣州市黃埔區(qū)學(xué)大道攬?jiān)侣窂V州企業(yè)孵化器B座402
電話:020-85625352
手機(jī):18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
3D基因組學(xué):一個(gè)嶄新的領(lǐng)域
日期:2018-11-15 標(biāo)簽:3D基因組,TAD
前言
基因組是生命體完整的遺傳信息。而基因組學(xué)則是研究基因組結(jié)構(gòu)、功能與進(jìn)化的學(xué)科。自上世紀(jì)八九十年代以來,隨著技術(shù)的發(fā)展,基因組學(xué)取得長足發(fā)展:從過去獲得核酸的序列,到如今對(duì)序列功能的描繪。
生物學(xué)中有一個(gè)基本觀點(diǎn):結(jié)構(gòu)與功能相適應(yīng)。盡管提到核酸鏈的結(jié)構(gòu),絕大多數(shù)人的第一反應(yīng)是“雙螺旋”模型,但是,基因組的物理結(jié)構(gòu),卻遠(yuǎn)比雙螺旋來得復(fù)雜——核酸鏈會(huì)在蛋白質(zhì)的輔助下,形成更加高級(jí)的結(jié)構(gòu)。這也催生了基因組學(xué)中一門子學(xué)科的誕生:三維(3D)基因組學(xué)。
倘若僅是回望基因組學(xué)本身的發(fā)展歷程——從1977年首個(gè)生物基因組噬菌體φX174序列被測(cè)定,到2003年人類基因組計(jì)劃完成,再到2012年ENCODE計(jì)劃完成——還不足以代表人類解讀生命遺傳奧秘的歷史。我們更應(yīng)該回顧和基因組學(xué)不分家的遺傳學(xué)之發(fā)展歷程。
高中的生物學(xué)課堂就已經(jīng)學(xué)到,Gregor Johann Mendel(孟德爾)是遺傳學(xué)的奠基人,他的“豌豆雜交實(shí)驗(yàn)”(1856-1863年),依然是中學(xué)生物考題的常用材料。隨后,對(duì)孟德爾由路轉(zhuǎn)粉的Thomas Hunt Morgan(摩爾根)利用果蠅的突變體,首次確認(rèn)基因位于染色體上,提出“連鎖互換定律”,成為了現(xiàn)代遺傳學(xué)的奠基人(1908-1915;摩爾根的貢獻(xiàn)非常多,這個(gè)時(shí)間段只是一個(gè)粗略的標(biāo)記)。
對(duì)如今的我們來說,不難理解DNA與RNA是攜帶遺傳信息的物質(zhì)。不過在上世紀(jì)中期以前,世人還認(rèn)為蛋白質(zhì)才是遺傳物質(zhì)。1928年,F(xiàn)rederick Griffith(格里菲斯)的“肺炎雙球菌轉(zhuǎn)化實(shí)驗(yàn)”,提出了轉(zhuǎn)化因子學(xué)說。但直到1944年,Oswald Avery、Colin MacLeod和Maclyn McCarty三人通過比較蛋白質(zhì)、多糖與DNA等的轉(zhuǎn)化效應(yīng),才逐漸樹立了DNA是遺傳物質(zhì)的地位。到了1952年,Alfred Hershey與Martha Chase利用同位素分別標(biāo)記蛋白質(zhì)和DNA,最終確認(rèn)了DNA是遺傳物質(zhì)。
早在DNA發(fā)現(xiàn)之初(1869年,F(xiàn)riedrich Miescher),科學(xué)家便展開了對(duì)其物理結(jié)構(gòu)的鑒定。但一直到1953年,才由James Watson和Francis Crick闡明了DNA的雙螺旋結(jié)構(gòu)。
真核生物的基因組含有大量的結(jié)合蛋白,包括組蛋白。在原核生物中,也有組蛋白樣的DNA結(jié)合蛋白。1974-1976年間,科學(xué)家首次獲得DNA纏繞在組蛋白上的電鏡照片(Science. 1974 Jan 25;183(4122):330-2.,Exp Cell Res. 1976 Jan;97:101-10.),并最終在1997年獲得結(jié)晶結(jié)構(gòu)(Nature. 1997 Sep 18;389(6648):251-60.)。
DNA-組蛋白這種beads on a string“串珠式”的結(jié)構(gòu),能夠顯著縮短DNA鏈在一維水平的尺度,大概7倍。形象一些,對(duì)于人類全部DNA而言,將DNA鏈線性展開,能得到約為2米的長鏈,再經(jīng)串珠式壓縮,也還有約29厘米。顯然,這對(duì)于袖珍的細(xì)胞核來說,這種結(jié)構(gòu)依然太大了。對(duì)染色體的形態(tài)觀察也提示,DNA與結(jié)合蛋白一定形成了更加高級(jí)的結(jié)構(gòu)。
2005年,Timothy J. Richmond團(tuán)隊(duì)首次報(bào)道了chromatin fiber(染色質(zhì)纖維)的結(jié)構(gòu)。2014年,中國科學(xué)家Ping Zhu和Guohong Li小組得到了更加精確的染色質(zhì)纖維結(jié)構(gòu)。他們的研究都證明,DNA-組蛋白的串珠式結(jié)構(gòu),還會(huì)進(jìn)一步被壓縮成直徑僅有30納米的纖維結(jié)構(gòu)。而在目前的理論模型中,這些染色質(zhì)纖維還會(huì)在包括Cohesin、CTCF等蛋白的幫助之下,扭曲成環(huán),形成更加復(fù)雜的結(jié)構(gòu),最終被壓縮成染色體。
講了半天歷史,目的是為了讓各位讀者能夠得到這樣一個(gè)基本認(rèn)識(shí):生命體的遺傳功能元件,包括編碼基因、非編碼基因、順式調(diào)控元件等,在空間結(jié)構(gòu)上,并不是在染色體上呈線性地一字依次排開,而是隨著DNA形成復(fù)雜高級(jí)結(jié)構(gòu)的同時(shí),具備了三維組織形式。
為了加深印象,我們不妨再來看下方另外一幅染色體結(jié)構(gòu)的卡通。簡而言之,DNA雙鏈就跟糾纏在一起的電話線一般,一圈圈地繞行、壓縮,最終形成了染色體。也正因?yàn)橛羞@種繞圈圈的壓縮方式,我們不難想象,DNA能夠密密麻麻地形成許多環(huán)狀結(jié)構(gòu)。這些環(huán)狀結(jié)構(gòu)還能再繼續(xù)繞圈壓縮下去。
換句話說,在DNA一維層面上相隔比較遠(yuǎn)的區(qū)域,反而有可能靠得更近。比方說下圖中的ABCD四個(gè)點(diǎn),若以A為參照物,C比B遠(yuǎn),但由于基因組形成了高級(jí)結(jié)構(gòu),反而把A和C拉得更近。這個(gè)示意圖還提示了另外一個(gè)問題,即同一條染色體上的某些區(qū)域,可能很難互相接觸,比如B和D之間就,被環(huán)狀結(jié)構(gòu)給隔開了。
DNA這種相對(duì)穩(wěn)定的高級(jí)結(jié)構(gòu),是由蛋白質(zhì)來維持的。這同時(shí)也為破解基因組的三維結(jié)構(gòu)奠定了技術(shù)基礎(chǔ)。我們?cè)賮砝蒙厦婺莻€(gè)ABCD四個(gè)小點(diǎn)的圖來理解這一項(xiàng)技術(shù)。假如說,A和C是幫助DNA凹造型的蛋白,并且它們靠得很近,甚至有蛋白-蛋白相互作用。這時(shí),我們使用甲醛等交聯(lián)劑,就可以把DNA-結(jié)合蛋白以及他們之間形成的高級(jí)結(jié)構(gòu)給固定下來。但這種復(fù)合物體積非常龐大,為了方便測(cè)序建文庫,我們需要將DNA利用超聲或限制性內(nèi)切酶打碎。這時(shí)候我們得到的,就是許許多多由蛋白質(zhì)緊緊鎖住的包含缺口的小結(jié)構(gòu)。我們?cè)儆妹赴堰@些斷裂的DNA給修復(fù)回去,就會(huì)得到許多能夠發(fā)生相互作用的、具備環(huán)狀結(jié)構(gòu)DNA了。最后,我們?cè)偻ㄟ^測(cè)序的方法就能發(fā)現(xiàn),原本中間隔了個(gè)B的A和C位點(diǎn),居然靠到一起,而C和D雖然很靠近,但卻可能測(cè)不到它們?cè)谝黄稹?/p>
上面所述的方法,便是染色質(zhì)構(gòu)象捕獲(Chromatin Conformation Capture)技術(shù)。大致的流程,可以看下面的圖片。最早的技術(shù)路線(簡稱3C,源自英文名首字母),只能研究一個(gè)位點(diǎn)對(duì)另外一個(gè)位點(diǎn)的相互作用(一對(duì)一)。而后又發(fā)展出了4C(一對(duì)全),5C(多對(duì)多),Hi-C(全對(duì)全),Capture-C(多重一對(duì)一)等技術(shù)。只是隨著復(fù)雜度的提高,分辨率也會(huì)降低。相關(guān)綜述可以看這篇文章Unraveling the 3D genome: genomics tools for multi-scale exploration,這里就不詳述了。
通過構(gòu)象捕獲技術(shù),從全基因組的角度而言,科學(xué)家都得到了什么樣的發(fā)現(xiàn)呢?
許多小組都發(fā)現(xiàn)了一個(gè)共同現(xiàn)象:如下圖所示,基因組的相互作用,因其三維的物理結(jié)構(gòu),形成了許多分區(qū)。為了讀懂這個(gè)圖,我們需要先理解它是如何繪制。假設(shè)線性的染色體座位的藍(lán)、橙、綠三點(diǎn)之間能夠發(fā)生相互作用,我們就用線段把它們連起來,形成一個(gè)等腰三角形,并在線段的交叉點(diǎn),用顏色的深淺,來代表相互作用的頻率,或者說強(qiáng)度。
通過這種方法作圖,可以得到許多三角形結(jié)構(gòu),密集排布在染色體之上。有些小的三角形,顏色比較深,代表著這個(gè)三角形內(nèi)部的相互作用更頻繁,同時(shí)它們之間甚至有些“涇渭分明”地相鄰排布,即甚少與相鄰區(qū)域發(fā)生相互作用,從而形成不同的結(jié)構(gòu)域。科學(xué)家將這樣的結(jié)構(gòu)域稱為Topologically Associating Domain(TAD,中文名姑且翻譯為“拓?fù)湎嚓P(guān)結(jié)構(gòu)域”)。但又不是說,小結(jié)構(gòu)域之間就絕對(duì)不會(huì)發(fā)生相互作用了,只是頻率會(huì)比較低。數(shù)個(gè)相鄰且又能發(fā)生相互作用的TAD,就形成了Superdomain(超結(jié)構(gòu)域)。隨著在染色體上的物理距離增大,相互作用的頻率會(huì)呈負(fù)指數(shù)式降低。
TAD里面會(huì)是些什么東西呢?
在哺乳動(dòng)物基因組中,TAD通常由CTCF這個(gè)轉(zhuǎn)錄抑制因子給分割開來。CTCF還會(huì)和Cohesin蛋白復(fù)合物結(jié)合,幫助基因組形成相對(duì)穩(wěn)定的三維結(jié)構(gòu)。正由于此,兩個(gè)TAD之間的轉(zhuǎn)錄活性是非常低的(轉(zhuǎn)錄需要打開DNA),而結(jié)合CTCF等轉(zhuǎn)錄抑制因子的DNA元件,也被稱為insulator(絕緣子)。
不過,在TAD內(nèi)部可就熱鬧了。CTCF在幫助基因組DNA凹造型的同時(shí),就把線性展開時(shí)距離較遠(yuǎn)的DNA元件給綁到了一起。而這樣相互作用的元件,通常是enhancer(增強(qiáng)子)和promoter(啟動(dòng)子)。
這樣做有兩個(gè)好處。一是縮短了enhancer和promoter之間的空間距離,增強(qiáng)了基因的轉(zhuǎn)錄。二是給調(diào)控元件合理分區(qū),使得基因轉(zhuǎn)錄在不同發(fā)育階段、不同生理?xiàng)l件下,受到特定enhancer的調(diào)控。比方說,在胚胎發(fā)育早期,干細(xì)胞那套基因的表達(dá)會(huì)占主導(dǎo)。隨著發(fā)育的進(jìn)行,表達(dá)模式會(huì)逐漸替換成特定lineage的基因,再到成熟細(xì)胞的基因。倘若沒有這樣的動(dòng)態(tài)調(diào)整的三維分區(qū),這種基因的空間與時(shí)序性表達(dá)機(jī)制,估計(jì)就很難實(shí)現(xiàn)了。
當(dāng)然,這里并不是在表達(dá)一種設(shè)計(jì)論的觀點(diǎn)。這種精致的調(diào)控機(jī)制,是在漫長的進(jìn)化過程中,逐漸選擇、適應(yīng)的結(jié)果。
TAD除了形成相對(duì)穩(wěn)定的遺傳信息表達(dá)功能結(jié)構(gòu)之外,還有其他重要的生物學(xué)意義。比如它同樣也是細(xì)胞周期S期時(shí),DNA復(fù)制的結(jié)構(gòu)單元。在不久的將來,科學(xué)家還將發(fā)現(xiàn)更多的三維基因組功能。
讀到這里,我想各位讀者應(yīng)該不難理解,假設(shè)基因組的三維結(jié)構(gòu)出了差錯(cuò),后果可是相當(dāng)嚴(yán)重。這里本司機(jī)舉兩個(gè)例子來說明。
首先,維系正常的基因組三維結(jié)構(gòu),對(duì)保持正常的發(fā)育進(jìn)程有重要的意義。早有文獻(xiàn)通過經(jīng)典的遺傳學(xué)方法,將F syndrome(表現(xiàn)為手指、腳趾、腭和胸骨發(fā)育異常)這種遺傳疾病定位到了染色體2q36處。這個(gè)區(qū)域含有對(duì)發(fā)育具有重要意義的IHH、WNT6A、WNT10A、PAX3和STK36等基因。如下圖所示,最近的研究證明,在有些F syndrome的病例中,WNT6A基因所在的TAD邊界染色體區(qū)域發(fā)生了翻轉(zhuǎn),使得相鄰TAD的增強(qiáng)子跑到WNT6A所在的TAD之中,導(dǎo)致WNT6A異常表達(dá)。在小鼠模型中,用CRISPR敲除PAX3基因所在TAD的邊界,同樣會(huì)導(dǎo)致相鄰TAD的增強(qiáng)子跑過來調(diào)控PAX3,使其表達(dá)量異常升高,造成小鼠指骨發(fā)育異常。與此對(duì)照,用CRISPR敲除相鄰TAD內(nèi)部的序列,不碰及PAX3所在TAD的邊緣,PAX3基因的表達(dá)水平就不會(huì)異常升高,也不會(huì)有發(fā)育異?,F(xiàn)象
第二個(gè)例子來自于癌癥。腫瘤細(xì)胞的基因組是非?;靵y的,有許多擴(kuò)增、缺失和易位。拿原癌基因?yàn)槔?,它的高表達(dá)可以來自于原癌基因本身的拷貝數(shù)增加,也可以是其表達(dá)調(diào)控機(jī)制得到了增強(qiáng)。這篇綜述(Copy number alterations unmasked as enhancer hijackers.)為我們?cè)斀猓蔷幋a區(qū)域拷貝數(shù)的異常,是如何導(dǎo)致原癌基因的過度表達(dá)的。比如說,MYC基因座位的易位,導(dǎo)致它跑到一個(gè)IGH增強(qiáng)子附近(a)。MYB基因附近的染色體區(qū)域缺失,把遠(yuǎn)處的QKI增強(qiáng)子給帶到它身邊(b)。TAL1所在TAD邊緣的染色體區(qū)域缺失,導(dǎo)致相鄰增強(qiáng)子越俎代庖(e)。IGF2基因座位跨TAD的倍增,導(dǎo)致原本不能調(diào)控IGF2的、來自隔壁TAD的增強(qiáng)子,推動(dòng)了IGF2的表達(dá)(f)。其他的機(jī)制,就請(qǐng)讀者自行讀圖。而這種現(xiàn)象,科學(xué)家將其命名為enhancer hijacking(增強(qiáng)子綁架)。
結(jié)語
自孟德爾以來,遺傳學(xué)與基因組學(xué)的歷史不過百余年。但也就在這百余年中,這兩個(gè)領(lǐng)域的發(fā)展如同其他生物學(xué)學(xué)科一般,可謂突飛猛進(jìn)。對(duì)80后而言,我們?cè)谥袑W(xué)課堂方才學(xué)到人類基因組計(jì)劃,但轉(zhuǎn)眼之間,基因組學(xué)就進(jìn)入了3D的時(shí)代。而在六七十年前,人類甚至還搞不清楚DNA是一種遺傳物質(zhì)。
雖然研究基因組三維結(jié)構(gòu)的染色質(zhì)構(gòu)象捕獲技術(shù)3C早在2002年就誕生了,但直到近年更高復(fù)雜度的捕獲技術(shù)的出現(xiàn),3D基因組領(lǐng)域才變得火熱起來。毫無疑問,3D基因組學(xué)也面臨著和經(jīng)典基因組學(xué)同樣的挑戰(zhàn):如何將結(jié)構(gòu)與功能聯(lián)系起來。在不久的將來,科學(xué)家們還必須回答另外一個(gè)問題,即如何結(jié)合3D基因組學(xué)的成果,用于治療人類疾病。