亚洲综合无码一级片无码的_国产丝袜一二三四区乱码_欧美福利大片二区_男人边吃奶边做边爱免费

高效、務(wù)實(shí)、嚴(yán)謹(jǐn)、敬業(yè)
技術(shù)服務(wù)
技術(shù)專題
聯(lián)系我們

聯(lián)系我們

廣州賽誠生物科技有限公司
廣州市天河區(qū)黃埔大道中124號2705室
電話:020-29031124
手機(jī):18102256923
Email:servers@gzscbio.com
Fax:020-85625352
QQ:2913120624
轉(zhuǎn)錄調(diào)控位點(diǎn)預(yù)測

      轉(zhuǎn)錄調(diào)控是分子生物學(xué)中的一個(gè)基本問題,而確定轉(zhuǎn)錄因子與靶基因間的調(diào)控關(guān)系以及轉(zhuǎn)錄因子在靶基因上的結(jié)合位點(diǎn)是理解轉(zhuǎn)錄調(diào)控機(jī)制的核心問題。

 

真核生物轉(zhuǎn)錄調(diào)控原理

圖1  真核生物轉(zhuǎn)錄調(diào)控原理

 

      轉(zhuǎn)錄因子結(jié)合位點(diǎn)(Transcription factor binding site,TFBS)是與轉(zhuǎn)錄因子結(jié)合的DNA片斷,長度通常在5~20 bp范圍內(nèi),它們與轉(zhuǎn)錄因子相互作用調(diào)控基因的轉(zhuǎn)錄過程。確定 TFBS 是理解轉(zhuǎn)錄調(diào)控機(jī)制 , 建立轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的關(guān)鍵問題。

      一個(gè)轉(zhuǎn)錄因子往往同時(shí)調(diào)控若干個(gè)基因,而它在不同基因上的結(jié)合位點(diǎn)具有一定的保守性,又不完全相同。較短的DNA片段在規(guī)模較大基因組中重復(fù)出現(xiàn)的次數(shù)很多,另外TFBS又允許一定的可變性,這給識別TFBS的工作帶來了困難,使得預(yù)測TFBS的算法普遍存在假陽性率偏高的問題。

      結(jié)合位點(diǎn)序列目前主要有3類描述模型:1)串模型:最常用的是共有序列模型2)位置頻率矩陣:是一種用統(tǒng)計(jì)學(xué)方法對轉(zhuǎn)錄因子與DNA的相互作用進(jìn)行建模的方法。3)使用信息論中熵的知識,用圖形方式來形象、直觀的表示結(jié)合位點(diǎn)。

 

轉(zhuǎn)錄因子結(jié)合位點(diǎn)的表示

圖2  轉(zhuǎn)錄因子結(jié)合位點(diǎn)的表示

 

      在UCSC Genenome Browser數(shù)據(jù)庫里面Regulation調(diào)控卡ENCODE TBBS里面有1000多套轉(zhuǎn)錄因子的數(shù)據(jù)。基本可以滿足醫(yī)學(xué)科研的需求。

      基因轉(zhuǎn)錄調(diào)控是一個(gè)非常復(fù)雜的網(wǎng)絡(luò)體系,在in vitro和in vivo的實(shí)驗(yàn)可能有不同的結(jié)果,而生物細(xì)胞生理狀態(tài)以及環(huán)境因素的不同也可能導(dǎo)致不同的實(shí)驗(yàn)結(jié)果。只有通過各種數(shù)據(jù)的融合和相互校正,才能挖掘出可靠的轉(zhuǎn)錄調(diào)控關(guān)系和TFBS。比如說,將基因表達(dá)數(shù)據(jù)和序列數(shù)據(jù)進(jìn)行融合分析,既保證TF與該基因的調(diào)控序列有相互結(jié)合,又保證該TF對該基因的表達(dá)有影響,從而能夠確信二者之間的調(diào)控關(guān)系。有效的利用生物信息學(xué)工具分析實(shí)驗(yàn)結(jié)果,從而產(chǎn)生出可以驗(yàn)證的生物學(xué)假設(shè),會使TFBS的預(yù)測及鑒定更加準(zhǔn)確和高效。

      傳統(tǒng)上,TFBS識別方法主要可分為兩大類:一類是基于字串的方法。這種方法主要是通過對多聯(lián)核普酸短序列的計(jì)數(shù)和頻率的統(tǒng)計(jì)來識別,其中最常用的方法是共有序列模型(ConsensuSModel)。第二類是基于概率序列模型的方法,如期望最大化(ExpeetationMaximization,EM)和吉布斯采樣(Gibbssampling)等方法。隨著實(shí)驗(yàn)方法的改進(jìn),尤其是高通量實(shí)驗(yàn)方法的出現(xiàn),近兩年出現(xiàn)了一些針對CHIP一CHIP以及CHIP一SEQ實(shí)驗(yàn)數(shù)據(jù)的處理方法。微陣列試驗(yàn)方法成為使用廣泛,技術(shù)相對成熟的一種TFBS識別方法。

     TFBS的生物信息學(xué)領(lǐng)域有以下幾個(gè)方面可以進(jìn)行深入研究:

      (1)根據(jù)已知的TFBS模型,在基因組中預(yù)測TFBS的各種算法普遍存在假陽性率偏高的問題,降低預(yù)測中的假陽性是今后研究的重要目標(biāo)。引起假陽性的一個(gè)主要原因是,基因組中存在很多與TFBS序列相同但沒有轉(zhuǎn)錄因子結(jié)合功能的短串。隨著人們對轉(zhuǎn)錄調(diào)控過程的了解的深入,可以考慮增加新的信息,比如將染色體結(jié)構(gòu)信息,即核小體在基因組中的分布情況,或TFBS與轉(zhuǎn)錄起始位點(diǎn)之間距離的分布特征,以此作為先驗(yàn)信息,提高TFBS預(yù)測的準(zhǔn)確率。另外, 轉(zhuǎn)錄調(diào)控通常需要多個(gè)轉(zhuǎn)錄因子的合作,它們的TFBS之間距離較近,組成相應(yīng)的“順式調(diào)控模塊”(Cis-Regulatory Module,CRM),有CRM的區(qū)域比只有單個(gè)TFBS的區(qū)域更有可能是真正的轉(zhuǎn)錄調(diào)控區(qū)域。因此,預(yù)測CRM從而推斷TFBS的分布,也能大大提高TFBS預(yù)測的準(zhǔn)確率。

      (2)目前的TFBS研究多為從DNA中提取信息、構(gòu)造模型、設(shè)計(jì)算法,而忽略了轉(zhuǎn)錄因子本身能提供的信息,可以嘗試將具有相同DNA結(jié)合域的轉(zhuǎn)錄因子家族作為一個(gè)整體進(jìn)行研究。

      (3)目前已有一些工作考慮轉(zhuǎn)錄因子與TFBS結(jié)合能的高低對下游基因轉(zhuǎn)錄的mRNA表達(dá)量的定量關(guān)系,而目前對TFBS模型的評介標(biāo)準(zhǔn)主要是“能否準(zhǔn)確判別某DNA序列是否為TFBS”,對于模型能否準(zhǔn)確描述轉(zhuǎn)錄因子與TFBS結(jié)合強(qiáng)度的定量關(guān)系缺乏評價(jià),此類定量模型也有待開發(fā)。近年來,一些研究發(fā)現(xiàn)TFBS的丟失和獲得在轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的進(jìn)化中起重要作用,TFBS在調(diào)控網(wǎng)絡(luò)進(jìn)化中的作用機(jī)制還有待進(jìn)一步揭示。我們相信實(shí)驗(yàn)技術(shù)的進(jìn)步以及對轉(zhuǎn)錄調(diào)控機(jī)制的深入理解必將為TFBS的生物信息學(xué)研究注入新的生命力, 生物信息學(xué)與實(shí)驗(yàn)相互結(jié)合相互促進(jìn),人們對轉(zhuǎn)錄調(diào)控的認(rèn)識將更加系統(tǒng)深入。


目錄瀏覽