亚洲综合无码一级片无码的_国产丝袜一二三四区乱码_欧美福利大片二区_男人边吃奶边做边爱免费

高效、務(wù)實、嚴(yán)謹(jǐn)、敬業(yè)
資訊
技術(shù)服務(wù)
技術(shù)專題
聯(lián)系我們

聯(lián)系我們

廣州賽誠生物科技有限公司
廣州市黃埔區(qū)學(xué)大道攬月路廣州企業(yè)孵化器B座402
電話:020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
您當(dāng)前所在的位置:首頁>>資訊 >>技術(shù)文章

miRNA與lncRNA的生物信息學(xué)預(yù)測

日期:2019-03-26 標(biāo)簽:miRNA與lncRNA的生物信息學(xué)預(yù)測


生物信息學(xué)在miRNA研究中的應(yīng)用.png

1  生物信息學(xué)在miRNA研究中的應(yīng)用

 

當(dāng)開始研究一基因是否為一個miRNA調(diào)控的靶基因時,可以用不同的生物信息學(xué)計算方法來分析每個序列(如mRNA3'-UTR區(qū)序列),這些計算方法采用不同的參數(shù)來預(yù)測一個給定的靶mRNA內(nèi)具功能性miRNA結(jié)合位點的可能性。由于每種計算方法的有效性不同,下面3種計算方法應(yīng)該被用來預(yù)測miRNA結(jié)合位點:miRanda、TargetScanPicTar.3種計算方法都允許研究者輸入一個基因符號,這些計算方法將計算此基因內(nèi)所有預(yù)測的miRNA結(jié)合位點。此外,這些計算方法可測定一個給定的miRNA所有的靶mRNA.因為不同的計算方法會預(yù)測出不同的miRNA結(jié)合位點,所以同時使用多種計算方法進行預(yù)測非常必要。值得注意的是,盡管miRNA結(jié)合位點在不同物種間的保守性是各種不同計算方法的組成部分,但并不是一個功能性位點所必需的。由于不同計算方法預(yù)測的結(jié)果存在很大的差異,如何確定哪些預(yù)測的結(jié)合位點需要進一步的實驗驗證成為研究者要面臨的一個難題。作者認(rèn)為至少這3種計算方法中的2種計算方法均預(yù)測到的miRNA結(jié)合位點,有必要進一步用實驗驗證。

因為很多經(jīng)種子序列匹配預(yù)測的miRNA靶經(jīng)體內(nèi)驗證實驗證實并不是真的miRNA靶,為了起始一步減少預(yù)測到的抑制一給定的靶mRNA表達的miRNA的數(shù)量,進一步的程序分析是有必要的。結(jié)構(gòu)特征控制著miRNA/mRNA間的相互作用的觀點已被越來越多的人所接受。例如,一個RNA分子的大部分結(jié)構(gòu)是高度復(fù)雜性的,只有特定的單鏈區(qū)域允許miRNAs接近并與互補位點結(jié)合。因此,復(fù)雜的RNA二級結(jié)構(gòu)可能阻止miRNA/mRNA的相互作用。最近有研究證實,絕大部分已證實的靶的一個共同特征是優(yōu)先與基于熱動力學(xué)在RNA分子中容易接近且沒有復(fù)雜二級結(jié)構(gòu)的3’-UTR區(qū)中的位點。由于RNA可接近性可能是靶識別的一個關(guān)鍵特征,所以有必要采用mFold軟件測定預(yù)測到的miRNA結(jié)合位點5’端和3’端各70個核苷酸的自由能,當(dāng)其低于平均隨機自由能時提示此位點允許miRNA接近并結(jié)合[20].這些允許miRNA接近并結(jié)合起來的位點,有必要進一步用實驗進行驗證。

在不同物種中成熟miRNA均是從具有莖環(huán)狀二級結(jié)構(gòu)的前體加工而來,具有較大的序列同源性??寺〉降?/span>miRNA序列通過檢索基因組數(shù)據(jù)庫找到在基因組中的位置,在和周圍基因組序列比較中發(fā)現(xiàn)他們同樣具有相似的前體結(jié)構(gòu),多位于編碼基因間或內(nèi)含子反向重復(fù)區(qū)域。一些miRNA基因在進化上具有高度保守性,此為生物信息學(xué)篩選的基礎(chǔ)。該方法根據(jù)比較基因組學(xué)原理,并結(jié)合生物信息軟件在已測序基因組中進行搜索比對,根據(jù)同源性的高低再進行RNA二級結(jié)構(gòu)預(yù)測,將符合條件的候選miRNA與已經(jīng)通過試驗鑒定的miRNA分子進行比較分析,最終確定該物種miRNA的分步及數(shù)量。目前國際上較為普遍使用的兩個計算機分析工具是miRseekermiRscan,前者已用于果蠅及昆蟲基因組候選基因的系統(tǒng)分析,后者則用于線蟲和脊椎動物候選基因的分析。這兩個工具已經(jīng)成功鑒定出了大量的miRNA基因并通過了實驗證實。由于miRseekermiRscan的高靈敏度,它們已用于人類miRNA基因的尋找。由于該方法只能用于已完成基因組測序的物種,而那些未完成測序的物種就無能為力,而且由于miRNA前體長度的可變性,故用計算機方法尋找新基因具有一定的遺漏性,所以目前大多數(shù)實驗室將計算機分析與實驗方法結(jié)合使用,使得miRNA的發(fā)現(xiàn)量成幾何級數(shù)增長。目前日益發(fā)展的微陣列技術(shù)也在篩選miRNA基因方面顯示了極大的潛力。

隨著疾病特異性的miRNAs不斷被鑒定,對感興趣的疾病通路中的新靶基因進行驗證可能催生新的治療策略。因此,能夠鑒定和驗證miRNA/mRNA靶配對具有極其重要的意義。盡管生物信息學(xué)方法和自由能分析并不完美,但可使作者能夠?qū)ν茰y的miRNA/mRNA靶配對進行鑒定。一旦生物信息學(xué)方法預(yù)測成功,可以通過以下4條標(biāo)準(zhǔn)驗證miRNA/mRNA靶配對的真實性。(1miRNA/mRNA靶相互作用得到驗證。(2miRNA/mRNA共表達。(3)給定miRNA對其蛋白表達有可預(yù)測的影響。即用此miRNA的類似物可減少靶基因表達水平,而用此miRNA特異性抑制劑可增加靶基因的表達水平。(4miRNA介導(dǎo)靶基因表達的調(diào)控導(dǎo)致相應(yīng)的生物學(xué)功能的改變。

 

2 LncRNA的生物信息學(xué)預(yù)測

lncRNA進行鑒定時,采取的策略是收集不同類型的數(shù)據(jù)(包括polyA RNA sequencing、nonpolyA RNA sequencing、表觀遺傳信號值、編碼可能性、保守性和RNA結(jié)構(gòu)等),并對其進行分析。例如CDSRNA-seqpolyA的表達值比較高,而ncRNARNA-seqnon-polyA表達值比較高。通過對不同類型數(shù)據(jù)的整合,還可以進一步得到不同類型基因元素的網(wǎng)絡(luò)調(diào)控關(guān)系。

lncRNA進行綜合分析的一般流程如下:(1)將基因組劃分成小的單位(bin),根據(jù)Gencode的注釋信息對每個bin進行注釋;(2)分別計算每個bin的特征值,這些特征值包括序列保守性、結(jié)構(gòu)穩(wěn)定性、RNA表達值、組蛋白修飾、轉(zhuǎn)錄因子結(jié)合等;(3)利用機器學(xué)習(xí)的模型,將lncRNA與其他基因類別區(qū)分開,并且對新的lncRNA進行預(yù)測。

 

利用數(shù)據(jù)整合對lncRNA進行鑒定.png


利用數(shù)據(jù)整合對lncRNA進行鑒定

 

lncRNA綜合分析方法流程示例.png

3 lncRNA綜合分析方法流程示例

 

有的時候我們的專業(yè)知識不足以完成分析和預(yù)測。尤其在面對高通量數(shù)據(jù)時,從中挖掘有用的信息尤為關(guān)鍵。這時可以用到機器學(xué)習(xí)(machinelearning)的方法,令機器自動分析數(shù)據(jù),比如特征提取或是分類。機器學(xué)習(xí)應(yīng)用在生物信息學(xué)主要有兩大分支,即監(jiān)督學(xué)習(xí)(supervisedlearning)和非監(jiān)督學(xué)習(xí)(unsupervisedlearning)。在監(jiān)督學(xué)習(xí)問題中,每個數(shù)據(jù)擁有一個對應(yīng)標(biāo)簽,我們希望通過數(shù)據(jù)建立一個模型,根據(jù)數(shù)據(jù)預(yù)測標(biāo)簽。傳統(tǒng)的監(jiān)督學(xué)習(xí)方法包括線性判別分析(LDA)、決策樹(decisiontree)、最近鄰法(nearestneighbor)和神經(jīng)網(wǎng)絡(luò)(neuralnetwork)。20世紀(jì)90年代后,誕生了一批很有影響力的工作,包括支持向量機(SVM)、Adaboosting和隨機森林(randomforest),相比于傳統(tǒng)的方法,上述方法更好地處理了過擬合(overfitting)的問題,從而在實際應(yīng)用中有很好的預(yù)測效果。

LncRNA研究是基因組時代重要的科學(xué)前沿,因為它有可能揭示一個全新的由RNA介導(dǎo)的遺傳信息表達調(diào)控網(wǎng)絡(luò),從不同于蛋白質(zhì)編碼基因的角度來注釋和闡明基因組的結(jié)構(gòu)與功能,并為人類的疾病研究和治療提供新的思路和方法。同時,新一代測序技術(shù)的發(fā)展也為鑒定lncRNA的計算機方法提供了強大的支持。以下是整理的長非編碼RNAlncRNAlincRNA)數(shù)據(jù)庫資源列表(按字母排序)。國內(nèi)外長非編碼RNA的研究剛剛興起,希望這資源對國內(nèi)的非編碼RNA的研究者有所幫助。

1 ChIPBase:提供長鏈非編碼RNA的表達圖譜和轉(zhuǎn)錄調(diào)控的全面鑒定和注釋。整合了高通量的RNA-seq鑒定的lncRNA及其表達圖譜和ChIP-Seq實驗技術(shù)鑒定的轉(zhuǎn)錄因子結(jié)合位點。

網(wǎng)站:http://deepbase.sysu.edu.cn/chipbase/

更新:201211

2LNCipedia:對人類的長鏈非編碼RNA的序列和結(jié)構(gòu)全面的注釋。

網(wǎng)站:http://www.lncipedia.org

更新:20127

3lncRNAdb:提供有生物學(xué)功能的長鏈非編碼RNA的全面注釋。這是長鏈非編碼RNA研究領(lǐng)域的大牛John mattick實驗室構(gòu)建的網(wǎng)站。

網(wǎng)站:http://www.lncrnadb.org/

更新:20117

4LncRNADisease:提供了文獻報道的疾病相關(guān)的長鏈非編碼RNA的注釋。

網(wǎng)站:http://cmbi.bjmu.edu.cn/lncrnadisease

更新:20127

5NONCODE:提供對長鏈非編碼RNA的全面注釋,包括表達和該團隊開發(fā)的ncFANs計算機軟件預(yù)測的lncRNA功能。這是非編碼RNA研究的知名數(shù)據(jù)庫,已經(jīng)更新到第三版。

網(wǎng)站:http://www.noncode.org

更新:20121

6NRED 提供人和小鼠的長鏈非編碼RNA在芯片數(shù)據(jù)的表達信息。這也是John mattick實驗室構(gòu)建的網(wǎng)站。

網(wǎng)站:http://jsm-research.imb.uq.edu.au/nred/

更新: 2009


最新技術(shù)文章: