廣州市黃埔區(qū)學(xué)大道攬月路廣州企業(yè)孵化器B座402
電話:020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
項目名稱:差異Peak計算
所屬分類:生物信息學(xué)分析
聯(lián)系電話:020-85625352
QQ:386244141
Email:servers@gzscbio.com
技術(shù)服務(wù)描述
1. 差異Peak計算
1.1. 背景簡介
為了理解細胞中更為復(fù)雜的生物過程,許多研究已在通過比較ChIP-seq的差異獲得的不同數(shù)據(jù)。
越來越多的ChIP-seq實驗正在研究多種實驗條件(例如各種治療條件,幾個不同的時間點和不同的治療劑量水平)下的轉(zhuǎn)錄因子結(jié)合。由于差異富集在生物學(xué)和醫(yī)學(xué)研究中已變得具有實際重要性,因此已有更多工具可用于此類分析。
每種工具的工作方式互不相同,但總體目標相同。您選擇的一個將歸結(jié)為您正在使用的數(shù)據(jù)集以及您的生物學(xué)問題。要考慮的一些事情: - 用戶需要什么輸入?一些工具需要通過外部峰調(diào)用算法對富集區(qū)域進行初步檢測,而其他工具則實現(xiàn)了自己的檢測方法。 - 該工具是否有助于在每個樣本組中使用重復(fù)樣本? - 用于信號分配的基礎(chǔ)統(tǒng)計模型是什么?它是基于泊松分布還是基于更靈活的負二項式分布。 - 已經(jīng)針對特定的ChIP-seq數(shù)據(jù)(信號類型)專門設(shè)計了一些工具,例如組蛋白修飾或轉(zhuǎn)錄因子(TF)結(jié)合。
對于有兩個重復(fù)的樣本,最好使用DiffBind之類的工具來利用這些重復(fù)項。
1.1. DiffBind
DiffBind是一種R Bioconductor軟件包,用于識別兩個或多個樣品組之間差異富集的位點。 它主要與峰調(diào)用集(“峰集”)配合使用,這是代表每個樣品的候選蛋白質(zhì)結(jié)合位點的基因組間隔集。它包括支持峰集處理的功能,包括在整個數(shù)據(jù)集中重疊和合并峰集,對峰集中重疊間隔中的測序讀數(shù)進行計數(shù),并根據(jù)結(jié)合親和力的證據(jù)在統(tǒng)計學(xué)上顯著鑒定差異結(jié)合位點(通過讀數(shù)差異來衡量)密度)。
1.2. DiffBind的基本計算步驟介紹
1.2.1. 閱讀峰集
第一步是讀取一組峰集和關(guān)聯(lián)的元數(shù)據(jù)。這是使用樣本表完成的。讀入峰集后,合并功能會找到所有重疊的峰,并得出覆蓋所有提供的峰的單組獨特的基因組間隔(實驗的共識峰集)。如果一個區(qū)域出現(xiàn)在兩個以上的樣本中,則認為該區(qū)域為共識集。該共有集代表將在進一步分析中使用的候選結(jié)合位點的總體集。
簡言之:尋找兩組對比樣本中的共有Peak區(qū)域。
1.2.2. 親和力結(jié)合矩陣
下一步是獲取比對文件,并為共識集中的每個峰/區(qū)域計算計數(shù)信息。在此步驟中,對于每個共有區(qū)域,DiffBind會獲取ChIP樣本和輸入樣本中對齊的讀取數(shù),以計算每個潛在結(jié)合位點上每個樣本的標準化讀取數(shù)。共識峰集中的峰可以基于計算其峰頂(最大讀取重疊點)進行重新居中和修整,以提供更標準的峰間隔。
1.2.3. 探索性數(shù)據(jù)分析
1.2.3.1. Peak共有位點相關(guān)性分析
為了了解樣本之間的聚類程度,我們使用所有共有位點繪制PCA圖,相關(guān)性熱圖
1.2.3.2. 差異分析
DiffBind的核心功能是差異結(jié)合親和力分析,該功能可識別出在樣品組之間統(tǒng)計學(xué)上顯著差異結(jié)合的結(jié)合位點。默認情況下,使用DESeq2執(zhí)行核心分析例程,并且還可以選擇使用edgeR。每個工具將為每個候選結(jié)合位點分配一個p值和FDR,以表明它們被差分結(jié)合的置信度。
1.2.3.2.1. 差異Peak的相關(guān)性分析
為了了解樣本之間的差異Peak計算結(jié)果的重復(fù)性,我們使用所有差異分析結(jié)果繪制PCA圖,相關(guān)性熱圖
MA圖
差異Peak一種可視化方法。
箱型圖
顯示在樣品中表現(xiàn)出增加的親和力的差異結(jié)合位點中的reads分布。
結(jié)果
表頭說明 【 之前給的分析報告里面有,待抄過來
】
Demo
1.1.chip/DiffBind/Demo_analysis/
文件 | 說明 |
---|---|
ZGW_H3K27ac/1cor_readCont_ZGW_H3K27ac.png | 讀取的reads計數(shù)的相關(guān)性分析(熱圖) |
ZGW_H3K27ac/1pca_readCont_ZGW_H3K27ac.png | 讀取的reads計數(shù)的相關(guān)性分析(PCA) |
ZGW_H3K27ac/2cor_peakScore_ZGW_H3K27ac.png | Peak共有位點相關(guān)性分析(熱圖) |
ZGW_H3K27ac/2pca_peakScore_ZGW_H3K27ac.png | Peak共有位點相關(guān)性分析(PCA) |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_1cor.png | 差異Peak可視化,相關(guān)性分析(熱圖) |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_2pca.png | 差異Peak可視化,相關(guān)性分析(熱圖) |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_3ma.png | 差異Peak可視化,MA圖 |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_4vol.png | 差異Peak可視化,火山圖 |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_5box.png | 差異Peak可視化,關(guān)于reads分布的箱型圖 |
ZGW_H3K27ac/ZGW_H3K27ac_treat-vs-con_6heatmap.png | 差異Peak可視化,表達熱圖 |