廣州市黃埔區(qū)學(xué)大道攬?jiān)侣窂V州企業(yè)孵化器B座402
電話:020-85625352
手機(jī):18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
項(xiàng)目名稱:Chip-seq分析流程
所屬分類:生物信息學(xué)分析
聯(lián)系電話:020-85625352
QQ:386244141
Email:servers@gzscbio.com
技術(shù)服務(wù)描述
Chip-seq分析流程
流程的一些關(guān)鍵點(diǎn)分析:
我們的Peak是如何找出來的?Callpeak的流程(MACS2)
1. 質(zhì)控 (quality control)
首先要看一下ChIP-seq數(shù)據(jù)的質(zhì)量,數(shù)據(jù)的信號最好比background要強(qiáng)很很多。一般要有control,這樣call peaks更準(zhǔn)確可信, control主要有Input DNA 和 IgG兩種,前一種更常用。
檢測質(zhì)量的一些方式:
1). peaks中reads的數(shù)量,如果peaks的reads普遍較少,則質(zhì)量一般。
2). peaks信號高,背景低。
3). 測序深度深 。
4). Diverse library (與重復(fù)duplications有關(guān),如下圖)
5). 有重復(fù)并且與重復(fù)之間相似性較高…
……
2. 序列比對 (mapping of fastq)
序列比對一般用BWA或者Bowtie2,兩者效果差不多。我們一般采用Bowtie2,對reads進(jìn)行基因組進(jìn)行回帖。
3. 去除重復(fù) (remove duplicates)
由于PCR實(shí)驗(yàn)存在不可避免的實(shí)驗(yàn)誤差,所以會存在重復(fù) (duplicates)。我們一般在Chip-seq中會進(jìn)行去除。
理論上來講,不同的序列在進(jìn)行PCR擴(kuò)增時,擴(kuò)增的倍數(shù)應(yīng)該是相同的。但是由于聚合酶的偏好性,PCR擴(kuò)增次數(shù)過多的情況下,會導(dǎo)致一些序列持續(xù)擴(kuò)增,而另一些序列擴(kuò)增到一定程度后便不再進(jìn)行,也就是我們常說的PCR偏好性。
這種情況對于定量分析(如ChIP-seq),會造成嚴(yán)重的影響。此外,PCR擴(kuò)增循環(huán)數(shù)過多,會出現(xiàn)一些擴(kuò)增偏差,進(jìn)而影響后續(xù)分析結(jié)果的置信度。
4. peak calling
peaks是reads信號比較強(qiáng)的區(qū)域,也就是我們找到的轉(zhuǎn)錄因子或者組蛋白修飾最有可能結(jié)合的地方。call peaks仍然有不少軟件,比較常用的是MACS2和Hotspot2。
5. 下游分析 (downstream analysis)
分析完之后下游可以做的事情很多,視情況而定。 可分析Peak的臨近注釋基因,分布類型情況,及功能注釋情況; 或者Homer等工具注釋peaks,看不同轉(zhuǎn)錄因子/組蛋白修飾之間的關(guān)系,或者分析TF的target gene。 或者同時分析RNA-seq、ATAC-seq等數(shù)據(jù),看轉(zhuǎn)錄因子與染色質(zhì)開放區(qū)的關(guān)系;