亚洲综合无码一级片无码的_国产丝袜一二三四区乱码_欧美福利大片二区_男人边吃奶边做边爱免费

高效、務(wù)實(shí)、嚴(yán)謹(jǐn)、敬業(yè)
服務(wù)目錄
技術(shù)服務(wù)
技術(shù)專題
聯(lián)系我們

聯(lián)系我們

廣州賽誠(chéng)生物科技有限公司
廣州市黃埔區(qū)學(xué)大道攬?jiān)侣窂V州企業(yè)孵化器B座402
電話:020-85625352
手機(jī):18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141

項(xiàng)目名稱:染色質(zhì)免疫共沉淀測(cè)序ChIP-Seq結(jié)題報(bào)告(解讀)

所屬分類:生物信息學(xué)分析-報(bào)告解讀

聯(lián)系電話:020-85625352

QQ:386244141

Email:servers@gzscbio.com

技術(shù)服務(wù)描述

此文為Chip-seq報(bào)告的解讀文件:

  • 以下紅字灰色背景為每一小節(jié)的結(jié)果解讀信息

  • 結(jié)果解讀位于每一小節(jié)末尾


1. 工作流程

染色體免疫共沉淀(ChIP)是一種用于研究蛋白質(zhì)與 DNA 的體內(nèi)相互作用的經(jīng)典實(shí)驗(yàn)技術(shù)。采用特異性抗體將目的蛋白進(jìn)行免疫沉淀,由此可以把目的蛋白所結(jié)合的基因組 DNA 片段也富集下來。通過與高通量測(cè)序技術(shù)的結(jié)合,對(duì) ChIP 后的DNA 產(chǎn)物進(jìn)行測(cè)序分析, 從全基因組范圍內(nèi)尋找目的蛋白的 DNA 結(jié)合位點(diǎn),以高效率的測(cè)序手段得到高通量的數(shù)據(jù)結(jié)果。

1.1. ChIP 免疫沉淀實(shí)驗(yàn)流程

目前主要有兩種不同的ChIP 實(shí)驗(yàn)方法,大致流程如下(以細(xì)胞樣品的處理過程為例):

Cross-liking Chromatin Immunoprecipitation (X-ChIP)

  1. 準(zhǔn)備足量的新鮮細(xì)胞,每個(gè)IP約4x106個(gè)細(xì)胞,用新鮮的1%的甲醛處理細(xì)胞,進(jìn)行細(xì)胞交聯(lián)。

  2. 125mM的甘氨酸終止交聯(lián),收集細(xì)胞。

  3. 超聲或酶解打斷染色質(zhì),將基因組 DNA 打斷至 100-500bp。

  4. 將抗體(一般為1~5ug)與染色質(zhì)片段4℃孵育過夜。

  5. 加入proteinA/G beads進(jìn)行4℃孵育4-6小時(shí)。

  6. Proteinase K 解交連。

  7. 酚氯仿或DNA提取試劑盒提取DNA

  8. QPCR 檢測(cè)或建庫(kù)測(cè)序


1.2. ChIP Sequencing 文庫(kù)構(gòu)建流程

  1. 用qubit 對(duì)ChIP片段進(jìn)行定量檢測(cè)

  2. 補(bǔ)齊片段末端,并在3’末端加A尾

  3. 添加Adapter

  4. 0.8X AMPure beads去掉多余的Adapter

  5. 文庫(kù)PCR擴(kuò)增

  6. 1XAMPure beads 去掉多余的primer

  7. qPCR測(cè)定文庫(kù)濃度

  8. Agilent 2100測(cè)定文庫(kù)片段大小






1.3. 生物信息分析流程

將測(cè)序結(jié)果與參考基因組比對(duì),比對(duì)上唯一位置的序列用于后續(xù)標(biāo)準(zhǔn)信息分析及個(gè)性化分析。信息分析流程如下:






此節(jié)內(nèi)容為Chip-seq基本流程介紹,包括

  • 實(shí)驗(yàn)流程

  • 建庫(kù)流程

  • 分析流程



2. 數(shù)據(jù)結(jié)果及生物信息分析

2.1. ChIP Sequencing 文庫(kù)質(zhì)檢結(jié)果

文庫(kù)片段質(zhì)檢,ChIP文庫(kù)的染色質(zhì)片段在100-500bp之間,建庫(kù)加入約140bp的接頭后,片段應(yīng)該分布在250-700bp之間為最好。

Fragment Analyzer (FA)毛細(xì)管電泳檢測(cè):






檢測(cè)結(jié)果匯總:(以下結(jié)果中文庫(kù)大小為 FA 判定結(jié)果)






此節(jié)內(nèi)容為Chip-seq文庫(kù)構(gòu)建質(zhì)檢結(jié)果展示:

  • 圖中展示了各個(gè)樣本文庫(kù)大小及濃度等信息



2.2. 測(cè)序數(shù)據(jù)質(zhì)量控制

對(duì)原始測(cè)序數(shù)據(jù)及去除接頭后的可用數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估。

具體的qc報(bào)告見:

Results/2.2.QC/qc_Demo-H3K27ac.html
Results/2.2.QC/qc_supplement.html


本節(jié)展示了ChIP-seq數(shù)據(jù)的質(zhì)量:

  • 比對(duì)情況

  • 測(cè)序深度

  • 組內(nèi)重復(fù)性

  • peaks數(shù)量、長(zhǎng)度分布

  • peaks中reads的數(shù)量百分比

  • ...



2.3. Reads 在全基因組的可視化分布

使用 IGV 軟件對(duì) Reads 進(jìn)行可視化查看,可以查看全基因組任何感興趣位置的 reads 富集情況,示例如下:





IGV 的安裝使用參考: http://software.broadinstitute.org/software/igv/

可視化操作步驟依次是:

在軟件的 Genome 選項(xiàng),基因參考序列 hg38 ;
在軟件的 File 選項(xiàng),上傳 要查看染色體 bigwig 文件 以及 narrowPeak文件;
以上文件上傳后可查看該染色體任意位置的基因信息及 reads 富集情況。


結(jié)果文件 :

Results/2.3.peak_cover/*


表頭說明:

Results/2.3.peak_cover/*.narrowPeak表頭說明:



表頭(以下表示第幾列)說明
Column 1seqnames, peak所在染色體
Column 2start, peak起始位置
Column 3end, peak終止位置
Column 4peakname, peak的名字
Column 5score, callPeak的置信度分?jǐn)?shù),結(jié)果按照該列進(jìn)行排名,計(jì)算方法為int(-10*log10Pvalue)
Column 6strand, 正負(fù)鏈信息
Column 7FC, target vs input 的倍數(shù)
Column 8score, pvalue,計(jì)算方法為-10*log10Pvalue
Column 9score, qvalue,計(jì)算方法為-10*log10qvalue
Column 10兩個(gè)峰最高點(diǎn)之間的距離,示例如圖



Results/2.3.peak_cover/*.narrowPeak表頭說明圖示:






此節(jié)內(nèi)容,對(duì)結(jié)果進(jìn)行說明并給出了在IGV中可視化的兩個(gè)最重要的基本文件:

  • .bigwig: 測(cè)序reads在基因組上的可視化分布結(jié)果文件

  • .narrowPeak: callPeak結(jié)果文件



2.4. 全基因組 Reads 富集峰 Peak 鑒定

采用常用 reads 富集峰鑒定軟件 MACS 在全基因范圍進(jìn)行 peak 掃描,得到 Peak 在基因組上的位置信息、peak 富集信息等。



圖1 全基因組 Reads 富集峰



結(jié)果文件:

Results/Demo-H3K27ac.PeakAnno.xls
Results/2.4.peak_scan/Demo-H3K27ac.covplot.pdf


表頭說明:
Results/*.PeakAnno.xls表頭說明:



表頭說明
seqnamespeak所在染色體
startpeak起始位置
endpeak終止位置
widthpeak長(zhǎng)度
strand正負(fù)鏈信息
V4同Peak文件第4列,peakname,peak的名字
V5同Peak文件第5列,callPeak的置信度分?jǐn)?shù),計(jì)算方法為int(-10*log10Pvalue)
V6同Peak文件第6列,與上述strand列一致,表示正負(fù)鏈信息
annotationpeak注釋信息(對(duì)于注釋到基因上等注釋信息的描述)
geneChr注釋基因的染色體信息
geneStart注釋基因的起始位置
geneEnd注釋基因的終止位置
geneLength注釋基因的長(zhǎng)度
geneStrand注釋基因的正負(fù)鏈
geneId注釋基因的EntrezID
transcriptId注釋基因的轉(zhuǎn)錄本名字
distanceToTSS被注釋Peak距離TSS的距離
ENSEMBL注釋基因的ENSEMBL名
SYMBOL注釋基因的SYMBOL名
GENENAME注釋基因的基本描述信息




此節(jié)內(nèi)容包括:

  • 所有Peak的臨近基因注釋結(jié)果文件

  • callPeak結(jié)果在全基因組上的分布情況(高度代表置信度)



2.5. Reads 在 TSS 近端富集強(qiáng)度分析

TSS 轉(zhuǎn)錄起始位點(diǎn)近端(0-3kb)與特定的基因轉(zhuǎn)錄調(diào)控功能有關(guān),統(tǒng)計(jì) reads 在TSS 近端的分布情況。



圖 2 reads 在 TSS 近端富集強(qiáng)度的分布(熱圖分布)

圖 3 reads 在 TSS 近端富集強(qiáng)度的分布(峰圖分布)


結(jié)果文件:

Results/2.5.tss_near/Demo-H3K27ac.tagheatmap.pdf
Results/2.5.tss_near/Demo-H3K27ac.plotavgprof.pdf


此節(jié)內(nèi)容包括:

  • 以TSS為中心向正負(fù)拓展3k距離的的Peak富集情況



2.6. Reads 在 TSS 近端及遠(yuǎn)端富集強(qiáng)度分析

TSS 轉(zhuǎn)錄起始位點(diǎn)近端(0-3kb)及遠(yuǎn)端(10kb以上)的 reads 分布與特定的基因轉(zhuǎn)錄調(diào)控功能有關(guān),統(tǒng)計(jì) reads 在TSS 近端及遠(yuǎn)端的分布情況。



圖4 reads 在 TSS 近端及遠(yuǎn)端富集強(qiáng)度的分布



結(jié)果文件:

Results/2.6.tss_near_far/Demo-H3K27ac.peakAnnodistotss.pdf


此節(jié)內(nèi)容包括:

  • 以TSS為中心向正負(fù)拓展3k-10k以上距離的的Peak富集情況



2.7. Peak 在基因組上的分布

將 Peak 根據(jù)位置信息進(jìn)行基因組注釋基因結(jié)構(gòu)元件,分別統(tǒng)計(jì) Peak 在結(jié)構(gòu)元件(intergenic region、upstream 5K、5`UTR、exon、intron,3’UTR、downstream5k)的數(shù)目,并根據(jù)其在各個(gè)元件上的富集程度,繪制分布特征。

Peak 在基因結(jié)構(gòu)元件上的分布特征:



圖5 Peak 在基因結(jié)構(gòu)元件上的分布

圖6 Peak 在基因結(jié)構(gòu)元件上的分布比例


Peak 在各基因結(jié)構(gòu)元件上的交叉分布特征:



圖7 Peak 在基因結(jié)構(gòu)元件上的交叉分布(upsetplot)

圖8 Peak 在基因結(jié)構(gòu)元件上的交叉分布(vennpie)


結(jié)果文件:

Results/2.7.peak_dis/Demo-H3K27ac.peakAnnobar.pdf
Results/2.7.peak_dis/Demo-H3K27ac.peakAnnopie.pdf
Results/2.7.peak_dis/Demo-H3K27ac.peakAnnoupset.pdf
Results/2.7.peak_dis/Demo-H3K27ac.peakAnnovinnpie.pdf


此節(jié)內(nèi)容包括:

  • 所有Peak在基因結(jié)構(gòu)元件上的分布特征(即,各個(gè)Peak注釋到了基因的什么結(jié)構(gòu)元件的比例統(tǒng)計(jì))

  • 所有Peak在各基因結(jié)構(gòu)元件上的交叉分布特征(即,各個(gè)Peak注釋到的同一個(gè)基因,同時(shí)分布在多個(gè)基因元件的數(shù)量統(tǒng)計(jì))



2.8. Peak注釋基因的富集分析

??我們將前面分析得到的Peak注釋基因,進(jìn)行后續(xù)富集分析。

??我們根據(jù)基因表達(dá)量分析得到差異基因之后,必須進(jìn)一步落到基因的功能上來。對(duì)于差異分析而言,往往涉及到成千上萬個(gè)基因,這會(huì)使分析變得很復(fù)雜。解決思路是將一個(gè)基因列表分成多個(gè)部分,從而減少分析的復(fù)雜度。為了解決怎么分成不同類,通常會(huì)對(duì)基因功能進(jìn)行富集分析, 期望發(fā)現(xiàn)在生物學(xué)過程中起關(guān)鍵作用的生物通路, 從而揭示和理解生物學(xué)過程的基本分子機(jī)制。功能富集分析可以將成百上千個(gè)基因、蛋白或者其他分子分到不同的通路中,以減少分析的復(fù)雜度。另外,在兩種不同實(shí)驗(yàn)條件下,激活的通路顯然比簡(jiǎn)單的基因或蛋白列表更有說服力?;蚬δ芨患治鍪紫纫獦?gòu)建基因集( gene set,如 GO 和 KEGG 數(shù)據(jù)庫(kù)等),也就是基因組注釋信息進(jìn)行分類。然后再把我們的目標(biāo)基因集(差異基因集或者其他基因集)映射到背景基因集上,注意區(qū)分注釋與富集。

??我們采用 clusterProfiler 軟件對(duì)差異基因集進(jìn)行 GO 功能富集分析, KEGG 通路富集分析等。富集分析基于超幾何分布原理,其中差異基因集為差異顯著分析所得差異基因并注釋到 GO 或 KEGG 數(shù)據(jù)庫(kù)的基因集,背景基因集為所有進(jìn)行差異顯著分析的基因并注釋到 GO 或 KEGG 數(shù)據(jù)庫(kù)的基因集。富集分析結(jié)果是對(duì)每個(gè)差異比較組合的所有差異基因集、上調(diào)差異基因集、下調(diào)差異基因集進(jìn)行富集。本報(bào)告中展示的表格是選取某一個(gè)比較組合的富集分析結(jié)果,圖片是部分富集分析結(jié)果。





圖 9 基因富集分析原理圖





2.8.1. 富集分析結(jié)果文件



結(jié)果路徑結(jié)果說明
GO富集分析結(jié)果
Results/*enrich_*/gene.ego_all-p.adjust1.00.csvGO富集結(jié)果列表(所有結(jié)果)
Results/*enrich_*/gene.ego_all-p.adjust0.05.csvGO富集結(jié)果列表(按p.adj<0.05篩選后)
Results/*enrich_*/gene.ego_ALL.csvGO富集結(jié)果列表(MF、BP、CC所有結(jié)果)
Results/*enrich_*/gene.GO-*-barplot.p*GO富集分析柱狀圖
Results/*enrich_*/gene.GO-*-dotplot.p*GO富集分析散點(diǎn)圖
Results/*enrich_*/gene.GO-*-DAG.p*GO富集分析DAG圖
KEGG富集分析結(jié)果
Results/*enrich_*/gene.KEGG.csvKEGG富集結(jié)果列表(所有)
Results/*enrich_*/gene.KEGG_significant.csvKEGG富集結(jié)果列表(按p.adj<0.05篩選后)
Results/*enrich_*/gene.KEGG-*-barplot.p*KEGG富集分析柱狀圖
Results/*enrich_*/gene.KEGG-*-dotplot.p*KEGG富集分析散點(diǎn)圖
ReactomePA富集分析結(jié)果
Results/*enrich_*/gene.ReactomePA.csvReactomePA富集結(jié)果列表(所有)
Results/*enrich_*/gene.ReactomePA_significant.csvReactomePA富集結(jié)果列表(按p.adj<0.05篩選后)
Results/*enrich_*/gene.ReactomePA-*-barplot.p*ReactomePA富集分析柱狀圖
Results/*enrich_*/gene.ReactomePA-*-dotplot.p*ReactomePA富集分析散點(diǎn)圖



結(jié)果文件夾:

說明:

  • Pathway1中對(duì)peaks進(jìn)行基因注釋,僅采用臨近基因注釋。

  • Pathway2中對(duì)peaks進(jìn)行基因注釋,需要考慮多個(gè)因素,包括注釋基因的外顯子/內(nèi)含子,promoter區(qū),也包括peaks兩側(cè)可能包含順式調(diào)控元件的區(qū)域。


表頭說明: (Results/*enrich_*/gene.ego_*.csv GO富集結(jié)果列表)



表頭說明
ID對(duì)應(yīng)GO數(shù)據(jù)庫(kù)中的ID
ONTOLOGY分子功能(Molecular Function),生物過程(biological process)和細(xì)胞組成(cellular component)
DescriptionGO的描述
GeneRatio對(duì)應(yīng)GO 差異基因數(shù) / 能夠?qū)?yīng)到GO數(shù)據(jù)庫(kù)中同類型的差異基因數(shù)
BgRatio對(duì)應(yīng)GO包含對(duì)應(yīng)物種的基因數(shù) / GO數(shù)據(jù)庫(kù)中包含對(duì)應(yīng)物種的基因數(shù)
pvalue富集分析得到的p-value
p.adjust校正后的p-value
qvalue富集分析得到的qvalue
Count富集基因數(shù)目
ENTREZID富集基因列表(ENTREZID)
SYMBOL富集基因列表(SYMBOL)




表頭說明: (Results/*enrich_*/gene.KEGG*.csv KEGG富集、Results/*enrich_*/gene.ReactomePA*.csv ReactomePA富集 結(jié)果列表)



表頭說明
ID對(duì)應(yīng)PATHWAY數(shù)據(jù)庫(kù)中的ID
DescriptionPATHWAY的描述
GeneRatio對(duì)應(yīng)PATHWAY 差異基因數(shù) / 能夠?qū)?yīng)到PATHWAY數(shù)據(jù)庫(kù)中的差異基因數(shù)
BgRatio對(duì)應(yīng)PATHWAY包含對(duì)應(yīng)物種的基因數(shù) / PATHWAY數(shù)據(jù)庫(kù)中包含對(duì)應(yīng)物種的基因數(shù)
pvalue富集分析得到的p-value
p.adjust校正后的p-value
qvalue富集分析得到的qvalue
Count富集基因數(shù)目
ENTREZID富集基因列表(ENTREZID)
SYMBOL富集基因列表(SYMBOL)




2.8.2. GO功能富集分析

?? GO(Gene Ontology) 是描述基因功能的綜合性數(shù)據(jù)庫(kù),可分為生物過程( biological process )和細(xì)胞組成( cellular component )分子功能( Molecular Function )三個(gè)部分。 GO 功能富集以 padj 小于 0.05 作為為顯著性富集的閾值,富集結(jié)果見結(jié)果文件。

??從 GO 富集分析結(jié)果中,選取最顯著的 20 個(gè) Term 繪制柱狀圖進(jìn)行展示,若不足 20 個(gè),則繪制所有 Term ,按生物過程、細(xì)胞組分和分子功能三大類別及差異基因上下調(diào)分類畫的柱狀圖。

??有向無環(huán)圖 (Directed Acyclic Graph,DAG) 為差異基因 GO 富集分析結(jié)果的圖形化展示方式。圖中,分支代表包含關(guān)系,從上至下所定義的功能范圍越來越小,選取每個(gè)差異比較組合的 GO 富集結(jié)果最顯著性前 5 位的 GO Term 作為有向無環(huán)圖的主節(jié)點(diǎn),并通過包含關(guān)系,將相關(guān)聯(lián)的 GO Term 一起展示,顏色的深淺代表富集程度。我們的項(xiàng)目中分別繪制生物過程、分子功能和細(xì)胞組分的 DAG 圖。






圖 10 GO富集分析柱狀圖

圖中縱坐標(biāo)為GO Term,橫坐標(biāo)為GO Term富集的顯著性水平,數(shù)值越高越顯著








圖 11 GO富集分析散點(diǎn)圖

圖中橫坐標(biāo)為注釋到GO Term上的差異基因數(shù)與差異基因總數(shù)的比值,縱坐標(biāo)為GO Term








圖 12 GO富集分析DAG圖

每個(gè)節(jié)點(diǎn)代表一個(gè)GO術(shù)語,方框代表的是富集程度為TOP5的GO,顏色的深淺代表富集程度,顏色越深就表示富集程度越高,每個(gè)節(jié)點(diǎn)上展示了該TERM的名稱及富集分析的padj




2.8.3. KEGG通路富集分析

?? KEGG(Kyoto Encyclopedia of Genes and Genomes) 是整合了基因組、化學(xué)和系統(tǒng)功能信息的綜合性數(shù)據(jù)庫(kù)。 KEGG 通路富集以 padj 小于 0.05 作為顯著性富集的閾值,富集結(jié)果見結(jié)果文件。

??從 KEGG 富集結(jié)果中,選取最顯著的 20 個(gè) KEGG 通路繪制柱狀圖進(jìn)行展示,若不足 20 個(gè),則繪制所有通路,如下圖所示。圖中橫坐標(biāo)為通路富集的顯著性水平,數(shù)值越高越顯著,縱坐標(biāo)為 KEGG 通路。

??從 KEGG 富集結(jié)果中,選取最顯著的 20個(gè)KEGG 通路繪制散點(diǎn)圖進(jìn)行展示,若不足 20 個(gè),則繪制所有通路,如下圖所示。圖中橫坐標(biāo)為注釋到 KEGG 通路上的差異基因數(shù)與差異基因總數(shù)的比值,縱坐標(biāo)為 KEGG 通路,點(diǎn)的大小代表注釋到 KEGG 通路上的基因數(shù),顏色從紅到紫代表富集的顯著性大小。






圖 13 KEGG富集分析柱狀圖

圖中橫坐標(biāo)為通路富集的顯著性水平,數(shù)值越高越顯著,縱坐標(biāo)為KEGG通路。








圖 14 KEGG富集散點(diǎn)圖

圖中橫坐標(biāo)為注釋到KEGG通路上的差異基因數(shù)與差異基因總數(shù)的比值,縱坐標(biāo)為KEGG通路





2.8.4. ReactomePA富集分析

?? Reactome數(shù)據(jù)庫(kù)匯集了人類等模式物種各項(xiàng)反應(yīng)及生物學(xué)通路。Reactome通路富集以padj小于0.05作為顯著性富集的閾值,富集結(jié)果見結(jié)果文件。

??以下柱狀圖與散點(diǎn)圖與上一節(jié)類似,選取最顯著的 20個(gè) 富集進(jìn)行展示,若不足 20 個(gè),則繪制所有通路,如下圖所示。






圖 15 ReactomePA富集分析柱狀圖

圖中橫坐標(biāo)為通路富集的顯著性水平,數(shù)值越高越顯著,縱坐標(biāo)為ReactomePA通路。








圖 16 ReactomePA富集散點(diǎn)圖

圖中橫坐標(biāo)為注釋到ReactomePA通路上的差異基因數(shù)與差異基因總數(shù)的比值,縱坐標(biāo)為ReactomePA通路





此節(jié)內(nèi)容包括:

  • 對(duì)注釋到的基因集的GO富集分析

  • 對(duì)注釋到的基因集的KEGG富集分析

  • 對(duì)注釋到的基因集的ReactomePA富集分析



2.9. Peak 區(qū)域 Motif 分析

用 Homer 軟件對(duì) Peak 區(qū)域鑒定 motif 序列;并將得到的 motif 序列與 JASPAR 數(shù)據(jù)庫(kù)(JASPAR CORE 2016 database)進(jìn)行比對(duì),鑒定已知的 motif。

Homer 結(jié)果示例:





結(jié)果文件:

Results/2.10.motif/*/*.html



此節(jié)內(nèi)容為所有Peak區(qū)域鑒定 motif 結(jié)果,包括:

  • 基于JASPAR數(shù)據(jù)庫(kù)已知查找結(jié)果

  • 基于denovo預(yù)測(cè)結(jié)果