廣州市黃埔區(qū)學大道攬月路廣州企業(yè)孵化器B座402
電話:020-85625352
手機:18102256923、18102253682
Email:servers@gzscbio.com
Fax:020-85625352
QQ:386244141
項目名稱:RIP測序與分析報告
所屬分類:生物信息學分析-報告解讀
聯(lián)系電話:020-85625352
QQ:386244141
Email:servers@gzscbio.com
技術(shù)服務描述
1. 工作流程
??RNA免疫共沉淀(RIP)是一種用于研究蛋白質(zhì)與 RNA 的體內(nèi)相互作用的經(jīng)典實驗技術(shù)。采用特異性抗體將目的蛋白進行免疫沉淀,由此可以把目的蛋白所結(jié)合的RNA片段也富集下來。通過與高通量測序技術(shù)的結(jié)合,對 RIP 后的RNA 產(chǎn)物進行測序分析, 從全基因組范圍內(nèi)尋找目的蛋白的 RNA 結(jié)合位點,以高效率的測序手段得到高通量的數(shù)據(jù)結(jié)果。
1.1. RIP 免疫沉淀實驗流程
??目前主要有兩種不同的RIP 實驗方法,大致流程如下(以細胞樣品的處理過程為例):
RNA Immunoprecipitation
準備足量的新鮮細胞,每個IP約1x107個細胞,用RIP裂解液裂解細胞
加入2-5ug抗體,抗體與蛋白,4℃孵育過夜
加入proteinA/G磁珠,4℃孵育4-6小時
清洗磁珠。
Proteinase K 解交連。
酚氯仿或RNA提取試劑盒提取RNA
QPCR 檢測或建庫測序
1.2. RIP Sequencing 文庫構(gòu)建流程
用qubit 及2100對RIP片段進行定量及片段長度檢測
加入適當?shù)腗g2+,加熱打斷RNA片段
加入反轉(zhuǎn)錄酶,反轉(zhuǎn)錄成cDNA
斷裂RNA鏈且以斷裂RNA為引物,cDNA為模版,形成雙鏈DNA
補齊片段末端,并在3’末端加A尾
添加Adapter
0.8X AMPure beads去掉多余的Adapter
文庫PCR擴增
1XAMPure beads 去掉多余的primer
qPCR測定文庫濃度
Agilent 2100測定文庫片段大小
1.3. 生物信息分析流程
??將測序結(jié)果與參考基因組比對,比對上唯一位置的序列用于后續(xù)標準信息分析及個性化分析。信息分析流程如下:
2. 生物信息分析
2.1. RIP Sequencing 文庫質(zhì)檢結(jié)果
??文庫片段質(zhì)檢,RIP文庫的染色質(zhì)片段在150-300bp之間,建庫加入約140bp的接頭后,片段應該分布在300-450bp之間為最好。
Ladder 自下而上依次為 25(綠色),200,500,1000,2000,4000nt
2.2. 測序數(shù)據(jù)質(zhì)量控制
??對原始測序數(shù)據(jù)及去除接頭后的可用數(shù)據(jù)進行質(zhì)量評估。RIP數(shù)據(jù)一般為雙端測序,因此,每個測序樣本會有兩個測序結(jié)果。
??評估的具體內(nèi)容見:
結(jié)果說明 | 結(jié)果路徑 |
---|---|
RawData-fastqc 文件鏈接 | /Results/01.qc/qc_rawdata/*.html |
CleanData-fastqc 文件鏈接 | /Results/01.qc/qc_cleandata/*.html |
Fastqc 格式補充說明 | /Results/01.qc/qc_Supplement/qc_Supplement.html |
??以上結(jié)果均位于文件夾:/Results/01.qc/
2.3. Peak calling數(shù)據(jù)統(tǒng)計結(jié)果
??質(zhì)檢后的reads,采用trim-galory對reads進行去接頭,去接頭后,再次對reads進行質(zhì)檢,主要檢測接頭是否去除干凈。去除接頭的reads,用hisat2軟件將reads mapping到基因組上,得到reads在基因組上的信息,即.bam文件,將input的.bam文件與IP的.bam文件,通過MASC2進行 peak calling,得到peak文件,即為.bed文件,對得到的peak進行注釋,并進行功能分析。
??采用常用 reads 富集峰鑒定軟件 MACS2 在全基因范圍進行 peak 掃描,得到 Peak 在基因組上的位置信息、peak 富集信息等。
圖 2.4.1 全基因組 Reads 富集峰
??使用Chipseeker對Reads富集峰進行注釋,得到tss上下游3k的基因注釋信息。使用bedtools對富集峰與lncRNA取交集得到所在基因,將得到的lncRNA基因同樣使用chipseeker(僅用 Protein-coding
注釋)進行上下游10k的臨近基因注釋,對基因結(jié)果進行后續(xù)富集分析。
圖 2.4.2 Peak信息anno流程圖
??結(jié)果文件:
結(jié)果說明 | 結(jié)果路徑 |
---|---|
reads在基因組上的分布信息 | DYQ-HCT116-target.bw |
callPeak peak信息 | DYQ-HCT116_peaks.bed |
callPeak tss上下游3k注釋信息 | DYQ-HCT116_peaks.PeakAnno.xls |
callPeak 與 lncRNA 交集peak信息 | DYQ-HCT116_peaks_lncRNA.bed |
交集peak信息與臨近Protein-coding的注釋信息 | Peak_LncRNA_Anno_Protein-coding.xls |
交集peak信息與臨近Protein-coding的注釋信息(bed) | Peak_LncRNA_Anno_Protein-coding.bed |
注釋信息的基因信息匯總 | gene.list.annoinfo.xls |
??以上結(jié)果均位于文件夾: /Results/02.callPeak
2.4. Peak 基因注釋與 GO 功能分析
??Peak 所在基因進行GO 功能分析,并按照基因功能進行聚類分析。y軸為基因的功能聚類,x軸為基因count數(shù),顏色為校正p值。GO功能富集以padj小于0.05作為為顯著性富集的閾值,GO分析有3種類型,分別為CC(細胞組分),MF(分子功能),BP(生物過程)。富集結(jié)果見:
??條形圖縱坐標為GO Term,縱坐標為count數(shù),顏色從紅到紫代表富集的顯著性大小。
圖 2.5.1 Peak 相關基因的GO 功能富集分析(條形圖)
??氣泡圖縱坐標為GO Term,點的大小代表注釋到GO Term上的基因數(shù),顏色從紅到紫代表富集的顯著性大小
圖 2.5.2 Peak 相關基因的 GO 功能富集分析(氣泡圖)
結(jié)果文件:
2.5. Peak 基因注釋與 KEGG通路分析
??KEGG(Kyoto Encyclopedia of Genes and Genomes)是整合了基因組、化學和系統(tǒng)功能信息的綜合性數(shù)據(jù)庫。KEGG通路富集以padj小于0.05作為顯著性富集的閾值,富集結(jié)果如下表所示,見結(jié)果文件:Enrichment/KEGG。 ?從KEGG富集結(jié)果中,選取最顯著的20個KEGG通路繪制柱狀圖進行展示,若不足20個,則繪制所有通路,如下圖所示。圖中橫坐標為KEGG通路,縱坐標為通路富集的顯著性水平,數(shù)值越高越顯著。
圖 2.6.1 Peak 相關基因的KEGG通路富集分析(條形圖)
??氣泡圖縱坐標為GO Term,點的大小代表注釋到GO Term上的基因數(shù),顏色從紅到紫代表富集的顯著性大小
圖 2.6.2 Peak 相關基因的KEGG通路富集分析(氣泡圖)
結(jié)果文件: