Deseq2 的可视化策略汇总

亡梦爱人 提交于 2020-05-01 07:28:04
1) MA图
 

 

对于MA图而言, 横坐标为该基因在所有样本中的均值,basemean = (basemean_A + basemean_B ) / 2, 纵坐标为 log2Fold change
其中,pvalue < 0.1 以下的点被认为是差异基因,标记为红色
 
 
2)  count 图 (单个基因在不同组样本中的分布)
 

 

 
 
为了防止样本表达量相同时,点出现重合的情况,添加了扰动
library("ggplot2")
ggplot(d, aes(x=condition, y=count)) + geom_point(position=position_jitter(w=0.1,h=0)) + scale_y_log10(breaks=c(25,100,400))
 
 
 
3) heatmap (基因表达矩阵的heatmap)
值得注意的是,当我们想要通过heatmap 图来看规律的时候,可以先不对样本和基因进行聚类,直接按照分组顺序来排就好,这样可以直观的看出来在不同分组中的规律
 

 

 
4)  heatmap (sample-to-sample 的距离矩阵的热图)
 

 

 
此时,可以对样本进行聚类,看样本的聚类效果和实验设计时的分组是否一致;
 
5)PCA 图(样本的PCA 图)
 

 

6) boxplot (观察离群值点)
 
 
 
 
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!