Principal component analysis (PCA) 分析

主成分分析(PCA)帮助我们归纳总结和可视化数据集中的信息，这些数据包含由多个相互关联的变量描述的个体 / 观察主成分分析。可以将每个变量视为不同的维度。但如果您的数据集中有3个以上的变量，那么很难在多维超空间可视化。主成分分析是用来从一个多变量数据表中提取重要信息，并将这些信息表示为一组称为主成分的新变量。这些新的变量相当于原始数据的线性组合。主成分的个数小于或等于原始变量的个数。给定数据集中的信息对应于它所包含的总变差。主成分分析的目的是确定数据变化最大的方向(或主成分)。换句话说，主成分分析将多变量数据的维数降低为两个或三个主成分，这些主成分可以以图形化的方式显示，信息损失最小。转录组中，一般用来检验不同处理组样本间重复性的好坏。更多PCA原理及分析方法请点击文末的PCA分析资料，下面小编用自己的数据在R中进行PCA分析。

PCA可视化

数据展示
代码展示

******************************************************************************************************
#### RNA-seq样本PCA分析####
#加载的R包
install.packages(c("ggpubr","ggthemes","gmodels"))
library(ggpubr)
#加载差异基因表达矩阵
library(gmodels)
library(ggpubr)
library(ggplot2)
library(ggthemes)
data<-read.csv("C:/Users/Administrator/Desktop/I.csv",header = T,row.names = 1)
head(data)#每一列为一个样本，每一行为一个基因
#计算PCA
pca.info <- fast.prcomp(data)
??fast.prcomp()
#显示PCA计算结果
head(pca.info$rotation)
#计算Y1与Y28之间的差异
pca.data <- data.frame(sample = rownames(pca.info$rotation),Type = c(rep("1d",3),rep("28d",3)),pca.info$rotation)
#绘图
ggscatter(pca.data,x = "PC1",y = "PC2",color = "Type") + theme_base()
###其它图形修饰参数自己摸索吧，哈哈~
************************************************************************************************************************

结果图

从图片来看，第一天间样本重复性较好，28d的就不行了，都聚不到一块。

更多信息可见：PCA分析资料

来源：https://www.cnblogs.com/R-kenmly/p/11937851.html

标签

pca

data

变量

RNA-seq表达数据之样本PCA分析

Principal component analysis (PCA) 分析

PCA可视化