一、R包与命令
㈠、R语言的获取帮助命令
1、help.start() 打开帮助文档
2、help("plot")或者help(plot)或者?plot 查看plot函数的帮助(引号可以省略)
3、help.search('plot')或者??plot 以plot为关键字搜索本地帮助文档
4、example("plot")或者example(plot) plot函数的使用实例(引号可以省略)
5、RSiteSearch("plot") 以plot为关键词搜索在线文档和邮件列表存档
6、apropos("plot",mode="function") 列出名称中含有plot的所有可用函数
7、data() 列出当前已加载包中所含的所有可用示例数据集
8、vignette() 列出当前已经安装的包中所有可能的vignette文档
9、vignette("plot") 为主题plot显示指定的vignette文档
㈡、R的工作空间管理命令
1、getwd() 显示当前的工作目录
2、setwd("new_path") 修改当前的工作目录为new_path
3、Is() 列出当前工作空间中的对象
4、rm(objectList) 移除(删除)一个或多个对象
5、 rm(list=Is()) 移除当前工作空间的所有对象,即清除R工作空间中的内存变量
6、help(options) 显示可用选项的说明
7、options() 显示或设置当前选项
8、history(n) 显示最近使用过的n个命令(默认值为25)
9、savehistory("myfile") 保存命令历史文件到myfile中(默认值为.Rhistory)
10、loadhistory() 载入一个命令历史文件(默认值为.Rhistory)
11、save.image("myfile") 保存工作空间到文件myfile中(默认值为.RData)
12、save(objectlist,file="myfile") 保存指定对象到一个文件中
13、load("myfile") 读取一个工作空间到当前回话中(默认值为.RData)
14、q() 退出R,并会询问是否保存工作空间
㈢、安装与加载R包
可以通过install.packages函数来下载和安装包,然后通过library函数加载相应的包
分类与预测
1、nnet函数需要加载BP神经网络nnet包
2、randomForest函数需要加载随机森林randomForest包
3、svm函数需要加载e1071包
4、tree函数需要加载CRAT决策树tree包等
㈣、聚类分析
1、hclust函数、kmeans函数在stats包中
关联规则
1、apriori函数需要加载arules包
时间序列
1、arima函数需要加载forecast、tseries包
二、数据结构
㈠、查看数据类型
1、查看对象类型
typeof(x)
class(x)
mode(x)
2、数据类型的判别和转换
数据类型 判别函数 转换函数
numeric is.numeric as.numeric
logical is.logical as.logical
character is.character as.character
integer is.integer as.integer
complex is.complex as.complex
double is.double as.double
㈡、判断数据结构
1、向量(vector)
⒈1、向量创建
⑴、直接创建向量
⑵、c函数创建向量
⑶、seq函数创建等差序列的向量
⑷、rep函数创建重复序列
⒈2、向量索引
⑴、下标索引
⑵、逻辑索引
⑶、名称索引
⑷、which函数索引
⑸、subset函数索引
⑹、match函数索引
⒈3、向量编辑
⑴、向量扩展
⑵、改变元素的值
⑶、删除元素
⒈4、向量排序
sort(x,decreasing=FALSE,na.last=NA,…)
rev函数将向量倒序
2、矩阵(matrix)
⒉1、创建矩阵
matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)
⑴、创建对角矩阵
⑵、创建单位矩阵
⒉2、矩阵索引
⑴、根据位置索引
⑵、根据行和列的名称索引
⑶、使用一维下标索引
⑷、使用数值型向量索引
⒉3、矩阵编辑
⒉4、矩阵运算
3、数组(Array)
⒊1、创建数组
array(data=NA,dim=length(data),dimnames=NULL)
⒊2、数组索引
4、数据框(data.frame)
⒋1、创建数据框
⒋2、数据框索引
⑴、列索引
⑵、行索引
⑶、元素索引
⑷、subset函数索引
⑸、sqldf函数索引
⒋3、数据框编辑
5、列表(list)
⒌1、创建列表
⒌2、列表索引
⒌3、列表编辑
、数据结构的判别与转换
数据结构 判别函数 转换函数
向量 is.vector 视具体情况而定
矩阵 is.matrix as.matrix
数组 is.array as.array
数据框 is.data.frame as.data.frame
列表 is.list as.list
三、数据集基本处理
1、重命名变量
⑴、利用交互式编辑器修改变量名
⑵、使用rename函数修改变量名(数据框、列表)
⑶、使用names函数修改变量名(数据框、列表)
⑷、使用rownames函数与colnames函数修改变量名(数据框、矩阵)
2、数据排序
⑴、sort函数
⑵、rank函数
⑶、order函数
3、合并数据集
rbind和cbind
4、选取变量及数据
⑴、使用subset函数选取数据
⑵、随机抽样
①、srswr函数(不放回)
②、srswor函数(有放回)
③、sample函数(放回、不放回)
5、重塑数据
⑴、merge函数(合并数据框)
⑵、melt函数(数据融合)
6、字符串处理函数
⑴、grep函数
返回值为下标
⑵、sub函数
⑶、gsub函数
⑷、strsplit函数
⑸、paste函数
连接字符串
四、函数与控制流
1、if–else结构
2、ifelse结构
3、switch分支语句
4、for循环语句
5、while循环语句
6、编写自定义函数
五、绘图
1、绘制基础图形
⑴、直方图(Histogram)
⑵、条形图(Bar Chart)
⑶、饼图(Pie Graph)
⑷、箱线图(Boxplot)
2、分析数据间的关系
⑴、散点图(ScatterDiagram)
⑵、散点矩阵图((Matrix of Scatter Plots))
3、多变量相关矩阵图
4、绘制其他图形
⑴、核密度图
⑵、小提琴图
⑶、QQ图
⑷、星状图
5、修改图形参数
⑴、修改颜色
①、固定颜色选择函数
②、渐变色生成函数
⑵、修改点符号与线条
①、点样式
②、线条样式
⑶、修改文本属性
⑷、设置坐标轴
⑸、添加图例
6、绘制组合图形
⑴、par函数
⑵、layout函数
六、高级绘图
1、lattice报绘图
2、ggplot2包绘图
七、可视化数据挖掘工具
Rattle