R语言

R语言

房东的猫 提交于 2019-12-10 21:00:07
安装xlsx包 #装之前先装jdk,配置环境变量 install.packages("xlsx") 代表安装成功 必须先加载包然后再使用包 library() $提取符号 当一个函数里需要返回多个值(比如有变量,有向量,有矩阵)时,我们要用list,而不是return,这时如果想提取某个变量的结果,就需要用到$,默认情况下,对于 `list`, `environment` 这两种对象,`$`可以提取(extract)出里面的元素。 必知必会的函数 x<-c(7,5,8,9,2) #最大值 max(x) #最小值 min(x) #同时获取最大值和最小值 range(x) #后一项减去前一项 diff(x) #极差 diff(range(x)) #累加和 cumsum(x) #累计乘积 cumprod(x) #累计求最大值 cummax(x) #累计求最小值 cummin(x) #基于矩阵和数据框的函数 #循环:显式循环、隐式循环 #显式:for、while、repeat #隐式:apply、lapply、sapply #apply #构造矩阵m m<-matrix(1:12,nrow = 3,byrow = T) #计算矩阵的每一行的和 # 1代表行,2代表列 apply(m,1,sum) #计算矩阵的每一列的均值 apply(m,2,mean) #lapply #构造一个列表 #

R语言中的 & 和 &&

孤人 提交于 2019-12-10 11:13:46
R语言中的 & 和 && 今天才发觉R中的& 和 && 不是一回事… 区别之一 当然,如果只计算两个标量(长度为1的向量),他俩似乎是差不多的: TRUE & FALSE ## [1] FALSE TRUE && FALSE ## [1] FALSE 如果计算的是两个向量的话,结果就明显不同: c(TRUE, FALSE) & c(TRUE, TRUE) ## [1] TRUE FALSE c(TRUE, FALSE) && c(TRUE, TRUE) ## [1] TRUE 区别在于,& 依次比较两个向量中的对应元素,而&&只比较两个向量的 首个 元素。 &&的这种偷懒的做法确保了它的计算结果只为一个标量,TURE或FALSE。这就使他 可以与if等只接受一个标量为参数的函数完美搭配起来。 区别之二 说到偷懒,和&相比,&&偷懒的地方还不止这一处: a #对象a不存在 ## Error in eval(expr, envir, enclos): 找不到对象'a' FALSE & a ## Error in eval(expr, envir, enclos): 找不到对象'a' FALSE && a ## [1] FALSE 在进行比较时,&& 如果发现左边对象的值为FALSE,那么他就不会计算右边的对象了,(因为无论 右边对象的值为多少,逻辑与的结果总为FALSE

R语言data.frame排序 sort

烂漫一生 提交于 2019-12-10 07:48:08
在这篇文章里面介绍了data.frame的基本操作 data.frame基本操作 。今天写一下data.frame的排序。R基本package里面用的比较多的排序function是order,sort是用来排序vector。 order 这个是order的用法 order(..., na.last = TRUE, decreasing = FALSE, method = c("auto", "shell", "radix")) … 代表的是排序数据,可以是vector,或者多个vectors。 na.last 对空值的处理。TRUE的话,NA值会被排在最后面,FALSE排在最前面。 decreasing 是设置生序排列还是降序排列。默认是生序排列。 method = c(“auto”, “shell”, “radix”) shell是指希尔排序。 百科希尔排序 radix 是基数排序。 百科基数排序 auto是数据类型为short numeric vectors, integer vectors, logical vectors and factors。其余的用shell。 我们来看一个简单的例子。 studentAges <- c(23, 34, 34, 89, 90, 35) studentNames <- c("Bob","Henry","Lily","LiMing",

R语言 机器学习包

孤人 提交于 2019-12-10 01:44:38
from: http://www.zhizhihu.com/html/y2009/410.html 机器学习是计算机科学和统计学的边缘交叉领域,R关于机器学习的包主要包括以下几个方面: 1)神经网络(Neural Networks): nnet包执行单隐层前馈神经网络,nnet是VR包的一部分( http://cran.r-project.org/web/packages/VR/index.html )。 2)递归拆分(Recursive Partitioning): 递归拆分利用树形结构模型,来做回归、分类和生存分析,主要在rpart包( http://cran.r-project.org/web/packages/rpart/index.html )和tree包( http://cran.r-project.org/web/packages/tree/index.html )里执行,尤其推荐rpart包。Weka里也有这样的递归拆分法,如:J4.8, C4.5, M5,包Rweka提供了R与Weka的函数的接口( http://cran.r-project.org/web/packages/RWeka/index.html )。 party包提供两类递归拆分算法,能做到无偏的变量选择和停止标准:函数ctree()用非参条件推断法检测自变量和因变量的关系;而函数mob(

R语言特征值相关性分析

*爱你&永不变心* 提交于 2019-12-07 19:48:09
转载自http://www.sohu.com/a/200219694_278730 接触这么多组学数据,大家肯定做过各种相关性分析。大到几个转录组样本的整体相关性分析,小到挑选了一些候选基因看它们在不同样本中的表达模式相关性。当我们做完了相关性分析的时候,常常会用下面这种图形来展示: 那么问题来了,有没有别的方法,可以让我的相关性分析展现方式更高大上呢? 请出今天的主角, corrplot程序包 ! 1 老规矩,第一步是安装并调用corrplot: install.packages("corrplot") library("corrplot") 2 第二步,整理数据。今天就拿一些女明星的身高、体重、年龄、微博粉丝与女神指数的数据来分析一下 ( 纯属杜撰 ) 。 3 第三步,我们读取数据,并做相关性分析。 a<-read.table(file=file.choose(),row.names=1,header=T,sep="t") b<-cor(a) 4 第四步,非常简单,可以直接作图了。 corrplot(b) #这里默认是圆形显示 还可以用饼图( pie ),颜色( color )等等来显示。 corrplot(b,method="pie") corrplot(b,method="color",addCoef.col="grey") #用颜色显示,同时显示相关系数

R语言中的SUMMARY结果汇总

落花浮王杯 提交于 2019-12-07 19:47:38
转自http://www.dataguru.cn/thread-476888-1-1.html 对于glm模型summary()输出的汇总结果,如何解读是非常重要的,它直接影响得出的结论。 例如下面这样一个输出结果,该如何理解呢? Call: glm(formula = bl ~ I, family = gaussian,data = anaData) Deviance Residuals: Min 1Q Median 3Q Max -62.364 -14.278 -0.462 14.293 51.475 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 67.067 5.766 11.632 < 2e-16 *** I 10.368 3.647 2.843 0.00521 ** 根据课程所学并查阅有关参考书箱,理解如下: 一、调用 Call: glm(formula = bl ~ I, family = gaussian,data = anaData) 当创建模型时,以上代码表明 glm 是如何被调用。 二、残差统计量 Deviance Residuals: Min 1Q Median 3Q Max -62.364 -14.278 -0.462 14.293 51.475 残差第一四分位数( 1Q

R语言

风流意气都作罢 提交于 2019-12-06 23:24:26
1、R语言介绍 R和RStudio 是与计算机进行对话的两个工具 RStudio 是话筒 R是沟通所用的语言 R的由来:基于S语言,由新西兰奥克兰大学的Robert Gentleman和Ross Ihaka开发,因两位开发者名字首字母都是R,所以该语言命名为R。 怎样理解R 一种计算机语言 一种用于统计分析、绘图的操作环境 用户接口 R 语言特点 R 是一款开源、免费的软件,可以跨平台运行 R 提供了非常丰富的统计分析技术 有很多非常实用并包含最新技术的R包,而且更新速度非常快 R的绘图功能十分强大 软件界面: 配置文件,选择SDI单窗口 选择save进行直接保存修改,不需要更改路径 效果图: R环境下的提示符: 2、R包的安装 下载包: 查看所有包的命名: (.packages(all=T)) 加载包命令: 没有任何提示表示结果正常 向量的长度=向量的个数 字符串向量,双引号 “ ” c函数:拼接功能 同时下载两个包 install.packages(c("reshape2","dplyr")) 创建R对象 R语言区分大小写 对象sz <-赋值符号 1:6数值 sz<-1:6 连续赋值: ls()函数调取所有对象 get()函数得到变量的数值 删除对象: 删除所有对象 rm(list=ls()) 统计函数 sum() sz+1:2 sz+1:4 元素方式运算

阶段性小结(一)---R语言回归案例实战&算法比较

梦想的初衷 提交于 2019-12-06 13:12:25
R的阶段性复习小结–回归 1. 数据说明 User_ID:用户ID Gender: 性别,M为男性,F为女性 Age:年龄段,划分为0-17、18-25、26-35、36-45、46-55、55+共六个年龄段 Occupation:职业,已转换为数字标签,共有21类职业 Stay_In_Current_City_Years:所在城市居住年份,分为0、1、2、3、4+五个类别 Marital_Status:婚姻状况,0为未婚,1为已婚 件数:本次消费所购买的商品数目 消费总额:该用户本次消费所支出的总金额,单位为美元 首先读入数据,file.choose()可以跳出窗口选择文件,输出文件所在位置,超级好用!!! #install.packages(“Rserve”) library(“Rserve”) Rserve() Starting Rserve… “C:\Users\LENOVO\DOCUME 1\R\WIN-LI 1\3.3\Rserve\libs\x64\Rserve.exe” #R与tableau连接 file.choose() [1] “F:\新建文件夹 (6)\黑色星期五\book233用户信息.csv” #读取文件位置 user=read.csv(“F:\新建文件夹 (6)\黑色星期五\book233用户信息.csv”)` #查看数据结构 str(user)

R语言简单介绍

烈酒焚心 提交于 2019-12-06 11:42:44
R语言 概述 R语言是用于统计分析,图形表示和报告的编程语言和软件环境。 R语言由Ross Ihaka和Robert Gentleman在新西兰奥克兰大学创建,目前由R语言开发核心团队开发。 R语言的核心是解释计算机语言,其允许分支和循环以及使用函数的模块化编程。 R语言允许与以C,C ++,.Net,Python或FORTRAN语言编写的过程集成以提高效率。 R语言在GNU通用公共许可证下免费提供,并为各种操作系统(如Linux,Windows和Mac)提供预编译的二进制版本。 R是一个在GNU风格的副本左侧的自由软件,GNU项目的官方部分叫做GNU S. R的演变   R语言最初是由新西兰奥克兰奥克兰大学统计系的Ross Ihaka和Robert Gentleman写的。 R语言于1993年首次亮相 一大群人通过发送代码和错误报告对R做出了贡献 自1997年年中以来,已经有一个核心组(“R核心团队”)可以修改R源代码归档 R的特点   如前所述,R语言是用于统计分析,图形表示和报告的编程语言和软件环境。 以下是R语言的重要特点: R语言是一种开发良好,简单有效的编程语言,包括条件,循环,用户定义的递归函数以及输入和输出设施 R语言具有有效的数据处理和存储设施 R语言提供了一套用于数组,列表,向量和矩阵计算的运算符 R语言为数据分析提供了大型,一致和集成的工具集合

R语言 包

落花浮王杯 提交于 2019-12-06 10:01:17
R语言包 R语言的包是R函数,编译代码和样本数据的集合。 它们存储在R语言环境中名为“library”的目录下。 默认情况下,R语言在安装期间安装一组软件包。 随后添加更多包,当它们用于某些特定目的时。 当我们启动R语言控制台时,默认情况下只有默认包可用。 已经安装的其他软件包必须显式加载以供将要使用它们的R语言程序使用。 所有可用的R语言包都列在R语言的包。 下面是用于检查,验证和使用R包的命令列表。 检查可用R语言的包 获取包含R包的库位置 .libPaths() 当我们执行上面的代码,它产生以下结果。 它可能会根据您的电脑的本地设置而有所不同。 [2] "C:/Program Files/R/R-3.2.2/library" 获取已安装的所有软件包列表 library() 当我们执行上面的代码,它产生以下结果。 它可能会根据您的电脑的本地设置而有所不同。 Packages in library ‘C:/Program Files/R/R-3.2.2/library’: base The R Base Package boot Bootstrap Functions (Originally by Angelo Canty for S) class Functions for Classification cluster "Finding Groups in Data":