R语言

R语言常用函数

元气小坏坏 提交于 2020-02-11 09:42:11
数据结构 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 seq,from:to,sequence:等差序列 rep:重复 NA:缺失值 NULL:空对象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:对象属性 mode,typeof:对象存储模式与类型 names:对象的名字属性 二、字符串处理 character:字符型向量 nchar:字符数 substr:取子串 format,format C:把对象用格式转换为字符串 paste,strsplit:连接或拆分 charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配与替换 三、复数 complex,Re,Im,Mod,Arg,Conj:复数函数 四、因子 factor:因子 codes:因子的编码 levels:因子的各水平的名字 nlevels:因子的水平个数 cut:把数值型对象分区间转换为因子 table:交叉频数表 split:按因子分组 aggregate:计算各数据子集的概括统计量 tapply:对“不规则”数组应用函数 数学相关计算 一、计算

R语言列表list函数

☆樱花仙子☆ 提交于 2020-02-11 09:41:12
列表是R语言中的对象,它包含不同类型的元素,比如 - 数字,字符串,向量和另一个列表等。一个列表还可以包含一个矩阵或一个函数作为它的元素。使用list()函数创建列表。 创建一个列表 下面是一个例子来创建一个包含字符串,数字,向量和逻辑值的列表 # Create a list containing strings, numbers, vectors and a logical values. list_data <- list("Red", "Green", c(21,32,11), TRUE, 51.23, 119.1) print(list_data) 当我们上面的代码执行时,它产生以下结果: [[1]] [1] "Red" [[2]] [1] "Green" [[3]] [1] 21 32 11 [[4]] [1] TRUE [[5]] [1] 51.23 [[6]] [1] 119.1 命名列表元素 列表元素可以给定它们的名字并且可以使用这些名称来访问。 # Create a list containing a vector, a matrix and a list. list_data <- list(c("Jan","Feb","Mar"), matrix(c(3,9,5,1,-2,8), nrow=2), list("green",12.3)) # Give

R语言矩阵matrix函数

依然范特西╮ 提交于 2020-02-11 09:39:09
矩阵是元素布置成二维矩形布局的R对象。 它们包含相同原子类型的元素。尽管我们可以创建只包含字符或只逻辑值的矩阵,但是它们没有多大用处。我们使用的是在数学计算中含有数字元素矩阵。 使用 matrix()函数创建一个矩阵。 语法 R语言中创建矩阵的基本语法是: matrix(data, nrow, ncol, byrow, dimnames) 以下是所使用的参数的说明: data - 是这成为矩阵的数据元素输入向量。 nrow - 是要创建的行数。 ncol - 要被创建的列的数目。 byrow - 是一个合乎逻辑。如果为True,那么输入向量元素在安排的行。 dimname - 是分配给行和列名称。 示例 创建矩阵取向量的数量作为输入 # Elements are arranged sequentially by row. M <- matrix(c(3:14), nrow=4, byrow=TRUE) print(M) # Elements are arranged sequentially by column. N <- matrix(c(3:14), nrow=4, byrow=FALSE) print(N) # Define the column and row names. rownames = c("row1", "row2", "row3", "row4")

2 R语言数据处理基础及函数应用

两盒软妹~` 提交于 2020-02-11 09:25:42
2.1 基本计算 2.1.1 数据类型 在R语言中,一切皆对象。对象是可以赋值给变量的任何事物,包括常量、数据结构、函数、甚至图形。每个对象都有类。R语言是面向对象的,R能处理的对象(包括数据)统称为object,一个object都有它所归属的类(class),一个class至少有一个特征是这类数据所共有的。类又可以被继承,产生儿孙类。 R语言中所有的对象都有2个内在属性,即:类型和长度。类型是对象元素的基本种类,长度是对象中元素的个数。R语言最基本的数据类型有:数值型(numeric)、复数型(complex)、逻辑型(logical)、字符型(character)等,还有不常用的类型,例如函数或表达式。 数据类型组成了对象,主要有6种结构,包括:向量、因子、数组、矩阵、列表、数据框等。多样化的数据对象赋予R语言灵活的数据处理能力。相关内容简述如下,详细内容可查阅帮助文件或有关文献。 (1)向量 向量(vector)是R语言处理数据的最基本单位,即可以是一串数字,也可以是一个数字。向量(vector)是虚拟类,本身不指定数据的存储类型,但赋值后立即变为数值型(numeric)、逻辑型(logical)、字符型(character)等实际数据类型。向量必须保证它的所有元素具有数据类型。 通过函数getClass()查到向量(vector)所包含的数据类型多达21种。

R语言快速入门

家住魔仙堡 提交于 2020-02-11 09:25:10
R语言是针对统计分析和数据科学的功能全面的开源语言,R的官方网址:http://www.r-project.org/ 在Windows环境下安装R是很方便的 R语言的两种运行模式:交互模式和批处理模式;顾名思义交互模式是一条输入一条输出,而批处理模式则可让处理过程自动化 批处理模式演示: pdf("demo.pdf") #创建demo.pdf文件 hist(rnorm(1000)) #调用hist()画直方图,调用rnorm()生成随机数 dev.off() #将实际文件输出到磁盘上 运行打开PDF文件后的效果 */ /*--> */ */ /*--> */ 在交互模式下工作 ①创建一个简单的数据集 a<-c(110,120,114,119) 从上面可以看出,在R语言中,标准的赋值语句是 “ <- ”,当然用“ = ”也是可以得,但不推荐;“ c “(concatenate)表示连接,把四个数字连接成一个向量 可以把向量再连接成向量,比如 > b<-c(a,a,a) 查看b中的内容 > b [1] 110 120 114 119 110 120 114 119 110 120 114 119 R语言的很多特性和Python语言很像,它们都是 ②访问向量中的单个元素,访问方式和其他语言中访问数组类似,只不过索引是从 1开始计算 访问a中的第三个元素 > a[3] [1] 114

R语言26-Prosper 贷款数据分析2

主宰稳场 提交于 2020-02-10 12:58:45
单变量分析 首先对平台客户的基本信息进行分析,包含所在地,信用状况,申请贷款原因等,旨在分析目标客户所倾向具备的一般特征: 所在地区分布: library ( ggplot2 ) ggplot ( data =subset ( data , ! data $BorrowerState == "" ) , aes ( x=BorrowerState ) ) + geom_bar ( fill= "pink" , color= "black" ) + theme ( axis . text = element_text ( size = 5 ) ) 可以看到公司客户在加利福尼亚州、纽约州、弗洛里达州、德克萨斯州、伊利诺斯州分布较多,领先于其他各州,可以适当增大在其余州的宣传力度,开发新客户。Prosper总部位于旧金山,可能也与加利佛尼亚州的使用人数最多有关。 违约次数分析: ggplot ( data =subset ( data , ! data $DelinquenciesLast7Years == "" ) , aes ( x=DelinquenciesLast7Years ) ) + geom_bar ( fill= "orange" , color= "black" ) + theme ( axis . text = element_text ( size = 5 ) )

给R语言读取Excel表的能力

你说的曾经没有我的故事 提交于 2020-02-07 02:04:18
Excel是企业电子表格处理的事实标准格式。R本身都是处理各种文本格式,像是CSV,或者自己的二进制格式文件。让两批人可能够彼此沟通,就必须让R能够读取xlsx格式。 R专门处理Excel文件的包是xlsx。 直接在线安装 > install.packages("xlsx") also installing the dependencies ‘rJava’, ‘xlsxjars’ trying URL 'https://mirrors.tongji.edu.cn/CRAN/bin/windows/contrib/3.6/rJava_0.9-11.zip' Content type 'application/zip' length 832080 bytes (812 KB) downloaded 812 KB trying URL 'https://mirrors.tongji.edu.cn/CRAN/bin/windows/contrib/3.6/xlsxjars_0.6.1.zip' Content type 'application/zip' length 9485571 bytes (9.0 MB) downloaded 9.0 MB trying URL 'https://mirrors.tongji.edu.cn/CRAN/bin/windows/contrib/3.6

R软件简介

大憨熊 提交于 2020-02-05 05:09:48
声明:这是我对R软件官网文档的翻译、摘注。 官网文档 什么是R语言? R语言简介 R语言是一种用于统计计算和图表计算的语言和环境。 R语言最开始是由AT&T公司的贝尔实验室发明的,后来因为公司解体所有权转给了朗讯公司 官网 ,现在也是该公司在维护。 来源: CSDN 作者: 戎码关山 链接: https://blog.csdn.net/dghcs18/article/details/103563650

R语言学习笔记 -- 绘图《R语言入门》

点点圈 提交于 2020-02-01 20:28:14
绘图结果不可赋给一个对象,而是直接输出到一个“绘图设备”上,而绘图设备是一个绘图的窗口或是文件 绘图函数分为:高级绘图函数和低级绘图函数。其中,高级绘图函数创建新图形,而低级绘图函数在现存的图形上添加元素。 绘图参数控制绘图选项,可以使用缺省值,或是使用函数par修改。 打开绘图窗口使用命令 x11() 或是 windows() . 打开文件作为绘图设备,包括 postscript() or pdf() or png() 。使用 ?device 查看绘图列表。 最后打开的设备是当前的绘图设备。使用 dev.list() 显示打开的列表。 > dev.list ( ) windows pdf windows 2 3 4 #数字是设备的编号 > dev.cur ( ) #查看当前设备 windows 4 > dev.set ( 3 ) #把当前设备设置为编号为3的绘图设备 pdf 3 > dev.off ( 3 ) #关闭3号绘图设备 windows #返回:关闭后的当前设备 4 > dev.off ( ) #缺省,即关闭当前设备 windows #返回:关闭后的当前设备 2 分割图形窗口,使用layout: layout ( matrix ( 1:4 , 2 , 2 )) layout.show ( 4 ) #参数4表示展示出4个图形子窗口 #又如 layout ( matrix (

R语言常用基本函数

喜夏-厌秋 提交于 2020-02-01 09:13:34
工作目录 # 获取当前工作目录 getwd ( ) # 设置工作目录 setwd ( ) 包管理 # 安装包 install . packages ( "packageName" ) 类 # 查看类信息 getClass ( "ClassName" ) # 查看对象的类型 class ( aObject ) 输出信息 # 基础 print ( anyObject ) # 输出前5行 head ( collection , 5 ) #第二个参数不指定的话,默认是6 脚本调用 # 获取传入执行脚本的参数 # @test.R commandArgs ( T ) # Rscript test.R a b, 返回 # [1] "a" # [2] "b" commandArgs ( F ) # Rscript test.R a b, 返回 # [1] test.R的文件绝对路径 # [2] "--slave" # [3] "--no-restore" # [4] "--file=test.R" # [5] "--args" # [6] "a" # [7] "b" 来源: CSDN 作者: 118路司机 链接: https://blog.csdn.net/qq_39609993/article/details/103714529