R语言

Coding and Paper Letter(八十)

会有一股神秘感。 提交于 2020-03-25 06:10:56
3 月,跳不动了?>>> 新一期资源整理。 1 Coding: 1.城市模拟综合。 UrbanSimulationSynthesis 2.基于 bookdown 的 ElegantBook。 ElegantBookdown 3.R语言包lifecycle,生命周期提供了一组工具和约定来管理导出功能的生命周期。 lifecycle 4.学习GitHub注册的基础知识,进行首次回购,上传文档/文件,分支,合并和拉取请求均在.ppt文档中进行了讨论 lunch and learn GitHub Basics ppt 5.这是MSU的PLP 847小组项目,由Greg Bonito教授。团队成员包括:Melini Jayawardana Austin McCoy Mitch Roth丽贝卡·谢伊。 TarSpot of Corn 6.弯嘴滨鹬和红颈滨鹬的迁徙方式和后果。 CurlewSands RedNStints 7.R语言包varstan,Varstan是一个使用哈密顿蒙特卡洛方法对结构化时间序列模型进行贝叶斯估计的软件包,该方法由Stan(一种C ++的概率语言模型)实现。 varstan 8.这是一个客户端库,可用于检测Python应用程序的分布式跟踪收集,并将这些跟踪发送到Jaeger。有关更多详细信息,请参见OpenTracing Python API。 jaeger

《R语言实战》之 创建数据集(第二章,各种数据结构)

梦想与她 提交于 2020-03-25 06:03:24
数据集 2.1数据集概念 概念:通常是由数据构成的矩形数据 不同行业对数据集的行和列叫法不同 行业人 行 列 统计学家 观测(observation) 变量(variable) 数据库分析师 记录(record) 字段(field) 数据挖掘和机器学习研究中 示例(example) 属性(attribute) 可处理的数据类型(模式):数值型、字符型、逻辑型、复数型、原生型(字节) 存储数据的结构:标量、向量、数据、数据框和列表 实例的标识符:rownames(行名);实例的类别型:因子(factors) 2.2数据结构 这节讲了几个数据结构,向量、矩阵、数组、数据框,前三种分别是一维、二维、大于二维的,它们共同点是一个数据结构中,仅能用一种数据的模式,而数据框则可以多种模式。 一些定义 对象:可复制给变量的任何事物,包括常量、数据结构、函数、图形 模式:描述对象如何存储和某各类 数据框:存储数据的一种结构(列表示变量,行表示观测),一个数据框 可存储不同类型的变量 (如数值型、字符型) 2.2.1 向量(一维数据,数值型、字符型、逻辑型) a<- c(1,2,3) #数值型 b<-c("one","two","three")#字符型 c<-c(TRUE,TURE,FALSE) #逻辑型 注意: 1.字符型的向量,元素要加“ ”或者' ',数值型和逻辑型不需要。 2.同一向量

R语言paste函数解析

我怕爱的太早我们不能终老 提交于 2020-03-20 10:42:56
目录 R语言paste函数解析 paste函数 理解sep 和collapse参数 与expand.grid函数联合使用实现循环拼接 R语言paste函数解析 paste函数 paste函数的作用就是将R对象转换为字符后连接向量。 paste (..., sep = " ", collapse = NULL) paste0(..., collapse = NULL) 参数 ... 一个或多个R对象,要转换为字符向量。 sep 分隔字符串。不是NA_character_。 collapse 分隔结果的可选字符串。不是NA_character_。 从上参数列表可知, ... 参数和sep参数是必须参数, collapse 参数是可选参数。 其中, ... 参数,可以有一个或多个对象。 sep 参数,的默认值为空格 " " 。 collapse 参数因为是可选参数,所以它的默认值就是空NULL。 所以对于paste函数的学习,重点就是学会sep参数和collapse参数。 理解sep 和collapse参数 代码示例用法 > LETTERS [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q" "R" "S" "T" "U" [22] "V" "W" "X" "Y" "Z" > letters [1

Coding and Paper Letter(七十九)

时间秒杀一切 提交于 2020-03-20 08:17:56
3 月,跳不动了?>>> 新一期资源整理。 1 Coding: 1.图灵方式的主机存储库:如何引导一个可重复的数据科学项目。 the turing way 2.COVID-19新型冠状病毒的样本数据处理(R语言)。 Coronavirus sample processing 3.野火极端事件的时空模拟。 wildfire extremes 4.sqlite3的egg插件。 egg sqlite3 5.我们为自然语言理解(NLU)和生成(NLG)任务开发预先训练的模型。 unilm 6.LaTeX 编译环境配置:Visual Studio Code 配置简介。 vscode latex 7.谷歌大脑自动机器学习。 automl 8.下一代无服务器计算。 cloudstate 9.Manim是一个解释数学视频的动画引擎。它被用来以编程方式创建精确的动画,就像在3Blue1Brown的视频中看到的那样。 manim 10.正式提交的“Joint 3D Tracking and Forecasting with Graph Neural Network and Diversity Sampling”PyTorch实现。 GNNTrkForecast 11.CVPR会议2020论文"Rotate-and-Render: Unsupervised Photorealistic Face

使用c实现简单的rpc

无人久伴 提交于 2020-03-17 11:00:59
某厂面试归来,发现自己落伍了!>>> RPC 简介 RPC(Remote Procedure Call)——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的细节的技术。 通过RPC我们可以充分利用非共享内存的多处理器环境(例如通过局域网连接得多台工作站),这样可以简便地将你的应用分布在多台工作站上,应用程序就像运行在一个多处理器的计算机上一样。你可以方便的实现过程代码共享,提高系统资源的利用率,也可以将以大量数值处理的操作放在处理能力较强的系统上运行,从而减轻前端机的负担。 在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易。 RPC 的主要目的是为组件提供一种相互通信的方式,使这些组件之间能够相互发出请求并传递这些请求的结果。 RPC 调用过程 客户机对服务器的一次RPC调用,其内部操作大致有如下十步: 1.调用客户端句柄;执行传送参数 2.调用本地系统内核发送网络消息 3.消息传送到远程主机 4.服务器句柄得到消息并取得参数 5.执行远程过程 6.执行的过程将结果返回服务器句柄 7.服务器句柄返回结果,调用远程系统内核 8.消息传回本地主机 9.客户句柄由内核接收消息 10.客户接收句柄返回的数据 RPC 的应用场景 RPC 在分布式系统中的系统环境建设和应用程序设计中有着广泛韵应用

R | R语言表达式中常用的符号

送分小仙女□ 提交于 2020-03-16 08:30:17
符号 用途 ~ 分隔符号,左边为响应变量,右边为解释变量,eg:要通过x、z和w预测y,代码为y~x+z+w + 分隔预测变量 : 表示预测变量的交互项 eg:要通过x、z及x与z的交互项预测y,代码为y~x+z+x:z * 表示所有可能交互项的简洁方式,代码y~x*z*w可展开为y~x+z+w+x:z+x:w+z:w+x:z:w ^ 表示交互项达到某个次数,代码y~(x+z+w)^2可展开为y~x+z+w+x:z+x:w+z:w . 表示包含除因变量外的所有变量,eg:若一个数据框包含变量x、y、z和w,代码y~.可展开为y~x+z+w - 减号,表示从等式中移除某个变量,eg:y~(x+z+w)^2-x:w可展开为y~x+z+w+x:z+z:w -1 删除截距项,eg:表示y~x-1拟合y在x上的回归,并强制直线通过原点 I() 从算术的角度来解释括号中的元素。Eg:y~x+(z+w)^2将展开为y~x+z+w+z:w。相反,代码y~x+I((z+w)^2)将展开为y~x+h,h是一个由z和w的平方和创建的新变量 function 可以在表达式中用的数学函数,例如log(y)~x+z+w表示通过x、z和w来预测log(y) 来源: https://www.cnblogs.com/ykit/p/12501664.html

R语言绘制箱型图

大城市里の小女人 提交于 2020-03-13 14:09:09
箱形图 是数据集中数据分布情况的衡量标准。它将数据集分为三个四分位数。盒形图表示数据集中的最小值,最大值,中值,第一四分位数和第四四分位数。 通过为每个数据集绘制箱形图, 比较数据集中的数据分布也很有用。 R中的盒形图通过使用 boxplot() 函数来创建。 基本公式为: boxplot(x, data, notch, varwidth, names, main)x - 是向量或公式。data - 是数据帧。notch - 是一个逻辑值,设置为TRUE可以画出一个缺口。varwidth - 是一个逻辑值。设置为true以绘制与样本大小成比例的框的宽度。names - 是将在每个箱形图下打印的组标签。main - 用于给图表标题。 > A <- c(79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04) > B <- c(80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95) > boxplot(A,B,notch=T,names=c('A','B'),col=c('green','yellow')) 五数总括 : 在探索性数据分析中,最有代表性,能反映数据特征的的五个数:上四分为数,下四分为数,中位数,最小值和最大值 R语言中,使用函数fivenum(x,na.rm=TRUE)来计算五个数,na

浅谈R语言的面向对象编程

為{幸葍}努か 提交于 2020-03-13 00:50:28
R语言有两种不同的OOP机制,分别是从其前身S语言继承而来的S3 Object和S4 Object,其中S4 Object更加的正式、也是现在用于开发的主力军,所以本文就从S4 Object谈起,并在最后讨论一下古老的S3 Object。 那我们就开始吧!首先我们来设计一个时间序列类,在它的内部,需要包含主数据、起始时间与截止时间、取样间隔这些数据。在R中我们可以定义如下: setClass("TimeSeries", representation( data = "numeric", start = "POSIXct", end = "POSIXct" ) ) 在这段代码中,data/start/end用于存放数据,称作“槽(slot)”。 现在我们已经定义了一个类,我们就来创建一个TimeSeries对象吧! My_TimeSeries <- new("TimeSeries", data = c(1,2,3,4,5,6), start = as.POSIXct("01/12/2015 0:00:00", tz = "GMT", format = "%m/%d/%Y %H:%M:%S"), end = as.POSIXct("12/04/2015 0:00:00", tz = "GMT", format = "%m/%d/%Y %H:%M:%S") ) 与其他OOP语言类似

多元统计分析R语言建模| 4 多元相关与回归分析

送分小仙女□ 提交于 2020-03-12 21:18:26
变量间的关系及分析方法 函数关系(确定性关系) 相关关系(非确定性关系)——平行关系(相关分析)、依存关系(回归分析) 1、变量间关系分析 图示法 总体线性相关系数 t相关 2、回归分析模型 参数估计公式 x=c(171,175,159,155,152,158,154,164,168,166,159,164) y=c(57,64,41,38,35,44,41,51,57,49,47,46) #图示法 plot(x,y) #总体线性相关系数,协方差标准化 #样本线性相关系数,pearson相关系数 r=cor(x,y,method = c('pearson')) #建立假设检验 n=length(x) tr=r/sqrt((1-r^2)/(n-2)) tr cor.test(x,y) #直线回归方程 lxy<-function(x,y) sum(x*y)-sum(x)*sum(y)/length(x) #建立离均差乘积和函数 b=lxy(x,y)/lxy(x,x) #线性回归方程斜率 a=mean(y)-b*mean(x) c(a=a,b=b) #方差分析,F检验,整体检验 #t检验,系数检验 d4.3=read.table('clipboard',header=T) #拟合模型 m4.3=lm(y~x,data = d4.3) m4.3 #做散点图 plot(y~x,data =

R语言3.11 因子分析因子旋转

两盒软妹~` 提交于 2020-03-12 03:51:06
因子旋转 目的 寻找每个主因子的实际意义 如果各主因子的典型代表变量不突出,就需要进行旋转 使因子载荷矩阵中载荷的绝对值向0和1两个方向分化 方法 正交旋转Varimax(最大方差正交旋转) 斜交旋转Promax Fa2=factanal(X,3,rotation="varimax") Fa2$loadings 因子得分计算方法:回归估计法(方差一致),Bartlett估计法 Fa1$scores(旋转前因子得分) Fa2$scores(旋转后因子得分) plot(Fa2$scores,asp=1) abline(h=0,v=0,lty=3) text(Fa2$scores,labels = rownames(X)) biplot(Fa2$scores,Fa2$loadings) abline(h=0,v=0,lty=3) Fa1$ranks(排名) 因子分析的基本步骤 1.确认数据是否适合作因子分析 一般用KMO与Bartlett’s进行检验 判断标准:KMO>0.9非常适合,0.8~0.9适合,0.7 ~ 0.8一般,0.6 ~0.7不太合适,0.5 ~0.6不合适,<0.5极不合适。 2.构造因子变量 3.旋转因子使其更具解释性 4.计算因子得分并做因子图 R语言因子分析过程 一、因子计算 1.是否适合做因子分析:KMO 2.计算因子分析的对象:factanal(极大似然)