R语言

R语言与概率统计(二)

匿名 (未验证) 提交于 2019-12-02 23:47:01
####################5.2 X<-c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170) t.test(X,alternative='greater',mu=225,conf.level = 0.95)#单边检验 ###########################5.3这是一个经典的两样本比较问题 X<-c(78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3) Y<-c(79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1) t.test(X,Y,var.equal=TRUE,alternative='less')#常把我们想要的结果作为备胎h1 t.test(X,Y,var.equal=F,alternative='less')#两组样本方差不同 t.test(X,Y,var.equal=TRUE,alternative='less',paired=T)#两组样本数量相同 #实战我们将使用MASS包中的UScrime数据集。它包含了1960年美国47个州的刑 罚制度 #对犯罪率影响的信息。我们感兴趣的结果变量为Prob

R语言--编数据

匿名 (未验证) 提交于 2019-12-02 23:43:01
a <- rnorm ( 50 , 30 , 2 ) #生成50个样本,均数30,标准差2 a <- round ( a , 2 ) #保留两位小数 write . popsv ( nor , "3.popsv" , row . names = F ) #输出成Expopel可以打开的格式 #目的:63个病人,一组正常人10个,某指标在1到3之间 #患者53个,指标在5:到20之间 #且正常人和患者随机来就诊,请模拟数据 nor <- runif ( 10 , 1 , 3 ) #生成10个,在1 :3 的数字 pat <- runif ( 53 , 5 , 20 ) pop <- c ( nor , pat ) pop <- round ( pop ) pop <- sample ( pop , 53 , replace = F ); pop #在pop中随抽取53次,无放回    转载请标明出处: R语言--编数据 文章来源: R语言--编数据

拟合R语言中的多项式回归

匿名 (未验证) 提交于 2019-12-02 23:43:01
版权声明:署名,允许他人基于本文进行创作,且必须基于与原先许可协议相同的许可协议分发本文 ( Creative Commons ) 如下所示: 但购买和出售,我们可能要考虑一些其他相关信息,就像当:购买显著数量很可能是我们可以要求并获得折扣,或购买更多更重要的是我们可能会推高价格。 这可能导致像这样的情况,其中总成本不再是数量的线性函数: 通过多项式回归,我们可以将n阶模型拟合到数据上,并尝试对非线性关系进行建模。 如何拟合多项式回归 这是我们模拟观测数据的图。模拟的数据点是蓝色的点,而红色的线是信号(信号是一个技术术语,通常用于表示我们感兴趣检测的总体趋势)。 让我们用R来拟合。当拟合多项式时,您可以使用 通过使用该confint()函数,我们可以获得我们模型参数的置信区间。 模型参数的置信区间: confint(model,level = 0.95) 拟合vs残差图 总的来说,这个模型似乎很适合,因为R的平方为0.8。正如我们所预期的那样,一阶和三阶项的系数在统计上显着。 预测值和置信区间: 将线添加到现有图中: 我们可以看到,我们的模型在拟合数据方面做得不错。 文章来源: https://blog.csdn.net/qq_19600291/article/details/79852448

R语言中绘制ROC曲线和PR曲线

匿名 (未验证) 提交于 2019-12-02 23:42:01
版权声明:本文为博主原创文章,未经博主允许不得转载。咨询链接:http://y0.cn/teradat 博文链接: https://blog.csdn.net/qq_19600291/article/details/89888141 接收器操作特性(ROC)曲线可能是评估评分分类器的预测性能的最常用的度量。 预测正类(+1)和负类(-1)的分类器的混淆矩阵具有以下结构: 预测/参考类 +1 -1 +1 TP FP -1 FN TN 这里,TP表示真阳性的数量(模型正确预测正类),FP表示误报的数量(模型错误地预测正类),FN表示假阴性的数量(模型错误地预测阴性类),TN表示真阴性的数量(模型正确预测阴性类)。 ROC曲线 在ROC曲线中,相对于假阳性率(FPR,x轴)绘制真阳性率(TPR,y轴)。这些数量定义如下: TPRFPR=TPTP+FN=FPFP+TNTPR=TPTP+FNFPR=FPFP+TN y^i=3.5y^i=3.5y^i=2y^i=2 [0,1][0,1] <span style="color:#000000"><span style="color:#000000"><code>plot.scores.AUC <- <strong>function</strong>(y, y.hat, measure = <span style="color:#880000">

卡尔曼滤波器:用R语言中的KFAS建模时间序列

匿名 (未验证) 提交于 2019-12-02 23:42:01
版权声明:本文为博主原创文章,未经博主允许不得转载。咨询链接:http://y0.cn/teradat 博文链接: https://blog.csdn.net/qq_19600291/article/details/90519319 于时间序列预测,ARIMA等传统模型通常是一种流行的选择。虽然这些模型可以证明具有高度的准确性,但它们有一个主要缺点 - 它们通常不会解释“冲击”或时间序列的突然变化。让我们看看我们如何使用称为 卡尔曼滤波器 的模型来潜在地缓解这个问题。 我们以货币市场为例。货币对可能会有整体上升趋势,然后在抛售期间大幅下跌。传统的时间序列模型不一定能够立即解决这个问题,并且在考虑到趋势的突然变化之前可能需要几个时期。 因此,我们希望使用一个确实能够解释这种冲击的时间序列模型。让我们来看一个称为 卡尔曼滤波器 的便捷模型。 卡尔曼滤波器是一种状态空间模型,可以更快地调整冲击到时间序列。让我们看一下如何使用一个例子。 2015年1月,当瑞士国家银行决定从瑞士法郎取消瑞士法郎时,货币市场遭受了历史上最大的冲击之一。结果,瑞士法郎飙升,而其他主要货币则暴跌。 让我们看看卡尔曼滤波器如何调整这种冲击。 首先,让我们下载2015年1月的USD / CHF数据: 我们正在将货币数据转换为数据框,然后转换为日志格式以根据回报构建我们的时间序列。 现在

R语言实现拟合神经网络; 神经网络包

匿名 (未验证) 提交于 2019-12-02 23:42:01
版权声明:本文为博主原创文章,未经博主允许不得转载。咨询链接:http://y0.cn/teradat 博文链接: https://blog.csdn.net/qq_19600291/article/details/90485459 神经网络一直是迷人的机器学习模型之一,不仅因为花哨的反向传播算法,而且还因为它们的复杂性(考虑到许多隐藏层的深度学习)和受大脑启发的结构。 神经网络并不总是流行,部分原因是它们在某些情况下仍然存在计算成本高昂,部分原因是与支持向量机(SVM)等简单方法相比,它们似乎没有产生更好的结果。然而,神经网络再一次引起了人们的注意并变得流行起来。 neuralnet 包装拟合一个简单的神经网络,并将线性模型作为比较。 数据集 我们将在MASS包中使用Boston数据集。 波士顿数据集是波士顿郊区房屋价值数据的集合。我们的目标是使用所有其他可用的连续变量来预测自住房屋(medv)的中值。 首先,我们需要检查是否缺少数据点,否则我们需要修复数据集。 apply(data,2,function(x)sum(is.na(x))) 没有遗漏数据,很好。我们通过随机将数据分成火车和测试集来进行,然后我们拟合线性回归模型并在测试集上进行测试。请注意,我正在使用该 gml() 函数而不是 lm() 这将在以后交叉验证线性模型时变得有用。 index < - sample(1

R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究分析案例

匿名 (未验证) 提交于 2019-12-02 23:42:01
版权声明:本文为博主原创文章,未经博主允许不得转载。咨询链接:http://y0.cn/teradat 博文链接: https://blog.csdn.net/qq_19600291/article/details/89921719 本文显示了如何基于潜在的ARMA-GARCH过程(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。 我们考虑使用\(t \)分布式创新的ARMA(1,1)-GARCH(1,1)过程。 模拟一条路径(用于说明目的)。 nu <- 3 # d.o.f. of the standardized distribution of Z_t fixed.p <- list(mu = 0, # our mu (intercept) ar1 = 0.5, # our phi_1 (AR(1) parameter of mu_t) ma1 = 0.3, # our theta_1 (MA(1) parameter of mu_t) omega = 4, # our alpha_0 (intercept) alpha1 = 0.4, # our alpha_1 (GARCH(1) parameter of sigma_t^2) beta1 = 0.2, # our beta_1 (GARCH(1) parameter of sigma_t^2) shape

R语言-并行计算

匿名 (未验证) 提交于 2019-12-02 23:32:01
1 install.packages("parallel") 2 library("parallel") 3 install.packages('doParallel') 4 library("doParallel") 5 6 n_Cores <- detectCores()##检测你的电脑的CPU核数 7 cluster_Set <- makeCluster(n_Cores)##进行集群 8 registerDoParallel(cluster_Set) 参考了https://blog.csdn.net/weixin_36220483/article/details/52639469 完整的R语言预测建模实例-从数据清理到建模预测

使用R语言 SDK调取tushare数据

偶尔善良 提交于 2019-12-02 15:35:43
安装Tushare 打开RStudio,在控制台输入命令: > install.packages('Tushare') Tushare的R包需要依赖httr、tidyverse、forecast和data.table这四个包。 由于Tushare包中申明了依赖关系,因此这四个依赖包也会自动下载下来。如果下载过程卡住了,导致下载失败,可以重试几次,毕竟CRAN的服务器不在大陆,后面将介绍如何使用CRAN的国内镜像。 载入Tushare 如同安装过程,在载入Tushare的同时,R也会自动载入其依赖的包。 > library('Tushare') 也可以通过help查看Tushare的相关信息 > help('Tushare') 在R官网也可以看到Tushare的索引信息: 使用Tushare 获得api接口对象 > api <- Tushare::pro_api(token = 'YOUR TOKEN HERE') 如同在Python包中使用Tushare Pro的pro.query,向api(只要调用Tushare::pro_api获得了接口,你可以使用任意的名字命名)传递想要调用的接口名以及相应的参数就可以调用相应的数据。 在api中,必须传递的是Tushare Pro提供的接口名(详细请见官方网站 https://tushare.pro/),其他参数视相应的接口传入相应的参数。

使用R语言 SDK调取tushare数据

≯℡__Kan透↙ 提交于 2019-12-02 15:16:10
安装Tushare 打开RStudio,在控制台输入命令: > install.packages('Tushare') Tushare的R包需要依赖httr、tidyverse、forecast和data.table这四个包。 由于Tushare包中申明了依赖关系,因此这四个依赖包也会自动下载下来。如果下载过程卡住了,导致下载失败,可以重试几次,毕竟CRAN的服务器不在大陆,后面将介绍如何使用CRAN的国内镜像。 载入Tushare 如同安装过程,在载入Tushare的同时,R也会自动载入其依赖的包。 > library('Tushare') 也可以通过help查看Tushare的相关信息 > help('Tushare') 在R官网也可以看到Tushare的索引信息: 使用Tushare 获得api接口对象 > api <- Tushare::pro_api(token = 'YOUR TOKEN HERE') 如同在Python包中使用Tushare Pro的pro.query,向api(只要调用Tushare::pro_api获得了接口,你可以使用任意的名字命名)传递想要调用的接口名以及相应的参数就可以调用相应的数据。 在api中,必须传递的是Tushare Pro提供的接口名(详细请见官方网站 https://tushare.pro/),其他参数视相应的接口传入相应的参数。