R语言

R语言-热力图

你说的曾经没有我的故事 提交于 2019-12-05 11:59:30
heatmap()函数 > heatmap(as.matrix(mtcars), #将自带数据集mtcars转为矩阵 + Rowv=NA, #不基于行聚类 + Colv=NA, #不基于列聚类 + col = heat.colors(256), #生成256种颜色(从红色到黄色到白色) + scale="column", #值集中的方向按列 + margins=c(2,8), #设置页边空白大小 + main = "Car characteristics by Model") #设置图标题 来源: https://www.cnblogs.com/all1008/p/11923728.html

R语言

不羁的心 提交于 2019-12-05 07:34:52
一、R包与命令 ㈠、R语言的获取帮助命令 1、help.start() 打开帮助文档 2、help("plot")或者help(plot)或者?plot 查看plot函数的帮助(引号可以省略) 3、help.search('plot')或者??plot 以plot为关键字搜索本地帮助文档 4、example("plot")或者example(plot) plot函数的使用实例(引号可以省略) 5、RSiteSearch("plot") 以plot为关键词搜索在线文档和邮件列表存档 6、apropos("plot",mode="function") 列出名称中含有plot的所有可用函数 7、data() 列出当前已加载包中所含的所有可用示例数据集 8、vignette() 列出当前已经安装的包中所有可能的vignette文档 9、vignette("plot") 为主题plot显示指定的vignette文档 ㈡、R的工作空间管理命令 1、getwd() 显示当前的工作目录 2、setwd("new_path") 修改当前的工作目录为new_path 3、Is() 列出当前工作空间中的对象 4、rm(objectList) 移除(删除)一个或多个对象 5、 rm(list=Is()) 移除当前工作空间的所有对象,即清除R工作空间中的内存变量 6、help(options)

R语言中的偏最小二乘回归PLS-DA

浪子不回头ぞ 提交于 2019-12-05 07:17:28
原文链接: http://tecdat.cn/?p=8890 主成分回归(PCR)的方法 本质上是使用第一个方法的普通最小二乘(OLS)拟合 ​来自预测变量的主成分(PC)。这带来许多优点: 预测变量的数量实际上没有限制。 相关的预测变量不会破坏回归拟合。 但是,在许多情况下,执行类似于PCA的分解要明智得多。 今天,我们将 在 Arcene数据集 上执行PLS-DA, 其中包含100个观察值和10,000个解释变量。 让我们开始使用R 癌症/无癌标签(编码为-1 / 1)存储在不同的文件中,因此我们可以将其直接附加到完整的数据集,然后使用公式语法来训练模型。 # Load caret, install if necessary library(caret) arcene <- read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/arcene/ARCENE/arcene_train.data", sep = " ", colClasses = c(rep("numeric", 10000), "NULL")) # Add the labels as an additional column arcene$class <- factor(scan("https://archive.ics.uci

R语言预测实战(第二章--预测方法论)

不想你离开。 提交于 2019-12-05 04:08:27
2.1预测流程   从确定预测主题开始,一次进行数据收集、选择方法、分析规律、建立模型、评估效果直到发布模型。 2.2.1确定主题   (1)指标:表达的是数量特征,预测的结果也通常是通过指标的取值来体现。   (2)主体:预测研究的对象。   (3)精度:预测能够达到的准确水平。   (4)周期:在预测工作开始前,需要明确预测结果的时间跨度,或叫做周期。   (5)用户:   (6)成本:   (7)数据: 2.1.2收集数据    内容划分    收集原则 :全面覆盖、质量良好、周期一致、粒度(粒度可以理解为事物的层次)对称、持续生产   数据整合:通常按时间、周期、粒度、对象这几个维度对数据进行整合。 2.1.3选择方法   按预测涉及对象的数量及预测相关指标的数量把预测的数据情况分成简单型、丰富型、多样型、复杂型这四类。   (1)简单型         (2)丰富型       来源: https://www.cnblogs.com/fd-682012/p/11816171.html

Coding and Paper Letter(三十一)

限于喜欢 提交于 2019-12-04 16:40:43
国庆假期余额不足,好好学习,天天向上,资源整理。 1 Coding: 1.用R做空间分析的小课程。 rspatialdata 2.Pytorch框架下的retinanet。 pytorch retinanet 3.R语言包mgcViz,广义相加模型的可视化工具。 mgcViz 4.Frequentist和混合贝叶斯分层模型简介。 IFBM 5.R语言包MBA,多层B样条逼近。 MBA 6.PyTorch的快速可微分预测控制模型(MPC)求解器。 mpc.pytorch 7.R语言包msmbstyle,为使用R包bookdown生成的HTML书籍提供了另一种设计。 布局由Sweave和LaTeX开发。 msmbstyle 8.R语言包fontHind,提供了基于Hind字体的ggplot2主题。 fontHind 9.R语言包nplcm,用于拟合嵌套的部分潜类模型。 nplcm 10.基于Google Earth Engine的哨兵2数据集的大气校正。 gee atmcorr S2 6SE 11.使用Google Earth Engine进行时间序列的大气校正。 ee atmcorr timeseries 12.使用Py6S对Google Earth Engine中的Sentinel 2图像进行大气校正。 gee atmcorr S2 13.开源书籍GeoSpatial Book

带南海九段线分位数地图可视化(R语言版)

谁说我不能喝 提交于 2019-12-04 07:27:54
今天带来一篇承诺虾神的可视化博客。内容是使用R语言进行带南海九段线分位数地图可视化。虾神的原博文地址如下(Python版)。 Python实现带南海九段线分位数地图完整可视化版本(附代码及数据) 1999-2017年中国各省旅游外汇收入分析及可视化(附代码及数据) 数据及代码github地址 1 数据下载 虾神把代码和数据放在了github上,没接触过github的人可能对如何下载不太熟悉,这里也简单介绍下两种方式。如果想进一步了解git这种神器的可以安装git,然后按第一种方式下载(以下介绍默认已安装git bash)。而第二种方式则完全不用了解git方面的内容。 1 git clone 首先新建一个你放数据和分析的文件夹。然后先点击浏览虾神提供的github地址,在页面中点击clone or download,即跳出如下的页面,复制https的地址。 然后右击打开git bash。敲入命令行。 git clone https://github.com/allenlu2008/PythonDemo.git 然后敲击回车,即可发现开始下载。当然由于虾神这个仓库内容比较多,是一个比较漫长的下载过程。 2 直接下载(Download ZIP) 第二种方式依旧是点击clone or download。这回是点击Download ZIP。 接下来就进入传统的浏览器点击下载存储文件的范畴了

机器学习:最小二乘法实际应用的一个完整例子

痞子三分冷 提交于 2019-12-04 06:57:28
整个过程分七步,为了方便喜欢直接copy代码看结果的同学,每步都放上了完整的代码。 实验数据: 第一步:准备样本数据并绘制散点图 1)代码及其说明 import numpy as np import scipy as sp import matplotlib.pyplot as plt from scipy.optimize import leastsq ##样本数据(Xi,Yi),需要转换成数组(列表)形式 Xi=np.array([160,165,158,172,159,176,160,162,171]) #身高 Yi=np.array([58,63,57,65,62,66,58,59,62])#体重 #画样本点 plt.figure(figsize=(8,6)) ##指定图像比例: 8:6 plt.scatter(Xi,Yi,color="green",label="样本数据",linewidth=1) plt.show() 2)结果图 3)分析 从散点图可以看出,样本点基本是围绕箭头所示的直线分布的。所以先以直线模型对数据进行拟合 第二步: 使用最小二乘法算法求拟合直线 1)代码及其说明 import numpy as np import scipy as sp import matplotlib.pyplot as plt from scipy.optimize

R语言预测实战(第一章)

倾然丶 夕夏残阳落幕 提交于 2019-12-03 19:03:32
本例使用forecast包中自带的数据集wineind,它表示从1980年1月到1994年8月, 由葡萄酒生产商销售的容量不到1升的澳大利亚酒的总量。数据示意如下: #观察曲线簇 len=1993-1980+1 data0=wineind[1:12*len] range0=range(data0)+c(-100,100) plot(1:12,1:12,ylim=range0,col='white',xlab="月份",ylab="销量") for(i in 1:len) { points(1:12,wineind[(12*(i-1)+1):(12*i)]) lines(1:12,wineind[(12*(i-1)+1):(12*i)],lty=2) } #对数据按指定格式进行转换 Month=NULL DstValue=NULL RecentVal1=NULL RecentVal4=NULL RecentVal6=NULL RecentVal8=NULL RecentVal12=NULL #替换掉太大或太小的值 wineind[wineind<18000]=18000 wineind[wineind>38000]=38000 for(i in (12+1):(length(wineind)-1)) { Month<-c(Month,i%%12+1) DstValue<-c

Coding and Paper Letter(十七)

允我心安 提交于 2019-12-03 13:18:28
资源整理。 1 Coding: 1.数据科学课程。课程、实验、教程以及code。 datascience box 2.自动根据github生成你的程序员简历。只需要输入github账户名即可生成。 resume.github.com 3.R语言包av,可以结合animation或者gganimate生成mp4视频。 av 4.Python开源项目PointProcesses,Python里点过程的简单模拟,点过程、时间点过程、时空过程,包括核密度估计。 PointProcesses 5.用GDAL/QGIS/WebGL制作3维地图,以DEM为主。 making 3d map 6.R语言开源项目,使用.stl文件中的R生成以3D打印。 impresion3D 7.机器学习研讨会。 ml workshop 1 ml workshop 2 ml workshop 3 ml workshop 4 8.基于R和QGIS的英国房价3维可视化。 datavis3d 9.R语言包ggcorrplot,ggplot2的拓展包, ggcorrplot 10.R语言周报,R语言社区的重要部分之一。更新R语言相关的各项资讯。 rweekly.org 11.美国环保署EPAR语言用户研讨会议程。 2018 12.Python机器学习书第二版代码和在线资源。 python machine learning

R语言中aggregate函数

巧了我就是萌 提交于 2019-12-03 02:03:24
前言 这个函数的功能比较强大,它首先将数据进行分组(按行),然后对每一组数据进行函数统计,最后把结果组合成一个比较nice的表格返回。根据数据对象不同它有三种用法,分别应用于数据框(data.frame)、公式(formula)和时间序列(ts): aggregate(x, by, FUN, ..., simplify = TRUE) aggregate(formula, data, FUN, ..., subset, na.action = na.omit) aggregate(x, nfrequency = 1, FUN = sum, ndeltat = 1, ts.eps = getOption("ts.eps"), ...) 语法 aggregate(x, ...) ## S3 method for class 'default': aggregate((x, ...)) ## S3 method for class 'data.frame': aggregate((x, by, FUN, ..., simplify = TRUE)) ## S3 method for class 'formula': aggregate((formula, data, FUN, ..., subset, na.action = na.omit)) ## S3 method for