时间序列

(转)利用Auto ARIMA构建高性能时间序列模型(附Python和R代码)

生来就可爱ヽ(ⅴ<●) 提交于 2019-12-01 12:31:59
转自: 原文标题:Build High Performance Time Series Models using Auto ARIMA in Python and R       作者:AISHWARYA SINGH;翻译:陈之炎;校对:丁楠雅 原文链接: https://www.analyticsvidhya.com/blog/2018/08/auto-arima-time-series-modeling-python-r /    简介 想象你现在有一个任务:根据已有的历史数据,预测下一代iPhone的价格,可使用的特征包括季度销售、月度支出以及苹果资产负债表上的一系列内容。作为一名数据科学家,你会把这个问题归类为哪一类问题?当然是时间序列建模。 从预测产品销售到估算家庭用电量,时间序列预测是任何数据科学家都应该知道——哪怕不是熟练掌握——的核心技能之一。你可以使用多种不同的方法进行时间序列预测,我们将在本文中讨论 Auto ARIMA ,它是最为有效的方法之一。 首先,我们来了解一下ARIMA的概念,然后再进入正题——Auto ARIMA。为了巩固概念,我们将使用一个数据集,并用Python和R实现它。 目录 一、什么是时间序列? 二、时间序列预测的方法 三、ARIMA简介 四、ARIMA实现步骤 五、为什么需要Auto ARIMA? 六、用Auto ARIMA实现案例

时间序列学习笔记1

我们两清 提交于 2019-12-01 12:16:22
时间序列 1.定义 时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。例如:北京市月度CPI同比数据。 http://data.eastmoney.com/cjsj/cpi.html 具体的定义去找度娘奥。 2.构成要素 与其说构成要素,不如说一个时间序列可以分解成哪些 构成要素:长期趋势,季节变动,循环变动,不规则变动。 1)长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。 2)季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动。 3)循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动。 4)不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型. 通过构成要素可以发现,时间序列可以用来分析事物的发展变化趋势,根据变化趋势进行预测等,为有关部分制定相关政策提供参考。 3.组合模型 时间序列的组合模型主要有两种形式 加法模型:\begin{equation} Y=T+S+C+l \end{equation}(即为上面几种趋势的相加) 乘法模型:\mathrm{Y}

[转帖]时间序列数据库 (TSDB)

。_饼干妹妹 提交于 2019-12-01 07:13:46
时间序列数据库 (TSDB) https://www.jianshu.com/p/31afb8492eff 0.3392019.01.28 10:51:33字数 5598阅读 4030 背景 2017年时序数据库忽然火了起来。开年2月Facebook开源了beringei时序数据库;到了4月基于PostgreSQL打造的时序数据库TimeScaleDB也开源了,而早在2016年7月,百度云在其天工物联网平台上发布了国内首个多租户的分布式时序数据库产品TSDB,成为支持其发展制造,交通,能源,智慧城市等产业领域的核心产品,同时也成为百度战略发展产业物联网的标志性事件。 例如: 时间序列数据库 Time Series Database (TSDB) 随着分布式系统监控、物联网的发展,TSDB开始受到更多的关注。 维基百科上对于时间序列的定义是‘一系列数据点按照时间顺序排列’ 时间序列数据就是历史烙印,具有不变性,、唯一性、时间排序性 时间序列数据跟关系型数据库有太多不同,但是很多公司并不想放弃关系型数据库。 于是就产生了一些特殊的用法,比如用 MySQL 的 VividCortex , 用 Postgres 的 Timescale 。 很多人觉得特殊的问题需要特殊的解决方法,于是很多时间序列数据库从头写起,不依赖任何现有的数据库, 比如 Graphite , InfluxDB 。

Docker 监控- Prometheus VS Cloud Insight

ぃ、小莉子 提交于 2019-12-01 06:25:45
如今,越来越多的公司开始使用 Docker 了,2 / 3 的公司在尝试了 Docker 后最终使用了它。为了能够更精确的分配每个容器能使用的资源,我们想要实时获取容器运行时使用资源的情况,怎样对 Docker 上的应用进行监控呢?Docker 的结构会不会加大监控难度? 可是在没有专业运维团队来监控 Docker 的情况下,并且还想加快 Docker 监控的日程,怎么办呢? 我们通过调查了解到几种不错的 Docker 监控方法,其中 Prometheus 和 Cloud Insight 让人很感兴趣。 Prometheis 先来说说一套开源的 Docker 监控方案: Prometheus ;而此篇文字的原文地址: Monitor Docker Containers with Prometheus 。 Prometheus 由 SoundCloud 发明,适合于监控基于容器的基础架构。Prometheus 特点是高维度数据模型,时间序列是通过一个度量值名字和一套键值对识别。灵活的查询语言允许查询和绘制数据。它采用了先进的度量标准类型像汇总(summaries),从指定时间跨度的总数构建比率或者是在任何异常的时候报警并且没有任何依赖,中断期间使它成为一个可靠的系统进行调试。 Prometheus 支持维度数据,你可以拥有全局和简单的指标名像 container_memory

时间序列回归

余生长醉 提交于 2019-12-01 04:58:31
VAR模型针对平稳时间序列,VEC模型针对存在协整关系的非平稳时间序列 协整方程表示变量之间的长期均衡关系,它反映的是系统内部不同变量之间的均衡 来源: https://www.cnblogs.com/caiweijun/p/11656398.html

动手学PyTorch | (34) 门控循环单元(GRU)

一世执手 提交于 2019-11-30 01:45:18
上⼀节介绍了循环神经网络中的梯度计算方法。我们发现,当时间步数T较大或者当前时间步t较小时,循环神经⽹络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸,但⽆法解决梯度衰减的问题。 通常由于这个原因,循环神经网络在实际中较难捕捉时间序列中时间步距离较大的依赖关系。 ⻔控循环神经网络(gated recurrent neural network)的提出,正是为了更好地捕捉时间序列中时间步距离较大的依赖关系。它通过可以学习的⻔来控制信息的流动。其中,⻔控循环单元(gated recurrent unit,GRU)是一种常⽤的⻔控循环神经⽹络。另一种常⽤的⻔控循环神经网络则将在下一节中介绍。 目录 1. 门控循环单元 2. 读取数据集 3. 从0开始实现 4. 简洁实现 5.小结 1. 门控循环单元 下⾯将介绍⻔控循环单元的设计。它引⼊了􏰀重置门(reset gate)和更新门(update gate)的概念,从⽽修改了循环神经网络中隐藏状态的计算方式。 重置门和更新门 如下图所示,⻔控循环单元中的重􏰀置门和更新门的输⼊均为当前时间步输入 与上一时间步隐藏状态 ,输出由激活函数为sigmoid函数的全连接层计算得到。 具体来说,假设隐藏单元个数为h,给定时间步t的小批量输入 (样本数为n(batch_size),输入个数为d)和上一时间步隐藏状态 ,重置门 和更新门 的计算如下:

时间序列算法

╄→гoц情女王★ 提交于 2019-11-29 21:33:57
以下哪个是常见的时间序列算法模型 正确答案: C 你的答案: 空 (错误) RSI MACD ARMA KDJ 时间序列中常用预测技术 一个时间序列是一组对于某一变量连续时间点或连续时段上的观测值。 1. 移动平均法 (MA) 1.1. 简单移动平均法 设有一时间序列y1,y2,..., 则按数据点的顺序逐点推移求出N个数的平均数,即可得到一次移动平均数. 1.2 趋势移动平均法 当时间序列没有明显的趋势变动时,使用一次移动平均就能够准确地反映实际情况,直接用第t周期的一次移动平均数就可预测第1t+周期之值。 时间序列出现线性变动趋势时,用一次移动平均数来预测就会出现滞后偏差。修正的方法是在一次移动平均的基础上再做二次移动平均,利用移动平均滞后偏差的规律找出曲线的发展方向和发展趋势,然后才建立直线趋势的预测模型。故称为趋势移动平均法。 2. 自回归模型(AR) AR模型是一种线性预测,即已知N个数据,可由模型推出第N点前面或后面的数据(设推出P点). 本质类似于插值,其目的都是为了增加有效数据,只是AR模型是由N点递推,而插值是由两点(或少数几点)去推导多点,所以AR模型要比插值方法效果更好。 3. 自回归滑动平均模型(ARMA) 其建模思想可概括为:逐渐增加模型的阶数,拟合较高阶模型,直到再增加模型的阶数而剩余残差方差不再显著减小为止。 4. GARCH模型 回归模型

时间序列分析模型——ARIMA模型

≡放荡痞女 提交于 2019-11-29 12:33:00
时间序列分析模型——ARIMA模型 一、研究目的 传统的经济计量方法是以经济理论为基础来描述变量关系的模型。但经济理论通常不足以对变量之间的动态联系提供一个严密的说明,而且内生变量既可以出现在方程的左端又可以出现在方程的右端使得估计和推断变得更加复杂。为了解决这些问题而出现了一种用非结构方法来建立各个变量之间关系的模型,如向量自回归模型(vector autoregression,VAR)和向量误差修正模型(vector error correction model,VEC)。 在经典的回归模型中,主要是 通过回归分析来建立不同变量之间的函数关系(因果关系),以考察事物之间的联系 。本案例要讨论如何 利用时间序列 数据本身建立模型,以研究事物发展自身的规律 ,并据此对事物未来的发展做出预测。研究时间序列数据的意义:在现实中,往往需要研究某个事物其随时间发展变化的规律。这就需要通过研究该事物过去发展的历史记录,以得到其自身发展的规律。在现实中很多问题,如利率波动、收益率变化、反映股市行情的各种指数等通常都可以表达为时间序列数据,通过研究这些数据,发现这些经济变量的变化规律(对于某些变量来说,影响其发展变化的因素太多,或者是主要影响变量的数据难以收集,以至于难以建立回归模型来发现其变化发展规律,此时,时间序列分析模型就显现其优势——因为这类模型不需要建立因果关系模型