多变量时间序列的预测和建模指南(附Python代码)
时间是决定企业兴衰的最关键因素。这就是为什么我们看到商店和电⼦商务平台的销售与节⽇⼀致。这些企业分析多年的消费数据,以了解打开⼤门的最佳时间,并看到消费⽀出的增加。
但是,作为⼀个数据科学家,你怎么能进⾏这种分析呢?别担⼼,你不需要建造⼀台时间机器!时间序列建模是⼀种强⼤的技术,是理解与预测趋势和模式的门户。
免费视频教程:p
但是即使是时间序列模型也有不同的⽅⾯。我们在Web上看到的⼤多数例⼦都是⽤单变量时间序列来处理的。不幸的是,现实世界的⽤例并不是这样⼯作的。有多个变量在起作⽤,同时处理所有这些变量是数据科学家体现其价值的地⽅。
在这篇⽂章中,我们将了解什么是多元时间序列,以及如何处理它。我们还将在Python中进⾏案例研究并实现它,以使您对该主题有实际的理解。honey
⽬录表
1.单变量与多变量时间序列
— —单变量时间序列
— —多元时间序列
excel乘法公式是哪个2.多变量时间序列-向量⾃回归(VAR)的处理
3.为什么我们需要VAR?
4.多变量时间序列的平稳性
5.训练验证拆分
6.Python实现
python入门教程视屏1.单变量与多变量时间序列
本⽂假定读者熟悉单变量时间序列的性质,以及⽤于预测的各种技术。由于本⽂将重点讨论多变量时间序列,因此我建议您阅读以下⽂章,这些⽂章可以作为对单变量时间序列的良好介绍:abstract的形容词
时间序列预测综合指南
使⽤Auto ARIMA构建⾼性能时序模型
但是,在讨论多元时间序列的细节之前,我将快速地介绍⼀下什么是单变量时间序列。让我们逐⼀观察它们的差异。
1.1单变量时间序列
⼀个单变量时间序列,顾名思义,是⼀个具有单⼀时间依赖变量的序列。
例如,在过去的2年中,查看下⾯的样本数据集,该数据集包括温度值(每⼩时)。这⾥,温度是因变量(取决于时间)。
核子基因累计已做7亿次核酸检测免费视频教程:p
如果要求我们预测未来⼏天的温度,我们将查看过去的值,并尝试测量和提取⼀个模式。我们会注意到早晨和晚上的温度较低,下午则达到峰值。此外,如果你有过去⼏年的数据,你会发现,在11⽉到1⽉份,天⽓⽐较冷,⽽在4⽉⾄6⽉⽐较热。
这样的观察将有助于我们预测未来的价值观。你注意到我们只使⽤了⼀个变量(过去2年的温度)吗?因此,这被称为单变量时间序列分析/预测。
1.2多元时间序列(MTS)
多变量时间序列具有⼀个以上的时间依赖变量。每个变量不仅取决于其过去的值,⽽且还对其他变量有⼀定的依赖性。这种依赖性⽤于预测未来的价值。听起来很复杂?让我解释⼀下。
考虑上⾯的例⼦。现在假设我们的数据集包括过去两年的汗⽔百分⽐、露点、风速、云层覆盖率等,以及温度值。在这种情况下,有多个变量被认为是最佳预测温度。像这样的系列将属于多元时间序列的范畴。下⾯是⼀个例证:
免费视频教程:p11的补码是多少
现在我们了解了多元时间序列的样⼦,让我们了解如何利⽤它来建⽴预测。
2.多元时间序列的处理——VAR
在本节中,我将介绍多变量时间序列预测中最常⽤的⽅法之⼀——向量⾃回归(VAR)。
在VAR模型中,每个变量是其⾃⾝过去值和所有其他变量的过去值的线性函数。为了更好地解释这⼀点,我将使⽤⼀个简单的视觉例⼦:
我们有两个变量y1和y2。我们需要从过去N值的给定数据预测时间t上的这两个变量的值。为了简单起见,我已经考虑滞后值为1。
免费视频教程:p
为了计算y1(t),我们将使⽤y1和y2的过去值。类似地,为了计算y2(t),将使⽤y1和y2的过去值。下⾯是表⽰这种关系的简单数学⽅法:
在这⾥,a1和a2是常数项,w11、w12、w21和w22是系数,e1和e2是误差项。
这些⽅程类似于AR⽅程的过程。由于AR过程⽤于单变量时间序列数据,所以未来值只是它们⾃⼰的过去值的线性组合。考虑AR(1)过程:
y(t) = a + w*y(t-1) +e
在这种情况下,我们只有⼀个变量—y、常数项—a、误差项—e和系数—w。为了适应VAR的每个⽅程中的多变量项,我们将使⽤向量。我们可以⽤下列形式写出⽅程式(1)和(2):
免费视频教程:p
这两个变量是Y1和Y2,其次是常数、系数度量、滞后值和误差度量。这是VAR(1)过程的向量⽅程。对于VAR(2)过程,将另⼀个时间向量项(T-2)加⼊到⽅程中,以推⼴P滞后:
免费视频教程:p
上述⽅程表⽰具有变量y1、y2…yk的var(p)过程。同样可以写成:
免费视频教程:p
⽅程中εt表⽰多元⽮量⽩噪声。对于⼀个多变量时间序列,εt应该是满⾜下列条件的连续随机向量:
1.E(εt)=0
误差向量的期望值为0。
2.E(εt1,εt2′)=12
εt和εt′的期望值是级数的标准偏差。
3.我们为什么需要VAR?
回想⼀下我们早些时候看到的温度预测例⼦,可以将其作为⼀个多变量单变量序列进⾏讨论。我们可以使⽤简单的单变量预测⽅法如AR来解决这个问题,因为其⽬的是预测温度,所以我们可以简单地去除其他变量(除了温度),并在剩余的单变量序列上拟合⼀个模型。
另⼀个简单的想法是使⽤我们已经知道的技术来逐个预测每个系列的值。这将使⼯作⾮常直截了当!那你为什么还要学习另⼀种预测技术呢?这个话题已经⾜够复杂了吗?
从上⾯的⽅程(1)和(2)可以清楚地看到,每个变量都使⽤每个变量的过去值来进⾏预测。与AR不
同,VAR能够理解和使⽤多个变量之间的关系。这有助于描述数据的动态⾏为,并提供更好的预测结果。此外,实现VAR与使⽤任何其他单变量技术⼀样简单(您将在最后⼀节中看到)。
4.多变量时间序列的平稳性
通过研究单变量概念,我们知道,平稳时间序列往往会给我们⼀组更好的预测。如果您不熟悉平稳性的概念,请先阅读本⽂:处理⾮平稳时间序列的温和介绍。
总之,对于给定的单变量时间序列:
y(t) = c*y(t-1) + ε t
如果c<1,则该级数是固定的。现在,回忆⼀下我们的VAR过程⽅程:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。