第六章 谱分析 Spectral Analysis
到目前为止,时刻变量的数值一般都表示成为一系列随机扰动的函数形式,一般的模型形式为:
我们研究的重点在于,这个结构对不同时点和上的变量和的协方差具有什么样的启示。这种方法被称为在时间域(time domain)上分析时间序列的性质。
在本章中,我们讨论如何利用型如和的周期函数的加权组合来描述时间序列数值的方法,这里表示特定的频率,表示形式为:
上述分析的目的在于判断不同频率的周期在解释时间序列性质时所发挥的重要程度如何。如此方法被称为频域分析(frequency domain analysis)或者谱分析(spectral analysis)。我们将要看到,时域分析和频域分析之间不是相互排斥的,任何协方差平稳过程既有时域表示,也有频域表示,由一种表示可以描述的任何数据性质,都可以利用另一种表示来加以体现。对某些性质来说,时域表示可能简单一些;而对另外一些性质,可能频域表示更为简单。
§6.1 母体谱
我们首先介绍母体谱,然后讨论它的性质。
6.1.1 母体谱及性质
假设是一个具有均值的协方差平稳过程,第个自协方差为:
假设这些自协方差函数是绝对可加的,则自协方差生成函数为:
这里表示复变量。将上述函数除以,并将复数表示成为指数虚数形式,,则得到的结果(表达式)称为变量的母体谱:
注意到谱是的函数:给定任何特定的值和自协方差的序列,原则上都可以计算的数值。
利用De Moivre定理,我们可以将表示成为:
因此,谱函数可以等价地表示成为:
注意到对于协方差平稳过程而言,有:,因此上述谱函数化简为:
利用三角函数的奇偶性,可以得到:
假设自协方差序列是绝对可加的,则可以证明上述谱函数存在,并且是的实值、对称、连续函数。由于对任意,有:,因此是周期函数,如果我们知道了内的所有的值,我们可以获得任意时的值。
§6.2 不同过程下母体谱的计算
假设随机过程服从过程:
这里:
,,
根据前面关于过程自协方差生成函数的推导:
因此得到过程的母体谱为:
例如,对白噪声过程而言,,这时它的母体谱函数是常数:
下面我们考虑过程,
此时:,则母体谱为:
可以化简成为:
显然,当时,谱函数在内是的单调递减函数;当时,谱函数在内是的单调递增函数。
对过程而言,有:
这时只要,则有:,因此谱函数为:
该谱函数的性质为:当时,谱函数在内是的单调递增函数;当时,谱函数在内是的单调递减函数。
一般地,对过程而言:
则母体谱函数为:
如果移动平均和自回归算子多项式可以进行下述因式分解:
则母体谱函数可以表示为:
从母体谱函数中计算自协方差
如果我们知道了自协方差序列,原则上我们就可以计算出任意的谱函数的数值。反过来也是对的:如果对所有在内的,已知谱函数的数值,则对任意给定的整数k,我们也能够计算k阶自协方差。这意味着母体谱函数和自协方差序列包含着相同的信息。其中任何一个都无法为我们提供另外一个无法给出的推断。
下面的命题为从谱函数计算自协方差提供了一个有用的公式:
命题6.1 假设是绝对可加的自协方差序列,则母体谱函数与自协方差之间的关系为:
上述公式也可以等价地表示为:
利用上述谱公式,可以实现谱函数与自协方差函数之间的转换。
解释母体谱函数
假设,则利用命题6.1可以得到时间序列的方差,即,计算公式为:
根据定积分的几何意义,上式说明母体谱函数在区间内的面积就是,也就是过程的方差。
更一般的,由于谱函数是非负的,对任意,如果我们能够计算:
这个积分结果也是一个正的数值,可以解释为的方差中与频率的绝对值小于的成分相关的部分。注意到谱函数也是对称的,因此也可以表示为:
这个积分表示频率小于的随机成分对方差的贡献。
但是,频率小于的随机成分对方差的贡献意味着什么?为了探索这个问题,我们考虑更为特殊一些的时间序列模型:
这里和是零均值的随机变量,这意味着对所有时间t,有。进一步假设序列和是序列不相关和相互不相关的:
,
,对所有的j和k
这时的方差是:
因此,对这个过程来说,具有频率的周期成分对的方差的贡献部分是frequency函数计算频数。如果频率是有顺序的:,则的方差中由频率小于或者等于的周期形成的部分是:。
这种情形下的k阶自协方差为:
因为过程的均值和自协方差函数都不是时间的函数,因此这个过程是协方差平稳过程。但是,可以验证此时的自协方差序列不是绝对可加的。
虽然在上述过程中,我们已经过程的方差分解为频率低于某种程度的周期成分的贡献,我们能够这样做的原因在于这个过程是比较特殊的。对于一般的情形,着名的谱表示定理(the sp
ectral representation theorem)说明:任何协方差平稳过程都可以表示成为不同频率周期成分的和形式。
对任意给定的固定频率,我们定义随机变量和,并假设可以将一个具有绝对可加自协方差的协方差平稳过程表示为:
这里需要对随机变量和的相关性给出更为具体的假设,但是上述公式便是谱表示定理的一般形式。
§6.2 样本周期图 Sample Periodogram
对一个具有绝对可加自协方差的协方差平稳过程,我们已经定义在频率处的谱函数值为:
,
注意到母体谱是利用表示的,而表示的是母体的二阶矩性质。
给定由表示的T个样本,我们可以利用下述公式计算直到阶的样本自协方差:
,
对于给定的,我们可以获得母体谱密度对应的样本情形,我们称其为样本周期图:
样本周期图也可以表示成为如下形式:
类似地,我们可以证明样本周期图下的面积等于样本方差:
样本周期图也是关于原点对称的,因此也有:
更为重要的是,谱表示定理在样本情形也有类似的表示。我们将要说明,对于平稳过程的任意一个容量为的观测值序列,存在频率和系数,,使得期的值可以表示成为:
其中:
当时,与不相关;
当时,与不相关;
对于所有的和,与不相关。
的样本方差是,该方差中可以归因于频率为的周期成分的部分由样本周期图给出。
我们对样本容量是奇数的情形展开讨论上述谱表示模式。这时可以表示成为由个不同频率构成的周期函数,频率如下:
,,……,
因此最高频率为:
我们考虑基于常数项、正弦函数和余弦函数的线性回归:
将这个回归方程表示成为下述方式:
其中:,这是一个具有个解释变量的回归方程,因此解释变量与观测值是一样多的。我们将证明解释变量之间是线性无关的,这意味着基于回归的OLS估计具有惟一解。该回归方程的 系数具有显着的统计意义:表示中可以归因于频率的周期成分的那部分。这就是说,任意观测到的序列,它都可以利用上述周期函数形式表示,并且不同频率的周期成分对方差的贡献都可以在样本周期图中到。
命题6.2 假设样本容量是奇数,定义,并设定,,假设解释变量为:
则有:
进一步,假设是任意个实数,则下述推断成立:
(a) 过程可以表示为:
这里:
,,
(b) 的样本方差可以表示为:
样本方差可以归因于频率为的周期成分的部分为。
(c) 的样本方差中可以归因于频率为的周期成分的部分还可以表示为:
其中是样本周期图在频率处的值。
上述结果说明,是对角矩阵,这意味着包含在向量中的向量之间是相互正交的。这个命题断言:任何奇数个观测到的时间序列可以表示成为一个常数加上具有个不同频率的个周期成分的加权和。当是偶数整数的时候,类似的结果也是成立的。因此,这个命题给出了类似谱表示定理的有限样本的类似情况。这个命题进一步表明了样本周期图的特征是将的方差按部分分解为不同频率的周期成分的贡献。
注意到解释的方差的频率都落在区间中。为什么不使用负的频率?假设数据确实是由上述过程的一种特殊情形生成的:
这里代表某个特殊的负频率,和是零均值的随机变量,利用三角函数的奇偶性,可以将表示为:
因此,利用上述式子无法从数据中识别数据是从正发频率还是负的频率生成的。这时一种简单的方式是假设数据是从具有正的频率中生成的。
为什么只考虑作为最大的频率呢?假设数据真的是从频率的周期函数中生成的,例如:
这时正弦和余弦函数的周期性质表明,上式可以表示成为:
因此,根据以前的讨论,具有频率的周期在观测值上等价于具有频率的周期。
注意到频率和周期之间的关系,频率对应的周期为。由于我们考虑的最高频率为,因此我们所观测到的能够自己重复的最短阶段是。如果,则周期是每阶段重复自己。但是,如果数据是整数阶段观测的,因此数据可以观测的时间间隔仍然是每4个阶段观测到,这对应着周期频率是。例如,函数和函数在整数的时间间隔上,它们的观测值是一致的。
命题6.2也为计算在频率()上的样本周期图的数值提供了方法。定义:
这里:
,
因此可以得到:
§6.3 估计总本谱 Estimating the Population Spectrum
上面我们介绍了母体谱的意义和性质,下面我们面对的问题是:获得了观测样本以后,如何估计母体谱函数?
样本周期图的大样本性质
一个显然的方法是利用样本周期图去估计母体谱函数。但是,这种方法具有显着的限制。假设对于无限移动平均过程而言:
这里系数是绝对可加的,是具有均值和方差的独立同分布序列,假设是如上定义的母体谱函数,且对所有的,都有。假设是如上定义的样本谱函数,Fuller (1976) 证明了,对和充分大的样本容量,样本周期图与母体谱函数之比的二倍具有下述渐近分布:
进一步,如果,也有:
并且上述两个渐近分布的随机变量是相互独立的。
注意到的均值等于自由度,因此有:
因为是母体数量,不是一个随机变量,因此上式也可以表示成为:
因此,对充分大的样本容量,样本周期函数为母体谱提供了一个渐近无偏估计。
母体谱的参数化估计
假设我们认为数据可以由模型表示:
这里是具有方差的白噪声。这时一个估计母体谱的出方法是先利用前面介绍的极大似然估计估计参数,具有绝对可加自协方差的协方差平稳过程,我们已经定义在频率处的谱函数
§6.4 谱分析的应用 Uses of Spectral Analysis
我们利用美国制造业生产的数据来说明谱分析的应用。书中给出了联邦储备委员会的季节非
调整的月度指数,从1947年1月至1989年11月。其中出现经济衰退的时候出现了生产的下降,大约持续一年左右。数据中出现了显着的季节成分,大约在7月出现下降,而在8月出现复苏。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论