2017 年软件2017,V〇1.38,No. 5第3 8 卷第 5 期COMPUTER ENGINEERING & SOFTWARE 国际IT 传媒品牌
设讨研尧与启用
基于具有加权模糊隶属函数的神经网络的
混沌时间序列预测
权鹏宇\车文刚2,周志元\龙婧1
(1.昆明理工大学信息工程与自动化学院,云南昆明650500;
2.昆明理工大学云南省计算机技术应用重点实验室,云南昆明650500)
摘要:本文提出了以时间延迟坐标嵌入方法为基础的周期性波动预测模型。此模型使用一种叫作具有加权模
糊隶属函数的神经网络的神经模糊网络(NEWFM)。在主要综合指标的预处理时间序列中使用了时间延迟坐标嵌入
方法,并将此序列用作此神经模糊网絡的输入数据来预测商业周期。以小波变换为基础使用其他方法进行了对比性
研究,并对性能比较进行了主成分分析。使用线性回归分析来测试预测结果,以比较输入数据与目标类别,国内生
产总值的近似值。另外两个模型忽略了基于混沌的模型捕捉非线性动态模型和系统中的相互作用。检验结果表明基
于混沌的方法能够有效地增强预测能力,因此表明此方法比其他方法具有更优越的性能。
关键词:加权模糊隶属函数;时间坐标嵌入;混沌时间序列预测;模糊神经网絡
中图分类号:TP391.9 文献标识码:A DOI: 10.3969/j.issn.l003-6970.2017.05.006
本文著录格式:权鹏宇,车文刚,周志元,等.基于具有加权模糊隶属函数的神经网络的混沌时间序列预测[J]. 软件,2017,38 (5):98-106
Prediction of Chaotic Time Series Based on Neural Networks with
Weighted Fuzzy Membership Functions
QUAN Peng-yu1, CHE Wen-gang2, ZHOU Zhi-yuan1, LONG Jing1
(1. School o f I nformation Engineering and Automation, Kunming University o f S cience and Technology, Kunming 650500, P. R. China', 2. Yunnan Provincial Key Laboratory o f C omputer Technology Application, Kunming University of S cience and Technology, Kunming 650500, P. R. China)
【Abstract】:This study presents a forecasting model of cyclical fluctuations of the economy based on the time de- lay coordinate embedding method. The model uses a neuro-fozzy network called neural network with weighted fuzzy membership functions (NEWFM). The preprocessed time series of the leading compos- ite index using the time delay coordinate embedding method are used as input data to the NEWFM to forecast the business cycle. A comparative study is conducted using other methods based on wavelet transform and Principal Component Analysis for the performance comparison. The forecasting results are tested using a linear regression analysis to compare the approximation of the input data against the tar- get class, gross domestic product (GDP). The chaos based model captures nonlinear dynamics and interac- tions within the system, which other two models ignore. The test results demonstrated that chaos based method significantly improved the prediction capability, thereby demonstrating superior performance to the other methods.
【Key words】:Weighted fozzy membership fonctions; Time delay coordinate embedding; Chaotic time seri diction; Neuro-fuzzy network
y胃 金融市场的不确定性环境正在发生不同寻常的变
化,因此很难使用传统经济模型来分析这种混沌的 全球金融网络的复杂性和维度的不断增加导致 金融环境。除了一些新型经济模型使用了人工智能
作者简介:权鹏宇(1993-),男,硕士研究生,主要研究方向:云计算、时间序列分析、模式识别;车文刚(1963-),男,教授,博士后,主要研究方向:人工智能、模式识别、时间序列分析、计算机应用;龙婧(1991-),女,硕士研究生,主要研究方向:时间序列分析、模式 识别;周志元(1992-),男,硕士研究生,主要研究方向:时间序列分析、模式识别。
权鹏宇等:基于具有加权模糊隶属函数的神经网络的混沌时间序列预测
之外,最近已经开发了一些基于混沌的方法来处理 变化的金融环境。
本研究主要关注基于混沌的方法,例如时间延 迟坐标嵌入方法,这种方法使用了 N E W FM 来预测 商业周期。早期对混沌时间序列研究的关注点主要 是确定在这些系统中是否存在非线性动态行为。然 而,最近的研究都在关注应用基于混沌的知识来提 高预测的准确性。基于混沌的模型能够提高短期预
测的准确性现在已经达到了广泛的认可[2]。
使用自互信息和Cao ’s 函数可以确定时间延迟 和嵌入维度的参数,并用这些参数来重构相空间。 在主要综合指标的预处理时间序列中使用了时间延 迟坐标嵌入方法,并将此序列用作N E W F M 的输入 数据来预测商业周期[23]。使用线性回归分析对比了 具有和不具有基于混沌预处理过程的预测结果,结 果表明基于混沌的方法能够有效地增强预测能力, 因此表明此方法比其他方法具有更优越的性能。
1
实验数据与方法
1.1数据
经济指标是经济分析中的关键因素,能够表示 出经济周期中的转折点和水平线[24]。特别地,主要 综合指标(LC I )的组成要素是从整体经济成分中选
择出来的非常敏感而且顺应周期变化的指标,并且 通常在经济发生变化之前就会变化。因此,我们选择 的样本阶段能够合理的评估经济周期分析的效果。
在本文中,使用了从1991年1月至2006年12 月之间的192个L C I 要素,包括就业职位求供比率、 库存
循环指标、消费期望和收到的机械订单。这些 数据集都来自国家统计办公室。使用G D P 平均增长 率来作为类别0和类别1的目标临界值,G D P 代表 了国民经济的总体活动,并将月度G D P 数据进行了 分类(表1)〇 1.2特征选择
特征选择是神经网络中的非常重要的要素,能 够通过降低维数来提高分类精确度并简化预测过 程。我们使用N E W F M 机器选择方法,也叫做
N E W F M 的非重叠分布方法(N A D M )来降低选择
重要输人时的维度,同时能够删除不重要的输人(图 1 ) [25-28]〇
N A D M 选择特征时使用的标准以非重叠区域
为基础。图1给出了一种BSW FM (图5),这种
B S W F M 由使用L
C I 要素作为输入特征的三个加权
模糊隶属函数得到。例如,将L C I 的要素之一——
收到的机械订单作为第i 个输入特征时,蓝区域
(A L )代表类别0中更大的模糊值,而红区域
表1
使用的经济指标
Tab.l Used economic indicators
数据集指标(序号)
LCI 的要索
数据量
训练
LCI ( 10)就业职位求供比率、库存循环指标、消费期望、收到的机械订单、资本货 物进口、收到的基建订单、股价、总体流动性、利差、净易货贸易条件180(1991.1D2005.12)检验
LCI (7 )
就业职位求供比率、库存循环指标、消费期望、收到的机械订单、资本货 物进口、收到的基建订单、总体流动性
12 (2006.102006.12)
类别0:低谷(GDP 平均增长宰小于5.5% )
类别1:峰值(
GDP 平均增长率大于5.5% )X 轴:标准单位;Y 轴:模糊映射值
图
1 NEWFM 的非重叠区域分布示例
Fig.l Example of non-oyerlapping area distribution for NEWFM
99《软件》杂志欢迎推荐投稿t cosoft @vip .163
第38卷第5期软 件
(A ie)代表类别1中更大的模糊值。如果区域A ic+ A ie很大,并且每个区域都是平均分割的,那么这两 个类别就更容易区分。区域越大,特征就越重要(图 1 (b))。第i个输人特征的非重叠区域分布启发函 数可以通过以下式子计算得到:
m=(4+4)2/M〇x(4,4)(1)
以特征的重要性为基础,在通过逐个减少输人 特征进行数次分类实验之后,使用最佳子集的十个 L C I要素结果中减少的七个特征来预测商业周期。
1.3具有混沌时间序列的商业周期预测方法
我们对全球金融网络的复杂性和维度的不断增 加导致金融市场的不确定性环境正在发生不同寻常 的变化进行了检验。在这里,基于混沌的方法集主 要关注外生因素本身,基于混沌的模型能够捕捉非 线性动态行为和系统中的相互作用。这种基于混沌 的预测方法为我们处理混沌的经济市场提供了一种 新的方法[29]。
由于我们仅仅对标量(或者是单变量)数据集 进行了检验,因此我们必须对轴线包含时间序列数 据集的相空间进行重构,以确定初始动态系统。为 了重构相空间,我们估算了嵌人维度和时间延迟的 参数,并使用这些参数对相空间进行了重构[1_2]。
使用一些参数对L C I要素的时间序列进行预处 理,然后使用这些时间序列作为N E W FM输入节点 中的输人数据,如图4所示。
针对不同的经济环境这七个L C I要素中的每一 个都代表不同的信息。进行重复实验之后,使用 N E W F M将这些信息进行整合。图2给出了商业周 期方法的示意图。2混沌时间序列分析和预测商业周期的结果
2.1混沌时间序列分析与结果
2.1.1相空间参数的选择
根据广泛使用的嵌入式Takens理论,嵌入维度 m (m>2d+l )适合于维度为d的动态系统相空间重 构。然而,其他研究者认为嵌入维度m (m>d)就 足够了[2]。
在众多计算方法中,我们使用了 Cao’s方法[4],用这种方法能够有效清楚地区分确定性信号和随机 信号,并通过较少的数据来确定时间序列需要的嵌 人维度m〇
对于时间延迟选择方法,我们使用的是互信息 方法。通过计算连续点的依赖关系能够确定合适的 延迟时间值。公式定义如下:
K t)=Z (x,,''+r)l〇gC)](2) Xi,xi+I P(X i)P(.X i+T)
其中i是样本总数,P(X i,x i+1)是测量值X i和x i+1的联合概率密度,P(X〇和P(x i+1)是X i和x i+1的边际 概率,最优延迟时间T对应最小的函数I(t)。
2.1.2 混沌特征的识别
为了识别混沌特征,很多研究中都是用了关联 维度和Lyapunov指数。使用关联方法能够估算时间 序列的相关维度。如果系统是混沌的,那么相关维 度应该是正数。相关子可以使用半径r和分数维形 C(r)a*产来表示,其中a是常数,d c为:
(3)
r->〇log(r)
可以使用L ya p u n o v指数来计算动态系统中相
G D F (目标)
综合趋势线给出了使用
N E W F M的商±L固期
LC]要麦
就业取位求供比
率
库存循环指标
消藤期望指标
利差
:
:争易货贸易条件9T I1
Fig.2
图2商业周期预测方法示意图Business cycle prediction method diagram
《软件》杂志欢迎推荐投稿:cosoft@vip. 163
100
权鹏宇等:基于具有加权模糊隶属函数的神经网络的混沌时间序列预测
5用的g 小ft 入
J _________________-0
1〇0 200 300 400标鱼时间..字列 时间序列复会榷标
时间洧后
便.弓互•信.§.函钕的最小时间延iS .
误苕或甜
时间序列的廷道
图3 TSTOOL 的应用结果
Fig J Application results of TSTOOL
2.2使用基于N E W F M 的时间延迟坐标嵌入来
预测商业周期(混沌-NEWFM )
2.2.1 NEW FM 的特征
为了预测未来的时间序列值,我们使用观测到的时间序列x l , x 2, x 3,...,xn 来预测混纯时间序列中的相空间[3e ],使用当前的状态X 可以通过下式
来计算未来的状态X i +T :
=M ^i )
(5)
其中T 为前置时间。将模糊神经网络,也就是
N E W F M 作为整个相空间的近似值。将嵌入相空间
矢量X 作为N E W FM 的输入数据,并且可以表示为:
X i -
»xi-(m -2)t^' >x i ) ( 6 )
邻轨迹和混沌程度的指数发散度。其中每一个维度 都存在一个指数,如果有一个或多个Lyapunov 指数 是正数,那么系统就是混沌的。因此,只需要计算 最大的Lyapunov 指数。第i 个Lyapunov 指数定义为:
A = limtlnCrf /,. (〇 - ln (rfr ))] /1
(4)
r ->0
2,1.3相关参数和系数的计算
使用软件包TSTO O L 可以到相关参数,并确 定时间序列的混沌特征。对于标量输入信号(图 3
U )),我们尝试着包含更长的时间阶段,并追溯到
1971年。将444个时间序列中较长的数据集用做输
入矢量,其中包括样本阶段的192个时间序列,商 业周期预测见表1。
第一,嵌人到TS TO O L 中的自互信息函数(自 互)能够帮助我们通过使用自互信息函数中的最小 值为时间延迟T 到合适的值。自互信息函数表明 在相空间重构过程中x 轴对应的延迟时间如图3( b )
所示。
第二,Cao ’s 方法使用了一个改进的虚临位方 法,并计算了时间序列的嵌入维度m 。使用上述时 间延迟参数作为输入数据,可以使用Cao ’s 方法在x 轴上给出一个合适的最小嵌入维度(图3 ( c ))。图 4 (d )给出了使用嵌入维度3和时间延迟1作为输 入信号的时间序列的时间延迟重构。不幸的是,时 间序列的长度不足以给出一个合适的吸引子几何 图线。
第三,图3(e )给出了关联总和与半径的双对 数坐标图的范围。输出,也就是斜率的值达到了 2.3040,这是一个非整数分形维度,同时也证明了 使用的数据集具有混沌特征。
最后,图3 (f )给出了预测误差的范围。使用
Lyapunov 算法通过预测误差计算了相邻轨道距离的 平均指数增加量。预测时间导致的预测误差的增大
会产生一个最大的Lyapunov 指数。检验结果(图3(0)表明最大的预测误差大约为+2.2,这个值表 示使用的时间序列存在混沌特征。
y
f i
v T c s 4
3
z
1
f i
o D f r a c u Q
o -0矢重大小
m
)i i i J i n s 的I s 0
賴:、
101
《软件》杂志欢迎推荐投稿t
cosoft@vip.163
第38卷第5期软 件
其中Xi 为时间(时的观测数据,m 为嵌入维度,
t
为时间延迟。
N E W F M 同时具有分类和特征选择的功能,因
此也被称为N A D 1VU N E W F M 包含三个层次,分别 为输入节点(\ )、超盒图节点(B i )和分类节点(Q ) (图4 )。可以对隶属函数的位置和权重进行适应性 训练。经过反复训练之后,超盒图节点中的模糊设 置会被整合到加权模糊隶属函数的界限总和中 (BSW FM )(图5 ) [25]。这些B S W F M 都是由三个 加权模糊隶属函数产生的,并且包含类别0和类别 1的规则(图1 (a )),可以用作预测的模糊规则。 另外,使用N A D M 可以调取最小的模糊规则,因此 可以使用压缩模式进行最终的商业预测。
将第i 个模糊中的B S W FM 设定为B U x ),那 么|A (x )定义为:
=
(7)
7=1
L C I 要素的预处理时间序列见方程(5),将其
用作N E W F M 的输人数据可以预测商业周期。整体 的机制,也就是所说的混沌N E W F M ,如图4所示。 2.2.2 使用N E W F M 进行分类
将1991年1月至2005年12月之间L C I 要素的 预处理月度数据作为训练数据和2006年1月至2006 年12月之间的月度数据作为测试数据,具体见表1。 使用最小的模糊规则进行预测,例如七个BSW FM 中的每一个都包含类别0 (谷底)和类别1 (峰值) 的规则,如图1 (a )所示。
在学习过程中经过3000次重复之后,训练数据 对应的分类率为93.19%,非训练数据对应的分类率 为91.66%。表2给出了最终的分类性能。3.2.3去模糊化和商业周期趋势线
使用B S W F M 的预测结果能够得到商业周期趋 势线,然后使用S u g en o 模糊模型对其去模型化[21]。 在这里,可以在不消耗时间和进行数学去模糊化操 作的条件下对模糊神经网络的输出数据进行处理。
混沌数据集的预处理 输入节点 超盒图节点 分类节点
图4使用时间延迟坐标嵌入的混沌NEW FM 结构
Fig.4 The use of time delay coordinates embedded in the chaotic NEWFM structure
表2
N EW FM 的分类性能
Tab.2 NEWFM classification performance
使用数据
sumifs函数的使用方法基础视频分类率(%)
错误率(%)
主要指标(7个指标)训练(91.9-05.12)
93.13 6.81非训练(06.1-06.12
91.66
8.34
在IF -T H E N 规则的模糊推理系统中,Sugeno 模糊模型的主要差别就是输出数据为加权平均值[29],
《软件》杂志欢迎推荐投稿:cosoft@vip.163
102
v 〇 V m m '
图5 3个加权模糊隶属函数的界限总和(B S W F M ,粗线)
Fig.5 Boundary Sum of 3 Weighted Fuzzy Membership
Functions(BSWFM, Thick line)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论