基于机器学习算法的股指期货价格预测模型研究
作者:***
来源:《软件工程》2022年第12期
        摘 要:人工智能技术和量化投资领域的结合,诞生了各类基于机器学习算法的价格预测模型。为研究不同机器学习算法在股指期货价格预测中的应用效果,采用支持向量回归、长短期记忆网络、随机森林及极端梯度提升树四种常用的机器学习算法构建价格预测模型,对沪深300股指期货价格进行预测研究,并利用贝叶斯算法对模型进行超参数优化,对比贝叶斯优化对于以上四种机器学习算法预测精度的提升效果。研究结果表明,随机森林和极端
梯度提升树因其模型自身的优点,可以实现对金融时序数据的准确预测,而贝叶斯优化利用高斯过程,不断更新先验,可以显著提高支持向量回归预测效果,均方误差(MSE)、平均绝对误差(MAE)、对称平均绝对百分比误差(SMAPE)和损失适应度(LOSS)分别降低了78.6%、94.7%、95.1%和97.0%。
        关键词:机器学习;支持向量机;长短期记忆网络;随机森林;极端梯度提升树
        中图分类号:TP312 文献标识码:A
        Research on Stock Index Futures Price Prediction Model
        based on Machine Learning Algorithms
        YANG Xuewei
        (School of Economics and Management, Qinghai University for Nationalities, Xining 810007, China)*****************
        Abstract: With the combination of artificial intelligence technology and quantitative in
vestment, various price prediction models based on machine learning algorithms have emerged. In order to study the effect of different machine learning algorithms on stock index futures price prediction, this paper proposes to use four commonly used machine learning algorithms, namely SVR (Support Vector Regression), LSTM (Long Short-Term Memory), RF (Random Forest) and XGBoost (Extreme Gradient Boosting), to construct a price prediction model, so as to predict the stock index futures price of Shanghai and Shenzhen 300. Bayesian algorithm is used to optimize the hyperparameters of the model, and the improvement effect of Bayesian optimization on the prediction accuracy of the four machine learning algorithms is compared. The research results show that RF and XGBoost can achieve accurate prediction of financial time series data due to their own advantages, while Bayesian optimization can significantly improve the prediction effect of support vector machines by using Gaussian process and constantly updating the prior. MSE, MAE, SMAPE and LOSS are reduced by 78.6%, 94.7%, 95.1% and 97.0% respectively.
        Keywords: machine learning; SVR; LSTM; RF; XGBoost
        1 引言(Introduction)
        宏觀经济背景、金融市场发展水平和投资者心理预期等多种复杂因素共同驱动金融工具价格变化,使得金融时序价格具有非平稳性、非线性和高噪声的复杂特性[1]。在国内金融市场高速发展的背景下,金融时序价格预测成为一个亟待解决的难题。伴随着人工智能技术的进步,机器学习算法为金融时序价格预测带来了新的研究思路,学界和业界也致力于运用机器学习算法预测各类金融工具短期趋势并构建量化择时策略,以期获取超额投资收益。
        随着国内量化投资的兴起,众多金融机构已将机器学习广泛应用于产品定价、风险管理、量化选股、策略管理等领域。对于非线性、非平稳、更新频率快的金融市场数据,相较于传统统计分析方法,机器学习算法能够迅速挖掘出市场上更多潜在信息。本文选用支持向量回归(Support Vector Regression, SVR)、长短期记忆网络(Long Short-Term Memory, LSTM)、随机森林(Random Forest, RF)、极端梯度提升树(Extreme Gradient Boosting, XGBoost)四种常用的机器学习算法构建沪深300股指期货价格预测模型,并利用贝叶斯算法对模型进行超参数优化,比较其预测效果,为量化择时策略开发提供价格预测基础。
        2 机器学习算法(Machine learning algorithms)
正则化参数的自适应估计        2.1 支持向量回归
        SVR模型利用支持向量机分类的原理,通过在损失函数中加入松弛变量提高模型回归拟合性能[2]。SVR模型能有效处理多维度样本,能够摆脱神经网络预测模型的局部最优问题,达到唯一的全局最优解。SAPANKEVYCH等[3]系统梳理并总结了SVR模型在时间序列预测的相关研究文献。王洪平[4]运用SVR模型根据金融机构贷款余额预测货币供应量。肖阳等[5]基于三种不同的核函数建立了SVR多因子选股模型,并通过网格搜索和交叉验证法确定了模型参数的最优取值,回测结果表现优异,其中高斯核函数绩效表现最优,年化收益达到24.76%。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。