stockranker算法
stockranker算法
StockRanker是一种监督式股票排序学习算法,假设我们要预测个股未来n天的收益率,然后将其进行排序,使用该算法在新的一天数据上进行预测,可以向我们推荐应该买入哪些股票。我们结合上图介绍下使用StockRanker算法来开发量化策略的流程。
1.首先,确定目标。因为是监督学习,因此需要对收益率数据进行标注。
2.正则化的约束条件接着,数据划分。将所有数据划分为训练数据和测试数据,训练数据用来训练模型,测试数据用来检验模型的表现。
3.然后,特征构造。特征构造是至关重要的一步,特征构造的好将会直接影响模型效果和策略表现。在这一步,你在金融行业的专业知识和投资经验将发挥很大的作用。
4.然后,训练和预测。在特征构造完毕后,就可以训练好StockRanker算法并进行预测。
5.最后,策略回测。根据StockRanker预测结果进行策略回测,获取策略表现。
量化交易人员对机器学习的态度很复杂,一方面自己实际投资中发现选股因子和股票收益之间关系并非完全线性,需要能力更强的分析预测工具,另一方面又担心机器学习工具过于复杂,导致数据控掘,样本内过拟合的结果外推性不强,经济含义也不好解释,我们这里想说明的是,ML(Machine learning)虽然没法完全避免过拟合的可能性,但配合使用一些方法是可以降ML低过拟合的概率,提升样本外预测能力的。
ML模型的预测偏差取决于这一项,第一项取值与 ML 模型选择无关第二项Bias和第三项Variance的理解可以参考下图,两者都受ML 模型复杂度的影响;
一般来讲,模型复杂度越高,Bias 越小,但 Variance 越大,模型复杂度越低,Bias越大,Variance越小。从下图可以看出,当模型复杂度较高的时候,虽然偏差很小,但是模型方差很大,因此模型的泛化能力不高。
因此要想提高 ML模型的预测能力,模型并不是越复杂越好,而是要在 Bias和 Variance 间做权衡,降低总体预测误差,也就是所谓的 Bias -Variance trade -off。
对待机器学习,我们应该摆脱固有的"黑箱”和"”过拟合"概念,一些 ML 算法的逻非常直白,而且 ML 在求解优化问题估计模型参数时,通常会带正则化约束条件,通过交叉验证的方式来选择参数,避免过拟合。众多的实践研究说明ML方法的预测能力大部分情况下都强于线性模型
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论