选择性Logistic回归集成算法在P2P网贷信用评估的应用
正则化逻辑回归集成学习是近二十年来机器学习领域中热点研究问题之一,其原理是通过组合多个基学习器来提高模型的预测精度和稳定性(以下统称泛化能力)。理论分析表明,对于给定的分类任务,使用集成学习产生多个基分类器之后,在满足一定的条件下,从基分类器集合中选择一部分进行集成比使用所有基分类器进行集成有更好的泛化能力。
所以选择性集成学习成为该领域一个重要研究的内容。Logistic回归是学者们最常用的方法之一,因此本文将Logistic回归设计成选择性Logistic回归集成算法,一方面本文通过提高单模型的预测效果来提高集成学习后模型的泛化能力;另一方面,本文通过有选择地集成部分基学习器的结果进一步提高模型的泛化能力。
通过对大数据平台提供的网贷用户基本数据进行实证分析,并与Logistic回归单模型和GBDT进行对比研究,结果显示Logistic回归单模型、GBDT算法以及选择性Logistic回归算法十折交叉验证后AUC均值分别为0.585、0.600和0.601,且本文所建议的方法在稳定性上也优于其他两种算法。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。