机器学习——随机森林,RandomForestClassifier参数含义详解1.随机森林模型
1 clf = RandomForestClassifier(n_estimators=200, criterion='entropy', max_depth=4)
2 rf_clf = clf.fit(x, y.ravel())
RandomForestClassifier函数的参数含义详解:
max_features:随机森林允许单个决策树使⽤特征的最⼤数量。 Python为最⼤特征数提供了多个可选项。下⾯是其中的⼏个:
Auto/None :简单地选取所有特征,每颗树都可以利⽤他们。这种情况下,每颗树都没有任何的限制。
sqrt :此选项是每颗⼦树可以利⽤总特征数的平⽅根个。例如,如果变量(特征)的总数是100,所以每颗⼦树只能取其中的10个。“log2”是另⼀种相似类型的选项。
0.2:此选项允许每个随机森林的⼦树可以利⽤变量(特征)数的20%。如果想考察的特征x%的作⽤,我们可以使⽤“0.X”的格式。
n_estimators:在利⽤最⼤投票数或平均值来预测之前,你想要建⽴⼦树的数量。较多的⼦树可以让模型
有更好的性能,但同时让你的代码变慢。你应该选择尽可能⾼的值,只要你的处理器能够承受的住,因为这使你的预测更好更稳定。
其他参数还包括决策树模型的系列参数。正则化随机森林
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论