LogisticRegression函数的各个参数意义API参数意义备注
LogisticRegression 的 parameters Penalty
Str类型,可选项为‘l1’和‘l2’,默认
为‘l2’,⽤来确定惩罚项的规范。‘newton-
cg’,‘sag’和’lbfgs’仅⽀持‘l2’惩罚
项。
惩罚项是⽤来添加参数避免过拟合,可以理解为
对当前训练样本的惩罚,⽤以提⾼函数的泛化能
⼒。
dual
布尔类型,默认为‘False’,dual仅仅
⽤在l2惩罚项的liblinear解法上。
Liblinear好像是线性多核,但不太清楚详
细意思。
tol
float类型,默认为‘1e-4’,表⽰满⾜
该精度时训练停⽌。
停⽌求解的标准,个⼈感觉应该是精度的
意思。
C
float类型,默认为‘1.0’,正则化系数
的倒数,取值必须为正浮点数。
例如在SVM中,值越⼩表⽰越强的正则
化。
fit_intercept
布尔类型,默认为‘Ture’,确定是否有
⼀个偏差或者截距应该被添加进决策函
数。
intercept_scaling
float类型,默认为‘1.’,仅在解
法‘liblinear’被使⽤且fit_intercept被
置为True。
class_weight
字典类型或’balanced‘,默认
为’None’,表⽰为各个类型样本的权
重。如果没有给定,所有类型的权重为
1。参数为‘balanced’则依照输⼊样本
的频率⾃动调整权重。
‘balanced’参数的情况下,会按照⽐例
调整⽐较多的类别的样本的权重降低,⽐
较少样本的类别的样本权重依⽐提⾼。random_state
int型,RandomState或None,默认
为‘None',仅在算法为 ‘sag’ 或
’liblinear’ 时使⽤。
solver
{’newton-cg’ , ‘lbfgs’,
‘liblinear’, ‘sag’, ‘saga’}, 分
别为⼏种优化算法。默认
为‘liblinear’。
网页float是什么意思--⼩数据集中,liblinear是⼀个好选
择,sag和saga对⼤数据集更快;
--多类别问题中,除了liblinear其它四种
算法都可以使⽤;
--newton-cg,lbfgs和sag仅能使⽤l2惩
罚项,liblinear和saga使⽤l1惩罚项。max_iter
int类型,默认为‘100’,仅适⽤于
newton-cg, sag和lbfgs算法。
表⽰算法收敛的最⼤次数。
multi_class
str类型,{‘ovr’, ‘multinomial’}为
可选参数,默认为‘ovr’,如果是⼆元
分类问题则两个选项⼀样,如果是多元分
类则ovr将进⾏多次⼆分类,分别为⼀类
别和剩余其它所有类别;multinomial则
分别进⾏两两分类,需要T(T-1)/2次分
类。
在多分类中,ovr快,精度低;
Multinomial慢,精度⾼。
verbose
int类型,默认为’0‘,为liblinear和
lbfgs算法设置⼀个任意正整数作为冗余
0表⽰不输出训练过程;
1表⽰偶尔输出;
⼤于1,每个⼦模型都输出
布尔类型,默认为’False‘,如果为
warm_start Ture,则使⽤上次的训练结果作为初始化
参数,否则擦除上次的训练结果。
对liblinear算法⽆效
n_jobs int类型,默认为‘1’,当
multi_class=‘ovr’ 时并⾏处理的CPU
核数量,当solver被设置为liblinear时不
论multi_class是否被设置都忽略此参数。
如果给定的值为-1表⽰所有的CPU核都被
使⽤。
API参数意义备注
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论