基于弹性网正则化Logistic回归的
上市公司财务预警研究□何胜美
【内容摘要】通过构建了基于弹性网正则化的Logistic回归财务预警模型,利用2017的50家和2018的41家被特别处理的制造业上市公司和其1ʒ1配对公司做实证研究。实证结果表明:弹性网正则化方法在上市公司被特别处理前三年能
较好的进行甄别,既在一定程度上克服了基于普通Logistic回归的财务预警模型的过拟合问题,也比L1正则化的
Logistic回归的财务预警模型有一定提升,在2017年训练集和2018年独立测试集上分别取得了0.930和0.805的
识别率。
【关键词】财务预警;弹性网正则化;Logistic回归
【基金项目】本文为广东省教育厅特创新项目“广东产业结构升级中的文化生产力研究”(编号:2016WTSCX079)成果。【作者简介】何胜美(1979 ),男,湖南邵阳人;广东金融学院金融数学与统计学院讲师;研究方向:高维复杂数据的统计建模
一、引言
随着我国资本市场的快速发展,上市公司质量日益受到重视。一旦公司出现财务危机,不仅会给企业本身带来巨大的经济损失,也会给投资者带来巨大的风险,因此,上市公司财务危机预警是备受国内外学者关注的研究议题。
财务预警典型方法有单变量分析法、多元判别分析、Lo-gistic回归分析和各种机器学习方法等。Logistic回归利用财务数据,计算发生财务危机的后验概率,结果具有明确的概率意义;且并不要求数据服从正态分布,因此有着广泛的应用和较好的效果[1]。
上市公司的财务指标数据维数较高,而且变量间的相关性较大,直接用于建模容易造成过拟合,因此选择合适的指标用于预警是重要环节。通常预警指标的选择分成两个步骤:一是根据经验选择一些有意义的财务指标用于建模分析,二是在具体Logistic回归建模过程中再进行二次指标筛选,选择有效的预警指标构成指标体系。指标的二次选择常用的方法有检验筛选、最优子集选择和逐步回归方法等等。但这些独立于模型的变量选择方法会带来巨大的计算成本,同时也很难从根本上克服过拟合现象,预警效果往
往被高估[2]。以LASSO为代表的正则化技术是近年来兴起的统计学习方法,它通过在优化模型中引入L1惩罚项,在模型参数估计过程中,将一些变量的系数收缩到零,从而实现在优化模型的同时进行变量选择[3],实践表明该方法能有效克服过拟合现象。例如刘遵雄等利用L1正则化Logistic回归模型建立财务预警模型,在优化模型的同时,进行预测指标的二次选择[4]。但这方法忽略了变量间的相关性,对于高相关的变量选择容易出现漏选或者错选的偏差[5]。弹性网正则化是在LASSO的L1正则化基础上,增加L2正则化项,能有效避免L1正则化的上述缺陷,提高模型的精度[5]。
由于我国上市公司的年报制度,上市公司被ST的时间与它年报时间基本平行,因此,利用被ST前一年的财务数据进行预测没有实际意义。过往研究通常采用被ST前两年或者三年的财务数据进行研究。而被ST前两年,公司财务已经出现亏损,对财务预警具有很大指导作用,从而导致预警效果被高估。因此,被ST前三年的财务数据构建的财务预警模型,更具有广泛的适应性。样本选择方面,过往研究多选取一定时间范围内的相应上市公司为总样本集合,然后随机分成训练集和测试集,分别训练模型和检验模型效果,从而导致很多模型存在使用当年样本建立模型,再来识别当年样本的情况[6]。然而财务预警的意义在于用当年样本建立模型对未来样本进行预判,过往样本设置往往会高估预警效果,同时也不符合财务预警的意图。
基于上述讨论,本文拟基于L1+L2惩罚项建立基于弹性网正则化Logistics回归模型的财务预警模型,并以2017年被ST的上市公司以及相应的配对公司为训练样本,建立预警模型,以2018年被ST的上市公司
及其配对样本为测试集,检测模型预警效果。
二、弹性网正则化的Logistic财务预警模型
(一)Logistic回归模型。从模式识别角度,财务危机预警是二分类问题。设上市公司财务指标向量为x i=(x i1,x
i2
,…,x
ip
)T
∈,其分类变量为y i∈{0,1},i=1,2,…n。其中,ST公司y i=1,正常公司y i=0。Logistics回归模型计算每个样本(x i,y i),i=1,2,…,n的y i=1后验概率
p(x
i
,β,β
)=P(y
i
=1|x
i
,β,β
)=
exp(β
+βT x
i
1+ex(β
+βT x
i
(1)其中,β=(β1,β2,…,βp)T是p维系数向量。是一般性,分别将(1,x i1,x i2,…,x i p)T和(β0,β1,β2,…,βp)T仍记为x i和β,则式(1)可表示为
p(x
i
,β)=P(y
i
=1|x
i
,β)=
exp(βT x
i
1+exp(βT x
i
(2)建立Logistics回归财务预警模型就是根据已有的财务样
本数据(x i ,y i ),i =1,2,…,n ,估计最优参数β=(β0,β1,
β2,…,βp )T
,极大似然估计等价于最小化如下问题:
β
^=argmin
β(β)=argmin β
-|1n ∑n
i =1[y i log (p (x i ,β)){
+(1-y i )log (1-p (x i ,β}
))]=argmin β
1n ∑n i =1[
y i
βT x i -log (1+e βT
x i {
}
)](3)
利用Newton -Raphson 迭代法,β的求解可以转化为下述迭代加权最小二乘方(IRLS ):
β
new
=argmin β
12n
∑n i =1w i (z i -x T
i β){
}
2
(4)
其中,
z i =x T i
β
+y i -p  (x i )
p  (x i )(1-p  (x i )
,w i =p  (x i )(1-
p  (x i ),i =1,2,…,n ,β 是上一步迭代结果。
(二)弹性网正则化Logistic 回归模型。Logistic 回归通
过计算样本所属类别的概率进行分类,
结果具有明确的概率意义,
容易给出经济学解释。同时,与线下回归不同,Logistic 回归无需正态性假设,因而是财务预警问题中
常用方法。但是,该模型对变量间多重共线性比较敏感。利用弹性网弹性网正则化对Logistics 模型进行约束,
得到以下模型β
=argmin β
{(β)+λP α(β)}
(5)
其中,(β)=-1n
∑n i =1[
y i βT x i -log (1+e βT
x i )],P α(β)=(1-α)
12‖β‖22+α‖β‖1=∑p j =1[12
(1-α)β2
J +α|βj |]
,0 α 1称为弹性网惩罚函数。当α=1时,P α(β)对应L1的Lasso 惩罚,在优化模型的同时,将部分系数βj 收缩到0,
从而实现变量选择的目的。当α=0时,P α(β)是桥回归惩罚,
将具有高相关的变量的系数趋向于相同。刘遵雄等利用L1正则化Logistic 回归模型建立财务预警模型,取得了较好效果[4]
(三)参数估计。将(β)在β=0
处泰勒展开得近似公式
(β)
正则化的回归分析≈(0)+β
T '(0)+β
T ᵡ(0)
=log (2)-1n (∑n i =1x i (y i -12))-12n βT (-14
∑n
i =1x i x T i )β
=
8n ∑n i =1(y  i -βT x i )2
+log (2)-8∑n
i =1y  2i =
8
Q
(β)+C (6)
其中,y  i =y i -0.516,Q (β)=1n ∑n i =1
(y  i -βT x i )2,C =log (2)-8∑n i =1y  2
i 是与β无关的常数。因此,问题(5)等价于下列问题的求解
min β
{Q (B )+λP α(β)}
(7)表1
财务预警指标表
类型名称
符号类型名称
符号每股指标
每股收益X 1每股净资产X 2每股营业收入X 3每股营业利润
X 4每股资本公积金X 5每股盈余公积金X 6每股公积金X 7每股未分配利润X 8每股留存收益
X 9每股经营活动现金流量X 10每股净现金流量
X 11营运能力
营业周期(天/次)X 26存货周转率(次)X 27存货周转天数(天/次)X 28应收账款周转率(次)X 29应收账款周转天数(天/次)X 30应付账款周转率(次)X 31应付账款周转天数(天/次)X 32流动资产周转率(次)X 33固定资产周转率(次)X 34股东权益周转率(次)X 35总资产周转率
X 36资产结构
盈利能力
资产负债率
X 12非流动资产/总资产X 13固定资产比率
X 14股东权益/全部投入资本X 15权益乘数X 16营运资金
X 17净资产收益率X 18资产报酬率X 19资产净利率X 20投入资本回报率X 21销售净利率X 22销售成本率
X 23营业总成本/营业总收入X 24净利润
X 25
成长能力
偿债能力
每股收益增长率X 37营业收入增长率X 38净利润增长率X 39净资产增长率
X 40资产总计相对年初增长率
X 41流动比率X 42速动比率X 43产权比率
X 44股东权益/负债合计X 45有形净值债务率
X 46经营净现金流量/负债合计X 47经营净现金流量/流动负债
X 48
(7)是基于弹性网正则化的线性回归问题,Zou和Hastie 做了详细研究[5],本文采用其中算法求解,故而不再详细说明。
三、上市公司财务预警实证研究
本文采用我国沪深两市部分上市公司为样本,建立基于弹性网正则化的Logistic回归模型展开实证研究。并将它与普通Logistic回归和L1正则化的Logistic回归财务预警模型结果做比较分析。
(一)样本和指标的选择和数据的预处理。我国财务预警研究中财务危机通常定义为上市公司因财务状况异常而特别处理,称为ST公司。研究中我们从2017年到2018年间被ST的上市公司作为财务危机公司样本,其中2017年50家和2018年41家。根据规模、时段相当的原则,1:1比例选取同时段的财务正常的公司作为配对样本。财务数据主要来自各公司每年公布的年报,锐思数据库上市公司财务指标分析数据库获得。由于我国上市公司的年报制度,上市公司被ST的时间与它年报时间基本平行,根据财务预警的有效性,选取上市公司首次被ST的前3年的财务数据进行分析。如果公司第T年被特别处理(ST),
则选取T-3年的财务数据。
财务指标的选择方面,本文综合国内外相关文献选取指标基础上,借鉴方匡南等[7],根据可比性、可测性和全面行的原则,选择了反映上市公司盈利能力、偿债能力、成长能力、营运能力、每股指标和资产结构等方面的48个财务指标(表1)。
为保持数据的完整性和指标对整体预警的影响,对于样本数据中的缺失值,我们采用采用样本的平均值来代替。同时,对数据进行标准化,具体公式为:
x*=x-μ
σ
(8)
其中μ为训练样本关于该指标的样本均值,σ为相应的样本标准差。对于测试集指标标准化时,每个指标的均值和标准差均采用训练样本的均值和标准差。
(二)预警结果与分析。实验中,我们以2017年的ST公司和配对的正常公司样本做为训练集(共100个样本),估计最优参数,得到最优的预警模型。2018年的ST公司和配对的正常公司样本共82个样本作
为独立测试集,检验模型在新的数据集上的预警效果。弹性网正则化Logistic回归参数估计用R软件编写程序实现。优化问题(7)中的参数λ和α均利用10-折交叉验证确定。为了做横向比较,我们建立普通的Logistic回归分析和L1正则化的Logistic回归的财务预警模型。
上述48个财务指标进行相关性分析,结果表明上市公司各财务指标之间存在高相关性。例如,每股资本公积金和每股公积金,计算可得Pearson相关系数为0.992,相关性检验p值几乎为零,在0.05显著性水平下相关。销售净利率、营业周期和存货周转天数三个财务指标,两两相关系数分别为0.914,0.922和0.999,表现为高相关性。上市公司财务指标之间相关关系错综复杂,普通Logistic回归不具有变量选择功能,高相关性给相应的财务预警效果带来很大影响。而基于L1正则化的Logistic回归模型具有较好的指标选择功能,实验中共有7个指标进入模型,分别为每股净资产、每股营业利润、每股未分配利润、每股留存收益、经营净现金流量/负债合计、每股收益和应收账款周转天数。由于考虑L2惩罚项,基于弹性网正则化的Logistic回归模型在进行变量选择的同时,让具有相关性的变量的系数趋向于相近。因此,基于弹性网正则化的Logistic回归财务预警模型选择了更多的财务指标,只有5个财务指标没有入选。变量选择而言,L1正则化的财务预警模型具有更好的解释性。
统计三种模型在2017年的训练集上的识别率和2018年的测试集上的识别率,结果如表2。
表2三种方法的财务预警效果
方法
20172018
正常公司ST公司识别率正常公司ST公司识别率
Logistic回归模型5050  1.00024290.646 L1正则化的Logistic回归模型35420.77028350.768弹性网正则化的Logistic回归模型45480.93029370.805
表2结果表明,Logistic回归财务预警模型采用全变量进行预测,在2017年训练样本的回测上取得了非常好的效果,所有正常公司和ST公司都能正确识别。但是,在2018年新样本的识别上,总体上只取得了0.646的识别率,出现了明显的过拟合现象。L1正则化Logistic模型通过选择合适的变量,从一定程度降低了过拟合现象,在2018年测试集上的识别率提升到了0.768。而基于弹性网正则化的Logistic回归的财务预警模型,变量选择时考虑了财务指标间的相关性,在2017年的训练样本和2018年的测试样本上的正确识别率分别为0.930和0.805。一方面一定程度上克服了过拟合现象,2018年测试集上的识别率远高于Logistic回归模型;另一方面,相比于L1正则化的Logistic回归模型,弹性网正则化的Logistic回归模型虽然选择了更多的财务指标,模型的可解释性有所下降,但是在训练集和测试集上识别率都有大幅提升。
四、结语
Logistic回归模型已广泛应用于上市公司财务预警研究当中,但传统的方法对多重共线性非常敏感,容易造成过拟合现象,因而泛化能力差。L1正则化的Logistic回归模型应用于财务预警,能够有效的选择财务指标。但是由于L1正则化项的缺陷,往往忽略了财务指标间的相关性,在一定程度上造成错选或者漏选,从而限制了模型的预警效果。本文构建了弹性网正则化Logistic回归的财务预警模型,通过在优化模型中引入L1+L2正则化项,在模型参数估计过程中,将一些变量的系数收缩到零,从而实现在优化模型的同时进行变量选择,又充分考虑了财务指标的相关系。实证结果表明该方法能有效克服过拟合现象,在训练集和测试集上都取得了很好的识别效果,分别为0.930和0.805。
【参考文献】
[1]Altman,E.,FinancialRatios,Discriminate Analysis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,23(4):578 609
[2]吴星泽.财务危机预警研究:存在问题与框架重构[J].会计研究,2011,2:61 67,99
[3]Tibshirani,R.Regression Shrinkage and Selection via the Lasso[J].Journal of theRoyal Statistical Society Series B(Statis-tical Methodology),1996,58(1):267 288[4]刘遵雄,郑淑娟,秦宾等.L1正则化Logistic回归在财务预警中的应用[J].经济数学,2012,29(2):106 110
[5]Zou,H.Trevor.Regularization and Variable Selection via the Elastic Net[J].Journal of theRoyal Statistical Society.Series B (Statistical Methodology),2005
[6]王甜,基于Probit与SVM组合模型的上市公司财务危机预警研究[D].上东大学,2019
[7]方匡南,范新妍,马双鸽.基于网络结构Logistic模型的企业信用风险预警[J].统计研究,2016,4:50 55
不同溶剂回收工艺流程的控制运行效果比较
□吴济川
【内容摘要】溶剂萃取是化工行业常用的工艺流程之一,为满足各国政府对化工厂健康、安全和环境的相关要求,需要对萃取塔尾料中含有的溶剂进行回收再利用。汽提塔是将溶剂从进料中回收再利用的柱状装置。为了保证汽提塔的运行
效果,须控制塔内泡沫密度、柱内液面、塔底液体流速三个变量在合理的范围内。本文对两种典型的脱沥青溶剂回
收工艺流程进行了比较分析,并在总体运行,控制要求相同的条件下,以PID控制原理为基础,建立了两套对应的
控制模型,随后通过Matlab软件检验了不同工艺流程控制模型的正确性和有效性,并对比给出了相应的结论。【关键词】溶剂回收;汽提塔;PID;Matlab
【作者简介】吴济川(1987.8 ),男,湖北人;中国原子能工业有限公司工程师;研究方向:核化工
溶剂萃取原理是利用物质在两种互不相溶的溶剂中溶解度的不同,使溶质物质从一种溶剂内转移到另外一种溶剂中,从而达到分离提纯的目的。在溶剂脱沥青的过程中,会将化学萃取溶剂注入萃取塔中以使沥青中的固体颗粒变稠,进而通过重力作用移动到萃取塔底部形成含有水、细小固体和溶剂组成的尾料,该尾料进一步作为汽提塔的上游进料,同水蒸汽混合后通过喷嘴进入塔内,经过一系列气液平衡过程后,进料中绝大多数溶剂会以气体形式扩散到塔顶出口,并进一步通过冷凝被回收。为了让汽提塔内的反应平稳、安全、高效地进行,需要确保控制量在合理的范围内。
一、工艺流程
从安全、经济、环保的角度来看,有效控制溶剂汽提器的液面高度能够使更多的溶剂从进料中分离出来,实现循环利用。液面高度由下游泵的转速和进料速度共同决定。
蒸汽和进料的混合物从塔顶进入汽提塔,进料过程中会产生泡沫。塔内的泡沫密度由一个带有核级密度测量元件的控制器(DIC)测量。如果该元件在汽提塔内有多处感应器,如果感应器在泡沫层中,便会得到泡沫的实际值,否则测量值为液体平均密度(1ton/m3)或空气密度(1.293kg/m3)。
液位测量由带有相应传感器的控制器(LIC)完成。其中,工艺流程1中的液位测量由两个相同的控制器串联而成。液位控制器会将实时信息传输到对应的流速控制器(FIC)中,流速控制器会根据实时数据自动调节稀释水阀门开度或下游泵的转速,由于进料中含有相当数量的细小固体,物料进入泵之前时需要保持一定的速度,使泵不与固体颗粒发生过度摩擦,该控制要求可通过稀释水阀门调节稀释水流速来实现。
综上所述,为保证汽提塔的高效运转,以下控制目标需要满足:泡沫密度设定值为:250kg/m3;液位高度设定值应为汽提塔总高的65% 80%;泡沫密度控制回路运行周期为:30 45分钟;液位控制运行周期约为4分钟;下游水流速度不低于650m3/h。
对应的两套工艺流程图如图1所示。
DIC控制器,泡沫密度测量。
LIC1控制器,塔内液面高度测量,设定值在汽提塔总高的65% 80%之间。
LIC2控制器,塔内液面高度测量,设定值为控制器LIC1控制器设定值+3%。
FIC1控制器,稀释水流速测量。
FIC2控制器,下游液体流速测量,液体最低流速设置为650m3/h。
DIC控制器,泡沫密度测量。
LIC3控制器,测量塔内液面高度测量,设定值在汽提塔总高的65% 80%之间,且直接控制下游水泵的流速。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。