财经管理
bootstrap检验方法
Bootstrap在商业银行资产负债评价中的运用
金明1寇莉2俞高1
(1.成都信息工程大学统计学院,四川成都610103;.成都信息工程大学商学院,四川成都610103)
摘要:Bootstrap方法是一种利用样本信息来估计总体的非参方法,聚类分析方法是将样本或变量进行归类评价的一种多元统计方法。基于boot strap抽样法和系统聚类技术对我国部分商业银行的资产负债况进行分析,聚类结果将各个商业银行的资产负债情况分为3类。
关键词:boot strap;聚类分析;商业银行;资产负债
中图分类号:F83 文献标识码:A doi:10. 19311/jki. 1672-3198. 2016. 33. 104
1引言
自E f r o n首次提出Bootstrap以来,在众多统计学家贡献下,bootstrap统计方法得到了充分的发展,尤其是在计算机技术发达的今天,bootstrap变得更加容易实现。就bootstrap方法的基本原理,Efron、Tibs
hira-ni、DiCiccio等曾作详细的论述。国内学者对bootstrap 的研究也取得一定的成绩,施锡铨在上世纪九十年代论述过独立同分布数据的bootstrap逼近方法。更多的国内学者是运用bootstrap方法做实证分析,如赵亮、程锦秀等把bootstrap运用到生物学研究上,孙佳美、段白鸽利用该方法做死亡模型检验的研究,刘勤、金丕焕推广了bootstrap法在医学统计上运用。
国内学者对商业银行的研究主要集中于银行的效率分析,如魏煜、张建华、姚树洁、朱南、郑录军等对此作有详细的论述,详见参考文献。另外一些学者重点研究了我国商业银行的信用风险的评估问题,沈沛龙、王春峰、唐国储等在这个方面作出贡献。后来的学者也在继续关注着这些领域。涉及商业银行收益研究的国内文献并不多见,张铁铸曾从银行贷款的多元化角度研究银行风险、收益与之的关系;于研、孙磊运用S F A方法探索银行收益结构与银行效率的相关性;蒲勇健、李绍芳考察研究了金融衍生品对商业银行收益的影响;王 连则运用了非参数统计手段研究了信用卡的信用额度变化与银行收益的关系;黄陈曾将我国商业银行收益水平作国际比较并归纳出商业银行收益的四个层次。银行的收益水平是投资者关注的重要指标之一,而银行资产负债情况正能反映银行经营状况,所以继续对此进行深入研究有着重要的现实意义。本文,笔者尝试利用多元统计技术并借助bootstrap方法来剖析我国商业银行的资产负债,分析各银行经营收益。
2银行资产负债评价方法
2.1 B O O T S T R A P
Bootstrap方法是一类非参数M o n t e C a r l o方法,其基本思想是根据样本的经验信息(分布)通过又放回的简单随机抽样获得B个bootstrap样本,进而利用这些Bootstrap样本信息进行统计推断。其中B o o­st r a p 样本容量依然和原样本一致,且观测值被抽到的概率相等。当目标总体未指定的情况下,Boot strap方法经常被使用,此时样本为唯一已有的信息。
Bootstrap方法的基本步骤为,假设x二(X1,X2,…,X n)为已知的一个样本,来自未知分布F d X*为从x中随机抽取的一个样本,通过有放回的抽样得到样本X f,…,X n%显然X f,…,X,服从{X1,…,X n}上的均勻分布,P(X*=^)=丄,丨=1,…,n。我们抽取简单子
n
样本X n= (X f,X f,…,X f),该样本为一个Boot­strap 子样本。进行B 次抽样,就可以得到B 个Boot­strap 样本。
另外,Bootstrap方法需借助计算机完成大量的模拟计算,通过足够多的重复抽样可以把样本均值的Bootstrap分布出来,进而进行统计推断。
2.2聚类分析
聚类分析思想是根据已知数据,观察各样品或变量之间亲疏关系的相似程度,依照某种准则,把一些
相似程度较大的样品或变量聚合为一类,把另外一些相似程度较大的样品或变量聚合为另外一类,使同一类内差别较小,而类与类之间的差别较大,最终将观察样品或变量分为若干类。
聚类分析中需要进行相似性度量,通常用距离来衡量哪些样本应该聚为一类。我们假设有n个样本单位,每个样本测有p个指标(变量),每个样本都可以看成p维空间中的一点,n个样本就是p维空间中的n个点,第i个样本与第j个样本之间的距离记为d j聚类过程中,相距较近的点归为一类,相距较远的点归为不同的类。其中dj满足条件:
dij>0对一切的i和j成立,且仅当i=j时d y^Q;
d^二dij对一切的i和j成立;
d j<d k+dkj对于一切的i和j成立。
聚类中常用的距离有明氏(M i n k o w s k i)距离,马氏距离,具体的聚类的方法有系统聚类、模糊聚类、K均
基金项目:全国统计科学研究计划重点项目(2013L X13);成都信息工程学院中青年学术带头人科研基金项目(201420)统计 信息技术与数据挖掘重点开放实验室(S D201501)。
作者简介:金明(1977 —),男,安徽桐城人,成都信息工程大学统计学院教授,高级统计师,研究方向:统计学、博弈论;寇莉 (980—),四川达州人,成都信息工程大学商学院讲师,硕士,研究方向:电子商务;俞高(986 —),男,安徽合肥人,成都信息工程大学硕士研究生,研究方向:统计学。
218 现代商贸工业 2016年第33期
现代商贸工业
值聚类等等,其中系统聚类中常用的方法有最短距离法、最长距离法、中间距离法、重心法、离差平方和法等。综合考虑到数据是跨时间的面板数据,本文选用离差平方和法聚类。
3实例分析
3.1数据描述
商业银行的收益情况可以由其资产负债表反映出来,考虑到数据的可得性,本文选取了包括五大国有商业银行、中兴(C I T I C)、光大(C E B)、兴业(I B C)、浦发(S H A N G)、招商(C M B)、宁波商业银行(N C B)、深发展(S H E N G)、华夏(H X B)、民生银行(C M B C)在内的14 家银行作为研究对象,选取了2002年至2008年间银
行的其他收入财产、总收入财产、固定资产、无收益资产、总资产、存款及短期资金、其他债券、其它免息财产、资产净值、总负责及股东权益、资产负债平衡、坏账准备金、流动性资产等13个指标考察各商业银行的收益水平情况。为消除部分数据缺失造成的影响,笔者在原有数据基础上采用Bootstrap方法,对原始数据进行重抽样计算得到各商业银行的13个指标的均值,简 记指标名依次为C O L1 — C O L13,具体数据见图1.
BANKS fCOLl C0L2C0L3C0L400L5 1C0L600L7C0L800L9IC0L10c o m C0L12C0L13 ICBC3057239645266233795. 09113S61.266501191 642264841512. 31 i 145509.240663.3216650119637m 4327170. 2995828.6 BOC23S5475469539935402. 28m^i.349723S3 42574〇e S1139. 32 302450.63313G5.7 4972S631247785111000. 31493^7.5 NCB124944.0350033. 71314.3812716. 40751619.5146043.^51441. 957E39. 9^43593.588151619.517435. 993i5.5m1575.6 CCBC121S4226472062854329. 33154754* 749297121 455222747059. 35 90906* 49252423.94929712858924,292789.4126045. 32 1186S960449124476394, 25141909.5470954844301348685.15118916扎 3S〇e〇9.43 2150507192320,e281337. 9367090.2 CITIC1262479. 7660175.47227.86910493.27677896.51620993*19083. 32218696.59225607. 94t 523548. 5229890.S54982.138240. 802 BCC1679494. 4147853425371.1730012,31533917! 138004454084.6
3122998.676453.6511533917279423.5122243. 33262582.3 CEB1217024.1521694.74494.55420S18.8546808.1120039.1411939. 8511685.07410614. 721 546808.1123982.515446.13100342.2 IBC253799. 8526299.23279.8566622. 642536201.71480390.232753.7617122.97719958. 311536201.792781. 425140.295102488.3 SH A N G2461S7. 9639308.75185.44710668.39555662.51605778.412828. 07116427.4420623. 641 6556S2. 51S4228.310741. 54130752.2 CHB350013832707.67S74.7798E61D21788114.219718. 45; 10911.7340T50.S5610215S T33.E13776.3836257.01 HXB[17S99S. 1398831.539219213875. 267406631. 61379781.812421.225426.26512130. 28t 406631. 61024965602* 0033538. 413 SH EN G190918*75259189.22188* 47341S9. 862265567.52525762658,2413311 M37694. 2451265567, 599217. 87l 4S42+ 5553S657.22 C M BC1221216.76C3121.24580*1027436. &53615137.9156828 L 918193. 2216653.24323970. 061615137.91239351 5S15+ 0S63491. 316
图1 Bootstrap法估计的13个指标均值
3.2结果分析
我们采用和离差平方和法利用S A S软件将14个商业银行的资产负债结构进行聚类分析,最终将其分为三个类别。运行以下S A S语句可以得到聚类的树状图以及分类结果。
proc cluster data=banks m e t h o d^w a r d ccc pseu­d o;
var col1 — coll3 ;
id b a n k s;
r u n;
proc tree horizontal ncl=3out=out;/ * out 为分类结果输出数据*/
id b a n k s;
r u n;
聚类树状图如图2所示:
从上图可以看出商业银行分类结果为:一类银行为中国工商银行,二类为中国银行、中国建设银行、中 国农业银行,其他的10个银行归为三类。正与S A S输出结果o u t数据完全吻合。O u t结果见表1。
表1聚类输出结果*12345678
BAN KS CLU STER CLU SN AM E BAN KS CLU STER CLU SN AM E
SH AN G 1CL4CEB 1CL4
CMBC 1CL4CMB 1CL4
CITIC 1CL4BOC 2CL3
IBC 1CL4CCBC 2CL3
HXB 1CL4BCC 1CL4
NCB 1CL4ABC 2CL3
SHENG 1CL4ICBC 3ICBC 对比聚类结果,可以发现部分的指标有减少的趋
势。其中中国工商银行大部分指标都高于其他商业银
行,一定程度说明了工行的优势地位。1类商业银行较
工行存在不小差距,需要完善其资产负债的合理性。
本文基于Bootstrap—聚类分析对商业银行的资产负债
进行初步的分类,必须意识到各个商业银行都在发展
中,该分类不是一劳永逸的。在此分类基础上,我们还
可以进一步挖掘资产负债与银行盈利能力、金融稳定
性等的关系。而且,随着时间的发展,我们还可以引入
时间序列分析方法,进行多指标时间序列聚类。
参考文献
[1] Efron Bradley.Bootst rap methods :another look a t the jackknife
[J].The Annals of Statistics,1979,7(1) :1-26.
[2] Efron Bradley,Tibshirani Robert.An introduction to the boot-
strap[M].New York:Chapman &Hall Ltd,1993.
[3] Thomas J.DiCiccio and Bradley Efron.Bootstrap Confidence In-
tervals[J].S t a t i s t i c a l Science,1996,11).
[4] 施锡铨.独立非同分布情况的光滑Bootstrap逼近[J].数学物
学报,1990,10).
[5] 赵亮,程锦秀.Bootstrap方法及其在生物学研究中的应用[]
川动物,2010,(29).
[6] 孙佳美,段白鸽.Bootstrap方法在死亡模型中的应用[J].统计
究,2010,(6).
[7] 刘勤,金丕煥.Bootstrap方法及其在医学统计中的应用[].中
预防医学杂志,1998,1(32):1.
[8] 谢益辉,朱钰.Bootstrap方法的历史发展和前沿研究[].统计
信息论坛,2008,(2) :90-96.
现代商贸工业 2016年第33期
219

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。