最近在学习过程中学习了Copula函数,在看了一些资料的基础上总结成了本文,希望对后面了解该知识的同学有所帮助。本文读者要已知概率分布,边缘分布,联合概率分布这几个概率论概念。我们为什么要引入Copula函数?当边缘分布(marginal probability distribution)不同的随机变量(random variable),互相之间并不独立的时候,此时对于联合分布的建模会变得十分困难。此时,在已知多个已知边缘分布的随机变量下,Copula函数则是一个非常好的工具来对其相关性进行建模。什么是Copula函数?copula这个单词来自于拉丁语,意思是“连接”。最早是由Sklar在1959年提出的,即Sklar定理:以二元为例,若 H(x,y) 是一个具有连续边缘分布的 F(x) 与 G(y) 的二元联合分布函数,那么存在唯一的Copula函数 C ,使得 H(x,y)=C(F(x),G(y)) 。反之,如果 C 是一个copula函数,而 F 和 G 是两个任意的概率分布函数,那么由上式定义的 H 函数一定是一个联合分布函数,且对应的边缘分布刚好就是 F 和 G 。Sklars theorem : Any multivariate joint distribution can be written in terms of univariate marginal distribution functions and a copula which describes the dependence structure between the two variable.Sklar认为,对于N个随机变量的联合分布,可以将其分解为这N个变量各自的边缘分布和一个Copula函数,从而将变量的随机性和耦合性分离开来。其中,随机变量各自的随机性由边缘分布进行描述,随机变量之间的耦合特性由Copula函数进行描述。
text函数什么意思换句话说,一个联合分布关于相关性的性质,完全由其Copula函数决定。如果已知 H , F 和 G ,则Copula函数可以表达为:C(u,v)=H(F^{-1}(u),G^{-1}(v))\\这里 F^{-1}(u) 代表 F(u) 的反函数,或者叫CDF的逆变换、逆累积分布函数。Copula理论的数学表达假设 X_1,X_2,...,X_N 是 N 个随机变量,它们各自的边缘分布分别为 F_1(x_1), F_2(x_2),...,F_N(x_N) ,它们的联合分布为 H(x_1,x_2,...,x_N) ,则存在一个将边缘分布和联合分布“连接”起来的函数 C(\cdot) ,使得:H(x_1,x_2,...,x_N)=C(F_1(x_1),F_2(x_2),...,F_N(x_N))\\而根据边缘分布的CDF的逆变换,即 x_i=F_i^{-1}(u_i)(i=1,2,...,N) ,则可以得到Copula函数的表达形式:C(u_1,u_2,...,u_N)=H[F^{-1}(u_1),F_2^{-1}(u_2),...,F_N(x_N)]\\补充知识:概率积分变换(Probability Integral transform)在概率论中,概率积分变换(也称为均匀的普适性)是指将任意给定连续分布的随机变量的数据值转换成具有标准均匀分布的随机变量的结果。简单解释一下概率积分变换[1]:如果 X_1 和 X_2 都是随机变量(Random Variables,RV),而 U_1 、 U_2 分别是二者的累计概率分布函数,即 U_1=F(X_1),U_2=F(X_2)那么:U_1 和 U_2 都服从均匀分布, U_1\sim Uniform(0,1),U_2\sim Uniform(0,1)简要的数学证明如下:F_u(u)=P(U\le u)=P(F(x)\le u)=P(F^{-1}(F(x))\le F^{-1}(u))\\=P(x\le F^{-1}(u))=F
(F^{-1}(u))=u换句话说,任何边际分布的CDF值都均匀分布在区间[0,1]上。如果从任意分布中随机抽取,那么抽取该分布的最大值(U=1)的概率与抽取可能的最小值(U=0)或中值(U= 5)的概率相同。而copula实际上是它所建模的随机变量的CDFs的联合分布。补充知识:概率积分变换的图象说明[2]首先我们可以生成均匀分布的随机变量 x :%matplotlib inlineimport seaborn as snsfrom scipy import statsimport matplotlib.pyplot as pltx = stats.uniform(, 1).rvs(10000)sns.distplot(x, kde=False, norm_hist=True);
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论