协方差的计算公式推导
协方差(Covariance)是指统计学中用于衡量两个随机变量之间的线性关系程度的一种指标。它可以用于描述两个随机变量之间的关联性,即随着一个变量的变化,另一个变量的变化情况。
为了推导协方差的计算公式,我们首先定义两个随机变量X和Y,其对应的观测值分别为x和y。假设有n个观测值对(x₁,y₁),(x₂,y₂),...(xₙ,yₙ),我们可以计算出X和Y的均值分别为μX和μY,以及X和Y的标准差分别为σX和σY。
1.首先,我们定义X和Y的中心化变量。中心化是指将观测值减去它们的均值,即:
正则化协方差x̂=x-μX
ŷ=y-μY
2.接下来,我们计算中心化变量X̂和Ŷ的乘积。由于我们关注的是随机变量之间的线性关系,我们需要计算X̂和Ŷ的乘积的期望值,即:
E(X̂Ŷ)=Σ[(x-μX)(y-μY)]/n
3.将上式展开,我们可以得到以下结果:
E(X̂Ŷ) = Σ[(xy - xμY - yμX + μXμY)] / n
4.根据期望值的性质,我们可以将上式分解为四个部分相加的形式:
E(X̂Ŷ) = Σ[xy]/n - Σ[xμY]/n - Σ[yμX]/n + Σ[μXμY]/n
5.由于μX和μY分别是常数,我们可以将其提出来,并使用定义的均值:
E(X̂Ŷ) = Σ[xy]/n - μYΣ[x]/n - μXΣ[y]/n + nμXμY/n
6.我们再次使用定义的均值,并将中心化变量去除获得原始的X和Y:
E(X̂Ŷ) = Σ[xy]/n - μYnμX/n - μXnμY/n + nμXμY/n
7.化简上式后,我们可以得到:
E(X̂Ŷ) = Σ[xy]/n - nμXμY/n
8.最后,我们将中心化变量转化回原始的变量,得到:
E(X̂Ŷ) = Σ[xy]/n - μXμY
由于协方差的计算公式中的期望值和均值可以用样本的经验均值和样本均值来代替,并将总体的协方差和样本的协方差相等,因此协方差的计算公式可以表示为:
Cov(X, Y) = Σ[(x - x̄)(y - ȳ)] / n
其中,x̄是样本X的均值,ȳ是样本Y的均值,n是样本的个数。
需要注意的是,协方差的取值范围没有限制,可以为正、负或零,表示不同的关联性。当协方差为正时,表示X和Y呈正相关关系,即随着X的增加,Y也会增加;当协方差为负时,表示X和Y呈负相关关系,即随着X的增加,Y会减少;当协方差为零时,表示X和Y之间没有线性关系。
协方差是协方差矩阵中的一个元素,协方差矩阵是描述多个随机变量之间关系的矩阵,其中的对角元素是各个随机变量的方差,非对角元素是随机变量之间的协方差。
总结起来,协方差的计算公式用于衡量两个随机变量之间的线性关系程度,它可以通过求取两个变量观测值与各自均值的差值的乘积的期望值来获得,最后计算得到的是两个变量的协方差值。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论