Java教程

概率论与数理统计(4):随机变量的数字特征

本文主要是介绍概率论与数理统计(4):随机变量的数字特征,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

概率论与数理统计(4):随机变量的数字特征

文章目录

  • 概率论与数理统计(4):随机变量的数字特征
    • 一.数学期望
          • 引例:
          • 频率与概率
      • 1.离散型随机变量
        • ①定义
        • ②常见期望
          • 证明:
            • 两点分布
            • 二项分布
            • 泊松分布
        • ③离散型随机变量函数的数学期望
          • (1)一维
          • (2)二维
      • 2.连续型随机变量
        • ①定义
        • ②常见期望
          • 证明:
            • 均匀分布
            • 指数分布
            • 正态分布
        • ③连续型随机变量函数的数学期望
          • (1)一维
          • (2)二维
      • 3.性质
          • 证明:
            • 性质(3)
            • 性质(4)
    • 二.方差
          • 引例
      • 1.定义
        • 计算:
      • 2.性质
          • 证明
            • 性质(3)
      • 3.**==常用随机变量期望、方差汇总==**
    • 三.协方差
          • 引入
      • 1.定义
        • 计算:
      • 2.性质
    • 四.相关系数
      • 1.定义
      • 2. ρ 的 性 质 \rho的性质 ρ的性质
          • 定义:
      • 3.X,Y不相关的等价条件
    • 五.矩
    • 六.总结

一.数学期望

引例:
img
频率与概率

​ 设对某一随机现象进行了n次试验与观察,其中A事件出现了m次,即其出现的频率为m/n。经过大量反复试验,常有m/n越来越接近于某个确定的常数(此论断证明详见伯努利大数定律)。该常数即为事件A出现的概率,常用P (A) 表示。

1.离散型随机变量

①定义

​ 设离散型随机变量X的分布列 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,\qquad k=1,2,... P{X=xk​}=pk​,k=1,2,...

​ 若级数 ∑ k = 1 ∞ x k p k \sum\limits_{k=1}^{\infty}x_kp_k k=1∑∞​xk​pk​绝对收敛,则称级数 ∑ k = 1 ∞ x k p k \sum\limits_{k=1}^{\infty}x_kp_k k=1∑∞​xk​pk​为X的数学期望(简称期望)或均值,记为E(X) or EX,即
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int^{\infty}_{-\infty}xf(x)dx E(X)=∫−∞∞​xf(x)dx

​ 数学期望 E ( X ) E(X) E(X)完全由随机变量 X X X的概率分布所确定,若 X X X服从某一分布,也称 E ( X ) E(X) E(X)是这一分布的数学期望

②常见期望

分布类型符号表示数学期望
两点分布 X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p) E X = p EX=p EX=p
二项分布 X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p) E X = n p EX=np EX=np
泊松分布 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) E X = λ EX=\lambda EX=λ
证明:
两点分布

​ 设 X X X的分布列为 P { X = 1 } = p , P { X = 0 } = 1 − p = q P\{X=1\}=p,P\{X=0\}=1-p=q P{X=1}=p,P{X=0}=1−p=q,则 E X = 0 ⋅ ( 1 − p ) + 1 ⋅ p = p EX=0\cdot(1-p)+1\cdot p=p EX=0⋅(1−p)+1⋅p=p

二项分布

​ 设 X ∼ B ( n , p ) , X\sim B(n,p), X∼B(n,p),即 X X X的分布列为 P { X = k } = C n k p k q n − k , k = 0 , 1 , ⋯   , n , 0 < p < 1 , q = 1 − p P\{X=k\}=C_n^kp^kq^{n-k},k=0,1,\cdots,n,0<p<1,q=1-p P{X=k}=Cnk​pkqn−k,k=0,1,⋯,n,0<p<1,q=1−p,则:
E X = ∑ k = 0 n k C n k p k q n − k = ∑ k = 1 n n ! p k q n − k ( k − 1 ) ! ( n − k ) ! = n p ∑ k = 1 n ( n − 1 ) ! ( k − 1 ) ! ( n − k ) ! p k − 1 q n − k = 令 m = k − 1 n p ∑ m = 0 n − 1 C n − 1 m p m q n − 1 − m = n p EX=\sum_{k=0}^nkC_n^kp^kq^{n-k}=\sum_{k=1}^n\dfrac{n!p^kq^{n-k}}{(k-1)!(n-k)!}=np\sum_{k=1}^n\dfrac{(n-1)!}{(k-1)!(n-k)!}p^{k-1}q^{n-k}\xlongequal{令m=k-1}np\sum_{m=0}^{n-1}C_{n-1}^mp^mq^{n-1-m}=np EX=k=0∑n​kCnk​pkqn−k=k=1∑n​(k−1)!(n−k)!n!pkqn−k​=npk=1∑n​(k−1)!(n−k)!(n−1)!​pk−1qn−k令m=k−1 npm=0∑n−1​Cn−1m​pmqn−1−m=np

泊松分布

​ 设 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ),即 X X X的分布列为 P { X = k } = λ k k ! e − λ , k = 0 , 1 , 2 , ⋯   , λ > 0 P\{X=k\}=\dfrac{\lambda^k}{k!}e^{-\lambda},k=0,1,2,\cdots, \quad \lambda>0 P{X=k}=k!λk​e−λ,k=0,1,2,⋯,λ>0,则
E X = ∑ k = 1 ∞ k λ k k ! e − λ = λ e − λ ∑ k = 1 ∞ λ k − 1 ( k − 1 ) ! = λ e − λ ( 1 + λ + 1 2 ! λ 2 + ⋯ + 1 n ! λ n + ⋯   ) = λ e − λ e λ = λ EX=\sum_{k=1}^{\infty} k\dfrac{\lambda^k}{k!}e^{-\lambda}=\lambda e^{-\lambda}\sum_{k=1}^{\infty}\dfrac{\lambda^{k-1}}{(k-1)!}=\lambda e^{-\lambda}(1+\lambda+\dfrac{1}{2!}\lambda^2+\cdots+\dfrac{1}{n!}\lambda^n+\cdots)=\lambda e^{-\lambda}e^{\lambda}=\lambda EX=k=1∑∞​kk!λk​e−λ=λe−λk=1∑∞​(k−1)!λk−1​=λe−λ(1+λ+2!1​λ2+⋯+n!1​λn+⋯)=λe−λeλ=λ

③离散型随机变量函数的数学期望

(1)一维

设离散型随机变量X的分布列为 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,\qquad k=1,2,... P{X=xk​}=pk​,k=1,2,..., Y = g ( X ) Y=g(X) Y=g(X),则:

E Y = E g ( X ) = ∑ i g ( x i ) p i EY=Eg(X)=\sum\limits_{i}g(x_i)p_i EY=Eg(X)=i∑​g(xi​)pi​

(2)二维

设二维离散型随机变量 ( X , Y ) (X,Y) (X,Y)的分布列为 P { X = x i , Y = y i } = p i j , i , j = 1 , 2 , . . . P\{X=x_i,Y=y_i\}=p_{ij},i,j=1,2,... P{X=xi​,Y=yi​}=pij​,i,j=1,2,..., Z = g ( X , Y ) , Z=g(X,Y), Z=g(X,Y),则 E Z = E g ( X , Y ) = ∑ i ∑ j g ( x i , y j ) p i j EZ=Eg(X,Y)=\sum\limits_{i}\sum\limits_{j}g(x_i,y_j)p_{ij} EZ=Eg(X,Y)=i∑​j∑​g(xi​,yj​)pij​

2.连续型随机变量

①定义

​ 设连续型随机变量 X X X的概率密度为 f ( x ) f(x) f(x),若积分 ∫ − ∞ + ∞ x f ( x ) d x \int^{+\infty}_{-\infty}xf(x)dx ∫−∞+∞​xf(x)dx绝对收敛,则称积分 ∫ − ∞ + ∞ x f ( x ) d x \int^{+\infty}_{-\infty}xf(x)dx ∫−∞+∞​xf(x)dx的值为随机变量 X X X的数学期望,记为 E ( X ) E(X) E(X),即
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int^{\infty}_{-\infty}xf(x)dx E(X)=∫−∞∞​xf(x)dx

②常见期望

分布类型符号表示数学期望
均匀分布 X ∼ U [ a , b ] X\sim U[a,b] X∼U[a,b] E X = a + b 2 EX=\dfrac{a+b}{2} EX=2a+b​
指数分布 X ∼ E ( β ) X\sim E(\beta) X∼E(β) E X = 1 β EX=\dfrac{1}{\beta} EX=β1​
正态分布 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2) E X = μ EX=\mu EX=μ
证明:
均匀分布

​ 设 X ∼ U [ a , b ] X\sim U[a,b] X∼U[a,b],即 X X X的概率密度为:
f ( x ) = { 1 b − a , a ≤ x ≤ b 0 , o t h e r w i s e f(x)=\left\{ \begin{array}{lr}\frac{1}{b-a},\quad a\leq x\leq b \\ 0,\qquad otherwise \end{array} \right. f(x)={b−a1​,a≤x≤b0,otherwise​

E X = ∫ − ∞ ∞ x f ( x ) d x = ∫ b a x b − a d x = a + b 2 EX=\int^{\infty}_{-\infty}xf(x)dx=\int^a_b\dfrac{x}{b-a}dx=\dfrac{a+b}{2} EX=∫−∞∞​xf(x)dx=∫ba​b−ax​dx=2a+b​

指数分布

​ 设 X ∼ E ( β ) X\sim E(\beta) X∼E(β),即 X X X的概率密度为:
f ( x ) = { 0 , x ⩽ 0 β e − β x , x > 0 f(x)= \left\{\begin{array}{lr} 0,\qquad \qquad x\leqslant0\\ \beta e^{-\beta x},\qquad x>0 \end{array} \right. f(x)={0,x⩽0βe−βx,x>0​

E X = ∫ − ∞ ∞ x f ( x ) d x = − ∫ 0 ∞ x d ( e − β x ) = − x e − β x ∣ 0 + ∞ + ∫ 0 ∞ e − β x d x = 1 β EX=\int^{\infty}_{-\infty}xf(x)dx=-\int^{\infty}_{0}xd(e^{-\beta x})=-xe^{-\beta x}\bigg|^{+\infty}_0+\int^{\infty}_{0}e^{-\beta x}dx=\dfrac{1}{\beta} EX=∫−∞∞​xf(x)dx=−∫0∞​xd(e−βx)=−xe−βx∣∣∣∣​0+∞​+∫0∞​e−βxdx=β1​

正态分布
img

​ 计算提示,最下方,左边那项是标准正态分布的概率密度在实数域上的积分乘以 μ \mu μ,结果为 μ \mu μ,右边那个是奇函数,积分为0

③连续型随机变量函数的数学期望

(1)一维

​ 设连续型随机变量X的概率密度为 f X ( x ) , Y = g ( X ) f_X(x),Y=g(X) fX​(x),Y=g(X),其中 g ( x ) g(x) g(x)连续,则

​ E Y = E g ( X ) = ∫ − ∞ + ∞ g ( x ) f X ( x ) d x EY=Eg(X)=\int^{+\infty}_{-\infty}g(x)f_X(x)dx EY=Eg(X)=∫−∞+∞​g(x)fX​(x)dx

(2)二维

​ 二维连续型随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , Z = g ( X , Y ) , f(x,y),Z=g(X,Y), f(x,y),Z=g(X,Y),其中 g ( x , y ) g(x,y) g(x,y)连续,则 E Z = E g ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y EZ=Eg(X,Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)f(x,y)dxdy EZ=Eg(X,Y)=∫−∞+∞​∫−∞+∞​g(x,y)f(x,y)dxdy

3.性质

(1) E C = C EC=C EC=C,(C为常数)

(2) E ( C X ) = C ⋅ E X E(CX)=C\cdot EX E(CX)=C⋅EX,(C为常数)

(3) E ( X 1 + X 2 + . . . + X n ) = E X 1 + E X 2 + . . . + E X n E(X_1+X_2+...+X_n)=EX_1+EX_2+...+EX_n E(X1​+X2​+...+Xn​)=EX1​+EX2​+...+EXn​

(4)若 X 1 , X 2 , . . . X n X_1,X_2,...X_n X1​,X2​,...Xn​相互独立,则 E ( X 1 X 2 . . . X n ) = E X 1 E X 2 . . . E X n E(X_1X_2...X_n)=EX_1EX_2...EX_n E(X1​X2​...Xn​)=EX1​EX2​...EXn​

证明:
性质(3)

​ (证明两个变量的情况,可以推广到任意有限个随机变量之和的情况)

​ 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , f(x,y), f(x,y),其边缘概率密度为 f X ( x ) , f Y ( y ) , f_X(x),f_Y(y), fX​(x),fY​(y),由连续型二维随机变量的数学期望公式可知
E ( X + Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x + y ) f ( x , y ) d x d y = ∫ − ∞ + ∞ x [ ∫ − ∞ + ∞ f ( x , y ) d y ] d x + ∫ − ∞ + ∞ y [ ∫ − ∞ + ∞ f ( x , y ) d x ] d y = ∫ − ∞ ∞ x f X ( x ) d x + ∫ − ∞ ∞ y f Y ( y ) d y = E ( X ) + E ( Y ) E(X+Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}(x+y)f(x,y)dxdy=\int^{+\infty}_{-\infty}x[\int^{+\infty}_{-\infty}f(x,y)dy]dx+\int^{+\infty}_{-\infty}y[\int^{+\infty}_{-\infty}f(x,y)dx]dy\\= \int^{\infty}_{-\infty}xf_X(x)dx+\int^{\infty}_{-\infty}yf_Y(y)dy=E(X)+E(Y) E(X+Y)=∫−∞+∞​∫−∞+∞​(x+y)f(x,y)dxdy=∫−∞+∞​x[∫−∞+∞​f(x,y)dy]dx+∫−∞+∞​y[∫−∞+∞​f(x,y)dx]dy=∫−∞∞​xfX​(x)dx+∫−∞∞​yfY​(y)dy=E(X)+E(Y)

性质(4)

​ 同上,仅证明两个变量的情况

​ 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , f(x,y), f(x,y),其边缘概率密度为 f X ( x ) , f Y ( y ) , f_X(x),f_Y(y), fX​(x),fY​(y),又若 X X X和 Y Y Y相互独立, f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y)=f_X(x)\cdot f_Y(y) f(x,y)=fX​(x)⋅fY​(y)(对独立变量有联合概率密度等于边缘概率密度的乘积)
E ( X Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) = ∫ − ∞ ∞ ∫ − ∞ ∞ x y f X ( x ) f Y ( y ) d x d y = [ ∫ − ∞ ∞ x f X ( x ) d x ] ⋅ [ ∫ − ∞ ∞ y f Y ( y ) d y ] = E ( X ) E ( Y ) E(XY)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}xyf(x,y)=\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}xyf_X(x)f_Y(y)dxdy=[\int^{\infty}_{-\infty}xf_X(x)dx]\cdot[\int^{\infty}_{-\infty}yf_Y(y)dy]=E(X)E(Y) E(XY)=∫−∞+∞​∫−∞+∞​xyf(x,y)=∫−∞∞​∫−∞∞​xyfX​(x)fY​(y)dxdy=[∫−∞∞​xfX​(x)dx]⋅[∫−∞∞​yfY​(y)dy]=E(X)E(Y)

二.方差

引例

img

​ 方差是衡量 X X X分散程度的一个尺度

1.定义

​ 设X是一个随机变量,若 E ( X − E X ) 2 E(X-EX)^2 E(X−EX)2存在,则称它为 X X X的方差,记为 D ( X ) D(X) D(X)或 V a r ( X ) Var(X) Var(X)或 D X DX DX,即: D X = E ( X − E X ) 2 DX=E(X-EX)^2 DX=E(X−EX)2

​ 同时,记 D X \sqrt{DX} DX ​为 X X X的标准差或均方差,记为 σ X \sigma_X σX​即 σ X = D X \sigma_X=\sqrt{DX} σX​=DX

​ 由定义知,**其实方差就是随机变量函数X的函数 g ( X ) = ( X − E X ) 2 g(X)=(X-EX)^2 g(X)=(X−EX)2的数学期望,**于是:

​ 对于离散型随机变量有:
D ( X ) = ∑ k = 1 ∞ [ x k − E ( X ) ] 2 p k D(X)=\sum\limits_{k=1}^{\infty}[x_k-E(X)]^2p_k D(X)=k=1∑∞​[xk​−E(X)]2pk​
其中 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,k=1,2,... P{X=xk​}=pk​,k=1,2,...是 X X X的分布律

​ 对于连续型随机变量有:
D ( X ) = ∫ − ∞ + ∞ [ x − E ( X ) ] 2 f ( x ) d x D(X)=\int^{+\infty}_{-\infty}[x-E(X)]^2f(x)dx D(X)=∫−∞+∞​[x−E(X)]2f(x)dx

计算:

​ D X = E X 2 − ( E X ) 2 DX=EX^2-(EX)^2 DX=EX2−(EX)2

证明:
D ( X ) = E ( [ X − E ( X ) ] 2 ) = E ( X 2 − 2 X ⋅ E ( X ) + [ E ( X ) ] 2 ) = E ( X 2 ) − 2 E ( X ) 2 + E ( X ) 2 = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E([X-E(X)]^2)=E(X^2-2X\cdot E(X)+[E(X)]^2)=E(X^2)-2E(X)^2+E(X)^2=E(X^2)-[E(X)]^2 D(X)=E([X−E(X)]2)=E(X2−2X⋅E(X)+[E(X)]2)=E(X2)−2E(X)2+E(X)2=E(X2)−[E(X)]2

2.性质

(1) D C = 0 DC=0 DC=0,(C为常数)

(2) D ( C X ) = C 2 D X D(CX)=C^2DX D(CX)=C2DX, D ( X + C ) = D ( X ) \quad D(X+C)=D(X) D(X+C)=D(X)(C为常数)

(3)若 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,...,Xn​相互独立,则 D ( X 1 + X 2 + . . . + X n ) = D X 1 + D X 2 + . . . + D X n D(X_1+X_2+...+X_n)=DX_1+DX_2+...+DX_n D(X1​+X2​+...+Xn​)=DX1​+DX2​+...+DXn​

(4) D ( X ) = 0 D(X)=0 D(X)=0的充要条件是 X X X以概率1取常数 E ( X ) E(X) E(X),即
P { X = E ( X ) } = 1 P\{X=E(X)\}=1 P{X=E(X)}=1

证明
性质(3)

​ 以两个变量为例,设 X , Y X,Y X,Y有两个随机变量,则有 D ( X + Y ) = D X + D Y + 2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } D(X+Y)=DX+DY+2E\{[X-E(X)][Y-E(Y)]\} D(X+Y)=DX+DY+2E{[X−E(X)][Y−E(Y)]},若 X , Y X,Y X,Y相互独立,则有
D ( X + Y ) = D X + D Y D(X+Y)=DX+DY D(X+Y)=DX+DY
证明如下:
D ( X + Y ) = E { [ X + Y − E ( X + Y ) ] 2 } = E { [ ( X − E ( X ) ) + ( Y − E ( Y ) ) ] 2 } = E { ( X − E ( X ) ) 2 } + E { ( Y − E ( Y ) ) 2 } + 2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = D X + D Y + 2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } D(X+Y)=E\{[X+Y-E(X+Y)]^2\}=E\{[(X-E(X))+(Y-E(Y))]^2\}=E\{(X-E(X))^2\}+E\{(Y-E(Y))^2\}\\+2E\{[X-E(X)][Y-E(Y)]\}=DX+DY+2E\{[X-E(X)][Y-E(Y)]\} D(X+Y)=E{[X+Y−E(X+Y)]2}=E{[(X−E(X))+(Y−E(Y))]2}=E{(X−E(X))2}+E{(Y−E(Y))2}+2E{[X−E(X)][Y−E(Y)]}=DX+DY+2E{[X−E(X)][Y−E(Y)]}
若X、Y相互独立,则 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = 2 E { X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) } = 2 { E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) } = 0 2E\{[X-E(X)][Y-E(Y)]\}=2E\{XY-XE(Y)-YE(X)+E(X)E(Y)\}\\=2\{E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)\}=0 2E{[X−E(X)][Y−E(Y)]}=2E{XY−XE(Y)−YE(X)+E(X)E(Y)}=2{E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)}=0

3.常用随机变量期望、方差汇总

变量类型XEXDX
两点分布 B ( 1 , p ) B(1,p) B(1,p) p p p p q pq pq
二项分布 B ( n , p ) B(n,p) B(n,p) n p np np n p q npq npq
泊松分布 P ( λ ) P(\lambda) P(λ) λ \lambda λ λ \lambda λ
均匀分布 U [ a , b ] U[a,b] U[a,b] a + b 2 \dfrac{a+b}{2} 2a+b​ ( b − a ) 2 12 \dfrac{(b-a)^2}{12} 12(b−a)2​
指数分布 E ( β ) E(\beta) E(β) 1 β \dfrac{1}{\beta} β1​ 1 β 2 \dfrac{1}{\beta^2} β21​
正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) μ \mu μ σ 2 \sigma^2 σ2

三.协方差

引入

img

1.定义

​ 对于二维随机变量 ( X , Y ) (X,Y) (X,Y),称 C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\{ [X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}为X与Y的协方差

计算:

​ C o v ( X , Y ) = E ( X Y ) − E X ⋅ E Y Cov(X,Y)=E(XY)-EX\cdot EY Cov(X,Y)=E(XY)−EX⋅EY

2.性质

​ 若X,Y相互独立,则协方差为0,反之未必成立

(1) C o v ( X , Y ) = C o v ( Y , X ) , C o v ( X , X ) = D ( X ) Cov(X,Y)=Cov(Y,X),\qquad Cov(X,X)=D(X) Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X)

(方差是协方差的一种特殊情况,即当两个变量是相同的情况)

(2) C o v ( a X , b Y ) = a b C o v ( Y , X ) Cov(aX,bY)=abCov(Y,X) Cov(aX,bY)=abCov(Y,X)

(3) C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1​+X2​,Y)=Cov(X1​,Y)+Cov(X2​,Y)

(4) D ( X ± Y ) = D X + D Y ± 2 C o v ( X , Y ) D(X±Y)=DX+DY\pm2Cov(X,Y) D(X±Y)=DX+DY±2Cov(X,Y)

四.相关系数

​ 协方差有量纲,数值随单位不同而不同,则不能准确评价两个随机变量之间的相依关系的程度大小,于是将其标准化,引出相关系数概念

1.定义

​ 设 ( X , Y ) (X,Y) (X,Y)是一个二维随机变量,若 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)存在, D X > 0 , D Y > 0 DX>0,DY>0 DX>0,DY>0,则称 ρ X Y = C o v ( X , Y ) D X ⋅ D Y = E ( X Y ) − E X ⋅ E Y D X ⋅ D Y \rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{DX}\cdot\sqrt{DY}}=\dfrac{E(XY)-EX\cdot EY}{\sqrt{DX}\cdot\sqrt{DY}} ρXY​=DX ​⋅DY ​Cov(X,Y)​=DX ​⋅DY ​E(XY)−EX⋅EY​为X与Y的相关系数

​ 若 ρ X Y = 0 \rho_{XY}=0 ρXY​=0,则称X,Y不相关

2. ρ 的 性 质 \rho的性质 ρ的性质

(1) ∣ ρ ∣ ⩽ 1 |\rho|\leqslant 1 ∣ρ∣⩽1

(2) ∣ ρ ∣ = 1    ⟺    ∃ 常 数 a , b , 使 得 P { Y = a + b X } = 1 |\rho|=1 \iff \exists 常数a,b,使得P\{Y=a+bX\}=1 ∣ρ∣=1⟺∃常数a,b,使得P{Y=a+bX}=1

​ ρ \rho ρ的绝对值越接近1, D ( Y − b X ) D(Y-bX) D(Y−bX)越接近于0, Y , X Y,X Y,X越近似地有线性关系,所以 X , Y X,Y X,Y的相关系数是刻画 X , Y X,Y X,Y之间线性关系相关程度的一个数字特征,且 ρ \rho ρ无量纲,用起来方便

定义:

​ 若 ρ X Y = 0 \rho_{XY}=0 ρXY​=0,则称 X , Y X,Y X,Y不相关;若 ∣ ρ X Y ∣ = 1 |\rho_{XY}|=1 ∣ρXY​∣=1,则称 X , Y X,Y X,Y完全相关

3.X,Y不相关的等价条件

(1) ρ X Y = 0 \rho_{XY}=0 ρXY​=0

(2) C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0

(3) E ( X Y ) = E X ⋅ E Y E(XY)=EX\cdot EY E(XY)=EX⋅EY

(4) D ( X + Y ) = D X + D Y D(X+Y)=DX+DY D(X+Y)=DX+DY

​ 若X,Y相互独立,则X,Y不相关,反之未必成立

五.矩

​ 设 X X X和 Y Y Y是随机变量,若
E ( X k ) , k = 1 , 2 , ⋯ E(X^k),\quad k=1,2,\cdots E(Xk),k=1,2,⋯
存在,称它为 X X X的 k k k阶原点矩,简称 k k k阶矩.

​ 若 E { [ X − E ( X ) ] k } , k = 2 , 3 , ⋯ E\{[X-E(X)]^k\},\quad k=2,3,\cdots E{[X−E(X)]k},k=2,3,⋯

存在,称它为 X X X的 k k k阶中心矩

​ 若 E ( X k Y l ) , k , l = 1 , 2 , ⋯ E(X^kY^l),\quad k,l=1,2,\cdots E(XkYl),k,l=1,2,⋯

存在,称它为 X X X和 Y Y Y的 k + l k+l k+l阶混合矩

​ 若 E { [ X − E ( X ) ] k [ Y − E ( Y ) ] l } , k , l = 1 , 2 , ⋯ E\{ [X-E(X)]^k[Y-E(Y)]^l\},\quad k,l=1,2,\cdots E{[X−E(X)]k[Y−E(Y)]l},k,l=1,2,⋯

存在,称它为 X 和 Y X和Y X和Y的 k + l k+l k+l阶混合中心矩

X X X的数学期望 E ( X ) E(X) E(X)是 X X X的一阶原点矩,方差$ D(X) 是 是 是X 的 二 阶 中 心 矩 , 协 方 差 的二阶中心矩,协方差 的二阶中心矩,协方差Cov(X,Y) 是 是 是X 和 和 和Y$的二阶混合中心矩

六.总结

​ 各个数字特征有什么意义呢?

​ 数学期望描述平均值大小,方差描述与数学期望的离散程度,

​ 协方差衡量两个变量的总体误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值

​ 相关系数可用来描述随机变量 ( X , Y ) (X,Y) (X,Y)的两个分量 X , Y X,Y X,Y之间的线性关系紧密程度

还看到两个很棒的解释

​ 点击这里and这里

这篇关于概率论与数理统计(4):随机变量的数字特征的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!