概率论与数理统计(4):随机变量的数字特征

本文主要是介绍概率论与数理统计(4):随机变量的数字特征，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

概率论与数理统计(4):随机变量的数字特征

文章目录

概率论与数理统计(4):随机变量的数字特征
- 一.数学期望
- - - - 引例：
      - 频率与概率
  - 1.离散型随机变量
  - - ①定义
    - ②常见期望
    - - 证明：
      - 两点分布
        二项分布
        泊松分布
    - ③离散型随机变量函数的数学期望
    - - (1)一维
      - (2)二维
  - 2.连续型随机变量
  - - ①定义
    - ②常见期望
    - - 证明：
      - 均匀分布
        指数分布
        正态分布
    - ③连续型随机变量函数的数学期望
    - - (1)一维
      - (2)二维
  - 3.性质
  - - - 证明：
      - 性质(3)
        性质(4)
- 二.方差
- - - - 引例
  - 1.定义
  - - 计算：
  - 2.性质
  - - - 证明
      - 性质（3）
  - 3.**==常用随机变量期望、方差汇总==**
- 三.协方差
- - - - 引入
  - 1.定义
  - - 计算：
  - 2.性质
- 四.相关系数
- - 1.定义
  - 2. ρ 的性质 \rho的性质 ρ的性质
  - - - 定义：
  - 3.X，Y不相关的等价条件
- 五.矩
- 六.总结

一.数学期望

引例：

频率与概率

设对某一随机现象进行了n次试验与观察，其中A事件出现了m次，即其出现的频率为m/n。经过大量反复试验，常有m/n越来越接近于某个确定的常数（此论断证明详见伯努利大数定律）。该常数即为事件A出现的概率，常用P (A) 表示。

1.离散型随机变量

①定义

设离散型随机变量X的分布列 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,\qquad k=1,2,... P{X=xk}=pk,k=1,2,...

若级数 ∑ k = 1 ∞ x k p k \sum\limits_{k=1}^{\infty}x_kp_k k=1∑∞xkpk绝对收敛，则称级数 ∑ k = 1 ∞ x k p k \sum\limits_{k=1}^{\infty}x_kp_k k=1∑∞xkpk为X的数学期望(简称期望）或均值，记为E(X) or EX，即
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int^{\infty}_{-\infty}xf(x)dx E(X)=∫−∞∞xf(x)dx

数学期望 E ( X ) E(X) E(X)完全由随机变量 X X X的概率分布所确定，若 X X X服从某一分布，也称 E ( X ) E(X) E(X)是这一分布的数学期望

②常见期望

分布类型	符号表示	数学期望
两点分布	X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p)	E X = p EX=p EX=p
二项分布	X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p)	E X = n p EX=np EX=np
泊松分布	X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ)	E X = λ EX=\lambda EX=λ

证明：

两点分布

设 X X X的分布列为 P { X = 1 } = p , P { X = 0 } = 1 − p = q P\{X=1\}=p,P\{X=0\}=1-p=q P{X=1}=p,P{X=0}=1−p=q,则 E X = 0 ⋅ ( 1 − p ) + 1 ⋅ p = p EX=0\cdot(1-p)+1\cdot p=p EX=0⋅(1−p)+1⋅p=p

二项分布

设 X ∼ B ( n , p ) , X\sim B(n,p), X∼B(n,p),即 X X X的分布列为 P { X = k } = C n k p k q n − k , k = 0 , 1 , ⋯ , n , 0 < p < 1 , q = 1 − p P\{X=k\}=C_n^kp^kq^{n-k},k=0,1,\cdots,n,0<p<1,q=1-p P{X=k}=Cnkpkqn−k,k=0,1,⋯,n,0<p<1,q=1−p,则：
E X = ∑ k = 0 n k C n k p k q n − k = ∑ k = 1 n n ! p k q n − k ( k − 1 ) ! ( n − k ) ! = n p ∑ k = 1 n ( n − 1 ) ! ( k − 1 ) ! ( n − k ) ! p k − 1 q n − k = 令 m = k − 1 n p ∑ m = 0 n − 1 C n − 1 m p m q n − 1 − m = n p EX=\sum_{k=0}^nkC_n^kp^kq^{n-k}=\sum_{k=1}^n\dfrac{n!p^kq^{n-k}}{(k-1)!(n-k)!}=np\sum_{k=1}^n\dfrac{(n-1)!}{(k-1)!(n-k)!}p^{k-1}q^{n-k}\xlongequal{令m=k-1}np\sum_{m=0}^{n-1}C_{n-1}^mp^mq^{n-1-m}=np EX=k=0∑nkCnkpkqn−k=k=1∑n(k−1)!(n−k)!n!pkqn−k=npk=1∑n(k−1)!(n−k)!(n−1)!pk−1qn−k令m=k−1 npm=0∑n−1Cn−1mpmqn−1−m=np

泊松分布

设 X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ),即 X X X的分布列为 P { X = k } = λ k k ! e − λ , k = 0 , 1 , 2 , ⋯ , λ > 0 P\{X=k\}=\dfrac{\lambda^k}{k!}e^{-\lambda},k=0,1,2,\cdots, \quad \lambda>0 P{X=k}=k!λke−λ,k=0,1,2,⋯,λ>0,则
E X = ∑ k = 1 ∞ k λ k k ! e − λ = λ e − λ ∑ k = 1 ∞ λ k − 1 ( k − 1 ) ! = λ e − λ ( 1 + λ + 1 2 ! λ 2 + ⋯ + 1 n ! λ n + ⋯ ) = λ e − λ e λ = λ EX=\sum_{k=1}^{\infty} k\dfrac{\lambda^k}{k!}e^{-\lambda}=\lambda e^{-\lambda}\sum_{k=1}^{\infty}\dfrac{\lambda^{k-1}}{(k-1)!}=\lambda e^{-\lambda}(1+\lambda+\dfrac{1}{2!}\lambda^2+\cdots+\dfrac{1}{n!}\lambda^n+\cdots)=\lambda e^{-\lambda}e^{\lambda}=\lambda EX=k=1∑∞kk!λke−λ=λe−λk=1∑∞(k−1)!λk−1=λe−λ(1+λ+2!1λ2+⋯+n!1λn+⋯)=λe−λeλ=λ

③离散型随机变量函数的数学期望

(1)一维

设离散型随机变量X的分布列为 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,\qquad k=1,2,... P{X=xk}=pk,k=1,2,...， Y = g ( X ) Y=g(X) Y=g(X),则：

E Y = E g ( X ) = ∑ i g ( x i ) p i EY=Eg(X)=\sum\limits_{i}g(x_i)p_i EY=Eg(X)=i∑g(xi)pi

(2)二维

设二维离散型随机变量 ( X , Y ) (X,Y) (X,Y)的分布列为 P { X = x i , Y = y i } = p i j , i , j = 1 , 2 , . . . P\{X=x_i,Y=y_i\}=p_{ij},i,j=1,2,... P{X=xi,Y=yi}=pij,i,j=1,2,..., Z = g ( X , Y ) , Z=g(X,Y), Z=g(X,Y),则 E Z = E g ( X , Y ) = ∑ i ∑ j g ( x i , y j ) p i j EZ=Eg(X,Y)=\sum\limits_{i}\sum\limits_{j}g(x_i,y_j)p_{ij} EZ=Eg(X,Y)=i∑j∑g(xi,yj)pij

2.连续型随机变量

①定义

设连续型随机变量 X X X的概率密度为 f ( x ) f(x) f(x),若积分 ∫ − ∞ + ∞ x f ( x ) d x \int^{+\infty}_{-\infty}xf(x)dx ∫−∞+∞xf(x)dx绝对收敛，则称积分 ∫ − ∞ + ∞ x f ( x ) d x \int^{+\infty}_{-\infty}xf(x)dx ∫−∞+∞xf(x)dx的值为随机变量 X X X的数学期望，记为 E ( X ) E(X) E(X)，即
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int^{\infty}_{-\infty}xf(x)dx E(X)=∫−∞∞xf(x)dx

②常见期望

分布类型	符号表示	数学期望
均匀分布	X ∼ U [ a , b ] X\sim U[a,b] X∼U[a,b]	E X = a + b 2 EX=\dfrac{a+b}{2} EX=2a+b
指数分布	X ∼ E ( β ) X\sim E(\beta) X∼E(β)	E X = 1 β EX=\dfrac{1}{\beta} EX=β1
正态分布	X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2)	E X = μ EX=\mu EX=μ

证明：

均匀分布

设 X ∼ U [ a , b ] X\sim U[a,b] X∼U[a,b]，即 X X X的概率密度为：
f ( x ) = { 1 b − a , a ≤ x ≤ b 0 , o t h e r w i s e f(x)=\left\{ \begin{array}{lr}\frac{1}{b-a},\quad a\leq x\leq b \\ 0,\qquad otherwise \end{array} \right. f(x)={b−a1,a≤x≤b0,otherwise
则
E X = ∫ − ∞ ∞ x f ( x ) d x = ∫ b a x b − a d x = a + b 2 EX=\int^{\infty}_{-\infty}xf(x)dx=\int^a_b\dfrac{x}{b-a}dx=\dfrac{a+b}{2} EX=∫−∞∞xf(x)dx=∫bab−axdx=2a+b

指数分布

设 X ∼ E ( β ) X\sim E(\beta) X∼E(β)，即 X X X的概率密度为:
f ( x ) = { 0 , x ⩽ 0 β e − β x , x > 0 f(x)= \left\{\begin{array}{lr} 0,\qquad \qquad x\leqslant0\\ \beta e^{-\beta x},\qquad x>0 \end{array} \right. f(x)={0,x⩽0βe−βx,x>0
则
E X = ∫ − ∞ ∞ x f ( x ) d x = − ∫ 0 ∞ x d ( e − β x ) = − x e − β x ∣ 0 + ∞ + ∫ 0 ∞ e − β x d x = 1 β EX=\int^{\infty}_{-\infty}xf(x)dx=-\int^{\infty}_{0}xd(e^{-\beta x})=-xe^{-\beta x}\bigg|^{+\infty}_0+\int^{\infty}_{0}e^{-\beta x}dx=\dfrac{1}{\beta} EX=∫−∞∞xf(x)dx=−∫0∞xd(e−βx)=−xe−βx∣∣∣∣0+∞+∫0∞e−βxdx=β1

正态分布

计算提示，最下方，左边那项是标准正态分布的概率密度在实数域上的积分乘以 μ \mu μ,结果为 μ \mu μ，右边那个是奇函数，积分为0

③连续型随机变量函数的数学期望

(1)一维

设连续型随机变量X的概率密度为 f X ( x ) , Y = g ( X ) f_X(x),Y=g(X) fX(x),Y=g(X),其中 g ( x ) g(x) g(x)连续，则

E Y = E g ( X ) = ∫ − ∞ + ∞ g ( x ) f X ( x ) d x EY=Eg(X)=\int^{+\infty}_{-\infty}g(x)f_X(x)dx EY=Eg(X)=∫−∞+∞g(x)fX(x)dx

(2)二维

二维连续型随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , Z = g ( X , Y ) , f(x,y),Z=g(X,Y), f(x,y),Z=g(X,Y),其中 g ( x , y ) g(x,y) g(x,y)连续，则 E Z = E g ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y EZ=Eg(X,Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)f(x,y)dxdy EZ=Eg(X,Y)=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy

3.性质

(1) E C = C EC=C EC=C,(C为常数)

(2) E ( C X ) = C ⋅ E X E(CX)=C\cdot EX E(CX)=C⋅EX,(C为常数)

(3) E ( X 1 + X 2 + . . . + X n ) = E X 1 + E X 2 + . . . + E X n E(X_1+X_2+...+X_n)=EX_1+EX_2+...+EX_n E(X1+X2+...+Xn)=EX1+EX2+...+EXn

(4)若 X 1 , X 2 , . . . X n X_1,X_2,...X_n X1,X2,...Xn相互独立，则 E ( X 1 X 2 . . . X n ) = E X 1 E X 2 . . . E X n E(X_1X_2...X_n)=EX_1EX_2...EX_n E(X1X2...Xn)=EX1EX2...EXn

证明：

性质(3)

(证明两个变量的情况，可以推广到任意有限个随机变量之和的情况)

设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , f(x,y), f(x,y),其边缘概率密度为 f X ( x ) , f Y ( y ) , f_X(x),f_Y(y), fX(x),fY(y),由连续型二维随机变量的数学期望公式可知
E ( X + Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x + y ) f ( x , y ) d x d y = ∫ − ∞ + ∞ x [ ∫ − ∞ + ∞ f ( x , y ) d y ] d x + ∫ − ∞ + ∞ y [ ∫ − ∞ + ∞ f ( x , y ) d x ] d y = ∫ − ∞ ∞ x f X ( x ) d x + ∫ − ∞ ∞ y f Y ( y ) d y = E ( X ) + E ( Y ) E(X+Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}(x+y)f(x,y)dxdy=\int^{+\infty}_{-\infty}x[\int^{+\infty}_{-\infty}f(x,y)dy]dx+\int^{+\infty}_{-\infty}y[\int^{+\infty}_{-\infty}f(x,y)dx]dy\\= \int^{\infty}_{-\infty}xf_X(x)dx+\int^{\infty}_{-\infty}yf_Y(y)dy=E(X)+E(Y) E(X+Y)=∫−∞+∞∫−∞+∞(x+y)f(x,y)dxdy=∫−∞+∞x[∫−∞+∞f(x,y)dy]dx+∫−∞+∞y[∫−∞+∞f(x,y)dx]dy=∫−∞∞xfX(x)dx+∫−∞∞yfY(y)dy=E(X)+E(Y)

性质(4)

同上，仅证明两个变量的情况

设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , f(x,y), f(x,y),其边缘概率密度为 f X ( x ) , f Y ( y ) , f_X(x),f_Y(y), fX(x),fY(y),又若 X X X和 Y Y Y相互独立， f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y)=f_X(x)\cdot f_Y(y) f(x,y)=fX(x)⋅fY(y)(对独立变量有联合概率密度等于边缘概率密度的乘积)
E ( X Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) = ∫ − ∞ ∞ ∫ − ∞ ∞ x y f X ( x ) f Y ( y ) d x d y = [ ∫ − ∞ ∞ x f X ( x ) d x ] ⋅ [ ∫ − ∞ ∞ y f Y ( y ) d y ] = E ( X ) E ( Y ) E(XY)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}xyf(x,y)=\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}xyf_X(x)f_Y(y)dxdy=[\int^{\infty}_{-\infty}xf_X(x)dx]\cdot[\int^{\infty}_{-\infty}yf_Y(y)dy]=E(X)E(Y) E(XY)=∫−∞+∞∫−∞+∞xyf(x,y)=∫−∞∞∫−∞∞xyfX(x)fY(y)dxdy=[∫−∞∞xfX(x)dx]⋅[∫−∞∞yfY(y)dy]=E(X)E(Y)

二.方差

引例

方差是衡量 X X X分散程度的一个尺度

1.定义

设X是一个随机变量，若 E ( X − E X ) 2 E(X-EX)^2 E(X−EX)2存在，则称它为 X X X的方差，记为 D ( X ) D(X) D(X)或 V a r ( X ) Var(X) Var(X)或 D X DX DX,即： D X = E ( X − E X ) 2 DX=E(X-EX)^2 DX=E(X−EX)2

同时，记 D X \sqrt{DX} DX 为 X X X的标准差或均方差，记为 σ X \sigma_X σX即 σ X = D X \sigma_X=\sqrt{DX} σX=DX

由定义知，**其实方差就是随机变量函数X的函数 g ( X ) = ( X − E X ) 2 g(X)=(X-EX)^2 g(X)=(X−EX)2的数学期望，**于是：

对于离散型随机变量有：
D ( X ) = ∑ k = 1 ∞ [ x k − E ( X ) ] 2 p k D(X)=\sum\limits_{k=1}^{\infty}[x_k-E(X)]^2p_k D(X)=k=1∑∞[xk−E(X)]2pk
其中 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,k=1,2,... P{X=xk}=pk,k=1,2,...是 X X X的分布律

对于连续型随机变量有：
D ( X ) = ∫ − ∞ + ∞ [ x − E ( X ) ] 2 f ( x ) d x D(X)=\int^{+\infty}_{-\infty}[x-E(X)]^2f(x)dx D(X)=∫−∞+∞[x−E(X)]2f(x)dx

计算：

D X = E X 2 − ( E X ) 2 DX=EX^2-(EX)^2 DX=EX2−(EX)2

证明：
D ( X ) = E ( [ X − E ( X ) ] 2 ) = E ( X 2 − 2 X ⋅ E ( X ) + [ E ( X ) ] 2 ) = E ( X 2 ) − 2 E ( X ) 2 + E ( X ) 2 = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E([X-E(X)]^2)=E(X^2-2X\cdot E(X)+[E(X)]^2)=E(X^2)-2E(X)^2+E(X)^2=E(X^2)-[E(X)]^2 D(X)=E([X−E(X)]2)=E(X2−2X⋅E(X)+[E(X)]2)=E(X2)−2E(X)2+E(X)2=E(X2)−[E(X)]2

2.性质

（1） D C = 0 DC=0 DC=0,(C为常数)

（2） D ( C X ) = C 2 D X D(CX)=C^2DX D(CX)=C2DX, D ( X + C ) = D ( X ) \quad D(X+C)=D(X) D(X+C)=D(X)(C为常数)

（3）若 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立，则 D ( X 1 + X 2 + . . . + X n ) = D X 1 + D X 2 + . . . + D X n D(X_1+X_2+...+X_n)=DX_1+DX_2+...+DX_n D(X1+X2+...+Xn)=DX1+DX2+...+DXn

（4） D ( X ) = 0 D(X)=0 D(X)=0的充要条件是 X X X以概率1取常数 E ( X ) E(X) E(X)，即
P { X = E ( X ) } = 1 P\{X=E(X)\}=1 P{X=E(X)}=1

证明

性质（3）

以两个变量为例,设 X , Y X,Y X,Y有两个随机变量，则有 D ( X + Y ) = D X + D Y + 2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } D(X+Y)=DX+DY+2E\{[X-E(X)][Y-E(Y)]\} D(X+Y)=DX+DY+2E{[X−E(X)][Y−E(Y)]},若 X , Y X,Y X,Y相互独立，则有
D ( X + Y ) = D X + D Y D(X+Y)=DX+DY D(X+Y)=DX+DY
证明如下：
D ( X + Y ) = E { [ X + Y − E ( X + Y ) ] 2 } = E { [ ( X − E ( X ) ) + ( Y − E ( Y ) ) ] 2 } = E { ( X − E ( X ) ) 2 } + E { ( Y − E ( Y ) ) 2 } + 2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = D X + D Y + 2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } D(X+Y)=E\{[X+Y-E(X+Y)]^2\}=E\{[(X-E(X))+(Y-E(Y))]^2\}=E\{(X-E(X))^2\}+E\{(Y-E(Y))^2\}\\+2E\{[X-E(X)][Y-E(Y)]\}=DX+DY+2E\{[X-E(X)][Y-E(Y)]\} D(X+Y)=E{[X+Y−E(X+Y)]2}=E{[(X−E(X))+(Y−E(Y))]2}=E{(X−E(X))2}+E{(Y−E(Y))2}+2E{[X−E(X)][Y−E(Y)]}=DX+DY+2E{[X−E(X)][Y−E(Y)]}
若X、Y相互独立,则 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
2 E { [ X − E ( X ) ] [ Y − E ( Y ) ] } = 2 E { X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) } = 2 { E ( X Y ) − E ( X ) E ( Y ) − E ( Y ) E ( X ) + E ( X ) E ( Y ) } = 0 2E\{[X-E(X)][Y-E(Y)]\}=2E\{XY-XE(Y)-YE(X)+E(X)E(Y)\}\\=2\{E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)\}=0 2E{[X−E(X)][Y−E(Y)]}=2E{XY−XE(Y)−YE(X)+E(X)E(Y)}=2{E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)}=0

3.常用随机变量期望、方差汇总

变量类型	X	EX	DX
两点分布	B ( 1 , p ) B(1,p) B(1,p)	p p p	p q pq pq
二项分布	B ( n ， p ) B(n，p) B(n，p)	n p np np	n p q npq npq
泊松分布	P ( λ ) P(\lambda) P(λ)	λ \lambda λ	λ \lambda λ
均匀分布	U [ a , b ] U[a,b] U[a,b]	a + b 2 \dfrac{a+b}{2} 2a+b	( b − a ) 2 12 \dfrac{(b-a)^2}{12} 12(b−a)2
指数分布	E ( β ) E(\beta) E(β)	1 β \dfrac{1}{\beta} β1	1 β 2 \dfrac{1}{\beta^2} β21
正态分布	N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)	μ \mu μ	σ 2 \sigma^2 σ2

三.协方差

引入

1.定义

对于二维随机变量 ( X , Y ) (X,Y) (X,Y)，称 C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\{ [X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}为X与Y的协方差

计算：

C o v ( X , Y ) = E ( X Y ) − E X ⋅ E Y Cov(X,Y)=E(XY)-EX\cdot EY Cov(X,Y)=E(XY)−EX⋅EY

2.性质

若X，Y相互独立，则协方差为0，反之未必成立

（1） C o v ( X , Y ) = C o v ( Y , X ) ， C o v ( X , X ) = D ( X ) Cov(X,Y)=Cov(Y,X)，\qquad Cov(X,X)=D(X) Cov(X,Y)=Cov(Y,X)，Cov(X,X)=D(X)

（方差是协方差的一种特殊情况，即当两个变量是相同的情况）

（2） C o v ( a X , b Y ) = a b C o v ( Y , X ) Cov(aX,bY)=abCov(Y,X) Cov(aX,bY)=abCov(Y,X)

（3） C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

（4） D ( X ± Y ) = D X + D Y ± 2 C o v ( X , Y ) D(X±Y)=DX+DY\pm2Cov(X,Y) D(X±Y)=DX+DY±2Cov(X,Y)

四.相关系数

协方差有量纲，数值随单位不同而不同，则不能准确评价两个随机变量之间的相依关系的程度大小，于是将其标准化，引出相关系数概念

1.定义

设 ( X , Y ) (X,Y) (X,Y)是一个二维随机变量，若 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)存在， D X > 0 , D Y > 0 DX>0,DY>0 DX>0,DY>0，则称 ρ X Y = C o v ( X , Y ) D X ⋅ D Y = E ( X Y ) − E X ⋅ E Y D X ⋅ D Y \rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{DX}\cdot\sqrt{DY}}=\dfrac{E(XY)-EX\cdot EY}{\sqrt{DX}\cdot\sqrt{DY}} ρXY=DX ⋅DY Cov(X,Y)=DX ⋅DY E(XY)−EX⋅EY为X与Y的相关系数

若 ρ X Y = 0 \rho_{XY}=0 ρXY=0，则称X,Y不相关

2. ρ 的性质 \rho的性质 ρ的性质

（1） ∣ ρ ∣ ⩽ 1 |\rho|\leqslant 1 ∣ρ∣⩽1

（2） ∣ ρ ∣ = 1 ⟺ ∃ 常数 a , b , 使得 P { Y = a + b X } = 1 |\rho|=1 \iff \exists 常数a,b,使得P\{Y=a+bX\}=1 ∣ρ∣=1⟺∃常数a,b,使得P{Y=a+bX}=1

ρ \rho ρ的绝对值越接近1， D ( Y − b X ) D(Y-bX) D(Y−bX)越接近于0， Y , X Y,X Y,X越近似地有线性关系，所以 X , Y X,Y X,Y的相关系数是刻画 X , Y X,Y X,Y之间线性关系相关程度的一个数字特征，且 ρ \rho ρ无量纲，用起来方便

定义：

若 ρ X Y = 0 \rho_{XY}=0 ρXY=0,则称 X , Y X,Y X,Y不相关；若 ∣ ρ X Y ∣ = 1 |\rho_{XY}|=1 ∣ρXY∣=1,则称 X , Y X,Y X,Y完全相关

3.X，Y不相关的等价条件

（1） ρ X Y = 0 \rho_{XY}=0 ρXY=0

（2） C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0

（3） E ( X Y ) = E X ⋅ E Y E(XY)=EX\cdot EY E(XY)=EX⋅EY

（4） D ( X + Y ) = D X + D Y D(X+Y)=DX+DY D(X+Y)=DX+DY

若X,Y相互独立，则X,Y不相关，反之未必成立

五.矩

设 X X X和 Y Y Y是随机变量，若
E ( X k ) , k = 1 , 2 , ⋯ E(X^k),\quad k=1,2,\cdots E(Xk),k=1,2,⋯
存在，称它为 X X X的 k k k阶原点矩，简称 k k k阶矩.

若 E { [ X − E ( X ) ] k } , k = 2 , 3 , ⋯ E\{[X-E(X)]^k\},\quad k=2,3,\cdots E{[X−E(X)]k},k=2,3,⋯

存在，称它为 X X X的 k k k阶中心矩

若 E ( X k Y l ) , k ， l = 1 ， 2 , ⋯ E(X^kY^l),\quad k，l=1，2,\cdots E(XkYl),k，l=1，2,⋯

存在，称它为 X X X和 Y Y Y的 k + l k+l k+l阶混合矩

若 E { [ X − E ( X ) ] k [ Y − E ( Y ) ] l } , k ， l = 1 ， 2 , ⋯ E\{ [X-E(X)]^k[Y-E(Y)]^l\},\quad k，l=1，2,\cdots E{[X−E(X)]k[Y−E(Y)]l},k，l=1，2,⋯

存在，称它为 X 和 Y X和Y X和Y的 k + l k+l k+l阶混合中心矩

X X X的数学期望 E ( X ) E(X) E(X)是 X X X的一阶原点矩，方差$ D(X) 是是是X 的二阶中心矩，协方差的二阶中心矩，协方差的二阶中心矩，协方差Cov(X,Y) 是是是X 和和和Y$的二阶混合中心矩

六.总结

各个数字特征有什么意义呢？

数学期望描述平均值大小，方差描述与数学期望的离散程度，

协方差衡量两个变量的总体误差，这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致，也就是说如果其中一个大于自身的期望值，另外一个也大于自身的期望值，那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反，即其中一个大于自身的期望值，另外一个却小于自身的期望值，那么两个变量之间的协方差就是负值

相关系数可用来描述随机变量 ( X , Y ) (X,Y) (X,Y)的两个分量 X , Y X,Y X,Y之间的线性关系紧密程度

还看到两个很棒的解释

点击这里and这里

这篇关于概率论与数理统计(4):随机变量的数字特征的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！