协方差 ¶
1 \(~~\)协方差的定义¶
设 \(X\) 和 \(Y\) 是两个随机变量, 考虑它们联合后的方差 \(\text{Var}(X \pm Y)\).
一方面可以看出, \(\text{Var}\) 不是一个线性算子, 即 \(\text{Var}(X \pm Y) \neq \text{Var}(X) \pm \text{Var}(Y)\). 另一方面,上式中的 \(E(XY) - E(X)E(Y)\) 可以看作是 \(X\) 和 \(Y\) 之间“共同的方差”, 而且如果 \(X\) 和 \(Y\) 独立, 则 \(E(XY) = E(X)E(Y)\), 故可以引出协方差的定义:
注意到 \(E(XY) - E(X)E(Y)\) 也可以写成
故协方差也可以写成
2 \(~~\)协方差的性质¶
由式 \eqref{eq1.1} 或 \eqref{eq1.2} 可以得到以下性质:
- \(\text{Cov}(X,X) = \text{Var}(X)\).
- \(\text{Cov}(X,Y) = \text{Cov}(Y,X)\)(对称).
- \(\text{Cov}(aX,bY) = ab\text{Cov}(X,Y)\)(倍乘).
- \(\text{Cov}(X \pm Y,Z) = \text{Cov}(X,Z) \pm \text{Cov}(Y,Z)\)(线性).
从上面的性质可以看出,协方差是一个双线性算子,而方差不是!
更进一步的,可以由上述四条性质得到,协方差可以看成是两个随机变量的内积. 所以下面这条性质变得显而易见:
要注意的是, 协方差可用来衡量两个随机变量之间的线性相关性, 但是不能说明独立性. 因为
3 \(~~\)协方差矩阵¶
设 \(X = (X_1, X_2, \cdots, X_n)\) 是一个 \(n\) 维随机向量,其协方差矩阵定义为
性质:
- \(\text{Cov}(X)\) 是一个实对称矩阵.
-
\(\text{Cov}(X)\) 是一个半正定矩阵.
<!-- 证明:对于任意的 \(n\) 维向量 \(a = (a_1, a_2, \cdots, a_n)\), 有
\begin{aligned} a^T\text{Cov}(X)a &= \begin{pmatrix} a_1 & a_2 & \cdots & a_n \end{pmatrix} \begin{pmatrix} \text{Cov}(X_1,X_1) & \text{Cov}(X_1,X_2) & \cdots & \text{Cov}(X_1,X_n) \ \text{Cov}(X_2,X_1) & \text{Cov}(X_2,X_2) & \cdots & \text{Cov}(X_2,X_n) \ \vdots & \vdots & \ddots & \vdots \ \text{Cov}(X_n,X_1) & \text{Cov}(X_n,X_2) & \cdots & \text{Cov}(X_n,X_n) \end{pmatrix} \begin{pmatrix} a_1 \ a_2 \ \vdots \ a_n \end{pmatrix} \ &= \begin{pmatrix} \sum_{i=1}^n a_i\text{Cov}(X_i,X_1) & \sum_{i=1}^n a_i\text{Cov}(X_i,X_2) & \cdots & \sum_{i=1}^n a_i\text{Cov}(X_i,X_n) \end{pmatrix} \begin{pmatrix} a_1 \ a_2 \ \vdots \ a_n \end{pmatrix} \ &= \sum_{i=1}^n \sum_{j=1}^n a_ia_j\text{Cov}(X_i,X_j) \ &= \text{Cov}\left(\sum_{i=1}^n a_iX_i, \sum_{j=1}^n a_jX_j\right) \geq 0. \end{aligned} -->