一、多维随机变量的协方差矩阵
对多维随机变量
![X=[X_{1},X_{2},...,X_{n}]^{T} 『ML笔记』机器学习中协方差矩阵的向量表示推导_javascript](https://file.cfanz.cn/uploads/gif/2022/11/15/5/84fZ6P1fd1.gif)
列向量,我们往往需要计算各维度之间的协方差,这样协方差就组成了一个n×n的矩阵,称为协方差矩阵。协方差矩阵是一个对角矩阵,对角线上的元素是各维度上随机变量的方差。 我们定义协方差为

, 矩阵内的元素
为
协方差矩阵为
![\bg_green \large \sum = E \left[ ( X - E ( X ) ) ( X - E ( X ) ) ^ { T } \right] 『ML笔记』机器学习中协方差矩阵的向量表示推导_协方差矩阵_03](https://file.cfanz.cn/uploads/gif/2022/11/15/5/Hc686W409Q.gif)
![= \left[ \begin{array} { c c c c } { \operatorname { cov } \left( X _ { 1 } , X _ { 1 } \right) } & { \operatorname { cov } \left( X _ { 1 } , X _ { 2 } \right) } & { \cdots } & { \operatorname { cov } \left( X _ { 1 } , X _ { n } \right) } \\ { \operatorname { cov } \left( X _ { 2 } , X _ { 1 } \right) } & { \operatorname { cov } \left( X _ { 2 } , X _ { 2 } \right) } & { \cdots } & { \operatorname { cov } \left( X _ { 2 } , X _ { n } \right) } \\ { \vdots } & { \vdots } & { \vdots } & { \vdots } \\ { \operatorname { cov } \left( X _ { n } , X _ { 1 } \right) } & { \operatorname { cov } \left( X _ { n } , X _ { 2 } , \right) } & { \cdots } & { \operatorname { cov } \left( X _ { n } , X _ { n } \right) } \end{array} \right] 『ML笔记』机器学习中协方差矩阵的向量表示推导_javascript_04](https://file.cfanz.cn/uploads/gif/2022/11/15/5/150PKc8L1M.gif)
二、样本的协方差矩阵
与上面的协方差矩阵相同,只是矩阵内各元素以样本的协方差替换。假设数据集

表示m个样本, 每个样本表示为

。所有样本可以组成一个

的矩阵。
![X _ { m \times n } = \left[ \begin{array} { c c c c } { x _ { 11 } } & { x _ { 12 } } & { \cdots } & { x _ { 1 n } } \\ { x _ { 21 } } & { x _ { 22 } } & { \cdots } & { x _ { 2 n } } \\ { \vdots } & { \vdots } & { \vdots } & { \vdots } \\ { x _ { m 1 } } & { x _ { m 2 } } & { \cdots } & { x _ { m n } } \end{array} \right] = \left[ c _ { 1 } , c _ { 2 } , \ldots , c _ { n } \right] 『ML笔记』机器学习中协方差矩阵的向量表示推导_协方差矩阵_08](https://file.cfanz.cn/uploads/gif/2022/11/15/5/5195eYW0f6.gif)
每一行代表一个对象,每一列代表一个维度,协方差矩阵,是求维度之间的相关性,而不是对象之间的,所以协方差矩阵的大小与维度相关。表示第i维的随机变量。
假设

,则有



这里分母为m−1是因为随机变量的数学期望未知,以样本均值代替,自由度减一。










