在众多的机器学习模型中,线性代数的身影无处不在,当然,我们也会时常碰到线性代数中的正定矩阵和半正定矩阵。例如,多元正态分布的协方差矩阵要求是半正定的。
1. 基本的定义
正定和半正定这两个词的英文分别是positive definite和positive semi-definite,其中,definite是一个形容词,表示“明确的、确定的”等意思。
初学线性代数的读者可能会被这两个词“唬住”,但正定矩阵和半正定矩阵的定义实际上是很简单的 (不考虑复数构成的矩阵):
【定义1】给定一个大小为的实对称矩阵
,若对于任意长度为
的非零向量
,有
恒成立,则矩阵
是一个正定矩阵。
【例1】单位矩阵
解:设向量
由于
单位矩阵是正定矩阵 (positive definite)。
【简单证明】对于任意单位矩阵
【例2】 实对称矩阵
解:设向量
因此,矩阵
【定义2】给定一个大小为的实对称矩阵
,若对于任意长度为
的向量
,有
恒成立,则矩阵
是一个半正定矩阵。
根据正定矩阵和半正定矩阵的定义,我们也会发现:半正定矩阵包括了正定矩阵,与非负实数 (non-negative real number)和正实数 (positive real number)之间的关系很像。

2. 从二次函数到正定/半正定矩阵
在初中数学中,我们学习了二次函数
以

实际上,我们可以将
当我们希望
另外,在
这在
3. 正定矩阵和半正定矩阵的直观解释
若给定任意一个正定矩阵和一个非零向量
,则两者相乘得到的向量
与向量
的夹角恒小于
. (等价于:
.)
【例3】给定向量
向量
即两个向量之间的夹角为0°.
【例4】给定向量
向量
即两个向量之间的夹角小于
若给定任意一个半正定矩阵和一个向量
,则两者相乘得到的向量
与向量
的夹角恒小于或等于
. (等价于:
.)
3. 为什么协方差矩阵要是半正定的?
在概率论与数理统计中,我们都学习的协方差矩阵的定义:
对于任意多元随机变量,协方差矩阵为
现给定任意一个向量
其中,
由于
注:原文搬运自知乎:https://zhuanlan.zhihu.com/p/44860862