1 基本的定义
正定和半正定这两个词的英文分别是 positive definite 和 positive semi-definite,其中,definite是一个形容词,表示“明确的、确定的”等意思。
定义1:给定一个大小为 $n imes n$ 的实对称矩阵 $A$ ,若对于任意长度为 $n$ 的非零向量 $oldsymbol{x}$ 有 $ oldsymbol{x}^{T} A oldsymbol{x}>0$ 恒成立, 则矩阵 $A$ 是一个正定矩阵。
正定矩阵:对于 $n$ 阶实对称矩阵 $A$ ,下列条件是等价的:
- $A$ 是正定矩阵;
- $A$ 的一切顺序主子式均为正;
- $A$ 的一切主子式均为正;
- $A$ 的特征值均为正;
- 存在实可逆矩阵 $C$,使 $A=C′C$;
- 存在秩为 $n$ 的 $m×n$ 实矩阵 B,使 $A=B′B$;
- 存在主对角线元素全为正的实三角矩阵 $R$,使 $A=R′R$ 。
例1:单位矩阵 $I in mathbb{R}^{2 imes 2}$ 是否是正定矩阵?
解:设向量 $ oldsymbol{x}=left[egin{array}{l}x_{1} \ x_{2}end{array}
ight] in mathbb{R}^{2}$ 为非零向量, 则
$oldsymbol{x}^{T} oldsymbol{I} oldsymbol{x}=oldsymbol{x}^{T} oldsymbol{x}=x_{1}^{2}+x_{2}^{2}$
由于 $ oldsymbol{x} eq mathbf{0} $,故$ oldsymbol{x}^{T} I oldsymbol{x}>0$ 恒成立,即单位矩阵 $ I in mathbb{R}^{2 imes 2}$ 是正定矩阵。
扩展:对于任意单位矩阵 $I in mathbb{R}^{n imes n}$ 而言,给定任意非零向量 $oldsymbol{x} in mathbb{R}^{n}$ , 恒有
$egin{array}{l} oldsymbol{x}^{T} I oldsymbol{x}=oldsymbol{x}^{T} oldsymbol{x} \ =x_{1}^{2}+x_{2}^{2}+cdots+x_{n}^{2}>0 end{array}$
例2:实对称矩阵 $A=left[egin{array}{ccc}2 & -1 & 0 \ -1 & 2 & -1 \ 0 & -1 & 2end{array} ight] in mathbb{R}^{3 imes 3} $ 是否是正定矩阵?
解:设向量 $oldsymbol{x}=left[egin{array}{l}x_{1} \ x_{2} \ x_{3}end{array} ight] in mathbb{R}^{3}$ 为非零向量,则
$egin{array}{l} oldsymbol{x}^{T} A oldsymbol{x}=left[egin{array}{ll} left(2 x_{1}-x_{2} ight) & left(-x_{1}+2 x_{2}-x_{3} ight) & -x_{2}+2 x_{3} end{array} ight]left[egin{array}{l} x_{1} \ x_{2} \ x_{3} end{array} ight] end{array}$
$ =x_{1}^{2}+left(x_{1}-x_{2} ight)^{2}+left(x_{2}-x_{3} ight)^{2}+x_{3}^{2}>0$
因此,矩阵 A 是正定矩阵。
定义2:给定一个大小为 $n imes n$ 的实对称矩阵 $A$ , 若对于任意长度为 $n$ 的向量 $oldsymbol{x} $, 有 $oldsymbol{x}^{T} A oldsymbol{x} geq 0$ 恒成立,则矩阵 $A $ 是一个半正定矩阵。
半正定矩阵:设 A 是 n 阶实对称矩阵,则下列的条件等价:
1.$A$ 是半正定的。
2.$A$ 的所有主子式均为非负的。
3.$A$ 的特征值均为非负的。
4.存在 $n$ 阶实矩阵 $C$,使 $A=C′C$.
5.存在秩为 $r$ 的 $r×n$ 实矩阵 $B$,使 $A=B′B$.
根据正定矩阵和半正定矩阵的定义,我们也会发现:半正定矩阵包括了正定矩阵
2 从二次函数到正定/半正定矩阵
我们学习过二次函数 $y=a x^{2}$ , 该函数的曲线会经过坐标原点,当参数 $a>0$ 时,曲线的 “开口" 向上,参数 $a<0$ 时,曲线的 "开口" 向下。
以 y=2 x^{2} 为例, 曲线如下:
实际上,我们可以将 $y=oldsymbol{x}^{T} A oldsymbol{x}$ 视作 $y=a x^{2}$ 的多维表达式。
当我们希望 $ y=oldsymbol{x}^{T} A oldsymbol{x} geq 0$ 对于任意向量 $ oldsymbol{x}$ 都恒成立,就要求矩阵 $ A$ 是一个半正定矩阵,对应于二次函数, $ y=a x^{2}>0$,$ forall x $ 需要使得 $ a geq 0 $。
另外,在 $ y=a x^{2}$ 中,我们还知道:若 $ a>0$ ,则对于任意 $ x
eq 0$, 有 $ y>0$ 恒成立。 这在 $ y=oldsymbol{x}^{T} A oldsymbol{x}$ 也有契合之处,当矩阵 $ A$ 是正定矩阵时,对于任意 $oldsymbol{x}
eq mathbf{0}, quad y>0$ 恒成 立。
3 正定矩阵和半正定矩阵的直观解释
若给定任意一个正定矩阵 $A in mathbb{R}^{n imes n}$ 和一个非零向量 $oldsymbol{x} in mathbb{R}^{n}$,则两者相乘得到的向量 $ oldsymbol{y}=A oldsymbol{x} in mathbb{R}^{n}$ 与向量 $oldsymbol{x}$ 的夹角恒小于 $frac{pi}{2} $。 (等价于: $oldsymbol{x}^{T} A oldsymbol{x}>0$。)
例3:给定向量 $oldsymbol{x}=left[egin{array}{l}2 \ 1end{array} ight] in mathbb{R}^{2}$, 对于单位矩阵 $I=left[egin{array}{ll}1 & 0 \ 0 & 1end{array} ight] in mathbb{R}^{2 imes 2} $, 则
$oldsymbol{y}=I oldsymbol{x}=oldsymbol{x}=left[egin{array}{l} 2 \1 end{array} ight]$
向量 $ oldsymbol{x}, oldsymbol{y} in mathbb{R}^{2}$ 之间的夹角为
$egin{array}{l} cos langleoldsymbol{x}, oldsymbol{y} angle=frac{oldsymbol{x}^{T} oldsymbol{y}}{|oldsymbol{x}| cdot|oldsymbol{y}|} \ =frac{2 imes 2+1 imes 1}{sqrt{2^{2}+1^{2}} cdot sqrt{2^{2}+1^{2}}} \ =1 end{array}$
即两个向量之间的夹角为 $0^{circ}$。
若给定任意一个半正定矩阵 $A in mathbb{R}^{n imes n}$ 和一个向量 $oldsymbol{x} in mathbb{R}^{n} $, 则两者相乘得到的向量 $oldsymbol{y}=A oldsymbol{x} in mathbb{R}^{n}$ 与向量 $oldsymbol{x}$ 的夹角恒小于或等于 $frac{pi}{2}$ . (等价于: $oldsymbol{x}^{T} A oldsymbol{x} geq 0$)
例4:给定向量 $oldsymbol{x}=left[egin{array}{l}1 \ 2 \ 1end{array} ight] in mathbb{R}^{3}$,对于实对称矩阵 $A=left[egin{array}{ccc}2 & -1 & 0 \ -1 & 2 & -1 \ 0 & -1 & 2end{array} ight] in mathbb{R}^{3 imes 3} $ ,则
$oldsymbol{y}=A oldsymbol{x}=left[egin{array}{l} 0 \ 2 \ 0 end{array} ight]$
向量 $ oldsymbol{x}, oldsymbol{y} in mathbb{R}^{2}$ 之间的夹角为
$cos langleoldsymbol{x}, oldsymbol{y} angle=frac{oldsymbol{x}^{T} oldsymbol{y}}{|oldsymbol{x}| cdot|oldsymbol{y}|}=frac{sqrt{6}}{3}$
$