在应用中,经常会碰到需要对某个矩阵的行列式进行求导的情况。而行列式的计算方法比较复杂,如果将它展开成后计算,会比较麻烦,因此最好直接记住一些结论。
本文以计算\(\dfrac{\partial |A|}{\partial A}\)和\(\dfrac{\partial \ln |A|}{\partial A}\)为例,介绍如何对行列式求导,并希望大家可以记住结论。
首先,为防止大家线性代数的内容忘得差不多了,我们先以方阵\(A\)(\(n\times n\))为例,回顾一下与行列式有关的基本概念:
- minor(余子式,或者叫余因式)\(M\):是一个\(n\times n\)方阵,其中元素\(M_{ij}\)就是把原方阵\(A\)去掉第\(i\)行、第\(j\)列之后再取行列式的值;
- cofactor(代数余子式)\(C\):\(C_{ij}=(-1)^{i+j}M_{ij}\);
- adjugate(伴随矩阵)\(A^*\):\(A^*_{ij}=(-1)^{i+j}M_{ji}\),即\(A^*=C'\);
而方阵\(A\)行列式,就可以用某一行(比如第\(i\)行)的cofactor \(C\)的形式来表达(当然也可以用\(A^*\)):$$|A|=\sum_{j}A_{ij}C_{ij}$$
另外,若\(A\)是非奇异矩阵,则有
\[A^{-1}=\dfrac{A^*}{|A|}=\dfrac{C'}{|A|}
\]
现在,再来看对\(|A|\)的求导。对于\(A\)的某个元素\(A_{ij}\),将行列式写成\(A\)的第\(i\)行展开的形式,我们有
\[\dfrac{\partial |A|}{\partial A_{ij}} = \dfrac{\partial \sum_{j}A_{ij}C_{ij}}{\partial A_{ij}}=C_{ij}
\]
第二个等式是因为,对于任意的\(j\),在\(C_{ij}\)的计算中都是剔除了\(A_{ij}\)的,也即它和\(A_{ij}\)的变动没关系。
因此,我们有
\[\dfrac{\partial |A|}{\partial A} = C = (A^*)'
\]
如果\(A\)非奇异,那么有
\[\dfrac{\partial |A|}{\partial A} = (|A|A^{-1})'= |A|(A^{-1})'
\]
对于\(\ln |A|\),利用链式法则,有
\[\dfrac{\partial \ln |A|}{\partial A} = \dfrac{1}{|A|} |A|(A^{-1})' = (A^{-1})'
\]