一、马尔可夫矩阵
马尔可夫矩阵例子:
$A=left[egin{array}{ccc}{0.1} & {0.01} & {0.3} \ {0.2} & {0.99} & {0.3} \ {0.7} & {0} & {0.4}end{array} ight]$
1)马尔可夫矩阵性质:
1. 每个元素大于等于0 - 马尔可夫矩阵和概率思想有关联,而概率值是非负的
2. 每一列元素相加和为1,实际上,马尔可夫矩阵的幂仍是马尔可夫矩阵
下面将会降到,马尔可夫矩阵存在一个特征值为1,矩阵每列的和为1的性质保证了1是矩阵的一个特征值,从而可以在不计算$A-lambda I$的情况下计算出其他特征值
2)马尔科夫矩阵的特征值性质是:
a.$lambda = 1$是一个特征值
b.其他特征值的绝对值小于1
从而可以推导出,在$lambda = 1$的情况下,其他特征值的绝对值均小于1,从而在$k$趋向无穷的时候$c_{n} lambda_{n}^{k} x_{n} ightarrow 0(n eq 1)$,最终$u_k$的值将等于$c_1x_1$,这就是$u_k$的稳态
$u_{k}=A^{k} u_{0}=c_{1} lambda_{1}^{k} x_{1}+c_{2} lambda_{2}^{k} x_{2}+cdots+c_{n} lambda_{n}^{k} x_{n}=c_{1} x_{1}$
这里不懂的话请参考22-对角化和A的幂
3)为何马尔可夫矩阵必有一个特征值$lambda_1 = 1$
我们通过下式来计算$A$的特征值:$det(A - lambda I) = 0$,如果$lambda = 1$是一个特征值,那么$det (A-I) = 0$,$A-I$一定是个奇异矩阵
$A -I =left[egin{array}{ccc}{-0.9} & {0.01} & {0.3} \ {0.2} & {-0.01} & {0.3} \ {0.7} & {0} & {-0.6}end{array} ight]$
$A$减去单位向量相当于把$A$的每一列之和减去$1$,此时所有行向量相加得到$0$向量,这意味着一个行向量可以用另外两个行向量表示,因此行向量是线性相关的,$A-I$是奇异矩阵,一定会有$det(A-I)=0$
向量$(1 1 1)$【左行右列:行向量在左,乘以矩阵表示矩阵的行进行线性组合,列向量在右,乘以矩阵表示矩阵的列进行线性组合】在其左零空间中,特征值为1对应特征向量在一定在其零空间(因为$Ax_1=x_1, (A-I)x_1=0$)
二、马尔可夫矩阵的应用
我要研究的是$u_{k+1} = Au_k$,$A$为马尔可夫矩阵
我们用人口的流动解释马尔可夫矩阵:
$A =left[egin{array}{ll}{0.9} & {0.2} \ {0.1} & {0.8}end{array} ight]$
$left[egin{array}{l}{u_{A}} \ {u_{B}}end{array} ight]_{t=k+1}=left[egin{array}{ll}{0.9} & {0.2} \ {0.1} & {0.8}end{array} ight]left[egin{array}{l}{u_{A}} \ {u_{B}}end{array} ight]_{t=k}$
$u$的分量分别表示目前两个城市人口,$A$中的每一列代表人口的去留比例。第一列的$0.9$表示留在$u_A$的人口占$u_A$总人口的90%,剩余10%流入$u_B$;第二列的0.2表示从$u_B$流入$u_A$的人口占$u_B$的20%,剩余80%留在$u_B$。
每一列的加和为1保证了总人口不变。如果有一个初始值:
$left[egin{array}{l}{u_{A}} \ {u_{B}}end{array} ight]_{t=0}=left[egin{array}{l}{0} \ {1000}end{array} ight]$
表示在t=0时刻,$u_A$的总人口是0,是个待开辟的新城市,$u_B$有1000人。经过一次迁徙,在t=1时刻:
$left[egin{array}{c}{u_{A}} \ {u_{B}}end{array} ight]_{t=1}=left[egin{array}{ll}{0.9} & {0.2} \ {0.1} & {0.8}end{array} ight]left[egin{array}{l}{u_{A}} \ {u_{B}}end{array} ight]_{t=0}=left[egin{array}{ll}{0.9} & {0.2} \ {0.1} & {0.8}end{array} ight]left[egin{array}{c}{0} \ {1000}end{array} ight]=left[egin{array}{c}{200} \ {800}end{array} ight]$
这次迁徙主要是从$u_B$迁入$u_A$,有200人进入$u_A$,剩余800人留在$u_B$
我们希望获得长时间迁徙后的人口分布,这需要知道$A$的特征值和特征向量。A是马尔可夫矩阵,因此一个特征值是$lambda_1 = 1$,通过矩阵的迹可知另一个特征值是$lambda_2= 0.9 + 0.8 - 1 = 0.7$,由此可以求得两个特征向量:
$left(A-lambda I ight) x=0 Rightarrow x_{1}=left[egin{array}{l}{2} \ {1}end{array} ight], x_{2}=left[egin{array}{c}{-1} \ {1}end{array} ight]$
通解为:$u_{k}=A^{k} u_{0}=c_{1} lambda_{1}^{k} x_{1}+c_{2} lambda_{2}^{k} x_{2}=c_1left[egin{array}{l}{2} \ {1}end{array} ight]+0.7^kc_2left[egin{array}{1}{-1} \ {1}end{array} ight]$,不懂请点击
由初始条件可求出$c_1 = frac{1000}{3}, c_2=frac{2000}{3}$
由于两个特征值符合方幂运算时达到稳态的条件,所以$u_k$在k增大的过程中趋近于$c_1x_1$,即最后经过多年的迁徙,两个城市的人口趋近于定值:
$left[egin{array}{c}{u_{A}} \ {u_{B}}end{array} ight]_{t=k} = frac{1000}{3} left[egin{array}{c}{2} \ {1}end{array} ight]$
三、带有标准正交基得投影问题
假设$q_1, q_2, ... , q_n$是$n$维空间中的一组基,任意向量$v$都可以利用$q_1, q_2, ... , q_n$来组合构建:
$v = x_1q_1 + x_2q_2 + ... + x_nq_n$
这组基是标准正交的,所以可以通过将每一项和对应的向量做内积来求得对应系数,如我们求系数$x_1$,我们在上面得等号左右同乘$q_1^T$:
$q_{1}^{T} v=x_{1} q_{1}^{T} q_{1}+x_{2} q_{1}^{T} q_{2}+cdots+x_{n} q_{1}^{T} q_{n}=x_{1} q_{1}^{T} q_{1}=x_{1}$,注意这组基标准正交的特点,内积为0,自己内积为1
所以我们可以得到求系数$x_i$的通式:$x_i = q_i^Tv$
又因为:
$mathbf{v}=left[egin{array}{lll}{mathbf{q}_{1}} & {cdots} & {mathbf{q}_{n}}end{array} ight]left[egin{array}{c}{x_{1}} \ {vdots} \ {x_{n}}end{array} ight]$
即:
$v = Qx$,所以$x = Q^{-1}V$
又因为$Q$为标准正交矩阵,所以$Q^{-1} = Q^T$:
$x = Q^Tv$
这与我们之前得到的$x_i = q_i^Tv$完全相同。
这里给出了求分量的思路:就是用空间的一组标准正交基去点乘目标向量,利用其标准正交的性质得到所求,标准正交是此处的核心概念。而傅里叶级数也是在这个概念上构建的。我们可以对任意函数做傅里叶展开,得到表达式
四、傅里叶级数