Files
ailearning/docs/linalg/chapter33.md
2021-05-07 10:20:42 +08:00

69 lines
6.8 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 第三十三讲单元检测3复习
在上一次复习中,我们已经涉及了求特征值与特征向量(通过解方程$\det(A-\lambda I)=0$得出$\lambda$,再将$\lambda$带入$A-\lambda I$求其零空间得到$x$)。
接下的章节来我们学习了:
* 解微分方程$\frac{\mathrm{d}u}{\mathrm{d}t}=Au$,并介绍了指数矩阵$e^{At}$
* 介绍了对称矩阵的性质$A=A^T$,了解了其特征值均为实数且总是存在足量的特征向量(即使特征值重复特征向量也不会短缺,总是可以对角化);同时对称矩阵的特征向量正交,所以对称矩阵对角化的结果可以表示为$A=Q\Lambda Q^T$
* 接着我们学习了正定矩阵;
* 然后学习了相似矩阵,$B=M^{-1}AM$,矩阵$A,B$特征值相同,其实相似矩阵是用不同的基表示相同的东西;
* 最后我们学习了奇异值分解$A=U\varSigma V^T$。
现在,我们继续通过例题复习这些知识点。
1. *解方程$\frac{\mathrm{d}u}{\mathrm{d}t}=Au=\begin{bmatrix}0&-1&0\\1&0&-1\\0&1&0\end{bmatrix}u$*
首先通过$A$的特征值/向量求通解$u(t)=c_1e^{\lambda_1t}x_1+c_2e^{\lambda_2t}x_2+c_3e^{\lambda_3t}x_3$,很明显矩阵是奇异的,所以有$\lambda_1=0$
继续观察矩阵会发现$A^T=-A$这是一个反对称矩阵anti-symmetric或斜对陈矩阵skew-symmetric这与我们在第二十一讲介绍过的旋转矩阵类似它的特征值应该为纯虚数特征值在虚轴上所以我们猜测其特征值应为$0\cdot i,\ b\cdot i,\ -b\cdot i$。通过解$\det(A-\lambda I)=0$验证一下:$\begin{bmatrix}-\lambda&-1&0\\1&-\lambda&-1\\0&1&\lambda\end{bmatrix}=\lambda^3+2\lambda=0, \lambda_2=\sqrt 2i, \lambda_3=-\sqrt 2i$。
此时$u(t)=c_1+c_2e^{\sqrt 2it}x_2+c_3e^{-\sqrt 2it}x_3$$e^{\sqrt 2it}$始终在复平面单位圆上,所以$u(t)$及不发散也不收敛,它只是具有周期性。当$t=0$时有$u(0)=c_1+c_2+c_3$,如果使$e^{\sqrt 2iT}=1$即$\sqrt 2iT=2\pi i$则也能得到$u(T)=c_1+c_2+c_3$,周期$T=\pi\sqrt 2$。
另外,反对称矩阵同对称矩阵一样,具有正交的特征向量。当矩阵满足什么条件时,其特征向量相互正交?答案是必须满足$AA^T=A^TA$。所以对称矩阵$A=A^T$满足此条件,同时反对称矩阵$A=-A^T$也满足此条件,而正交矩阵$Q^{-1}=Q^T$同样满足此条件,这三种矩阵的特征向量都是相互正交的。
上面的解法并没有求特征向量,进而通过$u(t)=e^{At}u(0)$得到通解,现在我们就来使用指数矩阵来接方程。如果矩阵可以对角化(在本例中显然可以),则$A=S\Lambda S^{-1}, e^{At}=Se^{\Lambda t}S^{-1}=S\begin{bmatrix}e^{\lambda_1t}&&&\\&e^{\lambda_1t}&&\\&&\ddots&\\&&&e^{\lambda_1t}\end{bmatrix}S^{-1}$,这个公式在能够快速计算$S,\lambda$时很方便求解。
2. 已知矩阵的特征值$\lambda_1=0,\lambda_2=c,\lambda_3=2$,特征向量$x_1=\begin{bmatrix}1\\1\\1\end{bmatrix},x_2=\begin{bmatrix}1&-1&0\end{bmatrix},x_3=\begin{bmatrix}1\\1\\-2\end{bmatrix}$
*$c$如何取值才能保证矩阵可以对角化?*其实可对角化只需要有足够的特征向量即可,而现在特征向量已经足够,所以$c$可以取任意值。
*$c$如何取值才能保证矩阵对称?*我们知道,对称矩阵的特征值均为实数,且注意到给出的特征向量是正交的,有了实特征值及正交特征向量,我们就可以得到对称矩阵。
*$c$如何取值才能使得矩阵正定?*已经有一个零特征值了,所以矩阵不可能是正定的,但可以是半正定的,如果$c$去非负实数。
*$c$如何取值才能使得矩阵是一个马尔科夫矩阵?*在第二十四讲我们知道马尔科夫矩阵的性质:必有特征值等于$1$,其余特征值均小于$1$,所以$A$不可能是马尔科夫矩阵。
*$c$取何值才能使得$P=\frac{A}{2}$是一个投影矩阵?*我们知道投影矩阵的一个重要性质是$P^2=P$,所以有对其特征值有$\lambda^2=\lambda$,则$c=0,2$。
题设中的正交特征向量意义重大,如果没有正交这个条件,则矩阵$A$不会是对称、正定、投影矩阵。因为特征向量的正交性我们才能直接去看特征值的性质。
3. 复习奇异值分解,$A=U\varSigma V^T$
先求正交矩阵$V$$A^TA=V\varSigma^TU^TU\varSigma V^T=V\left(\varSigma^T\varSigma\right)V^T$,所以$V$是矩阵$A^TA$的特征向量矩阵,而矩阵$\varSigma^T\varSigma$是矩阵$A^TA$的特征值矩阵,即$A^TA$的特征值为$\sigma^2$。
接下来应该求正交矩阵$U$$AA^T=U\varSigma^TV^TV\varSigma U^T=U\left(\varSigma^T\varSigma\right)U^T$,但是请注意,我们在这个式子中无法确定特征向量的符号,我们需要使用$Av_i=\sigma_iu_i$,通过已经求出的$v_i$来确定$u_i$的符号(因为$AV=U\varSigma$),进而求出$U$。
*已知$A=\bigg[u_1\ u_2\bigg]\begin{bmatrix}3&0\\0&2\end{bmatrix}\bigg[v_1\ v_2\bigg]^T$*
从已知的$\varSigma$矩阵可以看出,$A$矩阵是非奇异矩阵,因为它没有零奇异值。另外,如果把$\varSigma$矩阵中的$2$改成$-5$,则题目就不再是奇异值分解了,因为奇异值不可能为负;如果将$2$变为$0$,则$A$是奇异矩阵,它的秩为$1$,零空间为$1$维,$v_2$在其零空间中。
4. *$A$是正交对称矩阵,那么它的特征值具有什么特点*
首先,对于对称矩阵,有特征值均为实数;然后是正交矩阵,直觉告诉我们$|\lambda|=1$。来证明一下,对于$Qx=\lambda x$,我们两边同时取模有$\|Qx\|=|\lambda|\|x\|$,而**正交矩阵不会改变向量长度**,所以有$\|x\|=|\lambda|\|x\|$,因此$\lambda=\pm1$。
*$A$是正定的吗?*并不一定,因为特征向量可以取$-1$。
*$A$的特征值没有重复吗?*不是,如果矩阵大于$2$阶则必定有重复特征值,因为只能取$\pm1$。
*$A$可以被对角化吗?*是的,任何对称矩阵、任何正交矩阵都可以被对角化。
*$A$是非奇异矩阵吗?*是的,正交矩阵都是非奇异矩阵。很明显它的特征值都不为零。
*证明$P=\frac{1}{2}(A+I)$是投影矩阵*
我们使用投影矩阵的性质验证,首先由于$A$是对称矩阵,则$P$一定是对称矩阵;接下来需要验证$P^2=P$,也就是$\frac{1}{4}\left(A^2+2A+I\right)=\frac{1}{2}(A+I)$。来看看$A^2$是什么,$A$是正交矩阵则$A^T=A^{-1}$,而$A$又是对称矩阵则$A=A^T=A^{-1}$,所以$A^2=I$。带入原式有$\frac{1}{4}(2A+2I)=\frac{1}{2}(A+I)$,得证。
我们可以使用特征值验证,$A$的特征值可以取$\pm1$,则$A+I$的特征值可以取$0,2$$\frac{1}{2}(A+I)$的特征值为$0,1$,特征值满足投影矩阵且它又是对称矩阵,得证。