Files
ailearning/docs/linalg/chapter14.md
2021-05-07 10:20:42 +08:00

87 lines
4.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 第十四讲:正交向量与子空间
在四个基本子空间中提到对于秩为r的$m \times n$矩阵,其行空间($dim C(A^T)=r$)与零空间($dim N(A)=n-r$)同属于$\mathbb{R}^n$空间,其列空间($dim C(A)=r$)与左零空间($dim N(A^T)$=m-r同属于$\mathbb{R}^m$空间。
对于向量$x, y$,当$x^T \cdot y=0$即$x_1y_1+x_2y_x+\cdots+x_ny_n=0$时,有向量$x, y$正交vector orthogonal
毕达哥拉斯定理Pythagorean theorem中提到直角三角形的三条边满足
$$
\begin{aligned}
\left\|\overrightarrow{x}\right\|^2+\left\|\overrightarrow{y}\right\|^2 &= \left\|\overrightarrow{x+y}\right\|^2 \\
x^Tx+y^Ty &= (x+y)^T(x+y) \\
x^Tx+y^Ty &= x^Tx+y^Ty+x^Ty+y^Tx \\
0 &= x^Ty+y^Tx \qquad 对于向量点乘x^Ty=y^Tx \\
0 &= 2x^Ty \\
x^Ty &=0
\end{aligned}
$$
由此得出,两正交向量的点积为$0$。另外,$x, y$可以为$0$向量,由于$0$向量与任意向量的点积均为零,所以$0$向量与任意向量正交。
举个例子:
$x=\begin{bmatrix}1\\2\\3\end{bmatrix}, y=\begin{bmatrix}2\\-1\\0\end{bmatrix}, x+y=\begin{bmatrix}3\\1\\3\end{bmatrix}$,有$\left\| \overrightarrow{x} \right\|^2=14, \left\| \overrightarrow{y} \right\|^2=5, \left\| \overrightarrow{x+y} \right\|^2=19$,而$x^Ty=1\times2+2\times (-1)+3\times0=0$。
向量$S$与向量$T$正交,则意味着$S$中的每一个向量都与$T$中的每一个向量正交。若两个子空间正交,则它们一定不会相交于某个非零向量。
现在观察行空间与零空间,零空间是$Ax=0$的解,即$x$若在零空间,则$Ax$为零向量;
而对于行空间,有 $
\begin{bmatrix}row_1\\row_2\\ \vdots \\row_m\end{bmatrix}
\Bigg[x\Bigg]=
\begin{bmatrix}0\\0\\ \vdots\\ 0\end{bmatrix}
$,可以看出:
$$
\begin{bmatrix}row_1\end{bmatrix}\Bigg[x\Bigg]=0 \\
\begin{bmatrix}row_2\end{bmatrix}\Bigg[x\Bigg]=0 \\
\vdots \\
\begin{bmatrix}row_m\end{bmatrix}\Bigg[x\Bigg]=0 \\
$$
所以这个等式告诉我们,$x$同$A$中的所有行正交;
接下来还验证$x$是否与$A$中各行的线性组合正交,
$
\begin{cases}
c_1(row_1)^Tx=0 \\
c_2(row_2)^Tx=0 \\
\vdots \\
c_n(row_m)^Tx=0 \\
\end{cases}
$,各式相加得$(c_1row_1+c_2row_2+\cdots+c_nrow_m)^Tx=0$,得证。
我们可以说,行空间与零空间将$\mathbb{R}^n$分割为两个正交的子空间,同样的,列空间与左零空间将$\mathbb{R}^m$分割为两个正交的子空间。
举例,$A=\begin{bmatrix}1&2&5\\2&4&10\end{bmatrix}$,则可知$m=2, n=3, rank(A)=1, dim N(A)=2$。
有$Ax=\begin{bmatrix}1&2&5\\2&4&10\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}$,解得零空间的一组基$x_1=\begin{bmatrix}-2\\1\\0\end{bmatrix}\quad x_2=\begin{bmatrix}-5\\0\\1\end{bmatrix}$。
而行空间的一组基为$r=\begin{bmatrix}1\\2\\5\end{bmatrix}$,零空间与行空间正交,在本例中行空间也是零空间的法向量。
补充一点,我们把行空间与零空间称为$n$维空间里的正交补orthogonal complement即零空间包含了所有与行空间正交的向量同理列空间与左零空间为$m$维空间里的正交补,即左零空间包含了所有与零空间正交的向量。
接下来看长方矩阵,$m>n$。对于这种矩阵,$Ax=b$中经常混入一些包含“坏数据”的方程,虽然可以通过筛选的方法去掉一些我们不希望看到的方程,但是这并不是一个稳妥的方法。
于是,我们引入一个重要的矩阵:$A^TA$。这是一个$n \times m$矩阵点乘$m \times n$矩阵,其结果是一个$n \times n$矩阵,应该注意的是,这也是一个对称矩阵,证明如下:
$$
(A^TA)^T=A^T(A^T)^T=A^TA
$$
这一章节的核心就是$A^TAx=A^Tb$,这个变换可以将“坏方程组”变为“好方程组”。
举例,有$\begin{bmatrix}1&1\\1&2\\1&5\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}$,只有当$\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}$在矩阵的列空间时,方程才有解。
现在来看$\begin{bmatrix}1&1&1\\1&2&5\end{bmatrix}\begin{bmatrix}1&1\\1&2\\1&5\end{bmatrix}=\begin{bmatrix}3&8\\8&30\end{bmatrix}$,可以看出此例中$A^TA$是可逆的。然而并非所有$A^TA$都是可逆的,如$\begin{bmatrix}1&1&1\\3&3&3\end{bmatrix}\begin{bmatrix}1&3\\1&3\\1&3\end{bmatrix}=\begin{bmatrix}3&9\\9&27\end{bmatrix}$(注意到这是两个秩一矩阵相乘,其结果秩不会大于一)
先给出结论:
$$
N(A^TA)=N(A)\\
rank(A^TA)=rank(A)\\
A^TA可逆当且仅当N(A)为零向量即A的列线性无关\\
$$
下一讲涉及投影,很重要。