矩阵的QR分解
矩阵的QR分解
定理. 任意一个 $n$ 阶可逆实方阵 $A$ 均可表为一个实正交方阵 $O$ 和一个对角元全为正数的上三角方阵 $R$ 的乘积, 即 $A=OR$. 而且这种表法惟一.
QR分解中的Q实际上应该是指O, QR分解也可称为正交上三角分解.
参考 [1] P.439.
References
[1] 李炯生、查建国 编著 《线性代数》. 中国科学技术大学出版社.
定理. 任意一个 $n$ 阶可逆实方阵 $A$ 均可表为一个实正交方阵 $O$ 和一个对角元全为正数的上三角方阵 $R$ 的乘积, 即 $A=OR$. 而且这种表法惟一.
QR分解中的Q实际上应该是指O, QR分解也可称为正交上三角分解.
参考 [1] P.439.
References
[1] 李炯生、查建国 编著 《线性代数》. 中国科学技术大学出版社.
1
由此定理的证明, 不妨取 $\alpha_i=e_i$, $i=1,2,\ldots,n$, 则
\[
(\beta_1,\beta_2,\ldots,\beta_n)=(e_1,e_2,\ldots,e_n)A=A.
\]
即, $\beta_i$ 是 $A$ 的第 $i$ 个列向量. 而正交矩阵 $O$ 即 $(\eta_1,\eta_2,\ldots,\eta_n)$. 由于 $A=OR$, 故
\[
R=O^{-1}A=O^T A.
\]
这给出了将可逆方阵 $A$ 进行QR分解的具体算法.
2
证明: 设 $\{\alpha_1,\alpha_2,\ldots,\alpha_n\}$ 是 $n$ 维欧氏空间 $V$ 的一组标准正交基. 因为方阵 $A$ 可逆, 所以由
\[
(\beta_1,\beta_2,\ldots,\beta_n)=(\alpha_1,\alpha_2,\ldots,\alpha_n)A
\]
所确定的向量组 $\{\beta_1,\beta_2,\ldots,\beta_n\}$ 是 $V$ 的一组基. 对向量 $\beta_1,\beta_2,\ldots,\beta_n$ 施行 Gram-Schmidt 正交化, 即令
\[
\begin{aligned}
\xi_1&=\beta_1,\\
\xi_2&=\beta_2-\frac{(\beta_2,\xi_1)}{(\xi_1,\xi_1)}\xi_1,\\
\xi_3&=\beta_3-\frac{(\beta_3,\xi_2)}{(\xi_2,\xi_2)}\xi_2-\frac{(\beta_3,\xi_1)}{(\xi_1,\xi_1)}\xi_1,\\
&\vdots\\
\xi_n&=\beta_n-\frac{(\beta_n,\xi_{n-1})}{(\xi_{n-1},\xi_{n-1})}\xi_{n-1}-\cdots-\frac{(\beta_n,\xi_1)}{(\xi_1,\xi_1)}\xi_1,
\end{aligned}
\]
则向量 $\xi_1,\xi_2,\ldots,\xi_n$ 两两正交, 而且都是非零向量.
将上面的式子改写为
\[
\begin{aligned}
\beta_1&=\xi_1,\\
\beta_2&=\xi_2+\frac{(\beta_2,\xi_1)}{(\xi_1,\xi_1)}\xi_1,\\
\beta_3&=\xi_3+\frac{(\beta_3,\xi_2)}{(\xi_2,\xi_2)}\xi_2+\frac{(\beta_3,\xi_1)}{(\xi_1,\xi_1)}\xi_1,\\
&\vdots\\
\beta_n&=\xi_n+\frac{(\beta_n,\xi_{n-1})}{(\xi_{n-1},\xi_{n-1})}\xi_{n-1}+\cdots+\frac{(\beta_n,\xi_1)}{(\xi_1,\xi_1)}\xi_1,
\end{aligned}
\]
写成矩阵的形式,
\[
(\beta_1,\beta_2,\ldots,\beta_n)=(\xi_1,\xi_2,\ldots,\xi_n)
\begin{pmatrix}
1 & \frac{(\beta_2,\xi_1)}{(\xi_1,\xi_1)} & \frac{(\beta_3,\xi_1)}{(\xi_1,\xi_1)} & \cdots & \frac{(\beta_n,\xi_1)}{(\xi_1,\xi_1)}\\
0 & 1 & \frac{(\beta_3,\xi_2)}{(\xi_2,\xi_2)} & \cdots & \frac{(\beta_n,\xi_2)}{(\xi_2,\xi_2)}\\
0 & 0 & 1 & \cdots & \frac{(\beta_n,\xi_3)}{(\xi_3,\xi_3)}\\
\vdots & \vdots & \vdots &\ddots &\vdots\\
0 & 0 & 0 & \cdots & 1
\end{pmatrix}
\]
再将 $\xi_1,\xi_2,\ldots,\xi_n$ 单位化, 即令
\[
\eta_1=\frac{\xi_1}{\|\xi_1\|},\quad\eta_2=\frac{\xi_2}{\|\xi_2\|},\ldots,\eta_n=\frac{\xi_n}{\|\xi_n\|}.
\]
写成矩阵形式, 即为
\[
(\xi_1,\xi_2,\ldots,\xi_n)=(\eta_1,\eta_2,\ldots,\eta_n)
\begin{pmatrix}
\|\xi_1\| & 0 & 0 & \cdots & 0\\
0 & \|\xi_2\| & 0 & \cdots & 0\\
0 & 0 & \|\xi_3\| & \cdots & 0\\
\vdots & \vdots & \vdots & \ddots & \vdots\\
0 & 0 & 0 & \cdots & \|\xi_n\|
\end{pmatrix}
\]
于是
\[
(\beta_1,\beta_2,\ldots,\beta_n)=(\eta_1,\eta_2,\ldots,\eta_n)R,
\]
其中
\[
\begin{split}
R&=\begin{pmatrix}
\|\xi_1\| & 0 & 0 & \cdots & 0\\
0 & \|\xi_2\| & 0 & \cdots & 0\\
0 & 0 & \|\xi_3\| & \cdots & 0\\
\vdots & \vdots & \vdots & \ddots & \vdots\\
0 & 0 & 0 & \cdots & \|\xi_n\|
\end{pmatrix}
\begin{pmatrix}
1 & \frac{(\beta_2,\xi_1)}{(\xi_1,\xi_1)} & \frac{(\beta_3,\xi_1)}{(\xi_1,\xi_1)} & \cdots & \frac{(\beta_n,\xi_1)}{(\xi_1,\xi_1)}\\
0 & 1 & \frac{(\beta_3,\xi_2)}{(\xi_2,\xi_2)} & \cdots & \frac{(\beta_n,\xi_2)}{(\xi_2,\xi_2)}\\
0 & 0 & 1 & \cdots & \frac{(\beta_n,\xi_3)}{(\xi_3,\xi_3)}\\
\vdots & \vdots & \vdots &\ddots &\vdots\\
0 & 0 & 0 & \cdots & 1
\end{pmatrix}\\
&=\begin{pmatrix}
\|\xi_1\| & (\beta_2,\eta_1) & (\beta_3,\eta_1) & \cdots & (\beta_n,\eta_1) \\
0 & \|\xi_2\| & (\beta_3,\eta_2) & \cdots & (\beta_n,\eta_2)\\
0 & 0 & \|\xi_3\| &\cdots & (\beta_n,\eta_3) \\
\vdots & \vdots & \vdots &\ddots &\vdots\\
0 & 0 & 0 & \cdots & \|\xi_n\|
\end{pmatrix}
\end{split}
\]
由于 $\{\alpha_1,\alpha_2,\ldots,\alpha_n\}$ 与 $\{\eta_1,\eta_2,\ldots,\eta_n\}$ 均是 $V$ 的标准正交基, 故存在 $n$ 阶正交矩阵 $O$, 使得
\[
(\eta_1,\eta_2,\ldots,\eta_n)=(\alpha_1,\alpha_2,\ldots,\alpha_n)O.
\]
因此
\[
(\beta_1,\beta_2,\ldots,\beta_n)=(\alpha_1,\alpha_2,\ldots,\alpha_n)OR.
\]
由于 $V$ 中由一组基到另一组基的过渡矩阵是惟一的, 所以 $A=OR$.
下面证明QR分解的惟一性. 假设 $A=OR=O_1 R_1$, 这里 $O_1\in O(n)$, $R$ 是 $n$ 阶上三角矩阵, 其对角线元素均为正数. 于是
\[
O_1^T O=R_1 R^{-1}.
\]
令 $C=O_1^T O=R_1 R^{-1}$. 由于正交矩阵的乘积仍为正交矩阵 ($O(n)$ 是一个群), 故 $C=O_1^T O$ 仍是 $n$ 阶正交矩阵. 另一方面, 上三角矩阵如果可逆, 其逆仍为上三角矩阵, 于是 $R^{-1}$ 仍是上三角矩阵, 且对角线元素都是正的. 这说明 $C=R_1 R^{-1}$ 也是对角线元素均为正的上三角矩阵. 因此 $C$ 是对角矩阵, 且对角线元素只能是 $1$. 这推出 $O_1=O$, $R_1=R$. 故 QR 分解是惟一的.