线性代数-相似矩阵与二次型

线性代数-相似矩阵与二次型

本章主要讨论方阵的特征值与特征向量、方阵的相似对角化和二次型的化简等问题。

其中涉及向量的内积、长度及正交等知识,下面先介绍这些知识。

向量的内积、长度及正交性

向量的内积

向量内积的引入

在(平面/空间)解析几何中,我们曾引进向量的数量积/内积:\(x \cdot y=|x||y| \cos \theta\), 然后定义了向量间的夹角余弦与夹角(包括垂直的定义), 且以互相垂直向量为轴,建立直角坐标系,有(直角坐标系中的)数量积的坐标表示:\(\left(x_{1}, x_{2}, x_{3}\right) \cdot\left(y_{1}, y_{2}, y_{3}\right)=x_{1} y_{1}+x_{2} y_{2}+x_{3} y_{3}\)

n维向量的内积是数量积的一种推广。但n维向量没有3维向量那样直观的长度和夹角的概念,因此只能按数量积的直角坐标计算公式来推广。并且反过来,利用内积来定义n维向量的长度和夹角。

向量x与y内积的定义

设有n维向量: \(\boldsymbol{x}=\left(\begin{array}{c}x_{1} \\ x_{2} \\ \vdots \\ x_{n}\end{array}\right), \boldsymbol{y}=\left(\begin{array}{c}y_{1} \\ y_{2} \\ \vdots \\ y_{n}\end{array}\right)\)\([x, y]=x_{1} y_{1}+x_{2} y_{2}+\cdots+x_{n} y_{n}\) 称[ x, y]为向量x与y的内积

当x与y都是列向量时, 有\([x, y]=x^{T} y\)

向量的内积,结果是个实数。

向量内积的基本性质

(其中 x, y, z 为 n 维向量, \(\lambda\) 为实数)

\([x, y]=[y, x]\)

\([\lambda x, y]=\lambda[x, y]\)

\([x+y, z]=[x, z]+[y, z]\)

\(\boldsymbol x=\boldsymbol 0\)\(,[\boldsymbol x, \boldsymbol x]=0 ;\)\(\boldsymbol x \neq 0\)\(,[\boldsymbol x, \boldsymbol x]>0\)

施瓦茨不等式\([x, y]^{2} \leqslant[x, x][y, y]\)

\([x, y]^{2} \leqslant[x, x][y, y]\)

(证明见百度百科:柯西—施瓦茨不等式:实内积空间的情形

向量的长度与夹角

向量长度(范数)的定义

\(\|x\|=\sqrt{[x, x]}=\sqrt{x_{1}^{2}+x_{2}^{2}+\cdots+x_{n}^{2}}\)\(\| x \|\) 称为 n 维向量 \(x\) 的长度(或范数).

可见n维向量的长度是通过内积定义的。\(\| x \|=1\)时,称x为单位向量。

向量长度的性质
非负性

\(x \neq 0\)\(,\|x\|>0 ;\)\(x=0\)\(,\|x\|=0\)

齐次性

\(\|\lambda x\|=|\lambda|\|x\|\)

三角不等式

\(\|x+y\| \leqslant\|x\|+\|y\|\)

证明: \(\|x+y\|^{2}=[x+y, x+y]=[x, x]+2[x, y]+[y, y]\) 根据施瓦茨不等式\([x, y] \leqslant \sqrt{[x, x][y, y]}\)\(\|x+y\|^{2} \leqslant[x, x]+2 \sqrt{[x, x][y, y]}+[y, y]\)\(=\|x\|^{2}+2\|x\|\|y\|+\|y\|^{2}=(\|x\|+\|y\|)^{2}\)\(\|x+y\| \leqslant\|x\|+\|y\|\)

向量x与y夹角的定义

根据施瓦茨不等式\(|[x, y]| \leqslant\|x\|\|y\|\)\(\left|\frac{[x, y]}{x\|\| y \|}\right| \leqslant 1 \quad(\)\(\|x\|\|y\| \neq 0\)\()\)\(x \neq 0, y \neq 0\) 时,\(\theta=\arccos\frac{[x, y]}{\|x\|\|y\|}\)称为 n 维向量 x 与 y 的夹角

可见n维向量之间的夹角也是通过内积定义的。

向量的正交与正交矩阵

向量正交与向量组正交

向量x与向量y正交

\([ x, y]=0\) 时, 称向量 x 与 y 正交. 显然,若 \(x=0\), 则 \(x\) 与任何向量都正交。若\(x\neq 0, y\neq 0\),两向量正交也可认为是向量的夹角为\(\frac{\pi}{2}\)

向量组正交

一组两两都正交的非零向量,称为正交向量组

向量组非零且正交\(\Rightarrow\)向量组线性无关

定理:若n维向量\(\boldsymbol{a}_{1}, \boldsymbol{a}_{2}, \cdots, \boldsymbol{a}_{r}\)都非零且两两正交\(\Rightarrow\)\(\boldsymbol{a}_{1}, \boldsymbol{a}_{2}, \cdots, \boldsymbol{a}_{r}\)线性无关

证明

设有\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{r}\)使\(\lambda_{1} a_{1}+\lambda_{2} a_{2}+\cdots+\lambda_{r} a_{r}=0\)\(\boldsymbol{a}_{\mathbf{1}}^{\mathrm{T}}\)左乘上式,因当 \(i \geqslant 2\) 时, \(\boldsymbol{a}_{1}^{\mathrm{T}} \boldsymbol{a}_{i}=0\),故\(\lambda_{1} a_{1}^{T} a_{1}=0\)\(a_{1} \neq 0,\)\(a_{1}^{\mathrm{T}} a_{1}=\left\|a_{1}\right\|^{2} \neq 0\)。从而必有 \(\lambda_{1}=0 .\) 类似可证 \(\lambda_{2}=0, \cdots, \lambda_{r}=0\) 于是向量组 \(a_{1}, a_{2}, \cdots, a_{r}\) 线性无关.

向量空间的规范正交基

向量组正交的性质:向量组非零且正交\(\Rightarrow\)向量组线性无关, 那么考虑相反的情况,如何根据一个线性无关的向量组,如何得到一个等价的正交向量组呢?

规范正交基的定义

设n维向量\(e_{1}, e_{2}, \cdots, e_{r}\)是向量空间\(V\left(V \subset \mathbb{R}^{n}\right)\)的一个基1, 如果\(e_{1}, e_{2}, \cdots, e_{r}\)两两正交,且都是单位向量, 则称\(e_{1}, e_{2}, \cdots, e_{r}\)是一个规范正交基。 那么V中的任意向量都可以由 \(e_{1}, \cdots, e_{r}\)表示,表示式为\(a=\lambda_{1} e_{1}+\lambda_{2} e_{2}+\cdots+\lambda_{r} e_{r}\)

向量在规范正交基中的坐标的计算

为求\(a=\lambda_{1} e_{1}+\lambda_{2} e_{2}+\cdots+\lambda_{r} e_{r}\)的系数 \(\lambda_{i}(i=1, \cdots, r),\) 可用 \(e_{i}^{\mathrm{T}}\) 左乘上式,有\(e_{i}^{\mathrm{T}} a=\lambda_{i} e_{i}^{\mathrm{T}} e_{i}=\lambda_{i}\),即\(\lambda_{i}=e_{i}^{T} a=\left[a, e_{i}\right]\)

基(线性无关向量组)的规范正交化

\(a_{1}, \cdots, a_{r}\)是向量空间ⅴ的一个基(最大线性无关组),要求ⅴ的一个规范正交基。这也就是要找一组两两正交的单位向量\(e_{1}, \cdots, e_{r}\),使\(e_{1}, \cdots, e_{r}\)\(a_{1}, \cdots, a_{r}\)等价。这样的问题,称为把\(a_{1}, \cdots, a_{r}\)规范正交化。

施密特正交化方法

(按以下流程,得一组相互正交的向量组): \(b_{1}=a_{1}\) \(b_{2}=a_{2}-\frac{\left[b_{1}, a_{2}\right]}{\left[b_{1}, b_{1}\right]} b_{1}\)
(实际上是设\(\beta_{2}=\alpha_{2}-k \beta_{1}\),并满足 \(\beta_{1} \perp\beta_{2}\) ,即\(\left\langle\beta_{2}, \beta_{1}\right\rangle=\left\langle\alpha_{2}, \beta_{1}\right\rangle-k\left\langle\beta_{1}, \beta_{1}\right\rangle=0\),解得k) ……… \(b_{r}=a_{r}-\frac{\left[b_{1}, a_{r}\right]}{\left[b_{1}, b_{1}\right]} b_{1}-\frac{\left[b_{2}, a_{r}\right]}{\left[b_{2}, b_{2}\right]} b_{2}-\cdots-\frac{\left[b_{r-1}, a_{r}\right]}{\left[b_{r-1}, b_{r-1}\right]} b_{r-1}\) 容易验证\(b_{1}, \cdots, b_{r}\)两两相互正交,且\(b_{1}, \cdots, b_{r}\)\(a_{1}, \cdots, a_{r}\)等价。

单位化

将上面得到的正交向量组,都化为单位向量,就求得了一个规范正交基

正交矩阵

正交矩阵定义\(\boldsymbol{A}^{\mathrm{T}} \boldsymbol{A}=\boldsymbol{E}\)

如果 n 阶矩阵 A 满足\(\boldsymbol{A}^{\mathrm{T}} \boldsymbol{A}=\boldsymbol{E}\) \(\left(\right.\)\(\left.\boldsymbol{A}^{-1}=\boldsymbol{A}^{\mathrm{T}}\right)\) 那么称 A 为正交矩阵,简称正交阵。

也就是说矩阵的行(或列)向量之间点积等于0(向量正交),行(或列)向量与自身的点积等于1(单位向量),所以正交矩阵又有另一种定义:由行之间两两正交、列之间两两正交的单位向量组成的方阵。

方阵A是正交矩阵\(\Leftrightarrow\)\(A^T =A^{-1}\)
方阵A是正交矩阵\(\Leftrightarrow\)A的列向量组(或行向量组)是规范正交基

方阵A是正交矩阵\(\Leftrightarrow\)A的列向量(或行向量)都是单位向量,且两两正交\(\Leftrightarrow\)A的列向量组(或行向量组)是规范正交基

方阵A是正交矩阵 \(\Leftrightarrow\)方阵A用列向量组表示,根据正交矩阵定义有: \(\left(\begin{array}{c}a_{1}^{\mathrm{T}} \\ a_{2}^{\mathrm{T}} \\ \vdots \\ a_{n}^{\mathrm{T}}\end{array}\right)\left(a_{1}, a_{2}, \cdots, a_{n}\right)=E\) \(\Leftrightarrow\)\(\left(a_{i}^{T} a_{j}\right)=\left(\delta_{i j}\right)\) \(\Leftrightarrow\)\(\boldsymbol{a}_{i}^{\mathrm{T}} a_{j}=\delta_{i j}=\left\{\begin{array}{ll}1, \text { 当 } i=j, & (i, j=1,2, \cdots, n) \\ 0, \text { 当 } i \neq j\end{array}\right.\) \(\Leftrightarrow\)A的列向量都是单位向量,且两两正交 \(\Leftrightarrow\)列向量组构成向量空间\(\mathbb{R}^{n}\)规范正交基

\(\mathbf{A}^{\mathrm{T}} \mathbf{A}=\mathbf{E}\)\(\mathbf{A} \mathbf{A}^{\mathrm{T}}=\mathbf{E}\)等价,所以,上述结论对于A的行向量也成立

若A是正交阵\(\Rightarrow\)\(A^{-1}=A^{\mathrm{T}}\)也是正交阵,且 \(|A|=1\) 或(-1)
若A和B都是正交阵\(\Rightarrow\)AB也是正交阵

证明: A、B是正交矩阵,根据定义知道AA’=A’A=E, BB’=B’B=E, 那么(AB)(AB)‘=(AB)(B’A’)=ABB’A’=A(BB’)A=AEA’=AA’=E

若A是正交阵\(\Rightarrow\)\(\|Ax\|=\|x\|\)

证明 若A是正交阵,则\(A^T A = E\) \(\|Ax\|= (Ax)^T (Ax) = x^T A^T A x = x^T x = \|x\|\)

正交变换\(y=P x\)

若 P 为正交矩阵,则线性变换 \(y=P x\) 称为正交变换.

设y = Px 为正交变换,则\(\|y\|=\|x\|\)

证明:\(\|\boldsymbol{y}\|=\sqrt{\boldsymbol{y}^{\mathrm{T}} \boldsymbol{y}}=\sqrt{\boldsymbol{x}^{\mathrm{T}} \boldsymbol{P}^{\mathrm{T}} \boldsymbol{P x}}=\sqrt{\boldsymbol{x}^{\mathrm{T}} \boldsymbol{x}}=\|\boldsymbol{x}\|\)

即正交变换不改变向量的长度(从而保证三角形长度不变)

方阵的特征值与特征向量

\(A x=\lambda x\)中A的特征值与特征向量

设 A 是 n 阶矩阵,如果数$\(和 n 维**非零**列向量x 使关系式\)A x=x\(成立,(或者\)(A-E)x=0$成立) 那么,这样的数λ称为矩阵A的特征值,非零向量x称为A的对应于特征值λ的特征向量

求特征值与特征向量

根据方阵A,\(A x=\lambda x\)其中的特征值\(\lambda\)与对应的特征向量\(x\)的问题 \(\Leftrightarrow\)n个未知数n个方程的齐次线性方程组\((A-\lambda E) x=0\)何时有非零解,以及非零解的求解问题

根据方阵A,\(A x=\lambda x\)其中的特征值\(\lambda\) \(\Leftrightarrow\)n个未知数n个方程的齐次线性方程组\((A-\lambda E) x=0\)有非零解 \(\Leftrightarrow\)系数矩阵行列式=0,即\(|A-\lambda E| = 0\) \(\Leftrightarrow\)求矩阵A的特征方程(特征多项式2等于0)的解,即(下式中\(\lambda\)的解): \(\left|\begin{array}{cccc}a_{11}-\lambda & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n}-\lambda\end{array}\right|=0\)

求特征值与特征向量的步骤

根据上面解方程组的思路,给出求特征值与特征向量的一般方法: 1)由\(|A-\lambda E| = 0\)求特征值\(\lambda_i\),共n个(含重根) 2)由\((A-\lambda_i E) x=0\)求基础解系,用基础解系表示处特征向量的通解

事实上,还可以下面特征值的性质/公式来求解特征值

特征值的性质

n阶方阵A有n个特征值(含重根)

根据求特征值与特征向量的过程(特征多项式\(|A-\lambda E|\)\(\lambda\)的n次多项式), 可知n阶方阵A有n个特征值(以重根计算)

特征值之和\(\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=a_{11}+a_{22}+\cdots+a_{n n}\) 与特征值之积\(\lambda_{1} \lambda_{2} \cdots \lambda_{n}=|\boldsymbol{A}|\)

\(n\) 阶矩阵 \(\boldsymbol{A}=\left(a_{i j}\right)\) 的特征值为 \(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\) \(\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=a_{11}+a_{22}+\cdots+a_{n n}\) (特征值之和等于方阵的迹) \(\lambda_{1} \lambda_{2} \cdots \lambda_{n}=|\boldsymbol{A}|\) (特征值之积等于方阵的行列式)

证明: 根据 \(f(\lambda)=\left(\lambda-\lambda_{1}\right)\left(\lambda-\lambda_{2}\right) \cdots\left(\lambda-\lambda_{n}\right)\) \(=k_0 \lambda^0 + \cdots + k_{n-1} \lambda^{n-1} + k_{n} \lambda^n\) 显然 $k_0 = {1} {2} _{n} $, \(k_{n-1} = -(\lambda_1 + \lambda_2 + \cdots + \lambda_n)\)

又根据 $f()=|E-A|=| \[\begin{array}{cccc}\lambda-a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & \lambda-a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & \lambda-a_{n n}\end{array}\]

| \(, 要想产生n-1次项\)k_{n-1}{n-1}\(,只能由主对角线的乘积\)(-a_{11})(-a_{22})(-a_{nn})\(产生, 且\)k_{n-1}{n-1} = -(a_{11}+a_{22} + + a_{nn})$ 根据行列式的定义:所有不同行不同列的元素乘积组成的项之和, 0次项$k_0 _0 \(是排除掉其他幂次后的项,恰好\)k_0 _0 = |A|$

综上, \(\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=a_{11}+a_{22}+\cdots+a_{n n}\) (特征值之和等于方阵的迹) \(\lambda_{1} \lambda_{2} \cdots \lambda_{n}=|\boldsymbol{A}|\) (特征值之积等于方阵的行列式)

\(\lambda\)是A的特征值\(\Rightarrow\)\(\lambda^k\)\(A^k\) 的特征值

\(A x=\lambda x,x\neq 0\)\(\Rightarrow\)\(A^k x=\lambda^k x,x\neq 0\)

\(\lambda\)是A的特征值\(\Rightarrow\)\(\lambda+k\)\(A+kE\) 的特征值​

\(A x=\lambda x,x\neq 0\)\(\Rightarrow\)\((A+kE) x=(\lambda+k) x,x\neq 0\)

\(\lambda\)是A的特征值\(\Rightarrow\)\(\frac{1}{\lambda}\)\(A^{-1}\)的特征值

\(A x=\lambda x,x\neq 0\)\(\Rightarrow\)\(A^{-1} x=\frac{1}{\lambda} x,x\neq 0\)

推论:A可逆\(\Rightarrow\)特征值非0
\(\lambda\)是A的特征值\(\Rightarrow\)\(\frac{|A|}{\lambda}\)\(A^{*}\)的特征值

\(A x=\lambda x,x\neq 0\)\(\Rightarrow\)\(A^{*} x=\frac{|A|}{\lambda} x,x\neq 0\)

\(\lambda\)是A的特征值\(\Rightarrow\)特征值多项式\(\varphi(\lambda)\)是对应矩阵多项式\(\varphi(\boldsymbol{A})\)的特征值

\(\lambda\) 是方阵 A 的特征值,

\(\lambda^{2}\)\(A^2\)的特征值, \(\lambda^k\)\(A^k\) 的特征值

\(\frac{1}{\lambda}\)\(\boldsymbol{A}^{-1}\) 的特征值 (当 A 可逆时)

推论:当A可逆时,特征值不为0

\(\varphi(\lambda)=a_{0}+a_{1} \lambda+\cdots+a_{m} \lambda^{m}\)\(\varphi(\boldsymbol{A})=a_{0} \boldsymbol{E}\)\(+a_{1} \boldsymbol{A}+\cdots+a_{n} \boldsymbol{A}^{m}\)\(+a_{1} \boldsymbol{A}+\cdots+a_{n} \boldsymbol{A}^{m}\)的特征值 (实际上,这里的幂次m可取负数,只要认为\(A^{m}=(A^{-1})^n\))

特征值不相等\(\Rightarrow\)特征向量线性无关

\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{m}\) 是方阵 \(A\)\(m\) 个特征值 \(, p_{1}, p_{2}, \cdots, p_{m}\) 依次是与之对应的特征向量,如果 \(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{m}\) 各不相等 ,则 \(p_{1}, p_{2}, \cdots, p_{m}\) 线性无关.

证明(用数学归纳法证明)

当m=1时,因特征向量\(p_1\neq 0\),故只含一个向量的向量组\(p_1\)线性无关.

假设当 m = k - 1 时结论成立,要证当 m = k 时结论也成立。 假设\(p_{1}, p_{2}, \cdots, p_{k-1}\)线性无关, 令\(x_{1} p_{1}+x_{2} p_{2}+\cdots+x_{k-1} p_{k-1}+x_{k} p_{k}=0\), (1) 用A左乘上式,得\(x_{1} A p_{1}+x_{2} A p_{2}+\cdots+x_{k-1} A p_{k-1}+x_{k} A p_{k}=0\)\(x_{1} \lambda_{1} p_{1}+x_{2} \lambda_{2} p_{2}+\cdots+x_{k-1} \lambda_{k-1} p_{k-1}+x_{k} \lambda_{k} p_{k}=0\) (2)

\((2) - \lambda_k (1)\)\(x_{1}\left(\lambda_{1}-\lambda_{k}\right) p_{1}+x_{2}\left(\lambda_{2}-\lambda_{k}\right) p_{2}+\cdots+x_{k-1}\left(\lambda_{k-1}-\lambda_{k}\right) p_{k-1}=0\) 由于\(p_{1}, p_{2}, \cdots, p_{k-1}\)线性无关,\(x_{i}\left(\lambda_{i}-\lambda_{k}\right)=0(i=1,2, \cdots, k-1),\)\(\lambda_{i}-\lambda_{k} \neq 0\)\((i=1,2, \cdots, k-1)\), 于是\(x_{i}=0(i=1,2, \cdots, k-1)\) 代入(2)得\(x_{k} p_{k}=0\).而\(p_{k} \neq 0,\)\(x_{k}=0 .\) 因此, 向量组 \(p_{1}, p_{2}, \cdots, p_{k}\) 线性无关.

相似矩阵

矩阵相似\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B}\)

设A,B都是n阶矩阵,若有可逆矩阵P,使\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B}\),则称B是A的相似矩阵,或说矩阵A与B相似. 对A进行运算\(\boldsymbol{P}^{-1} \boldsymbol{A P}\)称为对A进行相似变换, 可逆矩阵P称为把A变成B的相似变换矩阵

矩阵相似的性质

反身性对称性传递性

矩阵A与A相似

矩阵A与B相似\(\Rightarrow\)矩阵B与A相似

矩阵A与B相似,B与C相似\(\Rightarrow\)矩阵A与C相似

矩阵A与B相似\(\Rightarrow\)矩阵\(A+kE\)\(B+kE\)相似

注意: 虽然有性质:矩阵A与B相似\(\Rightarrow\)矩阵\(A+kE\)\(B+kE\)相似 但是,并没有A的多项式与B的多项式相似的结论!!!

矩阵A与B相似\(\Rightarrow\)矩阵\(A^n\)\(B^n\)相似

特别的,矩阵A与\(\Lambda\)相似\(\Rightarrow\)矩阵\(A^n\)\(\Lambda^n\)相似

矩阵A与B相似\(\Rightarrow\)\(r(A)=r(B)\)

证明 矩阵A与B相似,即\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B}\), 又P是可逆矩阵,初等变换变换不改变矩阵的秩, 所以\(r(A)=r(B)\)

定理: n阶矩阵A与B相似\(\Rightarrow\)A与B的特征多项式相同\(\Rightarrow\)A与B的特征值相同

证明 \(|\boldsymbol{B}-\lambda \boldsymbol{E}|=\left|\boldsymbol{P}^{-1} \boldsymbol{A P}-\boldsymbol{P}^{-1}(\lambda \boldsymbol{E}) \boldsymbol{P}\right|=\left|\boldsymbol{P}^{-1}(\boldsymbol{A}-\lambda \boldsymbol{E}) \boldsymbol{P}\right|\) \(=\left|\boldsymbol{P}^{-1}\right||\boldsymbol{A}-\lambda \boldsymbol{E}||\boldsymbol{P}|=|\boldsymbol{A}-\lambda \boldsymbol{E}|\)

推论: n阶矩阵A与对角阵\(\Lambda\)相似\(\Rightarrow\)\(\Lambda\)对角线上的值是\(\boldsymbol{A}\)\(n\) 个特征值

若 n 阶矩阵 A 与对角阵\(\mathbf{\Lambda}=\left(\begin{array}{llll}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{array}\right)\)相似,则 \(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\) 即是 \(\boldsymbol{A}\)\(n\) 个特征值

证明

\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\) 即是 \(\boldsymbol{\Lambda}\)\(n\) 个特征值,由矩阵相似的性质:n阶矩阵A与B相似\(\Rightarrow\)A与B的特征多项式相同\(\Rightarrow\)A与B的特征值相同\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\) 也就是A的n个特征值

矩阵A与B相似\(\Rightarrow\)\(|A|=|B|\)

证明 根据:特征值之和\(\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=a_{11}+a_{22}+\cdots+a_{n n}\) 与特征值之积\(\lambda_{1} \lambda_{2} \cdots \lambda_{n}=|\boldsymbol{A}|\), 以及定理: n阶矩阵A与B相似\(\Rightarrow\)A与B的特征多项式相同\(\Rightarrow\)A与B的特征值相同 立即可知,若矩阵A与B相似,则\(|A|=|B|\)

矩阵A与B相似\(\Rightarrow\)\(\sum a_{ii}=\sum b_{ii}\)

证明 根据:特征值之和\(\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=a_{11}+a_{22}+\cdots+a_{n n}\) 与特征值之积\(\lambda_{1} \lambda_{2} \cdots \lambda_{n}=|\boldsymbol{A}|\), 以及定理: n阶矩阵A与B相似\(\Rightarrow\)A与B的特征多项式相同\(\Rightarrow\)A与B的特征值相同 立即可知,若矩阵A与B相似,则矩阵的迹相等

矩阵A与B相似\(\Rightarrow\)矩阵\(A^T\)\(B^T\)相似

证明 矩阵A与B相似,即\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B}\), 则\((\boldsymbol{P}^{-1} \boldsymbol{A P})^T=\boldsymbol{B}^T\), 即\(\boldsymbol{P}^{T} \boldsymbol{A} {(\boldsymbol{P^{-1}}})^T=\boldsymbol{B}^T\), 即\(\boldsymbol{P}^{T} \boldsymbol{A} {(\boldsymbol{P^{T}}})^{-1}=\boldsymbol{B}^T\) 即矩阵\(A^T\)\(B^T\)相似

矩阵A与B相似\(\Rightarrow\)矩阵\(A^{-1}\)\(B^{-1}\)相似

证明 矩阵A与B相似,即\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B}\), 则\((\boldsymbol{P}^{-1} \boldsymbol{A P})^{-1}=\boldsymbol{B}^{-1}\), 即\(\boldsymbol{P} \boldsymbol{A}^{-1} \boldsymbol{P^{-1}}=\boldsymbol{B}^{-1}\), 令\(Q=P^{-1}\),则\(\boldsymbol{Q}^{-1} \boldsymbol{A}^{-1} \boldsymbol{Q}=\boldsymbol{B}^{-1}\), 即矩阵\(A^{-1}\)\(B^{-1}\)相似

矩阵A与B相似\(\Rightarrow\)矩阵\(A^*\)\(B^*\)相似​

证明 \(AA^*=A^* A = |A| E\)\(A^* = |A| A^{-1}\) 根据矩阵A与B相似\(\Rightarrow\)\(|A|=|B|\), 以及矩阵A与B相似\(\Rightarrow\)矩阵\(A^{-1}\)\(B^{-1}\)相似\(\boldsymbol{Q}^{-1} \boldsymbol{A}^{-1} \boldsymbol{Q}=\boldsymbol{B}^{-1}\) 进一步有\(\boldsymbol{Q}^{-1} |A|\boldsymbol{A}^{-1} \boldsymbol{Q}=|B| \boldsymbol{B}^{-1}\)\(\boldsymbol{Q}^{-1} \boldsymbol{A}^{*} \boldsymbol{Q}=\boldsymbol{B}^{*}\) 即矩阵\(A^*\)\(B^*\)相似

矩阵A与B相似,矩阵C与D相似\(\Rightarrow\)矩阵\(\left(\begin{array}{ll}A & 0\\0 & C \end{array}\right)\)\(\left(\begin{array}{ll}B & 0\\0 & D \end{array}\right)\)相似

//TODO

矩阵对角化\(P^{-1} A P=\Lambda\)

对n阶矩阵A,寻求相似变换矩阵P,使\(\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\boldsymbol{\Lambda}\)为对角阵这就称为把矩阵A对角化 (即找与矩阵A相似的对角矩阵)

注: 根据矩阵相似的推论: n阶矩阵A与对角阵\(\Lambda\)相似\(\Rightarrow\)\(\Lambda\)对角线上的值是\(\boldsymbol{A}\)\(n\) 个特征值,可见用\(\Lambda\)矩阵求特征值是一种很好的方法,

矩阵可对角化的充要条件

\(P^{-1} A P=\Lambda\)\(\Leftrightarrow\)P可逆且\(\boldsymbol{A P}=\boldsymbol{P \Lambda}\)\(\Leftrightarrow\)\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i}\)\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关

即定理: n阶矩阵A与对角阵相似(即A能对角化)\(\Leftrightarrow\)A有n个线性无关的特征向量

\("\Rightarrow"\)的证明:

若有可逆矩阵 P 使 \(P^{-1} A P=\Lambda\) 为对角阵, 即有\(A P=P A\). 把P用其列向量表示为\(\boldsymbol{P}=\left(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\right)\)\(\boldsymbol{A}\left(p_{1}, p_{2}, \cdots, p_{n}\right)\) \(=\left(p_{1}, p_{2}, \cdots, p_{n}\right)\left(\begin{array}{cccc}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{array}\right)\) \(=\left(\lambda_{1} p_{1}, \lambda_{2} p_{2}, \cdots, \lambda_{n} p_{n}\right)\)\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i} \quad(i=1,2, \cdots, n)\) 又矩阵P可逆,则r(P)=n,对应的列向量组\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关

\("\Leftarrow"\)的证明:

对于矩阵A,根据n阶方阵A有n个特征值(含重根),可以找到n个特征值\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\), 并可对应地求得n个特征向量\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\),(写成列向量),写出n个特征方程\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i} \quad(i=1,2, \cdots, n)\) 令这n个特征向量构成矩阵\(\boldsymbol{P}=\left(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\right)\)\(A P=P A\)\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关,则\(r\left(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\right)=n\)\(r(P)=n\),则P可逆, 则有\(P^{-1} A P=\Lambda\)

\(P^{-1} A P=\Lambda\)\(\Leftrightarrow\)矩阵的每个特征值的代数重数等于它的几何重数的矩阵

参考:特征多项式、代数重数与几何重数

简单的说,\(|A-\lambda E|=(\lambda_1-\lambda)^{k_1}\cdots(\lambda_m - \lambda)^{k_m} = 0\)中,特征值\(\lambda_i\)的重数\(k_i\)称为特征值\(\lambda_i\)的代数重数; \((A-\lambda E)x = 0\)\(\lambda=\lambda_i\)时,解空间的维数(解的极大线性无关组的个数)特征值\(\lambda_i\)的几何重数.

实际上,这和上一条性质\(P^{-1} A P=\Lambda\)\(\Leftrightarrow\)P可逆且\(\boldsymbol{A P}=\boldsymbol{P \Lambda}\)\(\Leftrightarrow\)\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i}\)\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关是等价的,都是矩阵可对角化的充要条件

eg: 不可对角化的例子: \(A =\left(\begin{array}{ll}1 & 1\\0 & 1 \end{array}\right)\) 根据\(Ax=\lambda x\),即\((A-\lambda E) x = 0\),确定特征值与特征向量: 令\(|A-\lambda E|=\left|\begin{array}{ll}1-\lambda & 1\\0 & 1-\lambda \end{array}\right|=(1-\lambda)^2=0\) \(\lambda=1\)是二重根,即特征值\(\lambda = 1\)的代数重数为2. 若\(\lambda=1\), 则\((A-\lambda E) x = 0\)化为\(\left(\begin{array}{ll}0 & 1\\0 & 0 \end{array}\right)x= 0\)\(r(A-\lambda E)=1\), 则\(n-r(A-\lambda E)=2-1=1\),即方程组\(\left(\begin{array}{ll}0 & 1\\0 & 0 \end{array}\right)x= 0\)解空间的极大线性无关组个数为1 即特征值\(\lambda = 1\)的几何重数为1

矩阵相似对角化性质

n阶矩阵A的特征值互不相等\(\Rightarrow\)矩阵A与\(\Lambda\)相似

证明: 由于n阶矩阵A的特征值\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\)互不相等,根据矩阵相似的性质:特征值不相等\(\Rightarrow\)特征向量线性无关, 则各特征值对应的特征向量\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关 即\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i}\)\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关 根据矩阵对角化充要条件:\(P^{-1} A P=\Lambda\)\(\Leftrightarrow\)P可逆且\(\boldsymbol{A P}=\boldsymbol{P \Lambda}\)\(\Leftrightarrow\)\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i}\)\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关 得:\(P^{-1} A P=\Lambda\)

\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}\) \(\Rightarrow\) \(\varphi(\boldsymbol{A})=\boldsymbol{P} \varphi(\boldsymbol{\Lambda}) \boldsymbol{P}^{-1}\)

证明(线性代数矩阵章节曾经证过一次)

矩阵章节曾证明: 若有可逆矩阵 P 使 P \(^{-1} A P=\Lambda\) 为对角阵 \(\boldsymbol{A}=\boldsymbol{P B P}^{-1}\),\(\boldsymbol{A}^{k}=\boldsymbol{P} \boldsymbol{B}^{k} \boldsymbol{P}^{-1}\),\(\varphi(\boldsymbol{A})=\boldsymbol{P} \varphi(\boldsymbol{B}) \boldsymbol{P}^{-1}\)

特别的:取B为对角阵, 即 P \(^{-1} A P=\Lambda\) 为对角阵, 则有\(\varphi(\boldsymbol{A})=\boldsymbol{P} \varphi(\boldsymbol{B}) \boldsymbol{P}^{-1}\)

\(f(\lambda)\)是矩阵A的特征多项式\(\Rightarrow\)\(f(A)=O\)

注: \(f(\lambda) = |A-\lambda E|\)为矩阵A的特征多项式

证明(仅证可对角化的情况)

矩阵可对角化时的情况: A与对角阵相似,即有可逆矩阵P,使\(\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{\Lambda}=\operatorname{diag}\left(\lambda_{1}, \cdots, \lambda_{n}\right)\),其中\(f\left(\lambda_{i}\right)=0\) ( 因为\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\)\(\boldsymbol{\Lambda}\)\(n\) 个特征值,根据定理: n阶矩阵A与B相似\(\Rightarrow\)A与B的特征多项式相同\(\Rightarrow\)A与B的特征值相同\(\lambda_{1}, \lambda_{2}, \cdots, \lambda_{n}\) 是A的 \(n\) 个特征值,所以\(f\left(\lambda_{i}\right)=0\) ) 则\(f(A)=P f(\Lambda) P^{-1}\) \(=P\left(\begin{array}{ccc}f\left(\lambda_{1}\right) & & \\ & \ddots & \\ & & f\left(\lambda_{n}\right)\end{array}\right) \boldsymbol{P}^{-1}\) \(=P O P^{-1}=O\)

其他情况: //TODO

对称矩阵的对角化

对称矩阵

(实)对称矩阵的性质

实对称阵的特征值为实数

证明 设复数\(\lambda\)为矩阵A的特征值,复向量x为对应的特征向量,即\(A x=\lambda x, x \neq 0\)\(\bar{\lambda}\)\(\lambda\)的共轭复数,\(\bar{x}\)是x的共轭复向量. A 为实矩阵,有 \(A=\bar{A}\), 故 \(A \vec{x}=\)\(\bar{A} \bar{x}=(\overline{A x})=(\overline{\lambda x})=\bar{\lambda} \bar{x}\) 根据: \(\bar{x}^{\top} A x=\bar{x}^{\top}(A x)=\bar{x}^{\top} \lambda x=\lambda x^{\top} x\) \(\overline{\boldsymbol{x}}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=\left(\overline{\boldsymbol{x}}^{\mathrm{T}} \boldsymbol{A}^{\mathrm{T}}\right) \boldsymbol{x}=(\boldsymbol{A} \overline{\boldsymbol{x}})^{\mathrm{T}} \boldsymbol{x}=(\vec{\lambda} \overline{\boldsymbol{x}})^{\mathrm{T}} \boldsymbol{x}=\bar{\lambda} \overline{\boldsymbol{x}}^{\mathrm{T}} \boldsymbol{x}\) 两式相减,有\((\lambda-\bar{\lambda}) \vec{x}^{\top} x=0\)\(x \neq 0\),所以 \(\lambda-\bar{\lambda}=0,\)\(\lambda=\bar{\lambda},\) 这就说明 \(\lambda\) 是实数

显然,特征值 \(\lambda_i\) 为实数时,齐次线性方程组\(\left(A-\lambda_{i} E\right) x=0\)是实系数方程组, 再根据\(\left|\boldsymbol{A}-\lambda_{i} \boldsymbol{E}\right|=0\),必有实的基础解系,对应的特征向量可以取实向量

对称阵A特征值\(\lambda_1 \neq \lambda_2\)\(\Rightarrow\)特征向量\(p_1,p_2\)正交

证明 \(\lambda_{1} p_{1}=A p_{1}, \lambda_{2} p_{2}=A p_{2}, \lambda_{1} \neq \lambda_{2}\) \(\lambda_{1} p_{1}^{\mathrm{T}}=\left(\lambda_{1} p_{1}\right)^{\mathrm{T}}=\left(A p_{1}\right)^{\mathrm{T}}=p_{1}^{\mathrm{T}} A^{\mathrm{T}}=p_{1}^{\mathrm{T}} A\) \(\lambda_{1} \boldsymbol{p}_{1}^{\mathrm{T}} \boldsymbol{p}_{2}=\boldsymbol{p}_{1}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{p}_{2}=\boldsymbol{p}_{1}^{\mathrm{T}}\left(\lambda_{2} \boldsymbol{p}_{2}\right)=\lambda_{2} \boldsymbol{p}_{1}^{\mathrm{T}} \boldsymbol{p}_{2}\) 移项得\(\left(\lambda_{1}-\lambda_{2}\right) p_{1}^{\mathrm{T}} p_{2}=0\)\(\lambda_{1} \neq \lambda_{2},\)\(p_{1}^{\mathrm{T}} p_{2}=0,\)\(p_{1}\)\(p_{2}\) 正交

A是对称阵\(\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\Lambda\)

证明:知乎:为什么实对称矩阵一定能对角化?

A是对称阵,\(\lambda\)是A的特征方程的k重根\(\Rightarrow\)矩阵\(A - \lambda E\) 的秩\(R(\boldsymbol{A}-\lambda \boldsymbol{E})=n-k\) \(\Rightarrow\)对应特征值\(\lambda\)恰有 \(k\) 个线性无关的特征向量

证明 根据A是对称阵\(\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\), 则对称阵 A 与对角阵 \(\boldsymbol{\Lambda}=\operatorname{diag}\left(\lambda_{1}, \cdots, \lambda_{n}\right)\) 相似. 则\(\boldsymbol{A}-\lambda \boldsymbol{E}\)与与 \(\boldsymbol{\Lambda}-\lambda \boldsymbol{E}=\operatorname{diag}\left(\lambda_{1}-\lambda, \cdots, \lambda_{n}-\lambda\right)\) 相似.

\(\lambda\) 是 A 的 \(k\) 重特征根时, \(\lambda_{1}, \cdots, \lambda_{n}\)中有k个等于 \(\lambda,\)\(n-k\) 个不等于 \(\lambda\), 则对角阵$ - E\(的对角元恰有 k 个等于 0, 则\)n - k=r( - E)= r( A - E)\(, 则\)n-r( A - E)= k\(, 即对应特征值\) $恰有 k 个线性无关的特征向量

对称阵必可对角化

由: 对称阵A特征值\(\lambda_1 \neq \lambda_2\)\(\Rightarrow\)特征向量\(p_1,p_2\)正交, A是对称阵,\(\lambda\)是A的特征方程的k重根\(\Rightarrow\)\(\lambda\)恰有 \(k\) 个线性无关的特征向量 可知: 对称阵A有n个线性无关的特征向量, 对称阵A的每个特征值的代数重数等于它的几何重数. 根据\(P^{-1} A P=\Lambda\)\(\Leftrightarrow\)P可逆且\(\boldsymbol{A P}=\boldsymbol{P \Lambda}\)\(\Leftrightarrow\)\(\boldsymbol{A} \boldsymbol{p}_{i}=\lambda_{i} \boldsymbol{p}_{i}\)\(\boldsymbol{p}_{1}, \boldsymbol{p}_{2}, \cdots, \boldsymbol{p}_{n}\)线性无关, 则对称阵A必可对角化. (根据\(P^{-1} A P=\Lambda\)\(\Leftrightarrow\)矩阵的每个特征值的代数重数等于它的几何重数也可得出对称阵必可对角化的结论)

对称矩阵对角化步骤

对称阵必可对角化 A是对称阵\(\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\Lambda\)

可以给出矩阵对角化的一般步骤:

1)求出 A 的全部互不相等的特征值 \(\lambda_{1}, \cdots, \lambda_{s},\) 它们的重数依次为 \(k_{1}, \cdots,\)\(k_{s}\left(k_{1}+\cdots+k_{s}=n\right)\) 2)对每个 \(k_{i}\) 重特征值 \(\lambda_{i},\) 求方程 \(\left(A-\lambda_{i} E\right) x=0\) 的基础解系, 得 \(k_{i}\) 个线性无关的特征向量. 3)它们正交化3,单位化,得 \(k_{i}\) 个两两正交的单位特征向量. 4)把这 n 个两两正交的单位特征向量构成正交阵 P,便有\(\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\)\(\boldsymbol{P}^{\mathrm{T}} \boldsymbol{A P}=\boldsymbol{\Lambda}\),注意 A 中对角元的排列次序应与 P 中列向量的排列次序相对应 .

二次型及其标准型

二次型的引入

讨论n个变量的二次齐次多项式的化简问题,可以引入二次型.

以平面解析几何为例,为了便于研究二次曲线:\(a x^{2}+b x y+c y^{2}=1\)的几何性质, 做适当的坐标(旋转)变换: \(\left\{\begin{array}{l}x=x^{\prime} \cos \theta-y^{\prime} \sin \theta \\ y=x^{\prime} \sin \theta+y^{\prime} \cos \theta\end{array}\right.\) 则二次曲线变为标准型:\(m x^{\prime 2}+n y^{\prime 2}=1\) 从代数学的角度看, 坐标变换前二次曲线左边\(a x^{2}+b x y+c y^{2}\)是二次齐次多项式, 坐标变换后曲线左边\(m x^{\prime 2}+n y^{\prime 2}\)是仅含平方项的二次齐次多项式. 通过坐标变换,二次齐次式形式得到化简.

二次型\(f=\boldsymbol{x^{\mathrm{T}} A x}\)

二次型定义

含有 \(n\) 个变量 \(x_{1}, x_{2}, \cdots, x_{n}\) 的二次齐次函数: \(f\left(x_{1}, x_{2}, \cdots, x_{n}\right)=a_{11} x_{1}^{2}+a_{22} x_{2}^{2}+\cdots+a_{n n} x_{n}^{2}\)\(+2 a_{12} x_{1} x_{2}+2 a_{13} x_{1} x_{3}+\cdots+2 a_{n-1, n} x_{n-1} x_{n}\) 称为二次型.

\(a_{j i}=a_{i j}\),则二次型还可以写成: \(f=a_{11} x_{1}^{2}+a_{12} x_{1} x_{2}+\cdots+a_{1 n} x_{1} x_{n}\)\(+a_{21} x_{2} x_{1}+a_{22} x_{2}^{2}+\cdots+a_{2 n} x_{2} x_{n}\)\(+\cdots+a_{n 1} x_{n} x_{1}+a_{n 2} x_{n} x_{2}+\cdots+a_{n n} x_{n}^{2}\) \(=\sum_{i, j=1}^{n} a_{i j} x_{i} x_{j}\)

进一步,利用矩阵,二次型还可以表示为: \(f=x_{1}\left(a_{11} x_{1}+a_{12} x_{2}+\cdots+a_{1 n} x_{n}\right)\)\(+x_{2}\left(a_{21} x_{1}+a_{22} x_{2}+\cdots+a_{2 n} x_{n}\right)\)\(+\cdots+x_{n}\left(a_{n 1} x_{1}+a_{n 2} x_{2}+\cdots+a_{n n} x_{n}\right)\) \(=\left(x_{1}, x_{2}, \cdots, x_{n}\right)\)\(\left(\begin{array}{c}a_{11} x_{1}+a_{12} x_{2}+\cdots+a_{1 n} x_{n} \\ a_{21} x_{1}+a_{22} x_{2}+\cdots+a_{2 n} x_{n} \\ \vdots \\ a_{n 1} x_{1}+a_{n 2} x_{2}+\cdots+a_{n n} x_{n}\end{array}\right)\) \(=\left(x_{1}, x_{2}, \cdots, x_{n}\right)\left[\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n}\end{array}\right]\left(\begin{array}{c}x_{1} \\ x_{2} \\ \vdots \\ x_{n}\end{array}\right)\) \(=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}\) 其中A是对称阵(因为 \(a_{j i}=a_{i j}\))

由上面可知,任给一个二次型,就惟一地确定一个对称阵; 反之,任给一个对称阵,也可惟一地确定一个二次型。 这样,二次型与对称阵之间存在一一对应的关系。 因此,我们把对称阵A叫做二次型\(f\)的矩阵,也把\(f\)叫做对称阵A的二次型, 对称阵A的秩就叫做二次型f的秩

标准型\(f=\boldsymbol{y}^{\mathrm{T}} \Lambda \boldsymbol{ y}\)

对于二次型\(f=\boldsymbol{x^{\mathrm{T}} A x}\),若二次型的矩阵A是对角阵, 即f仅含平方项,即\(f=\boldsymbol{y}^{\mathrm{T}} \Lambda \boldsymbol{ y}\),称这样的二次型为标准型

规范型

对于标准型\(f=\boldsymbol{x^{\mathrm{T}} A x}\)(其中A为对角阵), 若对角阵A元素只包含0,+1,-1,称这样的标准型为规范型

矩阵合同

矩阵合同的引入

矩阵合同概念是在二次型做线性变换过程中产生的.

对于二次型\(f=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}\), 记可逆矩阵\(C=\left(c_{i j}\right)\),作线性变换\(x=C y\) 则有\(f=x^{\mathrm{T}} A x=(C y)^{\mathrm{T}} A C y=y^{\mathrm{T}}\left(C^{\mathrm{T}} A C\right) y\)

矩阵合同\(\boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\)

设 A 和 B 是 \(n\) 阶矩阵,若有可逆矩阵 \(\boldsymbol{C},\) 使 \(\boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\),则称矩阵A 与 \(\boldsymbol{B}\) 合同. (注意:这里并没有要求A与B为对称矩阵,则矩阵A与B不一定可以作为二次型的矩阵)

事实上,矩阵合同一般应用于二次型: 若矩阵A 与\(B\)合同,且A为对称矩阵,则矩阵A可认为是二次型f的矩阵, 矩阵A与B合同指明了各自对应二次型f到g作的线性变换是\(x=C y\),即\(f=f(x)=f(Cy)=g(y)\)

矩阵合同的性质

反身性对称性传递性

矩阵A与A合同

矩阵A与B合同\(\Rightarrow\)矩阵B与A合同

矩阵A与B合同,矩阵B与C合同\(\Rightarrow\)矩阵A与C合同

\(\boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\)且A为对称阵\(\Rightarrow\)B也是对称阵

证明 \(\boldsymbol{B}^{\mathrm{T}}=\left(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{C}\right)^{\mathrm{T}}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A}^{\mathrm{T}} \boldsymbol{C}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{C}=\boldsymbol{B}\) 即B也是对称阵

\(\boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\)\(\Rightarrow\)\(R(A) = R(B)\)

证明 C是可逆矩阵,则\(C^T\)也是可逆矩阵, 对A作初等变换\(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}=\boldsymbol{B}\)不改变矩阵的秩, 则\(R(A) = R(B)\)

\(\boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}\)且A与B是实对称阵\(\Rightarrow\)对应二次型的正负惯性指数分别相同

证明(参考:https://www.jianshu.com/p/0ffe6ef97844) 充分性: 设X,Y是两个实对称矩阵,设他们有相同的惯性指数,则X、Y有相同的规范式A,即存在可逆矩阵C、P使得C’XC=A、P’YP=A即(P^-1)‘C’XC(P^-1)=[C(P^-1)]’X[(p^-1)C]=Y,所以X、Y合同. 必要性: 设X,Y是两个合同的实对称矩阵,即C’XC=Y;有Y与其规范式A合同,即P’YP=A. 所以P’(C’XC)P=A,即(CP)’X(CP)=A,此即表示X也合同于规范式A.所以X、Y有相同的规范式,即有相同的正负惯性指数.

这里涉及到二次型的正负惯性指数概念,以及惯性定理,详见后面惯性定理

二次型作线性变换\(\Rightarrow\)原二次型的矩阵与现二次型的矩阵合同

\(x^T A x\)经线性变换\(x=Cy\) (C可逆时) 有\(x^T A x = y^T (C^T A C) y = y^T B y\) 其中二次型的矩阵A与B满足\(C^T A C = B\)且C可逆, 即A与B合同

二次型化为标准型

要使二次型 \(f\) 经可逆变换 \(x=C y\) 变成标准形, 即\(f=\boldsymbol{x^{\mathrm{T}} A x}=\boldsymbol{y}^{\mathrm{T}} \boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C y}=k_{1} y_{1}^{2}+k_{2} y_{2}^{2}+\cdots+k_{n} y_{n}^{2}\) \(=\boldsymbol{y}^{\mathrm{T}} \Lambda \boldsymbol{ y}\)

(矩阵合同对角化/正交变换对角化/对称矩阵对角化)使对应二次型化为标准型

从从二次型的矩阵的角度看,二次型化为标准型的过程对应矩阵\(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}=\boldsymbol{\Lambda}\), 问题转化为寻找可逆矩阵\(C\),使矩阵\(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}=\boldsymbol{\Lambda}\), 即矩阵的合同对角化问题.

定理:任意二次型\(f=\boldsymbol{x^{\mathrm{T}} A x},\left(\mathbf{A}^{\mathrm{T}}=\mathbf{A}\right)\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f=\boldsymbol{y^{\mathrm{T}} \Lambda y}\)\(=\lambda_{1} y_{1}^{2}+\lambda_{2} y_{2}^{2}+\cdots+\lambda_{n} y_{n}^{2}\)

证明: 任意二次型的矩阵A是对称阵, 由对称阵的性质:A是对称阵\(\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\Lambda\) 则必存在正交矩阵存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\Lambda\) 即A必可合同对角化, 则二次型\(f=\boldsymbol{x^{\mathrm{T}} A x}\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f=\boldsymbol{y^{\mathrm{T}} \Lambda y}\)\(=\lambda_{1} y_{1}^{2}+\lambda_{2} y_{2}^{2}+\cdots+\lambda_{n} y_{n}^{2}\)

推论:任意二次型\(f=\boldsymbol{x^{\mathrm{T}} A x},\left(\mathbf{A}^{\mathrm{T}}=\mathbf{A}\right)\),总能找到正交变换\(x=C z\)使\(f(Cz)\)为规范型

证明: 首先,根据定理:任意二次型\(f=\boldsymbol{x^{\mathrm{T}} A x},\left(\mathbf{A}^{\mathrm{T}}=\mathbf{A}\right)\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f(Py)=\boldsymbol{y^{\mathrm{T}} \Lambda y}\) 即二次型先正交变换成标准型:\(f(\boldsymbol{P y})=\boldsymbol{y}^{\mathrm{T}} \boldsymbol{\Lambda} \boldsymbol{y}=\lambda_{1} y_{1}^{2}+\cdots+\lambda_{n} y_{n}^{2}\) 设二次型\(f\)的秩为r,即\(\lambda_1,\lambda_2,\cdots,\lambda_n\)中有r个非零值, 不妨设\(\lambda_{1}, \cdots, \lambda_{r}\)不等于0,\(\lambda_{r+1}=\cdots=\lambda_{n}=0\) 取一个特殊矩阵: \(\boldsymbol{K}=\left(\begin{array}{cccc}k_{1} & & & \\ & k_{2} & & \\ & & \ddots & \\ & & & k_{n}\end{array}\right)\),其中\(k_{i}=\left\{\begin{array}{cc}\frac{1}{\sqrt{| \lambda_{i}|}},& i \leqslant r \\ 1,&i > r\end{array}\right.\) 则K可逆, 作线性变换\(y=K z\), \(f(\boldsymbol{P y})\\=f(P K z)\\=z^{\mathrm{T}} K^{\mathrm{T}} P^{\mathrm{T}} A P K z\\=z^{\mathrm{T}} K^{\mathrm{T}} \Lambda K z\\=z^{\mathrm{T}} \Lambda_2 z\) 其中\(\Lambda_2 = \boldsymbol{K}^{\mathrm{T}} \boldsymbol{\Lambda K}=\operatorname{diag}\left(\frac{\lambda_{1}}{\left|\lambda_{1}\right|}, \cdots, \frac{\lambda_{r}}{\mid \lambda_{r}\mid}, 0, \cdots, 0\right)\) 即通过线性变换\(x=PKz=Cz\),可将任意二次型\(f=\boldsymbol{x^{\mathrm{T}} A x},\left(\mathbf{A}^{\mathrm{T}}=\mathbf{A}\right)\),变为规范型, 且注意到P是正交矩阵,\(C=PK\)仍是正交矩阵.

矩阵合同对角化/矩阵正交对角化/对称矩阵对角化步骤

由于二次型的矩阵是对称矩阵, 则寻找可逆矩阵\(C\),使矩阵\(\boldsymbol{C}^{\mathrm{T}} \boldsymbol{A C}=\boldsymbol{\Lambda}\)的步骤就是对称矩阵的正交对角化步骤

正交变换好处是不改变几何形状(参见正交变换的性质)

配方法化二次型为标准型

如果不考虑几何形状的的改变,除了正交变换法, 也可以使用配方法来将二次型变换为标准型

注意:有多种方法可以把二次型转换为标准型,对应有多种可逆的线性变换

拉格朗日配方法

若二次型中含\(x_1\)的平方项, 先将含\(x_1\)的所有项(包含非平方项)归并起来,配方. 若二次型中含\(x_2\)的平方项, 将剩余项中含\(x_2\)的所有项(包含非平方项)归并起来,配方. … 作线性变换: 将配方之后的平方项内的一次项之和设为为\(y_1,y_2,...\), 令未出现的\(x_i\)项设为\(y_j\),

eg: 对于二次型\(f=x_{1}^{2}+2 x_{2}^{2}+5 x_{3}^{2}+2 x_{1} x_{2}+2 x_{1} x_{3}+6 x_{2} x_{3}\) 其中含\(x_1\)的平方项,可先将含\(x_1\)的所有项归并起来,配方: \(f=\left(x_{1}+x_{2}+x_{3}\right)^{2}-x_{2}^{2}-x_{3}^{2}-2 x_{2} x_{3}+2 x_{2}^{2}+5 x_{3}^{2}+6 x_{2} x_{3}\) 剩余项中含\(x_2\)的平方项,将剩余项中含\(x_2\)的所有项归并起来,配方: \(f=\left(x_{1}+x_{2}+x_{3}\right)^{2}+\left(x_{2}+2 x_{3}\right)^{2}\) 则作线性变换: \(\left\{\begin{array}{ll}y_{1}=x_{1}+&x_{2}+&x_{3} \\ y_{2}= & x_{2}+&2 x_{3} \\ y_{3}=& & x_{3}\end{array}\right.\) 就将二次型化为了标准型

若二次型中完全不含\(x_i\)的平方项, 可先作一次简单的线性变换,使新的二次型中出现平方项, 然后重新用上面的方法配方

eg: 对于二次型\(f=2 x_{1} x_{2}+2 x_{1} x_{3}-6 x_{2} x_{3}\) 其完全不含平方项,无法配方, 可以先作一次简单的线性变换: \(\left\{\begin{array}{l}x_{1}=y_{1}+y_{2} \\ x_{2}=y_{1}-y_{2} \\ x_{3}=y_{3}\end{array}\right.\) 二次型化为:\(f=2 y_{1}^{2}-2 y_{2}^{2}-4 y_{1} y_{3}+8 y_{2} y_{3}\) 其中出现了平方项,可以配方, 配方结果为:\(f=2\left(y_{1}-y_{3}\right)^{2}-2\left(y_{2}-2 y_{3}\right)^{2}+6 y_{3}^{2}\) 作线性变换: \(\left\{\begin{array}{l}z_{1}=\sqrt{2}\left(y_{1}-y_{3}\right) \\ z_{2}=\sqrt{2}\left(y_{2}-2 y_{3}\right) \\ z_{3}=\sqrt{6} y_{3}\end{array}\right.\) 可得规范型:\(f=z_{1}^{2}-z_{2}^{2}+z_{3}^{2}\)

正定二次型

二次型可以化为标准型,显然对应的线性变换不唯一;但是标准型中所含的项数是一定的. 在线性变换为实变换时,不同标准型中正系数的个数也是一定的(从而负系数的个数也是一定的). 此规律总结为如下惯性定理.

惯性定理

设有二次型 \(f=x^{\mathrm{T}} A x,\) 它的秩为 \(r\), 有两个可逆变换\(x=C y\)\(x=P z\) 使得 \(f=k_{1} y_{1}^{2}+k_{2} y_{2}^{2}+\cdots+k_{r} y_{r}^{2} \quad\left(k_{i} \neq 0\right)\) \(f=\lambda_{1} z_{1}^{2}+\lambda_{2} z_{2}^{2}+\cdots+\lambda_{r} z_{r}^{2} \quad\left(\lambda_{i} \neq 0\right)\)\(k_{1}, \cdots, k_{r}\) 中正数的个数与 \(\lambda_{1}, \cdots, \lambda_{r}\) 中正数的个数相等

二次型的标准形中正系数的个数称为二次型的正惯性指数, 二次型的标准形中负系数的个数称为负惯性指数. 若二次型 f 的正惯性指数为 p,秩为 r,则 \(f\) 的规范形便可确定为\(f=y_{1}^{2}+\cdots+y_{p}^{2}-y_{p+1}^{2}-\cdots-y_{r}^{2}\)

正定二次型

设有二次型 \(f(x)=x^{\mathrm{T}} A x,\) 如果对任何 \(x \neq 0\),都有 \(f(x)>0\) (显然\(f(0)=0\)),称\(f\) 为正定二次型,并称对称阵 A 是正定的; 如果对任何 \(x \neq 0\),都有 \(f(x)<0\) (显然\(f(0)=0\)),称\(f\) 为负定二次型,并称对称阵 A 是负定的;

二次型正定的充分必要条件

\(n\) 元二次型 \(f=x^{\mathrm{T}} A x\) 为正定的\(\Leftrightarrow\)它的标准型的n个系数全为正\(\Leftrightarrow\)它的规范型的n个系数都为1\(\Leftrightarrow\)它的正惯性系数等于n

证明 设存在可逆变换\(x=C y\) 使\(f(x)=f(C y)=\sum_{i=1}^{n} k_{i} y_{i}^{2}\)

充分性: 设 \(k_{i}>0(i=1, \cdots, n) .\) 任给 \(x \neq 0,\)\(y=C^{-1} x \neq 0,\)\(f(x)=\sum_{i=1}^{n} k_{i} y_{i}^{2}>0\)

必要性: 用反证法. 假设$ k_s $, 则当 \(y = e_s\) (单位坐标向置)时, \(f(x)=f(Cy)=f\left(C e_{s}\right)=k_{t} \leqslant 0\) 这与二次型正定矛盾.故\(k_s>0\)\(k_1,\cdots,k_n\)都可用反证法证明大于0

推论:对称阵A正定\(\Leftrightarrow\)A的特征值全为正

证明

用正交变换法对角化矩阵A,即\(P^{-1} A P=P^{T} A P=\Lambda\), 则\(\Lambda\)是它的标准型的矩阵,且A与\(\Lambda\)相似.

根据二次型正定充要条件:\(n\) 元二次型 \(f=x^{\mathrm{T}} A x\) 为正定的\(\Leftrightarrow\)它的标准型的n个系数全为正\(\Leftrightarrow\)它的规范型的n个系数都为1\(\Leftrightarrow\)它的正惯性系数等于n, 对称阵A正定\(\Leftrightarrow\)标准型的矩阵\(\Lambda\)的n个对角线元素全为正.

根据相似矩阵的性质推论: n阶矩阵A与对角阵\(\Lambda\)相似\(\Rightarrow\)\(\Lambda\)对角线上的值是\(\boldsymbol{A}\)\(n\) 个特征值,(实际上,从矩阵相似对角化过程来看,此性质应当是充要的) A与\(\Lambda\)相似\(\Leftrightarrow\)A与\(\Lambda\)特征值相同

赫尔维茨定理:对称阵A正定\(\Leftrightarrow\)A 的各阶主子式都为正

对称阵A正定 \(\Leftrightarrow\)A 的各阶主子式都为正, 即\(a_{11}>0\),\(\left|\begin{array}{ll}a_{11} & a_{12} \\ a_{21} & a_{22}\end{array}\right|>0\),\(\cdots\),\(\left|\begin{array}{ccc}a_{11} & \cdots & a_{1 n} \\ \vdots & & \vdots \\ a_{n 1} & \cdots & a_{n n}\end{array}\right|>0\)

对称阵A负定 \(\Leftrightarrow\)A的奇数阶主子式为负,而偶数阶主子式为正, 即\((-1)^{r}\left|\begin{array}{ccc}a_{11} & \cdots & a_{1 r} \\ \vdots & & \vdots \\ a_{r 1} & \cdots & a_{r r}\end{array}\right|>0(r=1,2, \cdots, n)\)


  1. 向量组章节我们介绍过,向量空间的基就是向量空间的极大线性无关组,向量空间中的任意向量都可以用基表示↩︎

  2. \(|A-\lambda E|\)\(\lambda\)的n次多项式,记\(f(\lambda) = |A-\lambda E|\)为矩阵A的特征多项式,有地方也取\(f(\lambda) = |\lambda E-A|\)↩︎

  3. 由于对称阵A不同特征值的特征向量已保证正交,只需正交化每个特征值对应的特征向量即可↩︎