线性代数-相似矩阵与二次型
线性代数-相似矩阵与二次型
本章主要讨论方阵的特征值与特征向量、方阵的相似对角化和二次型的化简等问题。
其中涉及向量的内积、长度及正交等知识,下面先介绍这些知识。
向量的内积、长度及正交性
向量的内积
向量内积的引入
在(平面/空间)解析几何中,我们曾引进向量的数量积/内积:
n维向量的内积是数量积的一种推广。但n维向量没有3维向量那样直观的长度和夹角的概念,因此只能按数量积的直角坐标计算公式来推广。并且反过来,利用内积来定义n维向量的长度和夹角。
向量x与y内积的定义
设有n维向量:
当x与y都是列向量时, 有
向量的内积,结果是个实数。
向量内积的基本性质
(其中 x, y, z 为 n 维向量,
当
施瓦茨不等式
向量的长度与夹角
向量长度(范数)的定义
可见n维向量的长度是通过内积定义的。
向量长度的性质
非负性
当
齐次性
三角不等式
证明:
根据施瓦茨不等式有 则 即
向量x与y夹角的定义
根据施瓦茨不等式有
可见n维向量之间的夹角也是通过内积定义的。
向量的正交与正交矩阵
向量正交与向量组正交
向量x与向量y正交
当
向量组正交
一组两两都正交的非零向量,称为正交向量组。
向量组非零且正交 向量组线性无关
定理:若n维向量
证明
设有
使 用 左乘上式,因当 时, ,故 因 故 。从而必有 类似可证 于是向量组 线性无关.
向量空间的规范正交基
向量组正交的性质:向量组非零且正交
规范正交基的定义
设n维向量
向量在规范正交基中的坐标的计算
为求
基(线性无关向量组)的规范正交化
设
施密特正交化方法
(按以下流程,得一组相互正交的向量组):
(实际上是设
单位化
将上面得到的正交向量组,都化为单位向量,就求得了一个规范正交基
正交矩阵
正交矩阵定义
如果 n 阶矩阵 A 满足
也就是说矩阵的行(或列)向量之间点积等于0(向量正交),行(或列)向量与自身的点积等于1(单位向量),所以正交矩阵又有另一种定义:由行之间两两正交、列之间两两正交的单位向量组成的方阵。
方阵A是正交矩阵
方阵A是正交矩阵 A的列向量组(或行向量组)是规范正交基
方阵A是正交矩阵
方阵A是正交矩阵
方阵A用列向量组表示,根据正交矩阵定义有: A的列向量都是单位向量,且两两正交 列向量组构成向量空间 的规范正交基
与 等价,所以,上述结论对于A的行向量也成立
若A是正交阵 也是正交阵,且 或(-1)
若A和B都是正交阵 AB也是正交阵
证明: A、B是正交矩阵,根据定义知道AA’=A’A=E, BB’=B’B=E, 那么(AB)(AB)‘=(AB)(B’A’)=ABB’A’=A(BB’)A=AEA’=AA’=E
若A是正交阵
证明 若A是正交阵,则
正交变换
若 P 为正交矩阵,则线性变换
设y = Px 为正交变换,则
证明:
即正交变换不改变向量的长度(从而保证三角形长度不变)
方阵的特征值与特征向量
中A的特征值与特征向量
设 A 是 n 阶矩阵,如果数$
求特征值与特征向量
根据方阵A,
根据方阵A,
求特征值与特征向量的步骤
根据上面解方程组的思路,给出求特征值与特征向量的一般方法: 1)由
事实上,还可以下面特征值的性质/公式来求解特征值
特征值的性质
n阶方阵A有n个特征值(含重根)
根据求特征值与特征向量的过程(特征多项式
特征值之和 与特征值之积
设
证明: 根据
又根据 $f()=|E-A|=|显然 $k_0 = {1} {2} _{n} $, |
k_{n-1}{n-1} (-a_{11})(-a_{22})(-a_{nn}) k_{n-1}{n-1} = -(a_{11}+a_{22} + + a_{nn}) k_0 _0 k_0 _0 = |A|$ 综上,
(特征值之和等于方阵的迹) (特征值之积等于方阵的行列式)
是A的特征值 是 的特征值
即
是A的特征值 是 的特征值
即
是A的特征值 是 的特征值
即
推论:A可逆 特征值非0
是A的特征值 是 的特征值
即
是A的特征值 特征值多项式 是对应矩阵多项式 的特征值
设
推论:当A可逆时,特征值不为0
特征值不相等 特征向量线性无关
设
证明(用数学归纳法证明)
当m=1时,因特征向量
,故只含一个向量的向量组 线性无关. 假设当 m = k - 1 时结论成立,要证当 m = k 时结论也成立。 假设
线性无关, 令 , (1) 用A左乘上式,得 即 (2)
得 由于 线性无关, 而 , 于是 代入(2)得 .而 得 因此, 向量组 线性无关.
相似矩阵
矩阵相似
设A,B都是n阶矩阵,若有可逆矩阵P,使
矩阵相似的性质
反身性对称性传递性
矩阵A与A相似
矩阵A与B相似
矩阵A与B相似,B与C相似
矩阵A与B相似 矩阵 与 相似
注意: 虽然有性质:矩阵A与B相似
矩阵A与B相似 矩阵 与 相似
特别的,矩阵A与
矩阵A与B相似
证明 矩阵A与B相似,即
, 又P是可逆矩阵,初等变换变换不改变矩阵的秩, 所以
定理: n阶矩阵A与B相似 A与B的特征多项式相同 A与B的特征值相同
证明
推论: n阶矩阵A与对角阵 相似 对角线上的值是 的 个特征值
若 n 阶矩阵 A 与对角阵
证明
因
即是 的 个特征值,由矩阵相似的性质:n阶矩阵A与B相似 A与B的特征多项式相同 A与B的特征值相同知 也就是A的n个特征值
矩阵A与B相似
证明 根据:特征值之和
与特征值之积 , 以及定理: n阶矩阵A与B相似 A与B的特征多项式相同 A与B的特征值相同 立即可知,若矩阵A与B相似,则
矩阵A与B相似
证明 根据:特征值之和
与特征值之积 , 以及定理: n阶矩阵A与B相似 A与B的特征多项式相同 A与B的特征值相同 立即可知,若矩阵A与B相似,则矩阵的迹相等
矩阵A与B相似 矩阵 与 相似
证明 矩阵A与B相似,即
, 则 , 即 , 即 即矩阵 与 相似
矩阵A与B相似 矩阵 与 相似
证明 矩阵A与B相似,即
, 则 , 即 , 令 ,则 , 即矩阵 与 相似
矩阵A与B相似 矩阵 与 相似
证明
则 根据矩阵A与B相似 , 以及矩阵A与B相似 矩阵 与 相似 得 进一步有 即 即矩阵 与 相似
矩阵A与B相似,矩阵C与D相似 矩阵 与 相似
//TODO
矩阵对角化
对n阶矩阵A,寻求相似变换矩阵P,使
注: 根据矩阵相似的推论: n阶矩阵A与对角阵
矩阵可对角化的充要条件
P可逆且 且 线性无关
即定理: n阶矩阵A与对角阵相似(即A能对角化)
的证明: 若有可逆矩阵 P 使
为对角阵, 即有 . 把P用其列向量表示为 则 即 又矩阵P可逆,则r(P)=n,对应的列向量组 线性无关
的证明: 对于矩阵A,根据n阶方阵A有n个特征值(含重根),可以找到n个特征值
, 并可对应地求得n个特征向量 ,(写成列向量),写出n个特征方程 令这n个特征向量构成矩阵 则 又 线性无关,则 则 ,则P可逆, 则有
矩阵的每个特征值的代数重数等于它的几何重数的矩阵
简单的说,
实际上,这和上一条性质
eg: 不可对角化的例子:
根据 ,即 ,确定特征值与特征向量: 令 是二重根,即特征值 的代数重数为2. 若 , 则 化为 则 , 则 ,即方程组 解空间的极大线性无关组个数为1 即特征值 的几何重数为1
矩阵相似对角化性质
n阶矩阵A的特征值互不相等 矩阵A与 相似
证明: 由于n阶矩阵A的特征值
互不相等,根据矩阵相似的性质:特征值不相等 特征向量线性无关, 则各特征值对应的特征向量 线性无关 即 且 线性无关 根据矩阵对角化充要条件: P可逆且 且 线性无关 得:
证明(线性代数矩阵章节曾经证过一次)
矩阵章节曾证明: 若有可逆矩阵 P 使 P
为对角阵 , , 特别的:取B为对角阵, 即 P
为对角阵, 则有
是矩阵A的特征多项式
注:
证明(仅证可对角化的情况)
矩阵可对角化时的情况: A与对角阵相似,即有可逆矩阵P,使
,其中 ( 因为 是 的 个特征值,根据定理: n阶矩阵A与B相似 A与B的特征多项式相同 A与B的特征值相同 则 是A的 个特征值,所以 ) 则 其他情况: //TODO
对称矩阵的对角化
对称矩阵
(实)对称矩阵的性质
实对称阵的特征值为实数
证明 设复数
为矩阵A的特征值,复向量x为对应的特征向量,即 设 是 的共轭复数, 是x的共轭复向量. A 为实矩阵,有 , 故 根据: 两式相减,有 又 ,所以 即 这就说明 是实数
显然,特征值
对称阵A特征值 特征向量 正交
证明
移项得 但 故 即 与 正交
A是对称阵 存在正交矩阵P,使得
A是对称阵, 是A的特征方程的k重根 矩阵 的秩 对应特征值 恰有 个线性无关的特征向量
证明 根据A是对称阵
存在正交矩阵P,使得 , 则对称阵 A 与对角阵 相似. 则 与与 相似. 当
是 A 的 重特征根时, 中有k个等于 有 个不等于 , 则对角阵$ - E n - k=r( - E)= r( A - E) n-r( A - E)= k $恰有 k 个线性无关的特征向量
对称阵必可对角化
由: 对称阵A特征值
对称矩阵对角化步骤
可以给出矩阵对角化的一般步骤:
1)求出 A 的全部互不相等的特征值
二次型及其标准型
二次型的引入
讨论n个变量的二次齐次多项式的化简问题,可以引入二次型.
以平面解析几何为例,为了便于研究二次曲线:
二次型
二次型定义
含有
取
进一步,利用矩阵,二次型还可以表示为:
由上面可知,任给一个二次型,就惟一地确定一个对称阵; 反之,任给一个对称阵,也可惟一地确定一个二次型。 这样,二次型与对称阵之间存在一一对应的关系。 因此,我们把对称阵A叫做二次型
标准型
对于二次型
规范型
对于标准型
矩阵合同
矩阵合同的引入
矩阵合同概念是在二次型做线性变换过程中产生的.
对于二次型
矩阵合同
设 A 和 B 是
事实上,矩阵合同一般应用于二次型: 若矩阵A 与
矩阵合同的性质
反身性对称性传递性
矩阵A与A合同
矩阵A与B合同
矩阵A与B合同,矩阵B与C合同
且A为对称阵 B也是对称阵
证明
即B也是对称阵
证明 C是可逆矩阵,则
也是可逆矩阵, 对A作初等变换 不改变矩阵的秩, 则
且A与B是实对称阵 对应二次型的正负惯性指数分别相同
证明(参考:https://www.jianshu.com/p/0ffe6ef97844) 充分性: 设X,Y是两个实对称矩阵,设他们有相同的惯性指数,则X、Y有相同的规范式A,即存在可逆矩阵C、P使得C’XC=A、P’YP=A即(P^-1)‘C’XC(P^-1)=[C(P^-1)]’X[(p^-1)C]=Y,所以X、Y合同. 必要性: 设X,Y是两个合同的实对称矩阵,即C’XC=Y;有Y与其规范式A合同,即P’YP=A. 所以P’(C’XC)P=A,即(CP)’X(CP)=A,此即表示X也合同于规范式A.所以X、Y有相同的规范式,即有相同的正负惯性指数.
这里涉及到二次型的正负惯性指数概念,以及惯性定理,详见后面惯性定理
二次型作线性变换 原二次型的矩阵与现二次型的矩阵合同
二次型化为标准型
要使二次型
(矩阵合同对角化/正交变换对角化/对称矩阵对角化)使对应二次型化为标准型
从从二次型的矩阵的角度看,二次型化为标准型的过程对应矩阵
定理:任意二次型 ,总能找到正交变换 使 化为标准型
证明: 任意二次型的矩阵A是对称阵, 由对称阵的性质:A是对称阵
存在正交矩阵P,使得 则必存在正交矩阵存在正交矩阵P,使得 即A必可合同对角化, 则二次型 ,总能找到正交变换 使 化为标准型
推论:任意二次型 ,总能找到正交变换 使 为规范型
证明: 首先,根据定理:任意二次型
,总能找到正交变换 使 化为标准型 即二次型先正交变换成标准型: 设二次型 的秩为r,即 中有r个非零值, 不妨设 不等于0, 取一个特殊矩阵: ,其中 则K可逆, 作线性变换 , 其中 即通过线性变换 ,可将任意二次型 ,变为规范型, 且注意到P是正交矩阵, 仍是正交矩阵.
矩阵合同对角化/矩阵正交对角化/对称矩阵对角化步骤
由于二次型的矩阵是对称矩阵, 则寻找可逆矩阵
正交变换好处是不改变几何形状(参见正交变换的性质)
配方法化二次型为标准型
如果不考虑几何形状的的改变,除了正交变换法, 也可以使用配方法来将二次型变换为标准型
注意:有多种方法可以把二次型转换为标准型,对应有多种可逆的线性变换
拉格朗日配方法
若二次型中含
eg: 对于二次型
其中含 的平方项,可先将含 的所有项归并起来,配方: 剩余项中含 的平方项,将剩余项中含 的所有项归并起来,配方: 则作线性变换: 就将二次型化为了标准型
若二次型中完全不含
eg: 对于二次型
其完全不含平方项,无法配方, 可以先作一次简单的线性变换: 二次型化为: 其中出现了平方项,可以配方, 配方结果为: 作线性变换: 可得规范型:
正定二次型
二次型可以化为标准型,显然对应的线性变换不唯一;但是标准型中所含的项数是一定的. 在线性变换为实变换时,不同标准型中正系数的个数也是一定的(从而负系数的个数也是一定的). 此规律总结为如下惯性定理.
惯性定理
设有二次型
二次型的标准形中正系数的个数称为二次型的正惯性指数, 二次型的标准形中负系数的个数称为负惯性指数. 若二次型 f 的正惯性指数为 p,秩为 r,则
正定二次型
设有二次型
二次型正定的充分必要条件
元二次型 为正定的 它的标准型的n个系数全为正 它的规范型的n个系数都为1 它的正惯性系数等于n
证明 设存在可逆变换
使 充分性: 设
任给 则 故 必要性: 用反证法. 假设
, 则当 (单位坐标向置)时, 这与二次型正定矛盾.故 则 都可用反证法证明大于0
推论:对称阵A正定 A的特征值全为正
证明
用正交变换法对角化矩阵A,即
, 则 是它的标准型的矩阵,且A与 相似. 根据二次型正定充要条件:
元二次型 为正定的 它的标准型的n个系数全为正 它的规范型的n个系数都为1 它的正惯性系数等于n, 对称阵A正定 标准型的矩阵 的n个对角线元素全为正. 根据相似矩阵的性质推论: n阶矩阵A与对角阵
相似 对角线上的值是 的 个特征值,(实际上,从矩阵相似对角化过程来看,此性质应当是充要的) A与 相似 A与 特征值相同
赫尔维茨定理:对称阵A正定 A 的各阶主子式都为正
对称阵A正定
对称阵A负定
向量组章节我们介绍过,向量空间的基就是向量空间的极大线性无关组,向量空间中的任意向量都可以用基表示↩︎
是 的n次多项式,记 为矩阵A的特征多项式,有地方也取 ↩︎由于对称阵A不同特征值的特征向量已保证正交,只需正交化每个特征值对应的特征向量即可↩︎