线性代数-相似矩阵与二次型

线性代数-相似矩阵与二次型

本章主要讨论方阵的特征值与特征向量、方阵的相似对角化和二次型的化简等问题。

其中涉及向量的内积、长度及正交等知识,下面先介绍这些知识。

向量的内积、长度及正交性

向量的内积

向量内积的引入

在(平面/空间)解析几何中,我们曾引进向量的数量积/内积:xy=|x||y|cosθ, 然后定义了向量间的夹角余弦与夹角(包括垂直的定义), 且以互相垂直向量为轴,建立直角坐标系,有(直角坐标系中的)数量积的坐标表示:(x1,x2,x3)(y1,y2,y3)=x1y1+x2y2+x3y3

n维向量的内积是数量积的一种推广。但n维向量没有3维向量那样直观的长度和夹角的概念,因此只能按数量积的直角坐标计算公式来推广。并且反过来,利用内积来定义n维向量的长度和夹角。

向量x与y内积的定义

设有n维向量: x=(x1x2xn),y=(y1y2yn)[x,y]=x1y1+x2y2++xnyn 称[ x, y]为向量x与y的内积

当x与y都是列向量时, 有[x,y]=xTy

向量的内积,结果是个实数。

向量内积的基本性质

(其中 x, y, z 为 n 维向量, λ 为实数)

[x,y]=[y,x]

[λx,y]=λ[x,y]

[x+y,z]=[x,z]+[y,z]

x=0,[x,x]=0;x0,[x,x]>0

施瓦茨不等式[x,y]2[x,x][y,y]

[x,y]2[x,x][y,y]

(证明见百度百科:柯西—施瓦茨不等式:实内积空间的情形

向量的长度与夹角

向量长度(范数)的定义

x=[x,x]=x12+x22++xn2x 称为 n 维向量 x 的长度(或范数).

可见n维向量的长度是通过内积定义的。x=1时,称x为单位向量。

向量长度的性质
非负性

x0,x>0;x=0,x=0

齐次性

λx=|λ|x

三角不等式

x+yx+y

证明: x+y2=[x+y,x+y]=[x,x]+2[x,y]+[y,y] 根据施瓦茨不等式[x,y][x,x][y,y]x+y2[x,x]+2[x,x][y,y]+[y,y]=x2+2xy+y2=(x+y)2x+yx+y

向量x与y夹角的定义

根据施瓦茨不等式|[x,y]|xy|[x,y]xy|1(xy0)x0,y0 时,θ=arccos[x,y]xy称为 n 维向量 x 与 y 的夹角

可见n维向量之间的夹角也是通过内积定义的。

向量的正交与正交矩阵

向量正交与向量组正交

向量x与向量y正交

[x,y]=0 时, 称向量 x 与 y 正交. 显然,若 x=0, 则 x 与任何向量都正交。若x0,y0,两向量正交也可认为是向量的夹角为π2

向量组正交

一组两两都正交的非零向量,称为正交向量组

向量组非零且正交向量组线性无关

定理:若n维向量a1,a2,,ar都非零且两两正交a1,a2,,ar线性无关

证明

设有λ1,λ2,,λr使λ1a1+λ2a2++λrar=0a1T左乘上式,因当 i2 时, a1Tai=0,故λ1a1Ta1=0a10,a1Ta1=a120。从而必有 λ1=0. 类似可证 λ2=0,,λr=0 于是向量组 a1,a2,,ar 线性无关.

向量空间的规范正交基

向量组正交的性质:向量组非零且正交向量组线性无关, 那么考虑相反的情况,如何根据一个线性无关的向量组,如何得到一个等价的正交向量组呢?

规范正交基的定义

设n维向量e1,e2,,er是向量空间V(VRn)的一个基1, 如果e1,e2,,er两两正交,且都是单位向量, 则称e1,e2,,er是一个规范正交基。 那么V中的任意向量都可以由 e1,,er表示,表示式为a=λ1e1+λ2e2++λrer

向量在规范正交基中的坐标的计算

为求a=λ1e1+λ2e2++λrer的系数 λi(i=1,,r), 可用 eiT 左乘上式,有eiTa=λieiTei=λi,即λi=eiTa=[a,ei]

基(线性无关向量组)的规范正交化

a1,,ar是向量空间ⅴ的一个基(最大线性无关组),要求ⅴ的一个规范正交基。这也就是要找一组两两正交的单位向量e1,,er,使e1,,era1,,ar等价。这样的问题,称为把a1,,ar规范正交化。

施密特正交化方法

(按以下流程,得一组相互正交的向量组): b1=a1 b2=a2[b1,a2][b1,b1]b1
(实际上是设β2=α2kβ1,并满足 β1β2 ,即β2,β1=α2,β1kβ1,β1=0,解得k) ……… br=ar[b1,ar][b1,b1]b1[b2,ar][b2,b2]b2[br1,ar][br1,br1]br1 容易验证b1,,br两两相互正交,且b1,,bra1,,ar等价。

单位化

将上面得到的正交向量组,都化为单位向量,就求得了一个规范正交基

正交矩阵

正交矩阵定义ATA=E

如果 n 阶矩阵 A 满足ATA=E (A1=AT) 那么称 A 为正交矩阵,简称正交阵。

也就是说矩阵的行(或列)向量之间点积等于0(向量正交),行(或列)向量与自身的点积等于1(单位向量),所以正交矩阵又有另一种定义:由行之间两两正交、列之间两两正交的单位向量组成的方阵。

方阵A是正交矩阵AT=A1
方阵A是正交矩阵A的列向量组(或行向量组)是规范正交基

方阵A是正交矩阵A的列向量(或行向量)都是单位向量,且两两正交A的列向量组(或行向量组)是规范正交基

方阵A是正交矩阵 方阵A用列向量组表示,根据正交矩阵定义有: (a1Ta2TanT)(a1,a2,,an)=E (aiTaj)=(δij) aiTaj=δij={1, 当 i=j,(i,j=1,2,,n)0, 当 ij A的列向量都是单位向量,且两两正交 列向量组构成向量空间Rn规范正交基

ATA=EAAT=E等价,所以,上述结论对于A的行向量也成立

若A是正交阵A1=AT也是正交阵,且 |A|=1 或(-1)
若A和B都是正交阵AB也是正交阵

证明: A、B是正交矩阵,根据定义知道AA’=A’A=E, BB’=B’B=E, 那么(AB)(AB)‘=(AB)(B’A’)=ABB’A’=A(BB’)A=AEA’=AA’=E

若A是正交阵Ax=x

证明 若A是正交阵,则ATA=E Ax=(Ax)T(Ax)=xTATAx=xTx=x

正交变换y=Px

若 P 为正交矩阵,则线性变换 y=Px 称为正交变换.

设y = Px 为正交变换,则y=x

证明:y=yTy=xTPTPx=xTx=x

即正交变换不改变向量的长度(从而保证三角形长度不变)

方阵的特征值与特征向量

Ax=λx中A的特征值与特征向量

设 A 是 n 阶矩阵,如果数$nx使A x=x((A-E)x=0$成立) 那么,这样的数λ称为矩阵A的特征值,非零向量x称为A的对应于特征值λ的特征向量

求特征值与特征向量

根据方阵A,Ax=λx其中的特征值λ与对应的特征向量x的问题 n个未知数n个方程的齐次线性方程组(AλE)x=0何时有非零解,以及非零解的求解问题

根据方阵A,Ax=λx其中的特征值λ n个未知数n个方程的齐次线性方程组(AλE)x=0有非零解 系数矩阵行列式=0,即|AλE|=0 求矩阵A的特征方程(特征多项式2等于0)的解,即(下式中λ的解): |a11λa12a1na21a22λa2nan1an2annλ|=0

求特征值与特征向量的步骤

根据上面解方程组的思路,给出求特征值与特征向量的一般方法: 1)由|AλE|=0求特征值λi,共n个(含重根) 2)由(AλiE)x=0求基础解系,用基础解系表示处特征向量的通解

事实上,还可以下面特征值的性质/公式来求解特征值

特征值的性质

n阶方阵A有n个特征值(含重根)

根据求特征值与特征向量的过程(特征多项式|AλE|λ的n次多项式), 可知n阶方阵A有n个特征值(以重根计算)

特征值之和λ1+λ2++λn=a11+a22++ann 与特征值之积λ1λ2λn=|A|

n 阶矩阵 A=(aij) 的特征值为 λ1,λ2,,λn λ1+λ2++λn=a11+a22++ann (特征值之和等于方阵的迹) λ1λ2λn=|A| (特征值之积等于方阵的行列式)

证明: 根据 f(λ)=(λλ1)(λλ2)(λλn) =k0λ0++kn1λn1+knλn 显然 $k_0 = {1} {2} _{n} $, kn1=(λ1+λ2++λn)

又根据 $f()=|E-A|=| λa11a12a1na21λa22a2nan1an2λann

| n1k_{n-1}{n-1},线(-a_{11})(-a_{22})(-a_{nn})k_{n-1}{n-1} = -(a_{11}+a_{22} + + a_{nn})0k_0 _0 k_0 _0 = |A|$

综上, λ1+λ2++λn=a11+a22++ann (特征值之和等于方阵的迹) λ1λ2λn=|A| (特征值之积等于方阵的行列式)

λ是A的特征值λkAk 的特征值

Ax=λx,x0Akx=λkx,x0

λ是A的特征值λ+kA+kE 的特征值​

Ax=λx,x0(A+kE)x=(λ+k)x,x0

λ是A的特征值1λA1的特征值

Ax=λx,x0A1x=1λx,x0

推论:A可逆特征值非0
λ是A的特征值|A|λA的特征值

Ax=λx,x0Ax=|A|λx,x0

λ是A的特征值特征值多项式φ(λ)是对应矩阵多项式φ(A)的特征值

λ 是方阵 A 的特征值,

λ2A2的特征值, λkAk 的特征值

1λA1 的特征值 (当 A 可逆时)

推论:当A可逆时,特征值不为0

φ(λ)=a0+a1λ++amλmφ(A)=a0E+a1A++anAm+a1A++anAm的特征值 (实际上,这里的幂次m可取负数,只要认为Am=(A1)n)

特征值不相等特征向量线性无关

λ1,λ2,,λm 是方阵 Am 个特征值 ,p1,p2,,pm 依次是与之对应的特征向量,如果 λ1,λ2,,λm 各不相等 ,则 p1,p2,,pm 线性无关.

证明(用数学归纳法证明)

当m=1时,因特征向量p10,故只含一个向量的向量组p1线性无关.

假设当 m = k - 1 时结论成立,要证当 m = k 时结论也成立。 假设p1,p2,,pk1线性无关, 令x1p1+x2p2++xk1pk1+xkpk=0, (1) 用A左乘上式,得x1Ap1+x2Ap2++xk1Apk1+xkApk=0x1λ1p1+x2λ2p2++xk1λk1pk1+xkλkpk=0 (2)

(2)λk(1)x1(λ1λk)p1+x2(λ2λk)p2++xk1(λk1λk)pk1=0 由于p1,p2,,pk1线性无关,xi(λiλk)=0(i=1,2,,k1),λiλk0(i=1,2,,k1), 于是xi=0(i=1,2,,k1) 代入(2)得xkpk=0.而pk0,xk=0. 因此, 向量组 p1,p2,,pk 线性无关.

相似矩阵

矩阵相似P1AP=B

设A,B都是n阶矩阵,若有可逆矩阵P,使P1AP=B,则称B是A的相似矩阵,或说矩阵A与B相似. 对A进行运算P1AP称为对A进行相似变换, 可逆矩阵P称为把A变成B的相似变换矩阵

矩阵相似的性质

反身性对称性传递性

矩阵A与A相似

矩阵A与B相似矩阵B与A相似

矩阵A与B相似,B与C相似矩阵A与C相似

矩阵A与B相似矩阵A+kEB+kE相似

注意: 虽然有性质:矩阵A与B相似矩阵A+kEB+kE相似 但是,并没有A的多项式与B的多项式相似的结论!!!

矩阵A与B相似矩阵AnBn相似

特别的,矩阵A与Λ相似矩阵AnΛn相似

矩阵A与B相似r(A)=r(B)

证明 矩阵A与B相似,即P1AP=B, 又P是可逆矩阵,初等变换变换不改变矩阵的秩, 所以r(A)=r(B)

定理: n阶矩阵A与B相似A与B的特征多项式相同A与B的特征值相同

证明 |BλE|=|P1APP1(λE)P|=|P1(AλE)P| =|P1||AλE||P|=|AλE|

推论: n阶矩阵A与对角阵Λ相似Λ对角线上的值是An 个特征值

若 n 阶矩阵 A 与对角阵Λ=(λ1λ2λn)相似,则 λ1,λ2,,λn 即是 An 个特征值

证明

λ1,λ2,,λn 即是 Λn 个特征值,由矩阵相似的性质:n阶矩阵A与B相似A与B的特征多项式相同A与B的特征值相同λ1,λ2,,λn 也就是A的n个特征值

矩阵A与B相似|A|=|B|

证明 根据:特征值之和λ1+λ2++λn=a11+a22++ann 与特征值之积λ1λ2λn=|A|, 以及定理: n阶矩阵A与B相似A与B的特征多项式相同A与B的特征值相同 立即可知,若矩阵A与B相似,则|A|=|B|

矩阵A与B相似aii=bii

证明 根据:特征值之和λ1+λ2++λn=a11+a22++ann 与特征值之积λ1λ2λn=|A|, 以及定理: n阶矩阵A与B相似A与B的特征多项式相同A与B的特征值相同 立即可知,若矩阵A与B相似,则矩阵的迹相等

矩阵A与B相似矩阵ATBT相似

证明 矩阵A与B相似,即P1AP=B, 则(P1AP)T=BT, 即PTA(P1)T=BT, 即PTA(PT)1=BT 即矩阵ATBT相似

矩阵A与B相似矩阵A1B1相似

证明 矩阵A与B相似,即P1AP=B, 则(P1AP)1=B1, 即PA1P1=B1, 令Q=P1,则Q1A1Q=B1, 即矩阵A1B1相似

矩阵A与B相似矩阵AB相似​

证明 AA=AA=|A|EA=|A|A1 根据矩阵A与B相似|A|=|B|, 以及矩阵A与B相似矩阵A1B1相似Q1A1Q=B1 进一步有Q1|A|A1Q=|B|B1Q1AQ=B 即矩阵AB相似

矩阵A与B相似,矩阵C与D相似矩阵(A00C)(B00D)相似

//TODO

矩阵对角化P1AP=Λ

对n阶矩阵A,寻求相似变换矩阵P,使P1AP=Λ为对角阵这就称为把矩阵A对角化 (即找与矩阵A相似的对角矩阵)

注: 根据矩阵相似的推论: n阶矩阵A与对角阵Λ相似Λ对角线上的值是An 个特征值,可见用Λ矩阵求特征值是一种很好的方法,

矩阵可对角化的充要条件

P1AP=ΛP可逆且AP=PΛApi=λipip1,p2,,pn线性无关

即定理: n阶矩阵A与对角阵相似(即A能对角化)A有n个线性无关的特征向量

""的证明:

若有可逆矩阵 P 使 P1AP=Λ 为对角阵, 即有AP=PA. 把P用其列向量表示为P=(p1,p2,,pn)A(p1,p2,,pn) =(p1,p2,,pn)(λ1λ2λn) =(λ1p1,λ2p2,,λnpn)Api=λipi(i=1,2,,n) 又矩阵P可逆,则r(P)=n,对应的列向量组p1,p2,,pn线性无关

""的证明:

对于矩阵A,根据n阶方阵A有n个特征值(含重根),可以找到n个特征值λ1,λ2,,λn, 并可对应地求得n个特征向量p1,p2,,pn,(写成列向量),写出n个特征方程Api=λipi(i=1,2,,n) 令这n个特征向量构成矩阵P=(p1,p2,,pn)AP=PAp1,p2,,pn线性无关,则r(p1,p2,,pn)=nr(P)=n,则P可逆, 则有P1AP=Λ

P1AP=Λ矩阵的每个特征值的代数重数等于它的几何重数的矩阵

参考:特征多项式、代数重数与几何重数

简单的说,|AλE|=(λ1λ)k1(λmλ)km=0中,特征值λi的重数ki称为特征值λi的代数重数; (AλE)x=0λ=λi时,解空间的维数(解的极大线性无关组的个数)特征值λi的几何重数.

实际上,这和上一条性质P1AP=ΛP可逆且AP=PΛApi=λipip1,p2,,pn线性无关是等价的,都是矩阵可对角化的充要条件

eg: 不可对角化的例子: A=(1101) 根据Ax=λx,即(AλE)x=0,确定特征值与特征向量: 令|AλE|=|1λ101λ|=(1λ)2=0 λ=1是二重根,即特征值λ=1的代数重数为2. 若λ=1, 则(AλE)x=0化为(0100)x=0r(AλE)=1, 则nr(AλE)=21=1,即方程组(0100)x=0解空间的极大线性无关组个数为1 即特征值λ=1的几何重数为1

矩阵相似对角化性质

n阶矩阵A的特征值互不相等矩阵A与Λ相似

证明: 由于n阶矩阵A的特征值λ1,λ2,,λn互不相等,根据矩阵相似的性质:特征值不相等特征向量线性无关, 则各特征值对应的特征向量p1,p2,,pn线性无关 即Api=λipip1,p2,,pn线性无关 根据矩阵对角化充要条件:P1AP=ΛP可逆且AP=PΛApi=λipip1,p2,,pn线性无关 得:P1AP=Λ

P1AP=Λ φ(A)=Pφ(Λ)P1

证明(线性代数矩阵章节曾经证过一次)

矩阵章节曾证明: 若有可逆矩阵 P 使 P 1AP=Λ 为对角阵 A=PBP1,Ak=PBkP1,φ(A)=Pφ(B)P1

特别的:取B为对角阵, 即 P 1AP=Λ 为对角阵, 则有φ(A)=Pφ(B)P1

f(λ)是矩阵A的特征多项式f(A)=O

注: f(λ)=|AλE|为矩阵A的特征多项式

证明(仅证可对角化的情况)

矩阵可对角化时的情况: A与对角阵相似,即有可逆矩阵P,使P1AP=Λ=diag(λ1,,λn),其中f(λi)=0 ( 因为λ1,λ2,,λnΛn 个特征值,根据定理: n阶矩阵A与B相似A与B的特征多项式相同A与B的特征值相同λ1,λ2,,λn 是A的 n 个特征值,所以f(λi)=0 ) 则f(A)=Pf(Λ)P1 =P(f(λ1)f(λn))P1 =POP1=O

其他情况: //TODO

对称矩阵的对角化

对称矩阵

(实)对称矩阵的性质

实对称阵的特征值为实数

证明 设复数λ为矩阵A的特征值,复向量x为对应的特征向量,即Ax=λx,x0λ¯λ的共轭复数,x¯是x的共轭复向量. A 为实矩阵,有 A=A¯, 故 Ax=A¯x¯=(Ax)=(λx)=λ¯x¯ 根据: x¯Ax=x¯(Ax)=x¯λx=λxx xTAx=(xTAT)x=(Ax)Tx=(λx)Tx=λ¯xTx 两式相减,有(λλ¯)xx=0x0,所以 λλ¯=0,λ=λ¯, 这就说明 λ 是实数

显然,特征值 λi 为实数时,齐次线性方程组(AλiE)x=0是实系数方程组, 再根据|AλiE|=0,必有实的基础解系,对应的特征向量可以取实向量

对称阵A特征值λ1λ2特征向量p1,p2正交

证明 λ1p1=Ap1,λ2p2=Ap2,λ1λ2 λ1p1T=(λ1p1)T=(Ap1)T=p1TAT=p1TA λ1p1Tp2=p1TAp2=p1T(λ2p2)=λ2p1Tp2 移项得(λ1λ2)p1Tp2=0λ1λ2,p1Tp2=0,p1p2 正交

A是对称阵存在正交矩阵P,使得P1AP=PTAP=Λ

证明:知乎:为什么实对称矩阵一定能对角化?

A是对称阵,λ是A的特征方程的k重根矩阵AλE 的秩R(AλE)=nk 对应特征值λ恰有 k 个线性无关的特征向量

证明 根据A是对称阵存在正交矩阵P,使得P1AP=PTAP=, 则对称阵 A 与对角阵 Λ=diag(λ1,,λn) 相似. 则AλE与与 ΛλE=diag(λ1λ,,λnλ) 相似.

λ 是 A 的 k 重特征根时, λ1,,λn中有k个等于 λ,nk 个不等于 λ, 则对角阵$ - Ek0,n - k=r( - E)= r( A - E),n-r( A - E)= k, $恰有 k 个线性无关的特征向量

对称阵必可对角化

由: 对称阵A特征值λ1λ2特征向量p1,p2正交, A是对称阵,λ是A的特征方程的k重根λ恰有 k 个线性无关的特征向量 可知: 对称阵A有n个线性无关的特征向量, 对称阵A的每个特征值的代数重数等于它的几何重数. 根据P1AP=ΛP可逆且AP=PΛApi=λipip1,p2,,pn线性无关, 则对称阵A必可对角化. (根据P1AP=Λ矩阵的每个特征值的代数重数等于它的几何重数也可得出对称阵必可对角化的结论)

对称矩阵对角化步骤

对称阵必可对角化 A是对称阵存在正交矩阵P,使得P1AP=PTAP=Λ

可以给出矩阵对角化的一般步骤:

1)求出 A 的全部互不相等的特征值 λ1,,λs, 它们的重数依次为 k1,,ks(k1++ks=n) 2)对每个 ki 重特征值 λi, 求方程 (AλiE)x=0 的基础解系, 得 ki 个线性无关的特征向量. 3)它们正交化3,单位化,得 ki 个两两正交的单位特征向量. 4)把这 n 个两两正交的单位特征向量构成正交阵 P,便有P1AP=PTAP=Λ,注意 A 中对角元的排列次序应与 P 中列向量的排列次序相对应 .

二次型及其标准型

二次型的引入

讨论n个变量的二次齐次多项式的化简问题,可以引入二次型.

以平面解析几何为例,为了便于研究二次曲线:ax2+bxy+cy2=1的几何性质, 做适当的坐标(旋转)变换: {x=xcosθysinθy=xsinθ+ycosθ 则二次曲线变为标准型:mx2+ny2=1 从代数学的角度看, 坐标变换前二次曲线左边ax2+bxy+cy2是二次齐次多项式, 坐标变换后曲线左边mx2+ny2是仅含平方项的二次齐次多项式. 通过坐标变换,二次齐次式形式得到化简.

二次型f=xTAx

二次型定义

含有 n 个变量 x1,x2,,xn 的二次齐次函数: f(x1,x2,,xn)=a11x12+a22x22++annxn2+2a12x1x2+2a13x1x3++2an1,nxn1xn 称为二次型.

aji=aij,则二次型还可以写成: f=a11x12+a12x1x2++a1nx1xn+a21x2x1+a22x22++a2nx2xn++an1xnx1+an2xnx2++annxn2 =i,j=1naijxixj

进一步,利用矩阵,二次型还可以表示为: f=x1(a11x1+a12x2++a1nxn)+x2(a21x1+a22x2++a2nxn)++xn(an1x1+an2x2++annxn) =(x1,x2,,xn)(a11x1+a12x2++a1nxna21x1+a22x2++a2nxnan1x1+an2x2++annxn) =(x1,x2,,xn)[a11a12a1na21a22a2nan1an2ann](x1x2xn) =xTAx 其中A是对称阵(因为 aji=aij)

由上面可知,任给一个二次型,就惟一地确定一个对称阵; 反之,任给一个对称阵,也可惟一地确定一个二次型。 这样,二次型与对称阵之间存在一一对应的关系。 因此,我们把对称阵A叫做二次型f的矩阵,也把f叫做对称阵A的二次型, 对称阵A的秩就叫做二次型f的秩

标准型f=yTΛy

对于二次型f=xTAx,若二次型的矩阵A是对角阵, 即f仅含平方项,即f=yTΛy,称这样的二次型为标准型

规范型

对于标准型f=xTAx(其中A为对角阵), 若对角阵A元素只包含0,+1,-1,称这样的标准型为规范型

矩阵合同

矩阵合同的引入

矩阵合同概念是在二次型做线性变换过程中产生的.

对于二次型f=xTAx, 记可逆矩阵C=(cij),作线性变换x=Cy 则有f=xTAx=(Cy)TACy=yT(CTAC)y

矩阵合同B=CTAC

设 A 和 B 是 n 阶矩阵,若有可逆矩阵 C, 使 B=CTAC,则称矩阵A 与 B 合同. (注意:这里并没有要求A与B为对称矩阵,则矩阵A与B不一定可以作为二次型的矩阵)

事实上,矩阵合同一般应用于二次型: 若矩阵A 与B合同,且A为对称矩阵,则矩阵A可认为是二次型f的矩阵, 矩阵A与B合同指明了各自对应二次型f到g作的线性变换是x=Cy,即f=f(x)=f(Cy)=g(y)

矩阵合同的性质

反身性对称性传递性

矩阵A与A合同

矩阵A与B合同矩阵B与A合同

矩阵A与B合同,矩阵B与C合同矩阵A与C合同

B=CTAC且A为对称阵B也是对称阵

证明 BT=(CTAC)T=CTATC=CTAC=B 即B也是对称阵

B=CTACR(A)=R(B)

证明 C是可逆矩阵,则CT也是可逆矩阵, 对A作初等变换CTAC=B不改变矩阵的秩, 则R(A)=R(B)

B=CTAC且A与B是实对称阵对应二次型的正负惯性指数分别相同

证明(参考:https://www.jianshu.com/p/0ffe6ef97844) 充分性: 设X,Y是两个实对称矩阵,设他们有相同的惯性指数,则X、Y有相同的规范式A,即存在可逆矩阵C、P使得C’XC=A、P’YP=A即(P^-1)‘C’XC(P^-1)=[C(P^-1)]’X[(p^-1)C]=Y,所以X、Y合同. 必要性: 设X,Y是两个合同的实对称矩阵,即C’XC=Y;有Y与其规范式A合同,即P’YP=A. 所以P’(C’XC)P=A,即(CP)’X(CP)=A,此即表示X也合同于规范式A.所以X、Y有相同的规范式,即有相同的正负惯性指数.

这里涉及到二次型的正负惯性指数概念,以及惯性定理,详见后面惯性定理

二次型作线性变换原二次型的矩阵与现二次型的矩阵合同

xTAx经线性变换x=Cy (C可逆时) 有xTAx=yT(CTAC)y=yTBy 其中二次型的矩阵A与B满足CTAC=B且C可逆, 即A与B合同

二次型化为标准型

要使二次型 f 经可逆变换 x=Cy 变成标准形, 即f=xTAx=yTCTACy=k1y12+k2y22++knyn2 =yTΛy

(矩阵合同对角化/正交变换对角化/对称矩阵对角化)使对应二次型化为标准型

从从二次型的矩阵的角度看,二次型化为标准型的过程对应矩阵CTAC=Λ, 问题转化为寻找可逆矩阵C,使矩阵CTAC=Λ, 即矩阵的合同对角化问题.

定理:任意二次型f=xTAx,(AT=A),总能找到正交变换x=Py使f化为标准型f=yTΛy=λ1y12+λ2y22++λnyn2

证明: 任意二次型的矩阵A是对称阵, 由对称阵的性质:A是对称阵存在正交矩阵P,使得P1AP=PTAP=Λ 则必存在正交矩阵存在正交矩阵P,使得P1AP=PTAP=Λ 即A必可合同对角化, 则二次型f=xTAx,总能找到正交变换x=Py使f化为标准型f=yTΛy=λ1y12+λ2y22++λnyn2

推论:任意二次型f=xTAx,(AT=A),总能找到正交变换x=Cz使f(Cz)为规范型

证明: 首先,根据定理:任意二次型f=xTAx,(AT=A),总能找到正交变换x=Py使f化为标准型f(Py)=yTΛy 即二次型先正交变换成标准型:f(Py)=yTΛy=λ1y12++λnyn2 设二次型f的秩为r,即λ1,λ2,,λn中有r个非零值, 不妨设λ1,,λr不等于0,λr+1==λn=0 取一个特殊矩阵: K=(k1k2kn),其中ki={1|λi|,ir1,i>r 则K可逆, 作线性变换y=Kz, f(Py)=f(PKz)=zTKTPTAPKz=zTKTΛKz=zTΛ2z 其中Λ2=KTΛK=diag(λ1|λ1|,,λrλr,0,,0) 即通过线性变换x=PKz=Cz,可将任意二次型f=xTAx,(AT=A),变为规范型, 且注意到P是正交矩阵,C=PK仍是正交矩阵.

矩阵合同对角化/矩阵正交对角化/对称矩阵对角化步骤

由于二次型的矩阵是对称矩阵, 则寻找可逆矩阵C,使矩阵CTAC=Λ的步骤就是对称矩阵的正交对角化步骤

正交变换好处是不改变几何形状(参见正交变换的性质)

配方法化二次型为标准型

如果不考虑几何形状的的改变,除了正交变换法, 也可以使用配方法来将二次型变换为标准型

注意:有多种方法可以把二次型转换为标准型,对应有多种可逆的线性变换

拉格朗日配方法

若二次型中含x1的平方项, 先将含x1的所有项(包含非平方项)归并起来,配方. 若二次型中含x2的平方项, 将剩余项中含x2的所有项(包含非平方项)归并起来,配方. … 作线性变换: 将配方之后的平方项内的一次项之和设为为y1,y2,..., 令未出现的xi项设为yj,

eg: 对于二次型f=x12+2x22+5x32+2x1x2+2x1x3+6x2x3 其中含x1的平方项,可先将含x1的所有项归并起来,配方: f=(x1+x2+x3)2x22x322x2x3+2x22+5x32+6x2x3 剩余项中含x2的平方项,将剩余项中含x2的所有项归并起来,配方: f=(x1+x2+x3)2+(x2+2x3)2 则作线性变换: {y1=x1+x2+x3y2=x2+2x3y3=x3 就将二次型化为了标准型

若二次型中完全不含xi的平方项, 可先作一次简单的线性变换,使新的二次型中出现平方项, 然后重新用上面的方法配方

eg: 对于二次型f=2x1x2+2x1x36x2x3 其完全不含平方项,无法配方, 可以先作一次简单的线性变换: {x1=y1+y2x2=y1y2x3=y3 二次型化为:f=2y122y224y1y3+8y2y3 其中出现了平方项,可以配方, 配方结果为:f=2(y1y3)22(y22y3)2+6y32 作线性变换: {z1=2(y1y3)z2=2(y22y3)z3=6y3 可得规范型:f=z12z22+z32

正定二次型

二次型可以化为标准型,显然对应的线性变换不唯一;但是标准型中所含的项数是一定的. 在线性变换为实变换时,不同标准型中正系数的个数也是一定的(从而负系数的个数也是一定的). 此规律总结为如下惯性定理.

惯性定理

设有二次型 f=xTAx, 它的秩为 r, 有两个可逆变换x=Cyx=Pz 使得 f=k1y12+k2y22++kryr2(ki0) f=λ1z12+λ2z22++λrzr2(λi0)k1,,kr 中正数的个数与 λ1,,λr 中正数的个数相等

二次型的标准形中正系数的个数称为二次型的正惯性指数, 二次型的标准形中负系数的个数称为负惯性指数. 若二次型 f 的正惯性指数为 p,秩为 r,则 f 的规范形便可确定为f=y12++yp2yp+12yr2

正定二次型

设有二次型 f(x)=xTAx, 如果对任何 x0,都有 f(x)>0 (显然f(0)=0),称f 为正定二次型,并称对称阵 A 是正定的; 如果对任何 x0,都有 f(x)<0 (显然f(0)=0),称f 为负定二次型,并称对称阵 A 是负定的;

二次型正定的充分必要条件

n 元二次型 f=xTAx 为正定的它的标准型的n个系数全为正它的规范型的n个系数都为1它的正惯性系数等于n

证明 设存在可逆变换x=Cy 使f(x)=f(Cy)=i=1nkiyi2

充分性: 设 ki>0(i=1,,n). 任给 x0,y=C1x0,f(x)=i=1nkiyi2>0

必要性: 用反证法. 假设ks, 则当 y=es (单位坐标向置)时, f(x)=f(Cy)=f(Ces)=kt0 这与二次型正定矛盾.故ks>0k1,,kn都可用反证法证明大于0

推论:对称阵A正定A的特征值全为正

证明

用正交变换法对角化矩阵A,即P1AP=PTAP=Λ, 则Λ是它的标准型的矩阵,且A与Λ相似.

根据二次型正定充要条件:n 元二次型 f=xTAx 为正定的它的标准型的n个系数全为正它的规范型的n个系数都为1它的正惯性系数等于n, 对称阵A正定标准型的矩阵Λ的n个对角线元素全为正.

根据相似矩阵的性质推论: n阶矩阵A与对角阵Λ相似Λ对角线上的值是An 个特征值,(实际上,从矩阵相似对角化过程来看,此性质应当是充要的) A与Λ相似A与Λ特征值相同

赫尔维茨定理:对称阵A正定A 的各阶主子式都为正

对称阵A正定 A 的各阶主子式都为正, 即a11>0,|a11a12a21a22|>0,,|a11a1nan1ann|>0

对称阵A负定 A的奇数阶主子式为负,而偶数阶主子式为正, 即(1)r|a11a1rar1arr|>0(r=1,2,,n)


  1. 向量组章节我们介绍过,向量空间的基就是向量空间的极大线性无关组,向量空间中的任意向量都可以用基表示↩︎

  2. |AλE|λ的n次多项式,记f(λ)=|AλE|为矩阵A的特征多项式,有地方也取f(λ)=|λEA|↩︎

  3. 由于对称阵A不同特征值的特征向量已保证正交,只需正交化每个特征值对应的特征向量即可↩︎