您好,欢迎访问三七文档
第22卷第5期大学数学Vol.22,.52006年10月COLLEGEMATHEMATICSOct.2006若当标准形的计算李尚志(北京航空航天大学理学院,北京100083)1在线性代数与矩阵论中,一个重要问题是如何将复数域ÈÈC上的任意n阶方阵A相似到尽可能简单的方阵J.也就是说:寻找适当的可逆方阵P,使P-1AP=J.在复数域上求出A的特征多项式A()=det(I-A)的全部不同的根1,,t,也就是A的特征值.对每个特征值i,解齐次线性方程组(A-iI)X=0,可求得一个基础解系Li.所有这些Li的并集L=L1!!Lt线性无关,是由最多的特征向量组成的线性无关集合.如果L包含n个向量,它就是复数域ÈÈC上n维列向量空间ÈÈCn∀1一组基.以L中的向量为各列排成的矩阵P是n阶可逆方阵,它将A相似到对角阵P-1AP.但是,也可能按以上步骤求得的L所含向量个数少于n,此时A不能相似于对角阵.但可以对L再补充适当的向量组成ÈÈCn∀1的一组基M,以这组基的各向量为各列排成可逆矩阵P,它将A相似到如下形式的准对角阵P-1AP=J=J1Js,其中每个块具有形式Ji=i11i这样的块Ji称为若当块,这样的矩阵J称为A的若当标准形,P称为过渡矩阵.很自然提出的问题是:怎样由A计算它的若当标准形J,并计算过渡矩阵P?很多教科书都叙述了利用矩阵I-A的相抵标准形来计算A的若当标准形J的方法.至于求过渡矩阵P,大多数高等代数、线性代数教材中都认为太难而不能加以讨论,一些矩阵论的教材也只是给出少量特殊例子而没有给出一般的算法.有少数教材(例如[2])给出了利用矩阵的相抵来求过渡矩阵P的算法:求可逆矩阵P(),Q()使P()(I-A)Q()=I-J,并求出R()=Q()-1=Rmm+Rm-1m-1++R1+R0.再将其中的替换成A就得到过渡矩阵P=R(A)=RmAm+Rm-1Am-1++R1A+R0.但是,对以多项式为元素的矩阵进行相抵变换,与复系数矩阵的相抵变换比起来,计算量要大得多,要实际用来对矩阵A进行计算仍然过于繁琐.本文作者在所编写的教材[1]中给出了由任意复方阵A计算若当标准形J和过渡矩阵P的一个新算法,在求得A的特征根之后只要解齐次线性方程组和求极大线性无关组就可以求出J和P.本文通过具体例子介绍这一算法.更详细的论述请参见[1].21设A=111222-3-3-3,求3阶可逆方阵P使P-1AP是若当标准形.分析计算可知A的特征多项式A()=det(I-A)=3,A只有唯一的特征值0,重数为3.注:由特征多项式det(I-A)计算特征值是常规的算法.对本题中的A,如果注意到A2=O,立即知道A只有唯一的特征值0.将齐次线性方程组AX=0的解空间记为KerA.本题中的rankA=1,因此KerA为2维.解方程组AX=0可得基础解系{X1,X2},也就是解空间KerA的一组基.如果能够找到一个向量X3满足条件AX3=X1,则由AX3#0知道X3不含于KerA,因此B={X1,X2,X3}线性无关,是复数域ÈÈC上三维列向量空间ÈÈC3∀1的一组基.依次以X1,X3,X2为各列组成的方阵P=(X1,X3,X2)可逆.且由AX1=0,AX3=X1,AX2=0,即`A(X1,X3,X2)=(0,X1,0)=(X1,X3,X2)010000000知AP=PJ,即P-1AP=J对J=010000000成立.这样就求出了A的若当标准形J及过渡矩阵P.然而,方程组AX3=X1有可能无解.此时可以考虑用KerA中适当的非零向量Y1=aX1+bX2代替X1,适当选择(a,b)#(0,0)使AX3=Y1有解.将Y1扩充为KerA的任意一组基{Y1,Y2}来代替{X1,X2}(比如可以取Y2=X1).依次以Y1,X3,Y2为各列排成可逆方阵P,则P-1AP=J仍然是若当标准形.由A2=O可知A有唯一的特征值0.解方程组AX=0求得解空间KerA的一组基{X1,X2},其中X1=(1,-1,0)T,X2=(1,0,-1)T.解方程组AX3=X1发现它无解.改为解方程组AX3=X1+bX2,即111222-3-3-3X3=a+b-a-b,其中a,b是不全为0的待定常数.对增广矩阵作初等行变换,111a+b222-a-3-3-3-b∃111a+b000-3a-2b0003a+2b,发现当3a+2b=0时有解.不妨取a=-2,b=3,对Y1=aX1+bX2=(1,2,-3)T,求得AX3=Y1的一个解X3=(1,0,0)T.Y1与X1线性无关,组成AX=0的一组基础解系{Y1,X1},再添加X3,组成ÈÈC3∀1的一组基.由AY1=0,AX3=Y1,AX1=0知道P-1AP=J=010000000对P=(Y1,X3,X1)=11120-1-300成立.以上解法的思路和过程可以用下图直观地表示出来:2大学数学第22卷X3%Y1%0X1%0X2%0其中的箭头%表示用A去左乘引起的变换.以上的解法是选择X1,X2的适当的非零线性组合Y1使得可以找到X3.这样的解法似乎太笨,而且很难推广到A的阶数更大的情形.从Y1求X3需要解方程组AX3=Y1,比较困难;如果反过来由X3求Y1就比较容易,只要做矩阵乘法X3|∃AX3=Y1就行了.(直观上说,在图中由Y1求X3是&由下往上跳∋,比较困难,由X3求Y1是&由上往下掉∋,容易得多.)什么样的向量可以充当X3?由于A2=O,AY1=0对任意Y1=AX3成立,因此只需选择X3使Y1=AX3#0就行了.比如A的第一列不为0,将A右乘X3=(1,0,0)T就得到A的第一列Y1=AX3=(1,2,-3)T#0,符合要求.这样就得到例1的另一个解法如下:12由A2=O知A有唯一的特征值0.解方程组AX=0得到解空间的一组基{X1,X2}={(1,-1,0)T,(1,0,-1)T}.取X3=(1,0,0)T不是方程组AX=0的解,则Y1=AX3=(1,2,-3)T#0,且AY1=A2X3=0.Y1,X1组成KerA的一组基.依次以Y1,X3,X1为各列排成可逆方阵P=(Y1,X3,X1)=11120-1-300,则P-1AP=J=010000000是若当标准形.2设A=4321040200430004,求可逆方阵P,使P-1AP=J是若当标准形.分析易见A的特征值全为4.计算可得A-4I=0321000200030000,(A-4I)2=00012000000000000,(A-4I)3=OA-4I,(A-4I)2,(A-4I)3的秩分别为2,1,0,由此可知方程组(A-4I)X=0,(A-4I)2X=0,(A-4I)3X=0的解空间Ker(A-4I),,Ker(A-4I)2,Ker(A-4I)3的维数分别是2,3,4.通过解方程组可以求得Ker(A-4I)的一组基{X1,X2};再添加X3扩充为Ker(A-4I)2的一组基(X1,X2,X3);再添加X4扩充为Ker(A-4I)3的一组基(X1,X2,X3,X4),也就是ÈÈC4∀1的一组基.用箭头图表示如下(图中每个箭头%表示用A-4I左乘作用一次):X4%%%0X3%%0X1%0X2%0取Y3=(A-4I)X4,则(A-4I)3X4=0#(A-4I)2X4就是(A-4I)2Y3=0#(A-4I)Y3.由此可知,Y3(Ker(A-4I)2且Y3Ker(A-4I),Y3添加Ker(A-4I)的任何一组基{X1,X2}得到Ker(A-4I)2的基,可见Y3可以取代X3.再取Y1=(A-4I)Y3=(A-4I)2X4,则(A-4I)3X4=0#(A-4I)2X3也就是(A-4I)Y1=0#Y1,Y1是Ker(A-4I)中的非零向量,可以扩充为Ker(A-4I)的一组基{Y1,Y2}来取3第5期李尚志:若当标准形的计算代{X1,X2}.{Y1,Y2,Y3,X4}仍组成ÈÈC4∀1的一组基,其中各向量在(A-4I)的左乘作用下的相互关系如下图:X4∃Y3∃Y1∃0Y2∃0依次以Y1,Y3,X4,Y2为各列组成可逆方阵P=(Y1,Y3,X4,Y2),则(A-4I)P=(A-4I)(Y1,Y3,X4,Y2)=(0,Y1,Y3,0)=(Y1,Y3,X4,Y2)J0=PJ0,其中J0=0100001000000000,P-1AP=4I+J0=4100041000400004=J,J是若当标准形.由此得出如下解法.先求X4(ÈÈC4∀1满足(A-4I)3X4=0#(A-4I)2X4.易见X4=(0,0,0,1)T符合要求.计算得Y3=(A-4I)X4=(1,2,3,0)T,Y1=(A-4I)Y3=(A-4I)2X4=(12,0,0,0)T.解方程组(A-4I)X=0,求得一个与Y1线性无关的解Y2=(0,2,-3,0)T.依次以Y1,Y3,X4,Y2为各列组成可逆矩阵P=121000202030-30010,则P-1AP=J=4100041000400004为若当标准形.3求A=11111102012300201-1000212000020000002的若当标准形J,并求可逆方阵P,使P-1AP=J.分析A的特征多项式A()=(-1)(-2)5,特征根为1(1重),2(5重).考虑任一数域F上的6维列向量空间V=F6∀1上的线性变换A:A|∃AX.A的属于特征值1的根子空间W1的维数等于特征值1的重数1.解方程组(A-I)X=0,求得W1=Ker(A-I)的一组基{X1}.A的属于特征值2的根子空间W2的维数等于特征值2的重数5.计算可求得A-2I,(A-2I)2,(A-2I)3的秩分别为4,2,1,因此方程组(A-2I)X=0,(A-2I)2X=0,(A-2I)3X=0,的解空间Ker(A-2I),Ker(A-2I)2,Ker(A-2I)3的维数分别是2,4,5,根子空间W2=Ker(A-2I)3.通过解方程组,可求得Ker(A-2I)的一组基{!1,!2},再扩充为Ker(A-2I)2的一组基{!1,!2,!3,!4},再扩充为W2=Ker(A-2I)3的一组基{!1,!2,!3,!4,!5},如下图(其中每个箭头%表示用A-2I左乘一次的作用):!5%%%0!3%%0!4%%0!1%0!2%0如果能够将W2的上述基{!i|1)i)5}中的向量!i(1)i)5)分别替换成Yi(1)i)5),使{Y1,Y2},4大学数学第22卷{Y1,Y2,Y3,Y4},{Y1,Y2,Y3,Y4,Y5}仍然分别是Ker(A-2I),Ker(A-2I)2,Ker(A-2I)3,的基,并且满足条件Y5∃Y3∃Y1∃0Y4∃Y2∃0则(A-2I)(Y1,Y3,Y5,Y2,Y4)=(0,Y1,Y3,0,Y2)=(Y1,Y3,Y5,Y2,Y4)0100000100000000000100000,A(Y1,Y3,Y5,Y2,Y4)=(Y1,Y3,Y5,Y2,Y4)2100002100002000002100002.取P=(X1,Y1,Y3,Y5,Y2,Y4),则P-1AP=12100210022102是若当标准形.(我们并没有实际求出X1与Yi(1)i)5),仅仅求出了rank(A-I)及各个rank(A-2I)k(k=1,2,3),就算出了A的若当标准形.一般地,对任意复方阵A,可以通过对各个特征值i求各个rank(A-iI)k来计算A的若当标准形.很多教科书都介绍了具体算法,比如,可以参见[1],[2].)为了由{!i|1)i)5}得到{Yi|1)i)5},首先可以直接取Y5=!5,并且按照要求依次取Y3=(A-2I)Y5,Y1=(A-2I)Y3=(A-2I)2Y5.则由(A-2I)3!5=0#(A-2I)2!5知道0#Y1(Ker(A-2I),Y3(Ker(A-2I)2\Ker(A-2I),Y1,Y3确实有资格分别取代!1,!3.进一步,需要选取原来的!3,!4之一作为Y4.由于Y2=(A-2I)Y4应当与Y1线性无关,所以我们需要计算(A-2I)!3与(A-2I)!4,看其中哪一个(A-2I)!i(i=3,4)
本文标题:若当标准形的计算
链接地址:https://www.777doc.com/doc-5565787 .html