线代:1.6矩阵的特征值和特征向量

扶醉桌前 提交于 2019-12-18 04:42:47


本课程来自深度之眼,部分截图来自课程视频。
【第一章 线性代数】1.6矩阵的特征值和特征向量
在线LaTeX公式编辑器

任务详解:

1、掌握内积,正交,线性相关,线性无关的概念
2、掌握规范正交基,正交矩阵
3、掌握特征值特征向量的几何意义与算法

1.向量的内积和范数

向量的内积以及正交性

定义1:

设有n维向量(如果不做特殊说明,n维向量都是指列向量)
在这里插入图片描述
[x,y]称为向量x与y的内积(或者叫点积,elementwise).
内积是两个向量之间的一种运算,其结果是一个实数,用矩阵记号表示,当x与y都是列向量时,有
[x,y]=xTy=yTx[x,y]=x^Ty=y^Tx
有时候也记做:<x,y>
在这里插入图片描述
还有一个重要性质:柯西不等式
[x,y]2[x,x][y,y][x,y]^2≤[x,x][y,y]
在这里插入图片描述
由以上性质加上我们中学在二维空间里面向量夹角的概念,我们可以推广到高维空间,也可以用来衡量高维空间中两个样本的相似度的一种度量(不同于欧式距离)。

定义2


x=[x,x]=x12+x22+...+xn2||x||=\sqrt{[x,x]}=\sqrt{x_1^2+x_2^2+...+x_n^2}
x||x||称为n维向量x的长度或者范数或者模长
x=1||x||=1时,称x为单位向量。
向量的长度具有下述性质:
(i)非负性:当x≠0时,x>0||x||>0;当x=0时,x=0||x||=0
(i)齐次性:λx=λx|\lambda x|=|\lambda|||x||;右边的实数外面是绝对值
(ii)三角不等式:x+yx+y||x+y||≤||x||+||y||
当[x,y]=0时,称向量x与y正交(二维上看就在垂直关系).显然,若x=0,则x与任何向量都正交。

定理1:若n维向量a1,a2,,ana_1,a_2,…,a_n是一组两两正交的非零向量([ai,aj]=0,ij[a_i,a_j]=0,i\neq j),则a1,a2,,ana_1,a_2,…,a_n线性无关.
以下是百度百科中的线性无关定义:
在向量空间V的一组向量A: a1,a2,,ama_1, a_2, ···,a_m如果存在不全为零的数 k1,k2,,kmk_1, k_2, ···,k_m , 使
k1a1+k2a2+...+kmam=0k_1a_1+k_2a_2+...+k_ma_m=0
则称向量组A是线性相关的 ,否则数 k1,k2,,kmk_1, k_2, ···,k_m全为0时,称它是线性无关。
由此定义看出 是否线性相关,就看是否存在一组不全为零的数 k1,k2,,kmk_1, k_2, ···,k_m使得上式成立。
定理1证明:
在式子k1a1+k2a2+...+kmam=0k_1a_1+k_2a_2+...+k_ma_m=0的左右两边同时点乘a1a_1
k1[a1,a1]+k2[a2,a1]+...+km[am,a1]=0k_1[a_1,a_1]+k_2[a_2,a_1]+...+k_m[a_m,a_1]=0
由于a1,a2,,ama_1,a_2,…,a_m两两正交,因此:[a2,a1]=0,...[am,a1]=0[a_2,a_1]=0,...[a_m,a_1]=0
k1[a1,a1]=0k_1[a_1,a_1]=0,由条件可知a1a_1是非零向量,[a_1,a_1]≠0,
因此k1=0k_1=0,同理k2=0,,km=0k_2=0, ···,k_m=0
a1,a2,,ana_1,a_2,…,a_n线性无关.得证。

定义3

设n维向量e1,e2,,ere_1,e_2,…,e_r,是向量空间V(VRn)V(V\subset R^n)的一个基,如果e1,e2,,ere_1,e_2,…,e_r两两正交,且都是单位向量,则称e1,e2,,ere_1,e_2,…,e_r是V的一个规范正交基。例如:
在这里插入图片描述
就是R4R^4的一个规范正交基.
e1,e2,,ere_1,e_2,…,e_r是V的一个规范正交基,那么V中任一向量a应能由e1,e2,,ere_1,e_2,…,e_r线性表示,设表示式为
a=λ1e1+λ2e2+,,+λrera=\lambda_1 e_1+\lambda_2e_2+,…,+\lambda_re_r
λr=[a,er]\lambda_r=[a,e_r]

定义4

如果n阶矩阵A满足
ATA=E,A1=ATA^TA=E,即A^{-1}=A^T
那么称A为正交矩阵,简称正交阵。
上式用列向量表示,即是
[a1Ta2TanT](a1,a2,,an)=E\begin{bmatrix} a_1^T\\a_2^T \\ \vdots \\a_n^T \end{bmatrix}(a_1,a_2,\cdots,a_n)=E
因为ATA=EA^TA=EAAT=EAA^T=E等价,所以上述结论对A的行向量也成立。
由此可见,你、阶正交阵A的n个列(或者行)向量构成的向量空间n\real^n的一个规范正交基。

判定矩阵A可逆的小结

1、A的行列式不等于0
2、A的秩等于A的维度n
3、a1,a2,,ana_1,a_2,…,a_n线性无关

2.特征值特征向量以及矩阵的相似

方阵的特征值与特征向量

定义6

设A是n阶矩阵,如果数λ和μ维非零列向量x使下面关系式成立,
Ax=λxAx=\lambda x
那么,这样的数λ称为矩阵A的特征值,非零向量x称为A的对应于特征值λ的特征向量。
人话版本(物理意义):刚开始讲矩阵的时候,讲过矩阵的本质是对应线性变换,如果从线性变换的角度看待这个问题,那么就是:现在我们有一个可以做线性变换的矩阵A,如果有一个向量x(注意不是变量),通过这个矩阵进行线性变换(就是乘上A)后的到x~\tilde x相对于原来的x方向不变,仅仅是大小变化而已(变大了λ倍),(说明这个x还蛮特殊的,一般的向量经过线性变换后大小方向都会变化)那么就把这个特殊的x叫做A的特征向量,变大的倍数λ称为特征值。
如果给我们一个A,如何来求特征值λ和特征向量x呢?就是把上面的公式Ax=λxAx=\lambda x解方程,把x提取出来,x向量提取出来后,还剩下单位向量E,变成下面的公式:
(AλE)x=0(A-\lambda E)x=0
根据之前学过的克莱姆法则(如果Ax=0Ax=0有非零解,则|A|=0,如果是|A|≠0则方程只有唯一解,那么x只能=0),则要使得上面的式子要有非零解的充分必要条件是AλE=0|A-\lambda E|=0
a11λa12a1na21a22λa2nan1an2annλ=0\begin{vmatrix} a_{11}-\lambda& a_{12}&\cdots & a_{1n}\\ a_{21}& a_{22}-\lambda&\cdots & a_{2n}\\ \vdots& \vdots&& \vdots\\ a_{n1}& a_{n2}&\cdots & a_{nn}-\lambda \end{vmatrix}=0
把上面的式子看做是关于λ的方程f(λ)=0f(\lambda)=0
(i)λ1+λ2++λn=a11+a22++ann\lambda_1+\lambda_2+\cdots+\lambda_n=a_{11}+a_{22}+\cdots+a_{nn}
(II)λ1λ2λn=A\lambda_1\lambda_2\cdots\lambda_n=|A|
λ=λi\lambda=\lambda_i为矩阵A的一个特征值,则由方程
(AλiE)x=0(A-\lambda_iE)x=0
可求得非零解x=pix=p_i,那么pip_i便是A的对应于特征值λi\lambda_i的特征向量。
例子:求矩阵A=[3113]A=\begin{bmatrix} 3 & -1\\ -1& 3 \end{bmatrix}的特征值和特征向量。
解:先求AλE=3λ113λ=(3λ)21=0|A-\lambda E|=\begin{vmatrix} 3-\lambda & -1\\ -1& 3-\lambda \end{vmatrix}=(3-\lambda)^2-1=0
3λ=±13-\lambda=\pm 1求得两个特征值:λ1=2,λ2=4\lambda_1=2,\lambda_2=4
分两步
第一步求λ1=2\lambda_1=2对应的特征向量,解下面方程
(Aλ1E)x1=0(A-\lambda_1 E)x_1=0
[3λ1113λ1]x1=0\begin{bmatrix} 3-\lambda_1 & -1\\ -1& 3-\lambda_1 \end{bmatrix}x_1=0
[1111][x11x12]=0\begin{bmatrix} 1 & -1\\ -1& 1 \end{bmatrix}\begin{bmatrix}x_{11}\\x_{12}\end{bmatrix}=0
解得:x1=[11]x_1=\begin{bmatrix}1\\1\end{bmatrix}归一化后得:x1=[2222]x_1=\begin{bmatrix}\frac{\sqrt{2}}{2}\\\frac{\sqrt{2}}{2}\end{bmatrix}
第一步求λ1=4\lambda_1=4对应的特征向量,解下面方程
(Aλ1E)x2=0(A-\lambda_1 E)x_2=0
[3λ2113λ2]x2=0\begin{bmatrix} 3-\lambda_2 & -1\\ -1& 3-\lambda_2 \end{bmatrix}x_2=0
[1111][x21x22]=0\begin{bmatrix} -1 & -1\\ -1& -1 \end{bmatrix}\begin{bmatrix}x_{21}\\x_{22}\end{bmatrix}=0
解得:x2=[11]x_2=\begin{bmatrix}1\\-1\end{bmatrix}归一化后得:x2=[2222]x_2=\begin{bmatrix}\frac{\sqrt{2}}{2}\\-\frac{\sqrt{2}}{2}\end{bmatrix}
再看一例:
求矩阵A=[110430102]A=\begin{bmatrix} -1& 1&0\\ -4& 3&0\\ 1 &0 &2 \end{bmatrix}的特征值和特征向量。
解:A的特征多项式为
AλE=1λ1043λ0102λ=(3λ)21=(2λ)(1λ)2|A-\lambda E|=\begin{vmatrix} -1-\lambda & 1&0\\ -4& 3-\lambda&0\\ 1 &0&2-\lambda \end{vmatrix}=(3-\lambda)^2-1=(2-\lambda)(1-\lambda)^2
所以A的特征值为λ1=2,λ2=λ3=1\lambda_1=2,\lambda_2=\lambda_3=1
λ1=2\lambda_1=2时,解方程(A2E)x=0(A-2E)x=0.由
在这里插入图片描述
得基础解系:p1=[001]p_1=\begin{bmatrix}0\\0\\1\end{bmatrix}
所以kp1(k0)kp_1(k\neq0)是对应于λ1=2\lambda_1=2的全部特征向量。
另外一组解:
λ2=λ3=1\lambda_2=\lambda_3=1时,解方程(A2E)x=0(A-2E)x=0.由
在这里插入图片描述
得基础解系:p2=[121]p_2=\begin{bmatrix}-1\\-2\\1\end{bmatrix}
所以kp2(k0)kp_2(k\neq0)是对应于λ2=λ3=1\lambda_2=\lambda_3=1的全部特征向量。
由于有重根,所以只要两个特征向量

例8设λ\lambda是方阵A的特征值,证明
(1)λ2\lambda^2A2A^2的特征值;
(2)当A可逆时,1λ\frac{1}{\lambda}A1A^{-1}的特征值.
证明(1):由λ\lambda是方阵A的特征值可知:Ax=λxAx=\lambda x
A2x=λAx=λ2xA^2x=\lambda Ax=\lambda^2x
以此类推:AnA^n的特征值为λn\lambda^n,特征向量为x
n可以为负数,例如A2A^{-2}的特征值为λ2\lambda^{-2}
证明(2):由λ\lambda是方阵A的特征值可知:Ax=λxAx=\lambda x,两边同时乘以A的逆矩阵得:
x=λA1xx=\lambda A^{-1}x,两边同时除以λ\lambda
1λx=A1x\frac{1}{\lambda}x=A^{-1}x,即A1x=1λxA^{-1}x=\frac{1}{\lambda}x,根据特征值的定义可知:
1λ\frac{1}{\lambda}A1A^{-1}的特征值,特征向量为x
再推广:如果λ\lambda是方阵A的特征值,那么f(λ)f(\lambda)是方阵f(A)f(A)的特征值。
例子:设3阶矩阵A的特征值为1,-1,2,求A2+3A2EA^2+3A-2E的特征值。
解:把A的特征值1,-1,2分别代入上式
12+312=21^2+3*1-2=2
(1)2+3(1)2=4(-1)^2+3(-1)-2=-4
22+322=82^2+3*2-2=8
A2+3A2EA^2+3A-2E的特征值为2,-4,8

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!