线性代数 · 矩阵 | 秩 / 行秩 / 列秩 / 计算方法

线性代数 · 矩阵 | 秩 / 行秩 / 列秩 / 计算方法

注:本文为 “线性代数 · 矩阵 | 秩” 相关合辑。 图片清晰度受引文原图所限。 略作重排,未全校去重。 如有内容异常,请看原文。

矩阵的秩及其应用

一、矩阵秩的基本概念

(一)k 阶子式

设矩阵

A

=

(

a

i

j

)

m

×

n

A = (a_{ij})_{m \times n}

A=(aij​)m×n​,在矩阵

A

A

A 中任意选取

k

k

k 行(

1

k

m

1 \leq k \leq m

1≤k≤m)和

k

k

k 列(

1

k

n

1 \leq k \leq n

1≤k≤n),将位于这些行与列交叉处的

k

2

k^2

k2 个元素按原有的相对位置组成一个

k

k

k 阶行列式,该行列式称为矩阵

A

A

A 的一个 k 阶子式。

对于

m

×

n

m \times n

m×n 矩阵

A

A

A,

k

k

k 阶子式的总数为组合数

C

m

k

×

C

n

k

\mathrm{C}_{m}^{k} \times \mathrm{C}_{n}^{k}

Cmk​×Cnk​(其中

C

n

k

=

n

!

k

!

(

n

k

)

!

\mathrm{C}_{n}^{k} = \frac{n!}{k!(n - k)!}

Cnk​=k!(n−k)!n!​ 表示从

n

n

n 个元素中选取

k

k

k 个元素的组合数)。

示例:设矩阵

A

=

(

1

2

3

4

1

3

4

1

1

4

1

2

)

A = \begin{pmatrix} 1 & 2 & 3 & 4 \\ 1 & 3 & 4 & 1 \\ 1 & 4 & 1 & 2 \end{pmatrix}

A=

​111​234​341​412​

选取第 1、2 行和第 2、4 列,交叉处元素组成的 2 阶子式为

D

2

=

2

4

3

1

D_2' = \begin{vmatrix} 2 & 4 \\ 3 & 1 \end{vmatrix}

D2′​=

​23​41​

​;选取第 1、3 行和第 1、3 列,交叉处元素组成的 2 阶子式为

D

2

=

1

3

1

1

D_2'' = \begin{vmatrix} 1 & 3 \\ 1 & 1 \end{vmatrix}

D2′′​=

​11​31​

​;该矩阵的 2 阶子式总数为

C

3

2

×

C

4

2

=

3

×

6

=

18

\mathrm{C}_{3}^{2} \times \mathrm{C}_{4}^{2} = 3 \times 6 = 18

C32​×C42​=3×6=18,3 阶子式总数为

C

3

3

×

C

4

3

=

1

×

4

=

4

\mathrm{C}_{3}^{3} \times \mathrm{C}_{4}^{3} = 1 \times 4 = 4

C33​×C43​=1×4=4。

(二)矩阵秩的定义

设矩阵

A

=

(

a

i

j

)

m

×

n

A = (a_{ij})_{m \times n}

A=(aij​)m×n​,若存在一个

r

r

r 阶子式不为

0

0

0,且所有

r

+

1

r + 1

r+1 阶子式(若存在)全为

0

0

0,则称

r

r

r 为矩阵

A

A

A 的秩,记作

R

(

A

)

R(A)

R(A) 或

r

a

n

k

(

A

)

\mathrm{rank}(A)

rank(A)。

特殊规定:零矩阵(所有元素均为

0

0

0 的矩阵)的秩为

0

0

0,即

R

(

0

)

=

0

R(0) = 0

R(0)=0。

重要结论:

对任意

m

×

n

m \times n

m×n 矩阵

A

A

A,必有

0

R

(

A

)

min

{

m

,

n

}

0 \leq R(A) \leq \min\{m, n\}

0≤R(A)≤min{m,n};若

n

n

n 阶方阵

A

A

A 的秩

R

(

A

)

=

n

R(A) = n

R(A)=n,则称

A

A

A 为 满秩矩阵(或非奇异矩阵),此时

det

(

A

)

0

\det(A) \neq 0

det(A)=0(

det

(

A

)

\det(A)

det(A) 表示矩阵

A

A

A 的行列式);若

n

n

n 阶方阵

A

A

A 的秩

R

(

A

)

<

n

R(A) < n

R(A)

A

A

A 为 降秩矩阵(或奇异矩阵),此时

det

(

A

)

=

0

\det(A) = 0

det(A)=0。

(三)秩的等价描述

矩阵的秩本质反映了矩阵中行(或列)向量的线性无关性,具体等价描述如下:

行秩:矩阵

A

A

A 的行向量组中线性无关的行向量的最大个数;列秩:矩阵

A

A

A 的列向量组中线性无关的列向量的最大个数;定理:对任意矩阵

A

A

A,其行秩 = 列秩 = 秩(即

R

(

A

)

=

行秩

=

列秩

R(A) = \text{行秩} = \text{列秩}

R(A)=行秩=列秩)。

二、矩阵秩的计算方法

(一)子式判别法(定义法)

根据矩阵秩的定义,通过寻找“最高阶非零子式”来确定秩,步骤如下:

从低阶子式开始计算,先判断 1 阶子式(即矩阵元素)是否全为

0

0

0:若全为

0

0

0,则

R

(

A

)

=

0

R(A) = 0

R(A)=0;若存在非零 1 阶子式,继续判断 2 阶子式;若存在非零 2 阶子式,继续判断 3 阶子式,以此类推;找到最大的

r

r

r,使得存在非零

r

r

r 阶子式,且所有

r

+

1

r + 1

r+1 阶子式全为

0

0

0,则

R

(

A

)

=

r

R(A) = r

R(A)=r。

示例 1:求矩阵

A

=

(

1

2

3

0

0

1

0

1

0

0

1

0

)

A = \begin{pmatrix} 1 & 2 & 3 & 0 \\ 0 & 1 & 0 & 1 \\ 0 & 0 & 1 & 0 \end{pmatrix}

A=

​100​210​301​010​

​ 的秩

选取第 1、2、3 行和第 1、2、3 列,组成的 3 阶子式为

1

2

3

0

1

0

0

0

1

=

1

0

\begin{vmatrix} 1 & 2 & 3 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{vmatrix} = 1 \neq 0

​100​210​301​

​=1=0;矩阵

A

A

A 为

3

×

4

3 \times 4

3×4 矩阵,不存在 4 阶子式;因此

R

(

A

)

=

3

R(A) = 3

R(A)=3。

示例 2:求矩阵

D

=

(

1

2

5

0

3

4

0

0

0

)

D = \begin{pmatrix} 1 & 2 & 5 \\ 0 & 3 & 4 \\ 0 & 0 & 0 \end{pmatrix}

D=

​100​230​540​

​ 的秩

1 阶子式(如元素

1

1

1、

2

2

2、

5

5

5 等)非零,2 阶子式(如

1

2

0

3

=

3

0

\begin{vmatrix} 1 & 2 \\ 0 & 3 \end{vmatrix} = 3 \neq 0

​10​23​

​=3=0)非零;所有 3 阶子式(仅 1 个,即矩阵

D

D

D 的行列式)为

1

2

5

0

3

4

0

0

0

=

0

\begin{vmatrix} 1 & 2 & 5 \\ 0 & 3 & 4 \\ 0 & 0 & 0 \end{vmatrix} = 0

​100​230​540​

​=0;因此

R

(

D

)

=

2

R(D) = 2

R(D)=2(原内容此处写为

R

(

A

)

R(A)

R(A),属于符号混淆,已修正为

R

(

D

)

R(D)

R(D))。

(二)初等变换法(最常用方法)

1. 重要定理

矩阵的初等变换(行变换或列变换)不改变矩阵的秩,即若矩阵

A

A

A 经过初等变换化为矩阵

B

B

B,则

R

(

A

)

=

R

(

B

)

R(A) = R(B)

R(A)=R(B)。

初等变换的类型:

行变换:

交换两行(记为

r

i

r

j

r_i \leftrightarrow r_j

ri​↔rj​);用非零常数

k

k

k 乘某一行(记为

k

r

i

k r_i

kri​,

k

0

k \neq 0

k=0);某一行的

k

k

k 倍加到另一行(记为

r

i

+

k

r

j

r_i + k r_j

ri​+krj​)。 列变换:

交换两列(记为

c

i

c

j

c_i \leftrightarrow c_j

ci​↔cj​);用非零常数

k

k

k 乘某一列(记为

k

c

i

k c_i

kci​,

k

0

k \neq 0

k=0);某一列的

k

k

k 倍加到另一列(记为

c

i

+

k

c

j

c_i + k c_j

ci​+kcj​)。

2. 行阶梯形矩阵的定义

满足以下两个条件的矩阵称为 行阶梯形矩阵:

全零行(所有元素均为

0

0

0 的行)位于矩阵的下方;非零行的第一个非零元素(称为“主元”)的列序数,从上到下严格递增。

示例:

(

1

0

2

4

0

1

1

2

0

0

0

0

)

\begin{pmatrix} 1 & 0 & 2 & -4 \\ 0 & 1 & -1 & 2 \\ 0 & 0 & 0 & 0 \end{pmatrix}

​100​010​2−10​−420​

​ 是行阶梯形矩阵(主元分别在第 1 列、第 2 列,列序数递增,全零行在最下方)。

3. 计算步骤

对矩阵

A

A

A 施行初等行变换,将其化为行阶梯形矩阵

B

B

B;行阶梯形矩阵

B

B

B 中非零行的行数,即为矩阵

A

A

A 的秩(

R

(

A

)

=

非零行数

R(A) = \text{非零行数}

R(A)=非零行数)。

示例 1:求矩阵

A

=

(

1

0

2

4

2

1

3

6

1

1

1

2

)

A = \begin{pmatrix} 1 & 0 & 2 & -4 \\ 2 & 1 & 3 & -6 \\ -1 & -1 & -1 & 2 \end{pmatrix}

A=

​12−1​01−1​23−1​−4−62​

​ 的秩

第一步:消去第 1 列下方元素(以第 1 行第 1 列元素

1

1

1 为主元)

A

r

2

2

r

1

(

1

0

2

4

0

1

1

2

1

1

1

2

)

r

3

+

r

1

(

1

0

2

4

0

1

1

2

0

1

1

2

)

A \xrightarrow{r_2 - 2 r_1} \begin{pmatrix} 1 & 0 & 2 & -4 \\ 0 & 1 & -1 & 2 \\ -1 & -1 & -1 & 2 \end{pmatrix} \xrightarrow{r_3 + r_1} \begin{pmatrix} 1 & 0 & 2 & -4 \\ 0 & 1 & -1 & 2 \\ 0 & -1 & 1 & -2 \end{pmatrix}

Ar2​−2r1​

​10−1​01−1​2−1−1​−422​

​r3​+r1​

​100​01−1​2−11​−42−2​

​;第二步:消去第 2 列下方元素(以第 2 行第 2 列元素

1

1

1 为主元)

r

3

+

r

2

(

1

0

2

4

0

1

1

2

0

0

0

0

)

\xrightarrow{r_3 + r_2} \begin{pmatrix} 1 & 0 & 2 & -4 \\ 0 & 1 & -1 & 2 \\ 0 & 0 & 0 & 0 \end{pmatrix}

r3​+r2​

​100​010​2−10​−420​

​;行阶梯形矩阵中非零行的行数为

2

2

2,因此

R

(

A

)

=

2

R(A) = 2

R(A)=2。

示例 2:求矩阵

A

=

(

4

2

1

1

2

2

1

8

7

2

14

13

)

A = \begin{pmatrix} 4 & -2 & 1 \\ 1 & 2 & -2 \\ -1 & 8 & -7 \\ 2 & 14 & -13 \end{pmatrix}

A=

​41−12​−22814​1−2−7−13​

​ 的秩

第一步:交换第 1、2 行(使第 1 列主元为

1

1

1,简化计算)

A

r

1

r

2

(

1

2

2

4

2

1

1

8

7

2

14

13

)

A \xrightarrow{r_1 \leftrightarrow r_2} \begin{pmatrix} 1 & 2 & -2 \\ 4 & -2 & 1 \\ -1 & 8 & -7 \\ 2 & 14 & -13 \end{pmatrix}

Ar1​↔r2​

​14−12​2−2814​−21−7−13​

​;第二步:消去第 1 列下方元素

r

2

4

r

1

(

1

2

2

0

10

9

1

8

7

2

14

13

)

r

3

+

r

1

(

1

2

2

0

10

9

0

10

9

2

14

13

)

r

4

2

r

1

(

1

2

2

0

10

9

0

10

9

0

10

9

)

\xrightarrow{r_2 - 4 r_1} \begin{pmatrix} 1 & 2 & -2 \\ 0 & -10 & 9 \\ -1 & 8 & -7 \\ 2 & 14 & -13 \end{pmatrix} \xrightarrow{r_3 + r_1} \begin{pmatrix} 1 & 2 & -2 \\ 0 & -10 & 9 \\ 0 & 10 & -9 \\ 2 & 14 & -13 \end{pmatrix} \xrightarrow{r_4 - 2 r_1} \begin{pmatrix} 1 & 2 & -2 \\ 0 & -10 & 9 \\ 0 & 10 & -9 \\ 0 & 10 & -9 \end{pmatrix}

r2​−4r1​

​10−12​2−10814​−29−7−13​

​r3​+r1​

​1002​2−101014​−29−9−13​

​r4​−2r1​

​1000​2−101010​−29−9−9​

​;第三步:消去第 2 列下方元素

r

3

+

r

2

(

1

2

2

0

10

9

0

0

0

0

10

9

)

r

4

+

r

2

(

1

2

2

0

10

9

0

0

0

0

0

0

)

\xrightarrow{r_3 + r_2} \begin{pmatrix} 1 & 2 & -2 \\ 0 & -10 & 9 \\ 0 & 0 & 0 \\ 0 & 10 & -9 \end{pmatrix} \xrightarrow{r_4 + r_2} \begin{pmatrix} 1 & 2 & -2 \\ 0 & -10 & 9 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}

r3​+r2​

​1000​2−10010​−290−9​

​r4​+r2​

​1000​2−1000​−2900​

​;行阶梯形矩阵中非零行的行数为

2

2

2,因此

R

(

A

)

=

2

R(A) = 2

R(A)=2。

(三)含参数矩阵的秩(需分类讨论)

当矩阵中含参数时,需根据参数的取值判断最高阶非零子式的阶数,进而确定秩。

示例:设矩阵

A

=

(

1

1

1

2

3

λ

1

2

5

3

μ

6

)

A = \begin{pmatrix} 1 & -1 & 1 & 2 \\ 3 & \lambda & -1 & 2 \\ 5 & 3 & \mu & 6 \end{pmatrix}

A=

​135​−1λ3​1−1μ​226​

​,且

R

(

A

)

=

2

R(A) = 2

R(A)=2,求

λ

\lambda

λ 和

μ

\mu

μ 的值

第一步:对

A

A

A 施行初等行变换化为行阶梯形

A

r

2

3

r

1

(

1

1

1

2

0

λ

+

3

4

4

5

3

μ

6

)

r

3

5

r

1

(

1

1

1

2

0

λ

+

3

4

4

0

8

μ

5

4

)

A \xrightarrow{r_2 - 3 r_1} \begin{pmatrix} 1 & -1 & 1 & 2 \\ 0 & \lambda + 3 & -4 & -4 \\ 5 & 3 & \mu & 6 \end{pmatrix} \xrightarrow{r_3 - 5 r_1} \begin{pmatrix} 1 & -1 & 1 & 2 \\ 0 & \lambda + 3 & -4 & -4 \\ 0 & 8 & \mu - 5 & -4 \end{pmatrix}

Ar2​−3r1​

​105​−1λ+33​1−4μ​2−46​

​r3​−5r1​

​100​−1λ+38​1−4μ−5​2−4−4​

​;第二步:由

R

(

A

)

=

2

R(A) = 2

R(A)=2 可知,行阶梯形矩阵中第 3 行需为全零行,因此第 2、3 行对应元素成比例 即

λ

+

3

8

=

4

μ

5

=

4

4

\frac{\lambda + 3}{8} = \frac{-4}{\mu - 5} = \frac{-4}{-4}

8λ+3​=μ−5−4​=−4−4​;第三步:求解比例方程 由

4

4

=

1

\frac{-4}{-4} = 1

−4−4​=1,得

λ

+

3

=

8

×

1

λ

=

5

\lambda + 3 = 8 \times 1 \implies \lambda = 5

λ+3=8×1⟹λ=5;

4

=

(

μ

5

)

×

1

μ

=

1

-4 = (\mu - 5) \times 1 \implies \mu = 1

−4=(μ−5)×1⟹μ=1;因此,当

λ

=

5

\lambda = 5

λ=5 且

μ

=

1

\mu = 1

μ=1 时,

R

(

A

)

=

2

R(A) = 2

R(A)=2。

三、矩阵化简的形式与方法

(一)矩阵化简的基本原理

矩阵化简通过初等变换(行变换或列变换)实现,初等变换不改变矩阵的秩,是计算秩、求解线性方程组的关键工具。常见化简目标包括行阶梯形、行简化行阶梯形、列阶梯形及等价标准形,不同形式适用于不同场景。

(二)常见化简形式及规则

1. 行阶梯形(Row Echelon Form, REF)

REF 是“阶梯状”的基础化简形式,需满足以下 4 条规则:

全零行位于矩阵最下方;非零行的第一个非零元素(称为“主元”)的列索引,严格大于上一行主元的列索引(形成“阶梯”结构);主元下方的所有元素全为

0

0

0;主元可为任意非零数(无需强制为

1

1

1)。

示例(主元用橙色标注):

(

2

3

5

7

0

1

4

2

0

0

0

3

0

0

0

0

)

\begin{pmatrix} \color{orange}{2} & 3 & 5 & 7 \\ 0 & \color{orange}{-1} & 4 & 2 \\ 0 & 0 & 0 & \color{orange}{3} \\ 0 & 0 & 0 & 0 \end{pmatrix}

​2000​3−100​5400​7230​

用途:快速判断矩阵的秩(非零行数 = 秩);初步求解线性方程组(需后续“回代”步骤)。 注意:一个矩阵的 REF 不唯一(主元可缩放,不同初等行变换可能得到不同 REF)。

2. 行简化行阶梯形(Reduced Row Echelon Form, RREF)

RREF 是 REF 的“最简形式”,在 REF 规则基础上额外满足 2 条严格规则:

所有主元的值必为

1

1

1;主元上方的所有元素全为

0

0

0(即主元列仅主元为

1

1

1,其余元素均为

0

0

0)。

示例(将上述 REF 化为 RREF,主元用橙色标注):

(

1

0

17

/

2

0

0

1

4

0

0

0

0

1

0

0

0

0

)

\begin{pmatrix} \color{orange}{1} & 0 & 17/2 & 0 \\ 0 & \color{orange}{1} & -4 & 0 \\ 0 & 0 & 0 & \color{orange}{1} \\ 0 & 0 & 0 & 0 \end{pmatrix}

​1000​0100​17/2−400​0010​

重要性质:一个矩阵的 RREF 是唯一的(无论采用何种初等行变换,最终结果完全相同)。 用途:直接读取线性方程组的解(无需回代);确定矩阵的主元列(对应列空间的基);判断向量组的线性相关性。

3. 列阶梯形(Column Echelon Form, CEF)

CEF 与 REF 逻辑对称,通过初等列变换实现,需满足以下 4 条规则:

全零列位于矩阵最右侧;非零列的第一个非零元素(称为“列主元”)的行索引,严格大于左一列列主元的行索引;列主元右侧的所有元素全为

0

0

0;列主元可为任意非零数(无需强制为

1

1

1)。

示例(列主元用橙色标注):

(

2

0

0

0

3

1

0

0

5

4

0

0

7

2

3

0

)

\begin{pmatrix} \color{orange}{2} & 0 & 0 & 0 \\ 3 & \color{orange}{-1} & 0 & 0 \\ 5 & 4 & 0 & 0 \\ 7 & 2 & \color{orange}{3} & 0 \end{pmatrix}

​2357​0−142​0003​0000​

用途:分析矩阵的行空间(非零行是行空间的基);计算矩阵的左逆(当矩阵列满秩时)。

4. 等价标准形(相抵标准形)

若同时允许初等行变换和初等列变换,任意

m

×

n

m \times n

m×n 矩阵可化为唯一的“等价标准形”,形式为:

E

=

(

I

r

0

r

×

(

n

r

)

0

(

m

r

)

×

r

0

(

m

r

)

×

(

n

r

)

)

\mathbf{E} = \begin{pmatrix} \mathbf{I}_r & \mathbf{0}_{r \times (n-r)} \\ \mathbf{0}_{(m-r) \times r} & \mathbf{0}_{(m-r) \times (n-r)} \end{pmatrix}

E=(Ir​0(m−r)×r​​0r×(n−r)​0(m−r)×(n−r)​​) 其中:

m

,

n

m, n

m,n 分别为原矩阵的行数和列数;

r

=

R

(

A

)

r = R(A)

r=R(A)(矩阵的秩);

I

r

\mathbf{I}_r

Ir​ 为

r

r

r 阶单位矩阵,

0

\mathbf{0}

0 为对应维度的零矩阵。

示例(秩为

2

2

2 的

3

×

4

3 \times 4

3×4 矩阵的等价标准形):

(

1

0

0

0

0

1

0

0

0

0

0

0

)

\begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}

​100​010​000​000​

用途:判断两个矩阵是否“等价”(若两个矩阵的等价标准形相同,则二者等价);简化矩阵的秩与行列式计算。

(三)矩阵化简的应用场景总结

为清晰区分不同化简形式的适用场景,下表梳理了重要信息:

化简目标推荐化简形式操作方式典型用途快速计算矩阵的秩行阶梯形(REF)初等行变换初步分析矩阵的有效维度,判断向量组线性相关性求解线性方程组行简化行阶梯形(RREF)初等行变换直接读取唯一解或无穷解的通解,无需回代确定列空间的基行简化行阶梯形(RREF)初等行变换主元列对应原矩阵的列向量,构成列空间的基确定行空间的基列阶梯形(CEF)初等列变换主元行对应原矩阵的行向量,构成行空间的基判断两个矩阵是否等价等价标准形初等行变换 + 初等列变换比较两个矩阵的结构相似度,验证是否可通过初等变换互化

四、矩阵秩的性质

A

A

A、

B

B

B 为任意矩阵,

k

k

k 为非零常数,

n

n

n 为方阵的阶数,则矩阵的秩满足以下性质,下表结合“性质内容”与“直观说明”展开:

性质序号性质内容说明1

R

(

A

T

)

=

R

(

A

)

R(A^T) = R(A)

R(AT)=R(A)(转置后秩不变)矩阵的行秩 = 列秩,转置后行与列互换,秩的本质(线性无关向量的最大个数)不变2

R

(

A

)

min

{

m

,

n

}

R(A) \leq \min\{m, n\}

R(A)≤min{m,n}(

A

A

A 为

m

×

n

m \times n

m×n 矩阵)秩反映矩阵的“有效维度”,无法超过矩阵的行数(行向量最大可能无关个数)或列数(列向量最大可能无关个数)3

R

(

k

A

)

=

R

(

A

)

R(kA) = R(A)

R(kA)=R(A)(

k

0

k \neq 0

k=0)非零常数

k

k

k 仅缩放矩阵元素,不改变子式的“非零性”(非零子式缩放后仍非零,零子式缩放后仍为零)4

R

(

A

)

=

0

A

=

0

R(A) = 0 \iff A = 0

R(A)=0⟺A=0(零矩阵的充要条件)零矩阵所有子式均为

0

0

0,故秩为

0

0

0;若

R

(

A

)

=

0

R(A)=0

R(A)=0,则无任何非零子式,矩阵必为零矩阵5

R

(

A

+

B

)

R

(

A

)

+

R

(

B

)

R(A + B) \leq R(A) + R(B)

R(A+B)≤R(A)+R(B)(和的秩不超过秩的和)矩阵

A

+

B

A + B

A+B 的行向量可由

A

A

A 和

B

B

B 的行向量组线性表示,因此其线性无关向量的最大个数不超过两组向量无关个数之和6

R

(

A

B

)

min

{

R

(

A

)

,

R

(

B

)

}

R(AB) \leq \min\{R(A), R(B)\}

R(AB)≤min{R(A),R(B)}(乘积的秩不超过因子矩阵的秩)

A

B

AB

AB 的列向量可由

A

A

A 的列向量线性表示(故

R

(

A

B

)

R

(

A

)

R(AB) \leq R(A)

R(AB)≤R(A)),行向量可由

B

B

B 的行向量线性表示(故

R

(

A

B

)

R

(

B

)

R(AB) \leq R(B)

R(AB)≤R(B)),因此取最小值7

R

(

A

)

+

R

(

B

)

n

R

(

A

B

)

R(A) + R(B) - n \leq R(AB)

R(A)+R(B)−n≤R(AB)(Sylvester 不等式)对

n

n

n 阶方阵

A

A

A、

B

B

B,乘积的秩存在下界,反映了因子矩阵秩与乘积矩阵秩的“关联约束”,可用于证明矩阵可逆性等问题8若

A

A

A 为

n

n

n 阶可逆矩阵,则

R

(

A

B

)

=

R

(

B

)

R(AB) = R(B)

R(AB)=R(B),

R

(

B

A

)

=

R

(

B

)

R(BA) = R(B)

R(BA)=R(B)可逆矩阵可通过初等变换化为单位阵,而初等变换不改变矩阵的秩,因此

A

A

A 的可逆性不影响

B

B

B 的秩传递

五、矩阵秩的应用

矩阵的秩是连接“矩阵结构”与“线性代数问题”的桥梁,以下从四个典型场景展开,结合示例说明其应用逻辑:

(一)判断线性方程组的解

对于线性方程组

A

x

=

b

A \boldsymbol{x} = \boldsymbol{b}

Ax=b(

A

A

A 为

m

×

n

m \times n

m×n 系数矩阵,

A

=

(

A

b

)

\overline{A} = (A \mid \boldsymbol{b})

A=(A∣b) 为增广矩阵),解的存在性与唯一性完全由

R

(

A

)

R(A)

R(A) 和

R

(

A

)

R(\overline{A})

R(A) 的关系决定,重要结论如下:

无解:

R

(

A

)

<

R

(

A

)

R(A) < R(\overline{A})

R(A)

1

1

1,对应矛盾方程

0

=

d

0

0 = d \neq 0

0=d=0,即“约束条件冲突”);唯一解:

R

(

A

)

=

R

(

A

)

=

n

R(A) = R(\overline{A}) = n

R(A)=R(A)=n(秩等于未知数个数,无自由变量,即“约束条件恰好确定唯一解”);无穷多解:

R

(

A

)

=

R

(

A

)

<

n

R(A) = R(\overline{A}) < n

R(A)=R(A)

示例:判断方程组

{

x

1

+

4

x

2

+

7

x

3

=

1

2

x

1

+

5

x

2

+

8

x

3

=

2

3

x

1

+

6

x

2

+

9

x

3

=

3

\begin{cases} x_1 + 4 x_2 + 7 x_3 = 1 \\ 2 x_1 + 5 x_2 + 8 x_3 = 2 \\ 3 x_1 + 6 x_2 + 9 x_3 = 3 \end{cases}

⎧​x1​+4x2​+7x3​=12x1​+5x2​+8x3​=23x1​+6x2​+9x3​=3​ 的解

第一步:构造增广矩阵

A

=

(

1

4

7

1

2

5

8

2

3

6

9

3

)

\overline{A} = \begin{pmatrix} 1 & 4 & 7 & 1 \\ 2 & 5 & 8 & 2 \\ 3 & 6 & 9 & 3 \end{pmatrix}

A=

​123​456​789​123​

​;第二步:初等行变换化为行阶梯形:

A

r

2

2

r

1

(

1

4

7

1

0

3

6

0

3

6

9

3

)

r

3

3

r

1

(

1

4

7

1

0

3

6

0

0

6

12

0

)

r

3

2

r

2

(

1

4

7

1

0

3

6

0

0

0

0

0

)

\overline{A} \xrightarrow{r_2 - 2 r_1} \begin{pmatrix} 1 & 4 & 7 & 1 \\ 0 & -3 & -6 & 0 \\ 3 & 6 & 9 & 3 \end{pmatrix} \xrightarrow{r_3 - 3 r_1} \begin{pmatrix} 1 & 4 & 7 & 1 \\ 0 & -3 & -6 & 0 \\ 0 & -6 & -12 & 0 \end{pmatrix} \xrightarrow{r_3 - 2 r_2} \begin{pmatrix} 1 & 4 & 7 & 1 \\ 0 & -3 & -6 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}

Ar2​−2r1​

​103​4−36​7−69​103​

​r3​−3r1​

​100​4−3−6​7−6−12​100​

​r3​−2r2​

​100​4−30​7−60​100​

​;第三步:分析秩的关系:

R

(

A

)

=

2

R(A) = 2

R(A)=2,

R

(

A

)

=

2

R(\overline{A}) = 2

R(A)=2,且未知数个数

n

=

3

n = 3

n=3,满足

R

(

A

)

=

R

(

A

)

<

n

R(A) = R(\overline{A}) < n

R(A)=R(A)

(二)判断向量组的线性相关性

设向量组

α

1

,

α

2

,

,

α

s

\alpha_1, \alpha_2, \dots, \alpha_s

α1​,α2​,…,αs​ 构成矩阵

A

A

A(列向量组构成

A

=

(

α

1

,

α

2

,

,

α

s

)

A = (\alpha_1, \alpha_2, \dots, \alpha_s)

A=(α1​,α2​,…,αs​),行向量组构成

A

=

(

α

1

T

α

2

T

α

s

T

)

A = \begin{pmatrix} \alpha_1^T \\ \alpha_2^T \\ \dots \\ \alpha_s^T \end{pmatrix}

A=

​α1T​α2T​…αsT​​

​),则向量组的线性相关性与

R

(

A

)

R(A)

R(A) 的关系为:

R

(

A

)

=

s

R(A) = s

R(A)=s,则向量组 线性无关(矩阵的秩等于向量个数,所有向量均可作为“有效约束”,无冗余);若

R

(

A

)

<

s

R(A) < s

R(A)

示例:判断向量组

α

1

=

(

1

,

2

,

3

)

T

\alpha_1 = (1, 2, 3)^T

α1​=(1,2,3)T,

α

2

=

(

2

,

5

,

8

)

T

\alpha_2 = (2, 5, 8)^T

α2​=(2,5,8)T,

α

3

=

(

3

,

6

,

9

)

T

\alpha_3 = (3, 6, 9)^T

α3​=(3,6,9)T 的线性相关性

构造矩阵

A

=

(

α

1

,

α

2

,

α

3

)

=

(

1

2

3

2

5

6

3

8

9

)

A = (\alpha_1, \alpha_2, \alpha_3) = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 5 & 6 \\ 3 & 8 & 9 \end{pmatrix}

A=(α1​,α2​,α3​)=

​123​258​369​

​;初等行变换化为行阶梯形:

A

r

2

2

r

1

(

1

2

3

0

1

0

3

8

9

)

r

3

3

r

1

(

1

2

3

0

1

0

0

2

0

)

r

3

2

r

2

(

1

2

3

0

1

0

0

0

0

)

A \xrightarrow{r_2 - 2 r_1} \begin{pmatrix} 1 & 2 & 3 \\ 0 & 1 & 0 \\ 3 & 8 & 9 \end{pmatrix} \xrightarrow{r_3 - 3 r_1} \begin{pmatrix} 1 & 2 & 3 \\ 0 & 1 & 0 \\ 0 & 2 & 0 \end{pmatrix} \xrightarrow{r_3 - 2 r_2} \begin{pmatrix} 1 & 2 & 3 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{pmatrix}

Ar2​−2r1​

​103​218​309​

​r3​−3r1​

​100​212​300​

​r3​−2r2​

​100​210​300​

​;得

R

(

A

)

=

2

<

3

R(A) = 2 < 3

R(A)=2<3(向量个数),因此向量组线性相关。

(三)判断矩阵的可逆性

n

n

n 阶方阵

A

A

A,“可逆性”与“秩”紧密关联,以下条件完全等价(可互相推导):

A

A

A 可逆(存在逆矩阵

A

1

A^{-1}

A−1,满足

A

A

1

=

A

1

A

=

I

n

A A^{-1} = A^{-1} A = \mathbf{I}_n

AA−1=A−1A=In​);

A

A

A 为满秩矩阵(

R

(

A

)

=

n

R(A) = n

R(A)=n,即矩阵无冗余行/列,有效维度等于阶数);

det

(

A

)

0

\det(A) \neq 0

det(A)=0(行列式非零,对应“最高阶子式非零”,符合满秩定义);

A

A

A 可通过初等行变换化为单位阵

I

n

\mathbf{I}_n

In​(初等变换不改变秩,单位阵秩为

n

n

n,故

A

A

A 秩也为

n

n

n)。

示例:设

A

=

(

1

2

3

2

1

2

3

1

2

)

A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 1 & 2 \\ 3 & 1 & 2 \end{pmatrix}

A=

​123​211​322​

​,验证

A

A

A 可逆并化为单位阵

第一步:计算

R

(

A

)

R(A)

R(A):

A

r

2

2

r

1

(

1

2

3

0

3

4

3

1

2

)

r

3

3

r

1

(

1

2

3

0

3

4

0

5

7

)

r

3

5

3

r

2

(

1

2

3

0

3

4

0

0

1

3

)

A \xrightarrow{r_2 - 2 r_1} \begin{pmatrix} 1 & 2 & 3 \\ 0 & -3 & -4 \\ 3 & 1 & 2 \end{pmatrix} \xrightarrow{r_3 - 3 r_1} \begin{pmatrix} 1 & 2 & 3 \\ 0 & -3 & -4 \\ 0 & -5 & -7 \end{pmatrix} \xrightarrow{r_3 - \frac{5}{3} r_2} \begin{pmatrix} 1 & 2 & 3 \\ 0 & -3 & -4 \\ 0 & 0 & -\frac{1}{3} \end{pmatrix}

Ar2​−2r1​

​103​2−31​3−42​

​r3​−3r1​

​100​2−3−5​3−4−7​

​r3​−35​r2​

​100​2−30​3−4−31​​

​;行阶梯形中非零行数为

3

=

n

3 = n

3=n(阶数),故

R

(

A

)

=

3

R(A) = 3

R(A)=3,

A

A

A 可逆;第二步:继续化为单位阵:

r

3

×

(

3

)

(

1

2

3

0

3

4

0

0

1

)

r

2

+

4

r

3

(

1

2

3

0

3

0

0

0

1

)

r

2

×

(

1

3

)

(

1

2

3

0

1

0

0

0

1

)

r

1

3

r

3

(

1

2

0

0

1

0

0

0

1

)

r

1

2

r

2

(

1

0

0

0

1

0

0

0

1

)

=

I

3

\xrightarrow{r_3 \times (-3)} \begin{pmatrix} 1 & 2 & 3 \\ 0 & -3 & -4 \\ 0 & 0 & 1 \end{pmatrix} \xrightarrow{r_2 + 4 r_3} \begin{pmatrix} 1 & 2 & 3 \\ 0 & -3 & 0 \\ 0 & 0 & 1 \end{pmatrix} \xrightarrow{r_2 \times (-\frac{1}{3})} \begin{pmatrix} 1 & 2 & 3 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix} \xrightarrow{r_1 - 3 r_3} \begin{pmatrix} 1 & 2 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix} \xrightarrow{r_1 - 2 r_2} \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix} = \mathbf{I}_3

r3​×(−3)

​100​2−30​3−41​

​r2​+4r3​

​100​2−30​301​

​r2​×(−31​)

​100​210​301​

​r1​−3r3​

​100​210​001​

​r1​−2r2​

​100​010​001​

​=I3​。

(四)数据降维和信息压缩

在机器学习、信号处理等领域,矩阵的秩反映“数据冗余度”:低秩矩阵(

R

(

A

)

min

{

m

,

n

}

R(A) \ll \min\{m, n\}

R(A)≪min{m,n})表示数据存在大量冗余,可通过“保留核心信息、剔除冗余”实现降维与压缩,典型应用为奇异值分解(SVD) 和主成分分析(PCA)。

逻辑:对矩阵

A

A

A 进行奇异值分解,得

A

=

U

Σ

V

T

A = U \Sigma V^T

A=UΣVT,其中

Σ

\Sigma

Σ 为对角矩阵,对角元素(奇异值)按从大到小排列;取前

r

r

r 个非零奇异值(

r

=

R

(

A

)

r = R(A)

r=R(A))对应的子矩阵,可得到原矩阵的低秩逼近

A

r

=

U

r

Σ

r

V

r

T

A_r = U_r \Sigma_r V_r^T

Ar​=Ur​Σr​VrT​,实现用

r

(

m

+

n

r

)

r(m + n - r)

r(m+n−r) 个元素表示原

m

×

n

m \times n

m×n 矩阵(大幅减少存储量)。示例:图片压缩。灰度图片可表示为

m

×

n

m \times n

m×n 矩阵(元素为像素灰度值),若矩阵秩

r

r

r 远小于

m

m

m 和

n

n

n,用低秩逼近矩阵

A

r

A_r

Ar​ 替代原矩阵,视觉上几乎无差异,但存储量显著降低。

六、特殊矩阵的秩

部分结构特殊的矩阵,其秩可直接通过“直观特征”计算,无需复杂变换,以下列举两类典型矩阵:

(一)三角矩阵

三角矩阵分为上三角矩阵和下三角矩阵,其秩由“主对角线元素”直接决定:

上三角矩阵(主对角线下方元素全为

0

0

0):

(

a

11

a

12

a

1

n

0

a

22

a

2

n

0

0

a

n

n

)

\begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ 0 & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & a_{nn} \end{pmatrix}

​a11​0⋮0​a12​a22​⋮0​……⋱…​a1n​a2n​⋮ann​​

​;下三角矩阵(主对角线上方元素全为

0

0

0):

(

a

11

0

0

a

21

a

22

0

a

n

1

a

n

2

a

n

n

)

\begin{pmatrix} a_{11} & 0 & \dots & 0 \\ a_{21} & a_{22} & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{pmatrix}

​a11​a21​⋮an1​​0a22​⋮an2​​……⋱…​00⋮ann​​

​;秩的计算规则:三角矩阵的秩等于主对角线上非零元素的个数。 (原因:三角矩阵的行列式为“主对角线元素乘积”,最高阶非零子式的阶数由非零对角元素的个数决定)。

示例:上三角矩阵

A

=

(

2

3

5

0

0

4

0

0

1

)

A = \begin{pmatrix} 2 & 3 & 5 \\ 0 & 0 & 4 \\ 0 & 0 & -1 \end{pmatrix}

A=

​200​300​54−1​

​,主对角线元素为

2

,

0

,

1

2, 0, -1

2,0,−1,非零个数为

2

2

2,故

R

(

A

)

=

2

R(A) = 2

R(A)=2。

(二)对角矩阵

对角矩阵是特殊的三角矩阵(主对角线外元素全为

0

0

0),形式为:

(

a

11

0

0

0

a

22

0

0

0

a

n

n

)

\begin{pmatrix} a_{11} & 0 & \dots & 0 \\ 0 & a_{22} & \dots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & a_{nn} \end{pmatrix}

​a11​0⋮0​0a22​⋮0​……⋱…​00⋮ann​​

​;

秩的计算规则:对角矩阵的秩等于对角线上非零元素的个数(与三角矩阵规则一致,因对角矩阵同时属于上三角矩阵和下三角矩阵)。

示例:对角矩阵

B

=

(

3

0

0

0

0

0

0

0

5

)

B = \begin{pmatrix} -3 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 5 \end{pmatrix}

B=

​−300​000​005​

​,对角线上非零元素为

3

-3

−3 和

5

5

5,共

2

2

2 个,故

R

(

B

)

=

2

R(B) = 2

R(B)=2。

七、MATLAB 计算矩阵秩的代码实现

在 MATLAB 中,可直接使用内置函数 rank() 快速计算矩阵的秩,其底层通过奇异值分解(SVD)实现,能有效避免数值误差对结果的影响。以下为具体实现步骤与示例:

% 1. 定义矩阵 A(以 3×3 矩阵为例)

A = [1 2 3; 4 5 6; 7 8 9];

% 2. 计算矩阵 A 的秩

rank_A = rank(A);

% 3. 显示结果

disp(['矩阵 A 的秩为: ', num2str(rank_A)]);

运行结果:矩阵 A 的秩为: 2(与通过初等变换手动计算的结果一致)。

说明:

rank() 函数的逻辑是:对矩阵进行奇异值分解,得到奇异值后,将小于某个阈值(默认约为

1

0

15

10^{-15}

10−15)的奇异值视为

0

0

0,非零奇异值的个数即为矩阵的秩;阈值可通过函数参数调整,例如 rank(A, tol) 中 tol 为自定义阈值,适用于对数值精度有特殊要求的场景;该函数适用于任意维度的矩阵(包括非方阵),是工程计算中高效可靠的秩计算工具。

八、例题解析:矩阵秩的应用

(一)题目

已知行简化行阶梯形矩阵

A

=

(

1

2

0

4

0

0

1

3

0

0

0

0

)

A = \begin{pmatrix} 1 & 2 & 0 & 4 \\ 0 & 0 & 1 & 3 \\ 0 & 0 & 0 & 0 \end{pmatrix}

A=

​100​200​010​430​

​,完成以下任务:

A

A

A 的秩;求

A

A

A 的行秩并验证其与秩的关系;求

A

A

A 的列秩并验证其与秩的关系。

(二)解答过程

1. 求矩阵

A

A

A 的秩

根据“行阶梯形矩阵的秩等于非零行的行数”这一结论:

矩阵

A

A

A 中,非零行包括第 1 行

(

1

2

0

4

)

\begin{pmatrix} 1 & 2 & 0 & 4 \end{pmatrix}

(1​2​0​4​) 和第 2 行

(

0

0

1

3

)

\begin{pmatrix} 0 & 0 & 1 & 3 \end{pmatrix}

(0​0​1​3​),共

2

2

2 行;零行仅第 3 行

(

0

0

0

0

)

\begin{pmatrix} 0 & 0 & 0 & 0 \end{pmatrix}

(0​0​0​0​),且位于所有非零行下方(符合行阶梯形结构)。

因此,

R

(

A

)

=

2

R(A) = 2

R(A)=2。

2. 求矩阵

A

A

A 的行秩

矩阵

A

A

A 的行向量组为:

α

1

=

(

1

,

2

,

0

,

4

)

,

α

2

=

(

0

,

0

,

1

,

3

)

,

α

3

=

(

0

,

0

,

0

,

0

)

\alpha_1 = (1, 2, 0, 4),\ \alpha_2 = (0, 0, 1, 3),\ \alpha_3 = (0, 0, 0, 0)

α1​=(1,2,0,4), α2​=(0,0,1,3), α3​=(0,0,0,0)

行秩是“行向量组中线性无关的最大向量个数”,分析如下:

线性无关性验证:假设存在常数

k

1

,

k

2

k_1, k_2

k1​,k2​ 使得

k

1

α

1

+

k

2

α

2

=

0

k_1\alpha_1 + k_2\alpha_2 = \boldsymbol{0}

k1​α1​+k2​α2​=0(零向量),展开得:

(

k

1

,

2

k

1

,

k

2

,

4

k

1

+

3

k

2

)

=

(

0

,

0

,

0

,

0

)

(k_1, 2k_1, k_2, 4k_1 + 3k_2) = (0, 0, 0, 0)

(k1​,2k1​,k2​,4k1​+3k2​)=(0,0,0,0) 解得

k

1

=

0

k_1 = 0

k1​=0 且

k

2

=

0

k_2 = 0

k2​=0,故

α

1

,

α

2

\alpha_1, \alpha_2

α1​,α2​ 线性无关;最大性验证:零向量

α

3

\alpha_3

α3​ 可由

α

1

,

α

2

\alpha_1, \alpha_2

α1​,α2​ 线性表示(

α

3

=

0

α

1

+

0

α

2

\alpha_3 = 0 \cdot \alpha_1 + 0 \cdot \alpha_2

α3​=0⋅α1​+0⋅α2​),因此行向量组中线性无关的最大向量个数为

2

2

2。

因此,

A

A

A 的行秩为

2

2

2,且

R

(

A

)

=

行秩

R(A) = \text{行秩}

R(A)=行秩。

3. 求矩阵

A

A

A 的列秩

矩阵

A

A

A 的列向量组为:

β

1

=

(

1

0

0

)

,

β

2

=

(

2

0

0

)

,

β

3

=

(

0

1

0

)

,

β

4

=

(

4

3

0

)

\beta_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix},\ \beta_2 = \begin{pmatrix} 2 \\ 0 \\ 0 \end{pmatrix},\ \beta_3 = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix},\ \beta_4 = \begin{pmatrix} 4 \\ 3 \\ 0 \end{pmatrix}

β1​=

​100​

​, β2​=

​200​

​, β3​=

​010​

​, β4​=

​430​

列秩是“列向量组中线性无关的最大向量个数”,分析如下(选取主元列

β

1

,

β

3

\beta_1, \beta_3

β1​,β3​ 验证):

线性无关性验证:假设存在常数

l

1

,

l

3

l_1, l_3

l1​,l3​ 使得

l

1

β

1

+

l

3

β

3

=

0

l_1\beta_1 + l_3\beta_3 = \boldsymbol{0}

l1​β1​+l3​β3​=0(零向量),展开得:

(

l

1

l

3

0

)

=

(

0

0

0

)

\begin{pmatrix} l_1 \\ l_3 \\ 0 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}

​l1​l3​0​

​=

​000​

​ 解得

l

1

=

0

l_1 = 0

l1​=0 且

l

3

=

0

l_3 = 0

l3​=0,故

β

1

,

β

3

\beta_1, \beta_3

β1​,β3​ 线性无关;最大性验证:非主元列可由主元列线性表示:

β

2

=

2

β

1

+

0

β

3

\beta_2 = 2\beta_1 + 0 \cdot \beta_3

β2​=2β1​+0⋅β3​,

β

4

=

4

β

1

+

3

β

3

\beta_4 = 4\beta_1 + 3\beta_3

β4​=4β1​+3β3​,因此列向量组中线性无关的最大向量个数为

2

2

2。

因此,

A

A

A 的列秩为

2

2

2,且

R

(

A

)

=

列秩

=

行秩

R(A) = \text{列秩} = \text{行秩}

R(A)=列秩=行秩。

(三)结论

通过例题验证,矩阵的秩、行秩与列秩三者完全相等,这一性质是矩阵理论的重要结论,也是理解矩阵结构与向量组关系的关键。

九、总结

矩阵的秩是线性代数中刻画矩阵“本质维度”的重要概念,其定义基于子式的非零性,计算可通过子式判别法或更高效的初等变换法实现。矩阵的秩具有诸多重要性质,如转置不变性、乘积秩的有界性等,这些性质为分析矩阵关系提供了有力工具。

在应用层面,矩阵的秩决定了线性方程组解的存在性与唯一性,可判断向量组的线性相关性,验证矩阵的可逆性,同时在数据降维、信息压缩等领域有广泛应用。掌握矩阵秩的概念、计算方法与应用场景,是学好线性代数的重要基础。

线性代数 —— 矩阵的列秩和行秩

原创于 2019-09-04 19:20:42 发布

1. 矩阵的列秩和行秩及秩的关系(行秩 = 列秩 = 秩)

2. 初等行变换不改变矩阵的线性相关性

3. 任一矩阵的秩、行秩和列秩相等

4. 求矩阵列向量组的秩及最大无关组示例

从两个角度看矩阵和向量相乘

Limi @_zhihu 发布于 2022-08-04 17:14・广东

前提条件

设矩阵

A

A

A 与向量

x

x

x 进行乘法运算,结果为向量

b

b

b,其维度与

x

x

x 相同。进行此乘法运算的前提条件是矩阵

A

A

A 的列数等于向量

x

x

x 的行数。以下从两个方面探讨如何求得

b

b

b :行视角(Row Aspect)和列视角(Column Aspect)。

行视角(Row Aspect)

将矩阵

A

A

A 视作“行向量的堆叠”,即

A

A

A 的每一行均为一个向量。则向量

b

b

b 的第

i

i

i 个维度的值为

A

A

A 的第

i

i

i 行向量与

x

x

x 作内积的结果,即

b

i

=

(

A

i

,

x

)

b_i = (A_i, x)

bi​=(Ai​,x) 。内积运算要求两个向量的维度相同,这也解释了矩阵与向量相乘时矩阵列数与向量行数需相等的原因。此外,在矩阵

×

\times

× 矩阵的运算中,常采用的计算方法为:矩阵

A

A

A 的第

i

i

i 行与矩阵

B

B

B 的第

j

j

j 列相乘,结果为

C

i

,

j

C_{i,j}

Ci,j​ 。矩阵

×

\times

× 向量可视为矩阵

×

\times

× 矩阵的特殊情形,即右侧矩阵仅有一列。

列视角(Column Aspect)

将矩阵

A

A

A 视作“列向量的并列”,即每一列均为一个向量。以向量

x

x

x 的第

i

i

i 个元素乘以矩阵

A

A

A 的第

i

i

i 个列向量,可得到

n

n

n 个向量(若矩阵

A

A

A 有

n

n

n 列)。将这

n

n

n 个向量相加,即得结果

b

b

b ,表达式为

b

=

i

=

1

n

A

i

x

i

b = \sum_{i=1}^{n} A_i \ast x_i

b=i=1∑n​Ai​∗xi​

其中,

A

i

A_i

Ai​ 为列向量,

x

i

x_i

xi​ 为标量。此方法同样解释了矩阵列数与向量行数需相等的原因。该方法可视为对矩阵

A

A

A 的

n

n

n 个向量进行线性组合以得到新向量,在某些情况下更易于理解。在 3b1b 的线性代数课程中,有一种解释是将

A

A

A 的每个列向量视为向量空间的基向量,向量

x

x

x 的每个值为对应基向量的投影长度。将每个投影长度与基向量相乘后再求和,即可得到新向量。

总结与对比

综合来看,列视角(Column Aspect)在理解矩阵与向量相乘方面更具优势,具有重要的现实意义。

矩阵的秩以及行秩 = 列秩的原因

Limi @_zhihu 编辑于 2022-08-07 20:16

在矩阵理论中,矩阵的秩是一个重要概念,广泛应用于多个数学分支。矩阵的秩定义为矩阵中线性无关行向量或列向量的最大数目。具体来说,矩阵

A

A

A 的列秩是其线性无关列向量的最大数目,而行秩是其线性无关行向量的最大数目。这两个定义是等价的,即矩阵的秩等于其行秩也等于其列秩。

用数学符号表示,矩阵

A

A

A 的秩通常记作

r

(

A

)

r(A)

r(A)、

rk

(

A

)

\text{rk}(A)

rk(A) 或

rank

A

\text{rank}\ A

rank A。矩阵的秩反映了矩阵中线性无关向量的最大数量,这一数量决定了矩阵的“厚度”或“维度”。

对于矩阵

A

m

×

n

A_{m \times n}

Am×n​,可以将其视为由

n

n

n 个列向量组成的矩阵。每个列向量对应一个基底,因此极大线性无关组的列向量个数(矩阵的秩)也称为列空间(Column Space)的维度。

在求解矩阵的秩时,通常通过基本行变换将其转换为阶梯矩阵。在阶梯矩阵中,每一行的第一个非零元素的列数依次向右移动(全零行除外)。即第

i

+

1

i + 1

i+1 行的第一个非零元素位于第

i

i

i 行第一个非零元素的右下方。矩阵的秩

r

r

r 等于阶梯矩阵中单位向量(unit vector)的个数。单位向量是指向量中只有一个元素为 1,其余元素均为 0,也称为基向量(pivot column)或标准向量(standard vector),类似于 one-hot 编码。例如,

[

1

,

0

,

0

]

[1, 0, 0]

[1,0,0] 和

[

0

,

1

,

0

]

[0, 1, 0]

[0,1,0] 均为单位向量。

如图所示,左侧为原始矩阵,右侧为阶梯矩阵。阶梯矩阵中有 3 个单位向量(红色框标记),因此列秩为 3。紫色向量为何不能计入矩阵的极大线性无关组呢?因为其非零元素出现的位置并非对应行的第一个,即在其左侧存在单位向量,该向量可由其左侧的单位向量线性表示。例如,图中的矩阵

[

1

,

0

,

1

,

0

]

=

1

×

[

1

,

0

,

0

,

0

]

+

0

×

[

0

,

1

,

0

,

0

]

+

1

×

[

0

,

0

,

1

,

0

]

[-1, 0, 1, 0] = -1 \times [1, 0, 0, 0] + 0 \times [0, 1, 0, 0] + 1 \times [0, 0, 1, 0]

[−1,0,1,0]=−1×[1,0,0,0]+0×[0,1,0,0]+1×[0,0,1,0]。线性无关向量组中的向量不能相互表示,因此紫色向量不能计入。

通过上述例子可知,单位向量的特点是:该向量中 1 的位置是其所在行的第一个非零元素。阶梯矩阵中单位向量的个数即为矩阵的秩。进一步分析可得,“第一个出现的非零元素” 的个数等于非零行的行数,即行秩。因此,矩阵的行秩等于列秩。此外,还可得出

rank

(

A

)

min

{

m

,

n

}

\text{rank}(A) \leq \min\{m, n\}

rank(A)≤min{m,n}。

总结如下图:

三种典型的子空间

列空间(Column Space)与行空间(Row Space)与零空间(Null Space)

对于零空间(Null Space),即

A

x

=

0

Ax = 0

Ax=0 的基础解系构成的空间。以下是一个例子,其中存在 2 个自由变量(free variable),可得两个基向量(basis),因此零空间的维度为 2。矩阵的秩为 3,满足

rank

(

A

)

+

dimension

(

Null space

)

=

n

\text{rank}(A) + \text{dimension}(\text{Null space}) = n

rank(A)+dimension(Null space)=n。

具体分析如下:共有

n

n

n 个变量,其中

k

k

k 个为自由变量,其余

n

k

n - k

n−k 个变量可直接确定。在由

k

k

k 个自由变量构成的

k

k

k 维空间中,任取一个向量,再与

n

k

n - k

n−k 个确定的值组合,即可得到

A

x

=

0

Ax = 0

Ax=0 的解。从另一个角度理解,存在

k

k

k 个自由变量,是因为在阶梯矩阵中,有

k

k

k 个列向量可由其余

n

k

n - k

n−k 个基向量(pivot columns)线性表示。因此,给定一组

n

k

n - k

n−k 个值,即可求得一组

k

k

k 个值。综合所有情况,可形成一个

k

k

k 维空间。

单位向量(unit vector)的重要作用

单位向量是指向量中仅有一个位置为 1,其余位置均为 0。对于

n

n

n 维向量,存在

n

n

n 个单位向量。按“1” 的位置从小到大排序,分别为

e

1

,

e

2

,

e

3

,

,

e

n

e_1, e_2, e_3, \dots, e_n

e1​,e2​,e3​,…,en​。其中,

e

1

=

[

1

,

0

,

0

,

,

0

]

T

e_1 = [1, 0, 0, \dots, 0]^T

e1​=[1,0,0,…,0]T,

e

2

=

[

0

,

1

,

0

,

,

0

]

e_2 = [0, 1, 0, \dots, 0]

e2​=[0,1,0,…,0],

\dots

…,

e

n

=

[

0

,

0

,

0

,

,

1

]

T

e_n = [0, 0, 0, \dots, 1]^T

en​=[0,0,0,…,1]T。

利用这些单位向量可“提取矩阵”。具体而言,

A

e

i

A e_i

Aei​ 得到的向量是矩阵

A

A

A 的第

i

i

i 列。以下是一个示例:

[

0

1

1

0

]

[

1

0

]

=

[

0

1

]

[

0

1

1

0

]

[

0

1

]

=

[

1

0

]

\begin{bmatrix} 0 & 1 \\-1 & 0 \end{bmatrix} \begin{bmatrix} 1 \\0 \end{bmatrix}= \begin{bmatrix} 0 \\-1 \end{bmatrix} \quad \begin{bmatrix} 0 & 1 \\-1 & 0 \end{bmatrix} \begin{bmatrix} 0 \\1 \end{bmatrix}= \begin{bmatrix} 1 \\0 \end{bmatrix}

[0−1​10​][10​]=[0−1​][0−1​10​][01​]=[10​]

矩阵与向量相乘可视为向量与其对应投影长度的乘积。单位向量

e

i

e_i

ei​ 仅在第

i

i

i 个位置为 1,其余位置为 0,因此只有矩阵

A

A

A 的第

i

i

i 个列向量的投影长度为 1,其余投影长度为 0,从而可提取矩阵

A

A

A 的第

i

i

i 列。

via:

矩阵秩的计算方法-CSDN博客 https://blog.csdn.net/edward_zcl/article/details/90177159

矩阵的秩及其求法-CSDN博客 https://blog.csdn.net/qq_55342245/article/details/120188405

什么是矩阵的秩,矩阵的秩如何计算?-CSDN博客 https://blog.csdn.net/weixin_44114030/article/details/143424474

线性代数学习笔记——矩阵的列秩和行秩_行秩和列秩怎么求-CSDN博客 https://blog.csdn.net/hpdlzu80100/article/details/100545450

从两个角度看矩阵和向量相乘 - 知乎 https://zhuanlan.zhihu.com/p/549884913

矩阵的秩以及为什么行秩=列秩 - 知乎 https://zhuanlan.zhihu.com/p/550019600

相关科技文章

安卓14无法安装应用解决历程
365bet提现多久到账

安卓14无法安装应用解决历程

⌚ 08-14 👁️ 7988
轻松上手:Windows系统下Bear的使用指南与常见问题解答
365bet提现多久到账

轻松上手:Windows系统下Bear的使用指南与常见问题解答

⌚ 07-23 👁️ 7467
《dnf》艾肯宝珠怎么样 艾肯宝珠效果解析
365体育投注注册

《dnf》艾肯宝珠怎么样 艾肯宝珠效果解析

⌚ 09-28 👁️ 9089
打印机复印怎么操作 打印机复印操作步骤介绍
365bet提现多久到账

打印机复印怎么操作 打印机复印操作步骤介绍

⌚ 07-27 👁️ 9281
2025年珠穆朗玛峰登顶统计:你不知道的数字与真相
365日博体育备用

2025年珠穆朗玛峰登顶统计:你不知道的数字与真相

⌚ 07-02 👁️ 6285

合作伙伴