第 2 章 線性變換與矩陣

線性代數 - 第 2 章

第 2 章 線性變換與矩陣 (Linear Transformations and Matrices)

2.1 線性變換、零空間與值域 (Linear Transformations, Null Spaces, and Ranges)
2.2 線性變換的矩陣表示 (The Matrix Representation of a Linear Transformation)
2.3 線性變換的合成與矩陣乘法 (Composition of Linear Transformations and Matrix Multiplication)
2.4 可逆性與同構 (Invertibility and Isomorphisms)
2.5 座標轉換矩陣 (The Change of Coordinate Matrix)
2.6* 對偶空間 (Dual Spaces)
2.7* 具常係數的齊次線性微分方程式 (Homogeneous Linear Differential Equations with Constant Coefficients)

在第 1 章中,我們相當詳細地發展了抽象向量空間的理論。現在很自然地要來考慮那些定義在向量空間上,並且在某種意義上「保留」其結構的函數。這些特殊的函數被稱為「線性變換 (linear transformations)」,它們在純數學與應用數學中都大量存在。在微積分中,微分與積分的運算為我們提供了兩個最重要的線性變換範例(見 2.1 節的範例 6 與 7)。這兩個範例使我們能夠將許多微分與積分方程式的問題,重新表述為特定向量空間上的線性變換問題(見 2.7 節與 5.2 節)。

在幾何學中,旋轉、鏡射與投影(見 2.1 節的範例 2、3 與 4)為我們提供了另一類線性變換。稍後我們將使用這些變換來研究 \( R^n \) 中的剛體運動(6.10 節)。

在接下來的章節中,我們將會看到更多出現在物理與社會科學中的線性變換範例。在本章中,我們假設所有的向量空間都是建立在同一個體 (field) \( F \) 之上。

2.1 線性變換、零空間與值域 (LINEAR TRANSFORMATIONS, NULL SPACES, AND RANGES)

在本節中,我們將探討許多線性變換的範例。其中許多變換將在後續的章節中進行更詳細的討論。回想一下,一個定義域為 \( V \) 且對應域為 \( W \) 的函數 \( T \) 記為 \( T:V\rightarrow W \)(請參見附錄 B)。

定義: 令 \( V \) 與 \( W \) 為在同一個體 \( F \) 上的向量空間。若一個函數 \( T:V\rightarrow W \) 對於所有的 \( x,y\in V \) 以及 \( c\in F \) 皆滿足以下條件,我們稱其為從 \( V \) 映射至 \( W \) 的線性變換 (linear transformation)
(a) \( T(x+y)=T(x)+T(y) \) 以及
(b) \( T(cx)=cT(x) \)。

如果基底的體 \( F \) 是有理數體,那麼 (a) 會推導出 (b)(見習題 38),但一般而言,(a) 與 (b) 在邏輯上是獨立的。請參見習題 39 與 40。我們通常簡單地稱 \( T \) 為線性的 (linear)

讀者應自行驗證函數 \( T:V\rightarrow W \) 的以下性質(見習題 7):

  1. 若 \( T \) 為線性,則 \( T(0)=0 \)。
  2. \( T \) 為線性若且唯若對於所有 \( x,y\in V \) 及 \( c\in F \),皆有 \( T(cx+y)=cT(x)+T(y) \)。
  3. 若 \( T \) 為線性,則對於所有 \( x,y\in V \),皆有 \( T(x-y)=T(x)-T(y) \)。
  4. \( T \) 為線性若且唯若對於 \( x_1,x_2,...,x_n\in V \) 及 \( a_1,a_2,...,a_n\in F \),我們有 \( T(\sum_{i=1}^{n}a_i x_i)=\sum_{i=1}^{n}a_i T(x_i) \)。

我們通常使用性質 2 來證明一個給定的變換是線性的。

範例 1
定義 \( T:R^2\rightarrow R^2 \) 為 \( T(a_1,a_2)=(2a_1+a_2,a_1) \)。為了證明 \( T \) 是線性的,令 \( c\in R \) 且 \( x,y\in R^2 \),其中 \( x=(b_1,b_2) \) 且 \( y=(d_1,d_2) \)。因為我們有 \( cx+y=(cb_1+d_1,cb_2+d_2) \),
所以 \( T(cx+y)=(2(cb_1+d_1)+cb_2+d_2,cb_1+d_1) \)。
同樣地,
\( cT(x)+T(y)=c(2b_1+b_2,b_1)+(2d_1+d_2,d_1) \)
\( =(2cb_1+cb_2+2d_1+d_2,cb_1+d_1) \)
\( =(2(cb_1+d_1)+cb_2+d_2,cb_1+d_1) \)。
因此 \( T \) 是線性的。

正如我們將在第 6 章中看到的,線性代數在幾何學上的應用非常廣泛且多樣。其主要原因在於大多數重要的幾何變換都是線性的。我們現在要考慮的三個特定變換分別是旋轉、鏡射與投影。我們將其線性性質的證明留給讀者。

範例 2
對於任意角度 \( \theta \),定義 \( T_\theta:R^2\rightarrow R^2 \) 如下:若 \( (a_1,a_2)\ne(0,0) \),則 \( T_\theta(a_1,a_2) \) 是將 \( (a_1,a_2) \) 逆時針旋轉 \( \theta \) 所得到的向量,並且定義 \( T_\theta(0,0)=(0,0) \)。那麼 \( T_\theta:R^2\rightarrow R^2 \) 是一個線性變換,稱為旋轉 \( \theta \) 角度 (rotation by \( \theta \))。我們來決定 \( T_\theta \) 的明確公式。固定一個非零向量 \( (a_1,a_2)\in R^2 \)。令 \( \alpha \) 為 \( (a_1,a_2) \) 與正 x 軸之間所成的夾角(見圖 2.1(a)),並令 \( r=\sqrt{a_1^2+a_2^2} \)。那麼 \( a_1=r\cos\alpha \) 且 \( a_2=r\sin\alpha \)。此外,\( T_\theta(a_1,a_2) \) 的長度為 \( r \),且與正 x 軸的夾角為 \( \alpha+\theta \)。由此可知:
\( T_\theta(a_1,a_2)=(r\cos(\alpha+\theta),r\sin(\alpha+\theta)) \)
\( =(r\cos\alpha\cos\theta-r\sin\alpha\sin\theta, r\cos\alpha\sin\theta+r\sin\alpha\cos\theta) \)
\( =(a_1\cos\theta-a_2\sin\theta, a_1\sin\theta+a_2\cos\theta) \)。
最後,觀察到這個相同的公式對於 \( (a_1,a_2)=(0,0) \) 依然成立。如同範例 1 一樣,現在很容易就能證明 \( T_\theta \) 是線性的。

範例 3
定義 \( T:R^2\rightarrow R^2 \) 為 \( T(a_1,a_2)=(a_1,-a_2) \)。\( T \) 稱為對 x 軸的鏡射 (reflection)。(見圖 2.1(b)。)

範例 4
定義 \( T:R^2\rightarrow R^2 \) 為 \( T(a_1,a_2)=(a_1,0) \)。\( T \) 稱為在 x 軸上的投影 (projection)。(見圖 2.1(c)。)

我們現在來看一些線性變換的其他範例。

範例 5
定義 \( T:M_{m\times n}(F)\rightarrow M_{n\times m}(F) \) 為 \( T(A)=A^t \),其中 \( A^t \) 是 \( A \) 的轉置矩陣,其定義見 1.3 節。由 1.3 節的習題 3 可知,\( T \) 是一個線性變換。

範例 6
令 \( V \) 表示定義在實數線上且具有任意階導數的所有實值函數之集合。很容易可以證明 \( V \) 是在 \( R \) 上的一個向量空間。(見 1.3 節的習題 16。)定義 \( T:V\rightarrow V \) 為 \( T(f)=f^\prime \),即 \( f \) 的導數。為了證明 \( T \) 是線性的,令 \( g,h\in V \) 且 \( a\in R \)。那麼 \( T(ag+h)=(ag+h)^\prime=ag^\prime+h^\prime=aT(g)+T(h) \)。所以根據前面的性質 2,\( T \) 是線性的。

範例 7
令 \( V=C(R) \),即定義在 \( R \) 上的連續實值函數之向量空間。令 \( a,b\in R \),\( a < b \)。定義 \( T:V\rightarrow R \) 為對於所有 \( f\in V \),\( T(f)=\int_a^b f(t)dt \)。那麼 \( T \) 是一個線性變換,因為函數之線性組合的定積分,等同於函數之定積分的線性組合。

在本書剩餘部分經常出現,並因此值得擁有專屬符號的兩個非常重要的線性變換範例,是恆等變換 (identity transformation) 與零變換 (zero transformation)。
對於向量空間 \( V \) 與 \( W \)(在 \( F \) 上),我們定義恆等變換 \( I_V:V\rightarrow V \) 為對於所有 \( x\in V \) 皆有 \( I_V(x)=x \);並且定義零變換 \( T_0:V\rightarrow W \) 為對於所有 \( x\in V \) 皆有 \( T_0(x)=0 \)。顯然這兩個變換都是線性的。我們經常直接寫 \( I \) 來代替 \( I_V \)。

我們現在將注意力轉向與線性變換相關的兩個非常重要的集合:值域 (range) 與零空間 (null space)。對這些集合的決定,能讓我們更仔細地檢驗線性變換的內在本質。

定義: 令 \( V \) 與 \( W \) 為向量空間,且令 \( T:V\rightarrow W \) 為線性變換。我們將 \( T \) 的零空間 (null space)(或稱核 kernel)\( N(T) \) 定義為 \( V \) 中所有使得 \( T(x)=0 \) 的向量 \( x \) 之集合;也就是說,\( N(T)=\{x\in V:T(x)=0\} \)。
我們將 \( T \) 的值域 (range)(或稱像 image)\( R(T) \) 定義為由 \( V \) 中向量在 \( T \) 之下的所有像所構成的 \( W \) 之子集;也就是說,\( R(T)=\{T(x):x\in V\} \)。

範例 8
令 \( V \) 與 \( W \) 為向量空間,並令 \( I:V\rightarrow V \) 與 \( T_0:V\rightarrow W \) 分別為恆等變換與零變換。那麼 \( N(I)=\{0\} \)、\( R(I)=V \)、\( N(T_0)=V \),且 \( R(T_0)=\{0\} \)。

範例 9
令 \( T:R^3\rightarrow R^2 \) 為定義成 \( T(a_1,a_2,a_3)=(a_1-a_2,2a_3) \) 的線性變換。讀者可將驗證 \( N(T)=\{(a,a,0):a\in R\} \) 以及 \( R(T)=R^2 \) 作為習題。

在範例 8 與 9 中,我們看到每個線性變換的值域與零空間都是一個子空間。下一個定理表明,在一般情況下這也是成立的。

定理 2.1 令 \( V \) 與 \( W \) 為向量空間,且令 \( T:V\rightarrow W \) 為線性變換。那麼 \( N(T) \) 與 \( R(T) \) 分別是 \( V \) 與 \( W \) 的子空間。

證明: 為使符號清晰,我們使用符號 \( 0_V \) 與 \( 0_W \) 分別表示 \( V \) 與 \( W \) 的零向量。因為 \( T(0_V)=0_W \),所以我們有 \( 0_V\in N(T) \)。令 \( x,y\in N(T) \) 且 \( c\in F \)。那麼 \( T(x+y)=T(x)+T(y)=0_W+0_W=0_W \),且 \( T(cx)=cT(x)=c0_W=0_W \)。因此 \( x+y\in N(T) \) 且 \( cx\in N(T) \),所以 \( N(T) \) 是 \( V \) 的子空間。

因為 \( T(0_V)=0_W \),所以我們有 \( 0_W\in R(T) \)。現在令 \( x,y\in R(T) \) 且 \( c\in F \)。那麼在 \( V \) 中存在 \( v \) 與 \( w \) 使得 \( T(v)=x \) 且 \( T(w)=y \)。所以 \( T(v+w)=T(v)+T(w)=x+y \) 且 \( T(cv)=cT(v)=cx \)。因此 \( x+y\in R(T) \) 且 \( cx\in R(T) \),所以 \( R(T) \) 是 \( W \) 的子空間。 \( \blacksquare \)

下一個定理提供了一個方法來尋找線性變換值域的生成集合 (spanning set)。一旦完成這一步,利用 1.6 節範例 6 的技巧,就能很容易地找到值域的基底。

定理 2.2 令 \( V \) 與 \( W \) 為向量空間,且令 \( T:V\rightarrow W \) 為線性變換。如果 \( \beta=\{v_1,v_2,...,v_n\} \) 是 \( V \) 的基底,那麼

$$ R(T)=\text{span}(T(\beta))=\text{span}(\{T(v_1),T(v_2),...,T(v_n)\}). $$

證明: 顯然對於每個 \( i \),皆有 \( T(v_i)\in R(T) \)。因為 \( R(T) \) 是子空間,由定理 1.5(第 31 頁)可知 \( R(T) \) 包含 \( \text{span}(\{T(v_1),T(v_2),...,T(v_n)\})=\text{span}(T(\beta)) \)。現在假設 \( w\in R(T) \)。那麼對於某個 \( v\in V \),有 \( w=T(v) \)。因為 \( \beta \) 是 \( V \) 的基底,對於某些 \( a_1,a_2,...,a_n\in F \),我們有 \( v=\sum_{i=1}^n a_i v_i \)。因為 \( T \) 是線性的,由此可知

$$ w=T(v)=\sum_{i=1}^n a_i T(v_i)\in \text{span}(T(\beta)). $$

所以 \( R(T) \) 包含於 \( \text{span}(T(\beta)) \) 中。 \( \blacksquare \)

應注意的是,如果 \( \beta \) 是無限集合,定理 2.2 依然成立,也就是說,\( R(T)=\text{span}(\{T(v):v\in \beta\}) \)。(見習題 34。)下一個範例說明了定理 2.2 的實用性。

範例 10
定義線性變換 \( T:P_2(\mathbb{R})\rightarrow M_{2\times2}(\mathbb{R}) \) 為

$$ T(f(x))=\begin{pmatrix}f(1)-f(2)&0\\ 0&f(0)\end{pmatrix} $$

因為 \( \beta=\{1,x,x^2\} \) 是 \( P_2(\mathbb{R}) \) 的基底,我們有

$$ R(T)=\text{span}(T(\beta))=\text{span}(\{T(1),T(x),T(x^2)\}) $$ $$ =\text{span}\left(\left\{\begin{pmatrix}0&0\\ 0&1\end{pmatrix},\begin{pmatrix}-1&0\\ 0&0\end{pmatrix},\begin{pmatrix}-3&0\\ 0&0\end{pmatrix}\right\}\right) $$ $$ =\text{span}\left(\left\{\begin{pmatrix}0&0\\ 0&1\end{pmatrix},\begin{pmatrix}-1&0\\ 0&0\end{pmatrix}\right\}\right) $$

因此我們已經找到了 \( R(T) \) 的一個基底,所以 \( \dim(R(T))=2 \)。

現在假設我們想找出 \( N(T) \) 的基底。請注意 \( f(x)\in N(T) \) 若且唯若 \( T(f(x))=O \)(即 \( 2\times 2 \) 零矩陣)。也就是說,\( f(x)\in N(T) \) 若且唯若

$$ \begin{pmatrix}f(1)-f(2)&0\\ 0&f(0)\end{pmatrix}=\begin{pmatrix}0&0\\ 0&0\end{pmatrix} $$

令 \( f(x)=a+bx+cx^2 \)。那麼 \( 0=f(1)-f(2)=(a+b+c)-(a+2b+4c)=-b-3c \) 且 \( 0=f(0)=a \)。因此 \( f(x)=a+bx+cx^2=-3cx+cx^2=c(-3x+x^2) \)。所以 \( N(T) \) 的基底為 \( \{-3x+x^2\} \)。請注意在這個範例中

$$ \dim(N(T))+\dim(R(T))=1+2=3=\dim(P_2(\mathbb{R})). $$

在定理 2.3 中,我們將會看到一個相似的結果在一般情況下也是成立的。

如同在第 1 章中,我們以「維度」來衡量一個子空間的「大小」。零空間與值域是如此重要,以至於我們為它們各自的維度賦予了專屬的名稱。

定義: 令 \( V \) 與 \( W \) 為向量空間,且令 \( T:V\rightarrow W \) 為線性變換。如果 \( N(T) \) 與 \( R(T) \) 為有限維的,那麼我們定義 \( T \) 的零度 (nullity),記為 \( \text{nullity}(T) \),以及 \( T \) 的秩 (rank),記為 \( \text{rank}(T) \),分別為 \( N(T) \) 與 \( R(T) \) 的維度。

反思線性變換的作用方式,我們可以直觀地看出,零度越大,秩就越小。換句話說,有越多的向量被映射到 \( 0 \),值域就越小。相同的啟發式推論也告訴我們,秩越大,零度就越小。這個秩與零度之間的平衡在下一個定理中被精確地表述出來,這個定理被恰當地稱為維度定理 (dimension theorem)。

定理 2.3(維度定理 Dimension Theorem) 令 \( V \) 與 \( W \) 為向量空間,且令 \( T:V\rightarrow W \) 為線性變換。如果 \( V \) 是有限維的,那麼

$$ \text{nullity}(T)+\text{rank}(T)=\dim(V). $$

證明: 假設 \( \dim(V)=n \),\( \dim(N(T))=k \) 且 \( \{v_1,v_2,...,v_k\} \) 是 \( N(T) \) 的基底。根據定理 1.11 的推論(第 51 頁),我們可以將 \( \{v_1,v_2,...,v_k\} \) 擴充為 \( V \) 的基底 \( \beta=\{v_1,v_2,...,v_n\} \)。我們宣稱 \( S=\{T(v_{k+1}),T(v_{k+2}),...,T(v_n)\} \) 是 \( R(T) \) 的基底。

首先我們證明 \( S \) 生成 \( R(T) \)。利用定理 2.2 以及對於 \( 1\le i\le k \) 皆有 \( T(v_i)=0 \) 的事實,我們得到

$$ R(T)=\text{span}(\{T(v_1),T(v_2),...,T(v_n)\})=\text{span}(\{T(v_{k+1}),T(v_{k+2}),...,T(v_n)\})=\text{span}(S). $$

現在我們證明 \( S \) 是線性獨立的。假設

$$ \sum_{i=k+1}^n b_i T(v_i)=0 \quad \text{對於 } b_{k+1},b_{k+2},...,b_n\in F. $$

利用 \( T \) 是線性的事實,我們有

$$ T\left(\sum_{i=k+1}^n b_i v_i\right)=0. $$

所以 \( \sum_{i=k+1}^n b_i v_i\in N(T) \)。
因此存在 \( c_1,c_2,...,c_k\in F \) 使得

$$ \sum_{i=k+1}^n b_i v_i=\sum_{i=1}^k c_i v_i \quad \text{或} \quad \sum_{i=1}^k (-c_i)v_i+\sum_{i=k+1}^n b_i v_i=0. $$

因為 \( \beta \) 是 \( V \) 的基底,我們有 \( b_i=0 \) 對於所有的 \( i \) 皆成立。因此 \( S \) 是線性獨立的。請注意,這個論證也證明了 \( T(v_{k+1}),T(v_{k+2}),...,T(v_n) \) 皆為相異的;因此 \( \text{rank}(T)=n-k \)。 \( \blacksquare \)

如果我們將維度定理應用於範例 9 中的線性變換 \( T \),我們有 \( \text{nullity}(T)+2=3 \),所以 \( \text{nullity}(T)=1 \)。

讀者應複習附錄 B 中所介紹的「一對一 (one-to-one / injective)」與「映成 (onto / surjective)」的概念。有趣的是,對於一個線性變換來說,這兩個概念都與該變換的秩和零度有著密切的關聯。這在接下來的兩個定理中得到了證明。

定理 2.4 令 \( V \) 與 \( W \) 為向量空間,且令 \( T:V\rightarrow W \) 為線性變換。則 \( T \) 是一對一的,若且唯若 \( N(T)=\{0\} \)。

證明: 假設 \( T \) 是一對一的,且 \( x\in N(T) \)。那麼 \( T(x)=0=T(0) \)。因為 \( T \) 是一對一的,我們有 \( x=0 \)。因此 \( N(T)=\{0\} \)。
現在假設 \( N(T)=\{0\} \),並假設 \( T(x)=T(y) \)。那麼由第 65 頁的性質 3 可知 \( 0=T(x)-T(y)=T(x-y) \)。因此 \( x-y\in N(T)=\{0\} \)。所以 \( x-y=0 \),即 \( x=y \)。這意味著 \( T \) 是一對一的。 \( \blacksquare \)

讀者應觀察到,定理 2.4 允許我們得出結論:在範例 9 中所定義的變換不是一對一的。

令人驚訝的是,在一個重要的特例中,一對一與映成的條件是等價的。

定理 2.5 令 \( V \) 與 \( W \) 為維度相等的有限維向量空間,且令 \( T:V\rightarrow W \) 為線性變換。那麼以下敘述皆等價:
(a) \( T \) 是一對一的。
(b) \( T \) 是映成的。
(c) \( \text{rank}(T)=\dim(V) \)。

證明: 從維度定理中,我們有 \( \text{nullity}(T)+\text{rank}(T)=\dim(V) \)。
現在,使用定理 2.4,我們得出 \( T \) 是一對一的,若且唯若 \( N(T)=\{0\} \),若且唯若 \( \text{nullity}(T)=0 \),若且唯若 \( \text{rank}(T)=\dim(V) \),若且唯若 \( \text{rank}(T)=\dim(W) \),且若且唯若 \( \dim(R(T))=\dim(W) \)。由定理 1.11(第 50 頁)可知,這個等式等價於 \( R(T)=W \),這正是 \( T \) 為映成的定義。 \( \blacksquare \)

我們注意到,如果 \( V \) 不是有限維的,且 \( T:V\rightarrow V \) 為線性,那麼一對一與映成就不一定等價了。(見習題 15、16 與 21。)
定理 2.4 與 2.5 中 \( T \) 的線性是不可或缺的,因為我們很容易就能構造出從 \( \mathbb{R} \) 映射到 \( \mathbb{R} \) 卻只是一對一而非映成的函數,反之亦然。

接下來的兩個範例使用了上述的定理,來判斷給定的線性變換是否為一對一或映成。

範例 11
令 \( T:P_2(\mathbb{R})\rightarrow P_3(\mathbb{R}) \) 為定義成以下的線性變換:

$$ T(f(x))=2f'(x)+\int_0^x 3f(t)dt. $$

現在

$$ R(T)=\text{span}(\{T(1),T(x),T(x^2)\})=\text{span}\left(\left\{3x,2+\frac{3}{2}x^2,4x+x^3\right\}\right). $$

因為 \( \{3x,2+\frac{3}{2}x^2,4x+x^3\} \) 是線性獨立的,所以 \( \text{rank}(T)=3 \)。因為 \( \dim(P_3(\mathbb{R}))=4 \),\( T \) 不是映成的。由維度定理可知,\( \text{nullity}(T)+3=3 \)。所以 \( \text{nullity}(T)=0 \),因此 \( N(T)=\{0\} \)。根據定理 2.4,我們得出 \( T \) 是一對一的結論。

範例 12
令 \( T:\mathbb{F}^2\rightarrow \mathbb{F}^2 \) 為定義成 \( T(a_1,a_2)=(a_1+a_2,a_1) \) 的線性變換。很容易可以看出 \( N(T)=\{0\} \),所以 \( T \) 是一對一的。因此定理 2.5 告訴我們 \( T \) 必定是映成的。

在習題 14 中提到,如果 \( T \) 是線性的且為一對一的,那麼一個子集 \( S \) 是線性獨立的若且唯若 \( T(S) \) 是線性獨立的。範例 13 說明了這個結果的應用。

範例 13
令 \( T:P_2(\mathbb{R})\rightarrow \mathbb{R}^3 \) 為定義成 \( T(a_0+a_1x+a_2x^2)=(a_0,a_1,a_2) \) 的線性變換。顯然 \( T \) 是線性的且為一對一。令 \( S=\{2-x+3x^2,x+x^2,1-2x^2\} \)。那麼 \( S \) 在 \( P_2(\mathbb{R}) \) 中是線性獨立的,因為 \( T(S)=\{(2,-1,3),(0,1,1),(1,0,-2)\} \) 在 \( \mathbb{R}^3 \) 中是線性獨立的。

在範例 13 中,我們將多項式向量空間中的一個性質轉換為三元組向量空間中的一個性質。這種技巧在稍後會被更充分地利用。

線性變換最重要的一個性質是:它完全由它在基底上的作用所決定。這個從下一個定理與推論所推導出的結果,在本書中將被頻繁地使用。

定理 2.6 令 \( V \) 與 \( W \) 為在 \( F \) 上的向量空間,並假設 \( \{v_1,v_2,...,v_n\} \) 是 \( V \) 的基底。對於 \( W \) 中的向量 \( w_1,w_2,...,w_n \),存在唯一一個線性變換 \( T:V\rightarrow W \) 使得對於 \( i=1,2,...,n \) 皆有 \( T(v_i)=w_i \)。

證明: 令 \( x\in V \)。那麼其中 \( x=\sum_{i=1}^n a_i v_i \),\( a_1,a_2,...,a_n \) 是唯一的純量。定義 \( T:V\rightarrow W \) 為 \( T(x)=\sum_{i=1}^n a_i w_i \)。
(a) \( T \) 是線性的:假設 \( u,v\in V \) 且 \( d\in F \)。那麼我們可以寫出 \( u=\sum_{i=1}^n b_i v_i \) 且 \( v=\sum_{i=1}^n c_i v_i \)(其中 \( b_1,b_2,...,b_n,c_1,c_2,...,c_n \) 為某些純量)。
於是 \( du+v=\sum_{i=1}^n (db_i+c_i)v_i \)。
所以 \( T(du+v)=\sum_{i=1}^n (db_i+c_i)w_i=d\sum_{i=1}^n b_i w_i+\sum_{i=1}^n c_i w_i=dT(u)+T(v) \)。
(b) 顯然對於 \( i=1,2,...,n \),\( T(v_i)=w_i \)。
(c) \( T \) 是唯一的:假設 \( U:V\rightarrow W \) 為線性的,且對於 \( i=1,2,...,n \) 皆有 \( U(v_i)=w_i \)。那麼對於 \( x=\sum_{i=1}^n a_i v_i \in V \),我們有

$$ U(x)=\sum_{i=1}^n a_i U(v_i)=\sum_{i=1}^n a_i w_i=T(x). $$

因此 \( U=T \)。 \( \blacksquare \)

推論: 令 \( V \) 與 \( W \) 為向量空間,並假設 \( V \) 具有有限基底 \( \{v_1,v_2,...,v_n\} \)。如果 \( U,T:V\rightarrow W \) 都是線性的,且對於 \( i=1,2,...,n \) 皆有 \( U(v_i)=T(v_i) \),那麼 \( U=T \)。

範例 14
令 \( T:\mathbb{R}^2\rightarrow \mathbb{R}^2 \) 為定義成 \( T(a_1,a_2)=(2a_2-a_1,3a_1) \) 的線性變換,並假設 \( U:\mathbb{R}^2\rightarrow \mathbb{R}^2 \) 為線性的。如果我們知道 \( U(1,2)=(3,3) \) 且 \( U(1,1)=(1,3) \),那麼 \( U=T \)。這是根據前述的推論,以及 \( \{(1,2),(1,1)\} \) 是 \( \mathbb{R}^2 \) 的一個基底的事實推導而來的。

習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。在每一部分中,假設 \( V \) 與 \( W \) 為(在體 \( F \) 上的)有限維向量空間,且 \( T \) 是從 \( V \) 映射到 \( W \) 的函數。
    (a) 如果 \( T \) 是線性的,那麼 \( T \) 保留和與純量乘積。
    (b) 如果 \( T(x+y) = T(x) + T(y) \),那麼 \( T \) 是線性的。
    (c) \( T \) 是一對一的若且唯若使得 \( T(x) = 0 \) 的唯一向量為 \( x=0 \)。
    (d) 如果 \( T \) 是線性的,那麼 \( T(0_V) = 0_W \)。
    (e) 如果 \( T \) 是線性的,那麼 \( \text{nullity}(T) + \text{rank}(T) = \dim(W) \)。
    (f) 如果 \( T \) 是線性的,那麼 \( T \) 會將 \( V \) 中的線性獨立子集映射到 \( W \) 中的線性獨立子集上。
    (g) 如果 \( T, U: V \rightarrow W \) 皆為線性,且在 \( V \) 的某個基底上相等,那麼 \( T=U \)。
    (h) 給定 \( x_1, x_2 \in V \) 與 \( y_1, y_2 \in W \),必存在一個線性變換 \( T: V \rightarrow W \) 使得 \( T(x_1) = y_1 \) 且 \( T(x_2) = y_2 \)。
  2. 針對習題 2 到 6,證明 \( T \) 是一個線性變換,並找出 \( N(T) \) 與 \( R(T) \) 的基底。接著計算 \( T \) 的零度與秩,並驗證維度定理。最後,利用本節中適當的定理來判斷 \( T \) 是否為一對一或映成。

  3. \( T: \mathbb{R}^3 \rightarrow \mathbb{R}^2 \) 定義為 \( T(a_1, a_2, a_3) = (a_1-a_2, 2a_3) \)。
  4. \( T: \mathbb{R}^2 \rightarrow \mathbb{R}^3 \) 定義為 \( T(a_1, a_2) = (a_1+a_2, 0, 2a_1-a_2) \)。
  5. \( T: M_{2 \times 3}(F) \rightarrow M_{2 \times 2}(F) \) 定義為
    $$ T\begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{pmatrix} = \begin{pmatrix} 2a_{11}-a_{12} & a_{13}+2a_{12} \\ 0 & 0 \end{pmatrix}. $$
  6. \( T: P_2(\mathbb{R}) \rightarrow P_3(\mathbb{R}) \) 定義為 \( T(f(x)) = xf(x) + f'(x) \)。
  7. \( T: M_{n \times n}(F) \rightarrow F \) 定義為 \( T(A) = \text{tr}(A) \)。回想(1.3 節範例 4)\( \text{tr}(A) = \sum_{i=1}^n A_{ii} \)。
  8. 證明第 65 頁的性質 1、2、3 與 4。
  9. 證明範例 2 與 3 中的變換皆為線性。
  10. 在本習題中,\( T: \mathbb{R}^2 \rightarrow \mathbb{R}^2 \) 是一個函數。對於以下各部分,請說明為何 \( T \) 不是線性的。
    (a) \( T(a_1, a_2) = (1, a_2) \)
    (b) \( T(a_1, a_2) = (a_1, a_1^2) \)
    (c) \( T(a_1, a_2) = (\sin a_1, 0) \)
    (d) \( T(a_1, a_2) = (|a_1|, a_2) \)
    (e) \( T(a_1, a_2) = (a_1+1, a_2) \)
  11. 假設 \( T: \mathbb{R}^2 \rightarrow \mathbb{R}^2 \) 是線性的,\( T(1, 0) = (1, 4) \) 且 \( T(1, 1) = (2, 5) \)。請問 \( T(2, 3) \) 為何?\( T \) 是一對一的嗎?
  12. 證明存在一個線性變換 \( T: \mathbb{R}^2 \rightarrow \mathbb{R}^3 \) 使得 \( T(1, 1) = (1, 0, 2) \) 且 \( T(2, 3) = (1, -1, 4) \)。請問 \( T(8, 11) \) 為何?
  13. 是否存在一個線性變換 \( T: \mathbb{R}^3 \rightarrow \mathbb{R}^2 \) 使得 \( T(1, 0, 3) = (1, 1) \) 且 \( T(-2, 0, -6) = (2, 1) \)?
  14. 令 \( V \) 與 \( W \) 為向量空間,令 \( T: V \rightarrow W \) 為線性,且令 \( \{w_1, w_2, \dots, w_k\} \) 為來自 \( R(T) \) 中包含 \( k \) 個向量的線性獨立集合。證明如果選擇 \( S=\{v_1, v_2, \dots, v_k\} \) 使得對於 \( i=1, 2, \dots, k \) 皆有 \( T(v_i) = w_i \),那麼 \( S \) 是線性獨立的。
  15. 令 \( V \) 與 \( W \) 為向量空間,且 \( T: V \rightarrow W \) 為線性。
    (a) 證明 \( T \) 是一對一的若且唯若 \( T \) 將 \( V \) 的線性獨立子集映射到 \( W \) 的線性獨立子集上。
    (b) 假設 \( T \) 是一對一的,且 \( S \) 是 \( V \) 的子集。證明 \( S \) 是線性獨立的若且唯若 \( T(S) \) 是線性獨立的。
    (c) 假設 \( \beta=\{v_1, v_2, \dots, v_n\} \) 是 \( V \) 的基底,且 \( T \) 是一對一且映成。證明 \( T(\beta) = \{T(v_1), T(v_2), \dots, T(v_n)\} \) 是 \( W \) 的基底。
  16. 回想第 11 頁 \( P(\mathbb{R}) \) 的定義。定義 \( T: P(\mathbb{R}) \rightarrow P(\mathbb{R}) \) 為 \( T(f(x)) = \int_0^x f(t) dt \)。證明 \( T \) 是線性的且一對一的,但不是映成。
  17. 令 \( T: P(\mathbb{R}) \rightarrow P(\mathbb{R}) \) 定義為 \( T(f(x)) = f'(x) \)。回想 \( T \) 是線性的。證明 \( T \) 是映成的,但不是一對一。
  18. 令 \( V \) 與 \( W \) 為有限維向量空間,且 \( T: V \rightarrow W \) 為線性。
    (a) 證明如果 \( \dim(V) < \dim(W) \),那麼 \( T \) 不可能是映成。
    (b) 證明如果 \( \dim(V) > \dim(W) \),那麼 \( T \) 不可能是一對一。
  19. 舉出一個線性變換 \( T: \mathbb{R}^2 \rightarrow \mathbb{R}^2 \) 的例子,使得 \( N(T) = R(T) \)。
  20. 舉出向量空間 \( V \) 與 \( W \) 以及從 \( V \) 映射到 \( W \) 的兩個相異線性變換 \( T \) 與 \( U \) 的例子,使得 \( N(T) = N(U) \) 且 \( R(T) = R(U) \)。
  21. 令 \( V \) 與 \( W \) 為向量空間,且分別具有子空間 \( V_1 \) 與 \( W_1 \)。如果 \( T: V \rightarrow W \) 為線性,證明 \( T(V_1) \) 是 \( W \) 的子空間,且 \( \{x \in V: T(x) \in W_1\} \) 是 \( V \) 的子空間。
  22. 令 \( V \) 為如 1.2 節範例 5 所述的數列向量空間。定義函數 \( T, U: V \rightarrow V \) 為 \( T(a_1, a_2, \dots) = (a_2, a_3, \dots) \) 與 \( U(a_1, a_2, \dots) = (0, a_1, a_2, \dots) \)。\( T \) 與 \( U \) 分別稱為 \( V \) 上的左移位 (left shift) 與右移位 (right shift) 算子。
    (a) 證明 \( T \) 與 \( U \) 是線性的。
    (b) 證明 \( T \) 是映成的,但不是一對一。
    (c) 證明 \( U \) 是一對一的,但不是映成。
  23. 令 \( T: \mathbb{R}^3 \rightarrow \mathbb{R} \) 為線性。證明存在純量 \( a, b, c \) 使得對於所有 \( (x, y, z) \in \mathbb{R}^3 \),皆有 \( T(x, y, z) = ax+by+cz \)。您能將這個結果推廣到 \( T: F^n \rightarrow F \) 嗎?請陳述並證明一個針對 \( T: F^n \rightarrow F^m \) 的類似結果。
  24. 令 \( T: \mathbb{R}^3 \rightarrow \mathbb{R} \) 為線性。請在幾何上描述 \( T \) 的零空間的可能性。提示:利用習題 22。
  25. 令 \( T: V \rightarrow W \) 為線性,\( b \in W \),且 \( K = \{x \in V: T(x) = b\} \) 非空。證明如果 \( s \in K \),那麼 \( K = \{s\} + N(T) \)。(子集的和的定義請參見第 22 頁。)

下列定義用於習題 25 至 28 以及習題 31。
定義。 令 \( V \) 為一個向量空間,且 \( W_1 \) 與 \( W_2 \) 為 \( V \) 的子空間,使得 \( V = W_1 \oplus W_2 \)。(回想第 22 頁關於直和的定義。)定義 \( T: V \rightarrow V \) 為 \( T(x) = x_1 \),其中 \( x = x_1 + x_2 \) 且 \( x_1 \in W_1 \)、\( x_2 \in W_2 \),這個函數 \( T \) 稱為 \( V \) 在 \( W_1 \) 上沿著 (along) \( W_2 \) 的投影 (projection)。

  1. 令 \( T: \mathbb{R}^2 \rightarrow \mathbb{R}^2 \)。包含下列每一部分的圖形。
    (a) 找出 \( T(a, b) \) 的公式,其中 \( T \) 代表在 y 軸上沿著 x 軸的投影。
    (b) 找出 \( T(a, b) \) 的公式,其中 \( T \) 代表在 y 軸上沿著直線 \( L = \{(s, s): s \in \mathbb{R}\} \) 的投影。
  2. 令 \( T: \mathbb{R}^3 \rightarrow \mathbb{R}^3 \)。
    (a) 如果 \( T(a, b, c) = (a, b, 0) \),證明 \( T \) 是在 xy 平面上沿著 z 軸的投影。
    (b) 找出 \( T(a, b, c) \) 的公式,其中 \( T \) 代表在 z 軸上沿著 xy 平面的投影。
    (c) 如果 \( T(a, b, c) = (a-c, b, 0) \),證明 \( T \) 是在 xy 平面上沿著直線 \( L = \{(a, 0, a): a \in \mathbb{R}\} \) 的投影。
  3. 使用上述定義中的符號,假設 \( T: V \rightarrow V \) 是在 \( W_1 \) 上沿著 \( W_2 \) 的投影。
    (a) 證明 \( T \) 是線性的且 \( W_1 = \{x \in V: T(x) = x\} \)。
    (b) 證明 \( W_1 = R(T) \) 且 \( W_2 = N(T) \)。
    (c) 描述若 \( W_1 = V \) 時的 \( T \)。
    (d) 描述若 \( W_1 \) 是零子空間時的 \( T \)。
  4. 假設 \( W \) 是有限維向量空間 \( V \) 的子空間。
    (a) 證明存在一個子空間 \( W' \) 與一個函數 \( T: V \rightarrow V \) 使得 \( T \) 是一個在 \( W \) 上沿著 \( W' \) 的投影。
    (b) 給出一個向量空間 \( V \) 的子空間 \( W \) 的例子,使得存在兩個在 \( W \) 上沿著兩個(相異)子空間的投影。

下列定義用於習題 29 至 33。
定義。 令 \( V \) 為一個向量空間,且令 \( T: V \rightarrow V \) 為線性。如果對於每個 \( x \in W \) 都有 \( T(x) \in W \),也就是說 \( T(W) \subseteq W \),則稱 \( V \) 的子空間 \( W \) 為 \( T \)-不變的 (\( T \)-invariant)。如果 \( W \) 是 \( T \)-不變的,我們將 \( T \) 限制在 \( W \) 上的函數定義為 \( T_W: W \rightarrow W \),其規則為對於所有 \( x \in W \),\( T_W(x) = T(x) \)。
習題 29 至 33 假設 \( W \) 是向量空間 \( V \) 的子空間,且 \( T: V \rightarrow V \) 為線性。警告:除非明確說明,否則不要假設 \( W \) 是 \( T \)-不變的或 \( T \) 是一個投影。

  1. 證明子空間 \( \{0\}, V, R(T) \) 與 \( N(T) \) 皆為 \( T \)-不變的。
  2. 如果 \( W \) 是 \( T \)-不變的,證明 \( T_W \) 是線性的。
  3. 假設 \( T \) 是一個在 \( W \) 上沿著某個子空間 \( W' \) 的投影。證明 \( W \) 是 \( T \)-不變的,且 \( T_W = I_W \)。
  4. 假設 \( V = R(T) \oplus W \) 且 \( W \) 是 \( T \)-不變的。參見第 22 頁直和的定義。
    (a) 證明 \( W \subseteq N(T) \)。
    (b) 證明如果 \( V \) 是有限維的,那麼 \( W = N(T) \)。
    (c) 舉出一個例子說明,如果 \( V \) 不是有限維的,(b) 的結論未必為真。
  5. 假設 \( W \) 是 \( T \)-不變的。證明 \( N(T_W) = N(T) \cap W \) 且 \( R(T_W) = T(W) \)。
  6. 證明當 \( \beta \) 為無限集合時,定理 2.2 依然成立,也就是說 \( R(T) = \text{span}(\{T(v): v \in \beta\}) \)。
  7. 證明定理 2.6 的以下推廣:令 \( V \) 與 \( W \) 為在同一個體上的向量空間,且令 \( \beta \) 為 \( V \) 的基底。那麼對於任何函數 \( f: \beta \rightarrow W \),皆存在唯一的一個線性變換 \( T: V \rightarrow W \) 使得對於所有 \( x \in \beta \) 都有 \( T(x) = f(x) \)。

習題 36 與 37 需要使用第 22 頁給出的直和定義。

  1. 令 \( V \) 為有限維向量空間,且 \( T: V \rightarrow V \) 為線性。
    (a) 假設 \( V = R(T) + N(T) \)。證明 \( V = R(T) \oplus N(T) \)。
    (b) 假設 \( R(T) \cap N(T) = \{0\} \)。證明 \( V = R(T) \oplus N(T) \)。
    請在各部分中仔細說明哪裡使用了有限維度這個條件。
  2. 令 \( V \) 與 \( T \) 如同習題 21 中的定義。
    (a) 證明 \( V = R(T) + N(T) \),但 \( V \) 不是這兩個空間的直和。因此,在不假設 \( V \) 為有限維的情況下,無法證明上述習題 36(a) 的結果。
    (b) 在 \( V \) 上找出一個線性算子 \( T_1 \),使得 \( R(T_1) \cap N(T_1) = \{0\} \),但 \( V \) 不是 \( R(T_1) \) 與 \( N(T_1) \) 的直和。由此得出結論,在習題 36(b) 中,\( V \) 為有限維的這個條件也是不可或缺的。
  3. 在向量空間 \( V \) 與 \( W \) 之間的函數 \( T: V \rightarrow W \) 如果對所有 \( x, y \in V \) 都滿足 \( T(x+y) = T(x) + T(y) \),則稱為加性的 (additive)。證明如果 \( V \) 與 \( W \) 為在有理數體上的向量空間,那麼從 \( V \) 到 \( W \) 的任何加性函數都是線性變換。
  4. 令 \( T: \mathbb{C} \rightarrow \mathbb{C} \) 為定義成 \( T(z) = \bar{z} \) 的函數。證明 \( T \) 是加性的(如習題 38 的定義),但不是線性的。
  5. 證明存在一個從 \( \mathbb{R} \) 到 \( \mathbb{R} \) 的加性函數 \( T \)(如習題 38 的定義),但它不是線性的。提示:令 \( V \) 為將實數集合視為在有理數體上的向量空間。根據定理 1.13 的推論(第 61 頁),\( V \) 擁有一個基底 \( \beta \)。令 \( x \) 與 \( y \) 為 \( \beta \) 中兩個相異的向量,並定義 \( f: \beta \rightarrow V \) 為 \( f(x)=y \)、\( f(y)=x \),並在其他情況下定義 \( f(z)=z \)。根據習題 35,存在一個線性變換 \( T: V \rightarrow V \) 使得對於所有的 \( u \in \beta \) 都有 \( T(u) = f(u) \)。那麼 \( T \) 是加性的,但對於 \( c = y/x \),\( T(cx) \neq cT(x) \)。
  6. 證明當 \( V \) 為無限維時,定理 2.6 及其推論依然成立。

下列習題需要熟悉 1.3 節習題 31 中給出的商空間定義。

  1. 令 \( V \) 為一個向量空間,且 \( W \) 為 \( V \) 的子空間。定義映射 \( \eta: V \rightarrow V/W \) 為對於 \( v \in V \),\( \eta(v) = v+W \)。
    (a) 證明 \( \eta \) 是一個從 \( V \) 映成 (onto) \( V/W \) 的線性變換,且 \( N(\eta) = W \)。
    (b) 假設 \( V \) 是有限維的。使用 (a) 與維度定理來推導出一個關聯 \( \dim(V) \)、\( \dim(W) \) 與 \( \dim(V/W) \) 的公式。
    (c) 閱讀維度定理的證明。比較解決 (b) 的方法,與 1.6 節習題 35 中概述的推導相同結果的方法。

2.2 線性變換的矩陣表示 (The Matrix Representation of a Linear Transformation)

到目前為止,我們是透過檢視線性變換的值域 (ranges) 與零空間 (null spaces) 來研究它們。在本節中,我們將展開一項分析有限維向量空間上之線性變換的最實用方法之一:利用矩陣來表示線性變換。事實上,我們將在矩陣與線性變換之間建立一種一對一的對應關係,這使我們能夠利用其中一方的性質來研究另一方的性質。

我們首先需要向量空間的「有序基底 (ordered basis)」概念。

定義: 令 \( V \) 為一個有限維向量空間。\( V \) 的一個有序基底 (ordered basis) 是一個被賦予特定順序的 \( V \) 之基底;也就是說,\( V \) 的有序基底是一個在 \( V \) 中能生成 \( V \) 的線性獨立向量的有限序列。

範例 1
在 \( F^3 \) 中,\( \beta = \{e_1, e_2, e_3\} \) 可以被視為一個有序基底。另外 \( \gamma = \{e_2, e_1, e_3\} \) 也是一個有序基底,但作為有序基底 \( \beta \neq \gamma \)。
對於向量空間 \( F^n \),我們稱 \( \{e_1, e_2, \dots, e_n\} \) 為 \( F^n \) 的標準有序基底 (standard ordered basis)。同樣地,對於向量空間 \( P_n(F) \),我們稱 \( \{1, x, \dots, x^n\} \) 為 \( P_n(F) \) 的標準有序基底。

既然我們已經有了有序基底的概念,我們就可以將 \( n \) 維向量空間中的抽象向量與 \( n \)-元組 (n-tuples) 建立對應關係。這種對應關係是透過使用下列定義的「座標向量 (coordinate vectors)」來提供的。

定義: 令 \( \beta = \{u_1, u_2, \dots, u_n\} \) 為有限維向量空間 \( V \) 的一個有序基底。對於 \( x \in V \),令 \( a_1, a_2, \dots, a_n \) 為滿足

$$ x = \sum_{i=1}^n a_i u_i $$

的唯一純量。我們定義 \( x \) 相對於 \( \beta \) 的座標向量 (coordinate vector)(記為 \( [x]_\beta \))為:

$$ [x]_\beta = \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix} $$

請注意,在前述定義中 \( [u_i]_\beta = e_i \)。我們將「證明對應關係 \( x \to [x]_\beta \) 提供了一個從 \( V \) 映至 \( F^n \) 的線性變換」作為一項習題。我們將在 2.4 節中更詳細地研究這個變換。

範例 2
令 \( V = P_2(\mathbb{R}) \),並令 \( \beta = \{1, x, x^2\} \) 為 \( V \) 的標準有序基底。如果 \( f(x) = 4 + 6x - 7x^2 \),那麼

$$ [f]_\beta = \begin{pmatrix} 4 \\ 6 \\ -7 \end{pmatrix} $$

現在讓我們繼續探討前面所承諾的線性變換之矩陣表示。假設 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta = \{v_1, v_2, \dots, v_n\} \) 與 \( \gamma = \{w_1, w_2, \dots, w_m\} \)。令 \( T: V \to W \) 為線性變換。那麼對於每一個 \( j = 1, 2, \dots, n \),皆存在唯一的純量 \( a_{ij} \in F \)(其中 \( i = 1, 2, \dots, m \)),使得

$$ T(v_j) = \sum_{i=1}^m a_{ij} w_i \quad \text{對於 } j = 1, 2, \dots, n \text{ 皆成立。} $$

定義: 使用上述的符號,我們稱由 \( A_{ij} = a_{ij} \) 所定義的 \( m \times n \) 矩陣 \( A \) 為 \( T \) 在有序基底 \( \beta \) 與 \( \gamma \) 中的矩陣表示 (matrix representation),並記為 \( A = [T]_\beta^\gamma \)。如果 \( V = W \) 且 \( \beta = \gamma \),那麼我們將其記為 \( A = [T]_\beta \)。

請注意,\( A \) 的第 \( j \) 行(即第 \( j \) 個 column)正好就是 \( [T(v_j)]_\gamma \)。同時請觀察到,如果 \( U: V \to W \) 是一個滿足 \( [U]_\beta^\gamma = [T]_\beta^\gamma \) 的線性變換,那麼由定理 2.6 的推論(第 73 頁)可知 \( U = T \)。我們在接下來的幾個範例中說明 \( [T]_\beta^\gamma \) 的計算。

範例 3
令 \( T: \mathbb{R}^2 \to \mathbb{R}^3 \) 為定義成 \( T(a_1, a_2) = (a_1 + 3a_2, 0, 2a_1 - 4a_2) \) 的線性變換。令 \( \beta \) 與 \( \gamma \) 分別為 \( \mathbb{R}^2 \) 與 \( \mathbb{R}^3 \) 的標準有序基底。
此時

$$ T(1, 0) = (1, 0, 2) = 1e_1 + 0e_2 + 2e_3 $$

$$ T(0, 1) = (3, 0, -4) = 3e_1 + 0e_2 - 4e_3 $$

因此

$$ [T]_\beta^\gamma = \begin{pmatrix} 1 & 3 \\ 0 & 0 \\ 2 & -4 \end{pmatrix} $$

如果我們令 \( \gamma' = \{e_3, e_2, e_1\} \),那麼

$$ [T]_\beta^{\gamma'} = \begin{pmatrix} 2 & -4 \\ 0 & 0 \\ 1 & 3 \end{pmatrix} $$

範例 4
令 \( T: P_3(\mathbb{R}) \to P_2(\mathbb{R}) \) 為定義成 \( T(f(x)) = f'(x) \) 的線性變換。令 \( \beta \) 與 \( \gamma \) 分別為 \( P_3(\mathbb{R}) \) 與 \( P_2(\mathbb{R}) \) 的標準有序基底。那麼

$$ T(1) = 0 \cdot 1 + 0 \cdot x + 0 \cdot x^2 $$ $$ T(x) = 1 \cdot 1 + 0 \cdot x + 0 \cdot x^2 $$ $$ T(x^2) = 0 \cdot 1 + 2 \cdot x + 0 \cdot x^2 $$ $$ T(x^3) = 0 \cdot 1 + 0 \cdot x + 3 \cdot x^2 $$

所以

$$ [T]_\beta^\gamma = \begin{pmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \end{pmatrix} $$

請注意,當把 \( T(x^j) \) 寫成 \( \gamma \) 中向量的線性組合時,其係數即給出了 \( [T]_\beta^\gamma \) 第 \( j+1 \) 行的項。

令 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta = \{v_1, v_2, \dots, v_n\} \) 與 \( \gamma = \{w_1, w_2, \dots, w_m\} \)。那麼 \( T_0(v_j) = 0 = 0w_1 + 0w_2 + \dots + 0w_m \)。因此 \( [T_0]_\beta^\gamma = O \),即為 \( m \times n \) 的零矩陣。同樣地,

$$ I_V(v_j) = v_j = 0v_1 + 0v_2 + \dots + 0v_{j-1} + 1v_j + 0v_{j+1} + \dots + 0v_n $$

因此 \( [I_V]_\beta \) 的第 \( j \) 行就是 \( e_j \),亦即

$$ [I_V]_\beta = \begin{pmatrix} 1 & 0 & \dots & 0 \\ 0 & 1 & \dots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \dots & 1 \end{pmatrix} $$

前述的矩陣稱為 \( n \times n \) 單位矩陣 (identity matrix),將在下面與一個非常實用的符號——克羅內克 \( \delta \) (Kronecker delta) 一起定義。

定義: 我們定義克羅內克 \( \delta \) (Kronecker delta) \( \delta_{ij} \) 如下:如果 \( i = j \) 則 \( \delta_{ij} = 1 \),如果 \( i \neq j \) 則 \( \delta_{ij} = 0 \)。
\( n \times n \) 單位矩陣 (identity matrix) \( I_n \) 定義為 \( (I_n)_{ij} = \delta_{ij} \)。
當上下文清楚時,我們有時會省略 \( I_n \) 的下標 \( n \)。例如,\( I_1 = (1) \),\( I_2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} \),且 \( I_3 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix} \)。

因此,零變換的矩陣表示是一個零矩陣,而恆等變換的矩陣表示是一個單位矩陣。

既然我們已經定義了一個將矩陣與線性變換聯繫起來的程序,我們將在定理 2.8 中證明這種聯繫「保留 (preserves)」了加法與純量乘法。為了使其更明確,我們需要對線性變換的加法與純量乘法做一些初步討論。

定義: 令 \( T, U: V \to W \) 為任意函數,其中 \( V \) 與 \( W \) 為在 \( F \) 上的向量空間,並令 \( a \in F \)。我們定義 \( T + U: V \to W \) 為對於所有的 \( x \in V \)皆有 \( (T + U)(x) = T(x) + U(x) \),並定義 \( aT: V \to W \) 為對於所有的 \( x \in V \) 皆有 \( (aT)(x) = aT(x) \)。

當然,這些僅僅是函數加法與純量乘法的常見定義。然而幸運的是,我們能得出「線性變換的總和與純量倍數也都是線性的」這樣的結果。

定理 2.7 令 \( V \) 與 \( W \) 為在體 \( F \) 上的向量空間,並令 \( T, U: V \to W \) 為線性。
(a) 對於所有的 \( a \in F \),\( aT + U \) 是線性的。
(b) 使用前述定義的加法與純量乘法運算,從 \( V \) 映至 \( W \) 的所有線性變換之集合是在 \( F \) 上的一個向量空間。

證明:
(a) 令 \( x, y \in V \) 且 \( c \in F \)。那麼

$$ (aT + U)(cx + y) = aT(cx + y) + U(cx + y) $$ $$ = a[cT(x) + T(y)] + cU(x) + U(y) $$ $$ = acT(x) + cU(x) + aT(y) + U(y) $$ $$ = c(aT + U)(x) + (aT + U)(y) $$

所以 \( aT + U \) 是線性的。
(b) 注意到 \( T_0 \)(零變換)扮演著零向量的角色,很容易可以驗證向量空間的各項公理皆被滿足,因此從 \( V \) 映至 \( W \) 的所有線性變換之集合是在 \( F \) 上的一個向量空間。 \( \blacksquare \)

定義: 令 \( V \) 與 \( W \) 為在 \( F \) 上的向量空間。我們將從 \( V \) 映至 \( W \) 的所有線性變換之向量空間記為 \( \mathcal{L}(V, W) \)。在 \( V = W \) 的情況下,我們會寫作 \( \mathcal{L}(V) \) 而非 \( \mathcal{L}(V, V) \)。

在 2.4 節中,我們將看到 \( \mathcal{L}(V, W) \) 與向量空間 \( M_{m \times n}(F) \) 的完整等同性(其中 \( n \) 與 \( m \) 分別為 \( V \) 與 \( W \) 的維度)。這種等同性可以透過運用下一個定理輕鬆建立。

定理 2.8 令 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta \) 與 \( \gamma \),並令 \( T, U: V \to W \) 為線性變換。那麼
(a) \( [T + U]_\beta^\gamma = [T]_\beta^\gamma + [U]_\beta^\gamma \)
(b) \( [aT]_\beta^\gamma = a[T]_\beta^\gamma \) 對於所有純量 \( a \)。

證明: 令 \( \beta = \{v_1, v_2, \dots, v_n\} \) 與 \( \gamma = \{w_1, w_2, \dots, w_m\} \)。存在唯一的純量 \( a_{ij} \) 與 \( b_{ij} \)(\( 1 \le i \le m, 1 \le j \le n \))使得

$$ T(v_j) = \sum_{i=1}^m a_{ij} w_i \quad \text{且} \quad U(v_j) = \sum_{i=1}^m b_{ij} w_i \quad \text{對於 } 1 \le j \le n $$

因此

$$ (T + U)(v_j) = \sum_{i=1}^m (a_{ij} + b_{ij}) w_i $$

所以

$$ ([T + U]_\beta^\gamma)_{ij} = a_{ij} + b_{ij} = ([T]_\beta^\gamma + [U]_\beta^\gamma)_{ij} $$

由此證得 (a),而 (b) 的證明亦相似。 \( \blacksquare \)

範例 5
令 \( T: \mathbb{R}^2 \to \mathbb{R}^3 \) 與 \( U: \mathbb{R}^2 \to \mathbb{R}^3 \) 分別為由以下定義的線性變換:

$$ T(a_1, a_2) = (a_1 + 3a_2, 0, 2a_1 - 4a_2) $$

以及

$$ U(a_1, a_2) = (a_1 - a_2, 2a_1, 3a_1 + 2a_2) $$

令 \( \beta \) 與 \( \gamma \) 分別為 \( \mathbb{R}^2 \) 與 \( \mathbb{R}^3 \) 的標準有序基底。那麼(如範例 3 所計算),

$$ [T]_\beta^\gamma = \begin{pmatrix} 1 & 3 \\ 0 & 0 \\ 2 & -4 \end{pmatrix} $$

$$ [U]_\beta^\gamma = \begin{pmatrix} 1 & -1 \\ 2 & 0 \\ 3 & 2 \end{pmatrix} $$

如果我們使用前述的定義來計算 \( T + U \),我們得到

$$ (T + U)(a_1, a_2) = (2a_1 + 2a_2, 2a_1, 5a_1 - 2a_2) $$

所以

$$ [T + U]_\beta^\gamma = \begin{pmatrix} 2 & 2 \\ 2 & 0 \\ 5 & -2 \end{pmatrix} $$

這恰好就是 \( [T]_\beta^\gamma + [U]_\beta^\gamma \),說明了定理 2.8 的結果。

習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。假設 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta \) 與 \( \gamma \),且 \( T, U: V \to W \) 為線性變換。
    (a) 對於任何純量 \( a \),\( aT + U \) 是從 \( V \) 映至 \( W \) 的線性變換。
    (b) \( [T]_\beta^\gamma = [U]_\beta^\gamma \) 意味著 \( T = U \)。
    (c) 如果 \( m = \dim(V) \) 且 \( n = \dim(W) \),那麼 \( [T]_\beta^\gamma \) 是一個 \( m \times n \) 矩陣。
    (d) \( [T + U]_\beta^\gamma = [T]_\beta^\gamma + [U]_\beta^\gamma \)
    (e) \( \mathcal{L}(V, W) \) 是一個向量空間。
    (f) \( \mathcal{L}(V, W) = \mathcal{L}(W, V) \)。
  2. 令 \( \beta \) 與 \( \gamma \) 分別為 \( \mathbb{R}^n \) 與 \( \mathbb{R}^m \) 的標準有序基底。對於每一個線性變換 \( T: \mathbb{R}^n \to \mathbb{R}^m \),計算 \( [T]_\beta^\gamma \)。
    (a) \( T: \mathbb{R}^2 \to \mathbb{R}^3 \) 定義為 \( T(a_1, a_2) = (2a_1 - a_2, 3a_1 + 4a_2, a_1) \)。
    (b) \( T: \mathbb{R}^3 \to \mathbb{R}^2 \) 定義為 \( T(a_1, a_2, a_3) = (2a_1 + 3a_2 - a_3, a_1 + a_3) \)。
    (c) \( T: \mathbb{R}^3 \to \mathbb{R} \) 定義為 \( T(a_1, a_2, a_3) = 2a_1 + a_2 - 3a_3 \)。
    (d) \( T: \mathbb{R}^3 \to \mathbb{R}^3 \) 定義為 \( T(a_1, a_2, a_3) = (2a_2 + a_3, -a_1 + 4a_2 + 5a_3, a_1 + a_3) \)。
    (e) \( T: \mathbb{R}^n \to \mathbb{R}^n \) 定義為 \( T(a_1, a_2, \dots, a_n) = (a_1, a_1, \dots, a_1) \)。
    (f) \( T: \mathbb{R}^n \to \mathbb{R}^n \) 定義為 \( T(a_1, a_2, \dots, a_n) = (a_n, a_{n-1}, \dots, a_1) \)。
    (g) \( T: \mathbb{R}^n \to \mathbb{R} \) 定義為 \( T(a_1, a_2, \dots, a_n) = a_1 + a_n \)。
  3. 令 \( T: \mathbb{R}^2 \to \mathbb{R}^3 \) 定義為 \( T(a_1, a_2) = (a_1 - a_2, a_1, 2a_1 + a_2) \)。令 \( \beta \) 為 \( \mathbb{R}^2 \) 的標準有序基底,且 \( \gamma = \{(1, 1, 0), (0, 1, 1), (2, 2, 3)\} \)。計算 \( [T]_\beta^\gamma \)。如果 \( \alpha = \{(1, 2), (2, 3)\} \),計算 \( [T]_\alpha^\gamma \)。
  4. 定義 \( T: M_{2 \times 2}(\mathbb{R}) \to P_2(\mathbb{R}) \) 為 \( T\begin{pmatrix} a & b \\ c & d \end{pmatrix} = (a + b) + (2d)x + bx^2 \)。令
    $$ \beta = \left\{ \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix} \right\} $$
    且 \( \gamma = \{1, x, x^2\} \)。計算 \( [T]_\beta^\gamma \)。
  5. $$ \alpha = \left\{ \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix} \right\}, $$
    \( \beta = \{1, x, x^2\} \),且 \( \gamma = \{1\} \)。
    (a) 定義 \( T: M_{2 \times 2}(F) \to M_{2 \times 2}(F) \) 為 \( T(A) = A^t \)。計算 \( [T]_\alpha \)。
    (b) 定義 \( T: P_2(\mathbb{R}) \to M_{2 \times 2}(\mathbb{R}) \) 為
    $$ T(f(x)) = \begin{pmatrix} f'(0) & 2f(1) \\ 0 & f''(3) \end{pmatrix} $$
    其中 ' 表示微分。計算 \( [T]_\beta^\alpha \)。
    (c) 定義 \( T: M_{2 \times 2}(F) \to F \) 為 \( T(A) = \text{tr}(A) \)。計算 \( [T]_\alpha^\gamma \)。
    (d) 定義 \( T: P_2(\mathbb{R}) \to \mathbb{R} \) 為 \( T(f(x)) = f(2) \)。計算 \( [T]_\beta^\gamma \)。
    (e) 如果 \( A = \begin{pmatrix} 1 & -2 \\ 0 & 4 \end{pmatrix} \),計算 \( [A]_\alpha \)。
    (f) 如果 \( f(x) = 3 - 6x + x^2 \),計算 \( [f(x)]_\beta \)。
    (g) 對於 \( a \in F \),計算 \( [a]_\gamma \)。
  6. 完成定理 2.7 (b) 部分的證明。
  7. 證明定理 2.8 的 (b) 部分。
  8. 令 \( V \) 為一個具有有序基底 \( \beta \) 的 \( n \) 維向量空間。定義 \( T: V \to F^n \) 為 \( T(x) = [x]_\beta \)。證明 \( T \) 是線性的。
  9. 令 \( V \) 為在體 \( \mathbb{R} \) 上的複數向量空間。定義 \( T: V \to V \) 為 \( T(z) = \bar{z} \),其中 \( \bar{z} \) 是 \( z \) 的共軛複數。證明 \( T \) 是線性的,並計算 \( [T]_\beta \),其中 \( \beta = \{1, i\} \)。(回想 2.1 節習題 39,如果將 \( V \) 視為在體 \( \mathbb{C} \) 上的向量空間,那麼 \( T \) 就不是線性的。)
  10. 令 \( V \) 為一個具有有序基底 \( \beta = \{v_1, v_2, \dots, v_n\} \) 的向量空間。定義 \( v_0 = 0 \)。根據定理 2.6(第 73 頁),存在一個線性變換 \( T: V \to V \) 使得對於 \( j = 1, 2, \dots, n \) 皆有 \( T(v_j) = v_j + v_{j-1} \)。計算 \( [T]_\beta \)。
  11. 令 \( V \) 為一個 \( n \) 維向量空間,且令 \( T: V \to V \) 為線性變換。假設 \( W \) 是 \( V \) 的一個維度為 \( k \) 的 \( T \)-不變子空間(參見 2.1 節的習題)。證明存在一個 \( V \) 的基底 \( \beta \) 使得 \( [T]_\beta \) 具有以下形式:
    $$ \begin{pmatrix} A & B \\ O & C \end{pmatrix} $$
    其中 \( A \) 是一個 \( k \times k \) 矩陣,而 \( O \) 是一個 \( (n - k) \times k \) 的零矩陣。
  12. 令 \( \beta = \{v_1, v_2, \dots, v_n\} \) 為向量空間 \( V \) 的基底,且 \( T: V \to V \) 為線性變換。證明 \( [T]_\beta \) 是上三角矩陣若且唯若對於 \( j = 1, 2, \dots, n \) 皆有 \( T(v_j) \in \text{span}(\{v_1, v_2, \dots, v_j\}) \)。
  13. 令 \( V \) 為有限維向量空間,且 \( T \) 是在 \( W \) 上沿著 \( W' \) 的投影,其中 \( W \) 與 \( W' \) 為 \( V \) 的子空間。(參見第 76 頁 2.1 節習題中的定義。)請找出一個 \( V \) 的有序基底 \( \beta \) 使得 \( [T]_\beta \) 為一個對角矩陣。
  14. 令 \( V \) 與 \( W \) 為向量空間,且令 \( T \) 與 \( U \) 為從 \( V \) 映至 \( W \) 的非零線性變換。如果 \( R(T) \cap R(U) = \{0\} \),證明 \( \{T, U\} \) 是 \( \mathcal{L}(V, W) \) 中的一個線性獨立子集。
  15. 令 \( V = P(\mathbb{R}) \),並對於 \( j \ge 1 \) 定義 \( T_j(f(x)) = f^{(j)}(x) \),其中 \( f^{(j)}(x) \) 是 \( f(x) \) 的第 \( j \) 階導數。證明對於任何正整數 \( n \),集合 \( \{T_1, T_2, \dots, T_n\} \) 是 \( \mathcal{L}(V) \) 的一個線性獨立子集。
  16. 令 \( V \) 與 \( W \) 為向量空間,且令 \( S \) 為 \( V \) 的一個子集。定義 \( S^0 = \{T \in \mathcal{L}(V, W) : \text{對於所有 } x \in S \text{ 皆有 } T(x) = 0\} \)。證明下列敘述:
    (a) \( S^0 \) 是 \( \mathcal{L}(V, W) \) 的子空間。
    (b) 如果 \( S_1 \) 與 \( S_2 \) 是 \( V \) 的子集且 \( S_1 \subseteq S_2 \),那麼 \( S_2^0 \subseteq S_1^0 \)。
    (c) 如果 \( V_1 \) 與 \( V_2 \) 是 \( V \) 的子空間,那麼 \( (V_1 \cup V_2)^0 = (V_1 + V_2)^0 = V_1^0 \cap V_2^0 \)。
  17. 令 \( V \) 與 \( W \) 為滿足 \( \dim(V) = \dim(W) \) 的向量空間,且令 \( T: V \to W \) 為線性。證明分別存在 \( V \) 與 \( W \) 的有序基底 \( \beta \) 與 \( \gamma \),使得 \( [T]_\beta^\gamma \) 是一個對角矩陣。

2.3 線性變換的合成與矩陣乘法 (Composition of Linear Transformations and Matrix Multiplication)

在 2.2 節中我們看到,將線性變換以矩陣來表示,為我們提供了一種研究這類變換的實用工具。在本節中,我們將引進線性變換合成的概念。我們將會看到,兩個線性變換的合成也可以透過矩陣乘法這個相對應的運算,用矩陣來表示。

定理 2.9
令 \( V, W \) 與 \( Z \) 為在同一個體 \( F \) 上的向量空間,並令 \( T: V \to W \) 與 \( U: W \to Z \) 為線性變換。那麼這兩個變換的合成 \( UT: V \to Z \) 也是線性的。

證明:
令 \( x, y \in V \) 且 \( a \in F \)。那麼

$$ (UT)(ax + y) = U(T(ax + y)) = U(aT(x) + T(y)) = aU(T(x)) + U(T(y)) = a(UT)(x) + (UT)(y) $$

因此 \( UT \) 是線性的。 \( \blacksquare \)

下面的定理列出了線性變換合成的幾個基本性質,讀者可以發現它們與實數乘法的性質非常相似。

定理 2.10
令 \( V \) 為一個向量空間。並令 \( T, U_1, U_2 \in \mathcal{L}(V) \)。那麼
(a) \( T(U_1 + U_2) = TU_1 + TU_2 \) 且 \( (U_1 + U_2)T = U_1T + U_2T \)
(b) \( T(U_1 U_2) = (TU_1)U_2 \)
(c) \( TI = IT = T \)
(d) \( a(U_1 U_2) = (aU_1)U_2 = U_1(aU_2) \) 對於所有的純量 \( a \in F \) 皆成立。

證明:
我們僅證明 (a) 的第一部分,其餘部分留作習題(見習題 4)。
令 \( x \in V \)。那麼

$$ (T(U_1 + U_2))(x) = T((U_1 + U_2)(x)) = T(U_1(x) + U_2(x)) = T(U_1(x)) + T(U_2(x)) = (TU_1)(x) + (TU_2)(x) = (TU_1 + TU_2)(x) $$

因此 \( T(U_1 + U_2) = TU_1 + TU_2 \)。 \( \blacksquare \)

現在,令 \( V, W \) 與 \( Z \) 為有限維向量空間,其有序基底分別為 \( \alpha = \{v_1, v_2, \dots, v_n\} \), \( \beta = \{w_1, w_2, \dots, w_m\} \) 與 \( \gamma = \{z_1, z_2, \dots, z_p\} \)。並令 \( T: V \to W \) 與 \( U: W \to Z \) 為線性變換。由定理 2.9 可知,\( UT: V \to Z \) 是一個線性變換。我們想探討 \( UT \) 的矩陣表示 \( [UT]_\alpha^\gamma \) 如何與 \( T \) 和 \( U \) 的矩陣表示 \( [T]_\alpha^\beta \) 和 \( [U]_\beta^\gamma \) 產生關聯。

假設 \( [U]_\beta^\gamma = A \) 且 \( [T]_\alpha^\beta = B \)。對於 \( 1 \le j \le n \),我們有

$$ (UT)(v_j) = U(T(v_j)) = U\left(\sum_{k=1}^m B_{kj} w_k\right) = \sum_{k=1}^m B_{kj} U(w_k) $$ $$ = \sum_{k=1}^m B_{kj} \left(\sum_{i=1}^p A_{ik} z_i\right) = \sum_{i=1}^p \left(\sum_{k=1}^m A_{ik} B_{kj}\right) z_i $$

因此,\( UT \) 在其對應基底下的矩陣表示中,第 \( i \) 列第 \( j \) 行的項必定是 \( \sum_{k=1}^m A_{ik} B_{kj} \)。這自然地引導出了矩陣乘法的定義。

定義:
令 \( A \) 為一個 \( p \times m \) 矩陣,且 \( B \) 為一個 \( m \times n \) 矩陣。我們定義 \( A \) 與 \( B \) 的乘積 (product)(記為 \( AB \))為一個 \( p \times n \) 矩陣,其第 \( i \) 列第 \( j \) 行的項定義為:

$$ (AB)_{ij} = \sum_{k=1}^m A_{ik} B_{kj} \quad \text{對於 } 1 \le i \le p, 1 \le j \le n $$

請注意,為了讓乘積 \( AB \) 有意義,前一個矩陣(即 \( A \))的行數 (columns) 必須等於後一個矩陣(即 \( B \))的列數 (rows)。如果這個條件不滿足,則 \( AB \) 未定義。也要注意,\( (AB)_{ij} \) 恰好是矩陣 \( A \) 的第 \( i \) 列向量與矩陣 \( B \) 的第 \( j \) 行向量的內積(或稱點積)。

前述為了引導出矩陣乘法定義所作的推導,實際上就構成了下一個定理的證明。

定理 2.11
令 \( V, W \) 與 \( Z \) 為有限維向量空間,其有序基底分別為 \( \alpha, \beta \) 與 \( \gamma \)。令 \( T: V \to W \) 與 \( U: W \to Z \) 為線性變換。那麼

$$ [UT]_\alpha^\gamma = [U]_\beta^\gamma [T]_\alpha^\beta $$

範例 1

$$ A = \begin{pmatrix} 1 & 2 & 1 \\ 0 & 4 & -1 \end{pmatrix} \quad \text{且} \quad B = \begin{pmatrix} 4 & 2 \\ 2 & 3 \\ 1 & -2 \end{pmatrix} $$

那麼 \( A \) 是一個 \( 2 \times 3 \) 矩陣,而 \( B \) 是一個 \( 3 \times 2 \) 矩陣。因此乘積 \( AB \) 有定義,且必定是一個 \( 2 \times 2 \) 矩陣。我們有

$$ (AB)_{11} = 1(4) + 2(2) + 1(1) = 9 $$ $$ (AB)_{12} = 1(2) + 2(3) + 1(-2) = 6 $$ $$ (AB)_{21} = 0(4) + 4(2) + (-1)(1) = 7 $$ $$ (AB)_{22} = 0(2) + 4(3) + (-1)(-2) = 14 $$

所以

$$ AB = \begin{pmatrix} 9 & 6 \\ 7 & 14 \end{pmatrix} $$

請注意,\( BA \) 也是有定義的,但它會是一個 \( 3 \times 3 \) 矩陣。因此,一般來說 \( AB \neq BA \)。即使在 \( AB \) 與 \( BA \) 的維度相同的情況下,它們也未必相等。

既然我們已經定義了矩陣乘法,我們將在下一個定理中證明,矩陣的乘法運算享有許多與線性變換合成相同的自然性質。

定理 2.12
令 \( A \) 是一個 \( m \times n \) 矩陣,\( B \) 與 \( C \) 為 \( n \times p \) 矩陣,且 \( D \) 與 \( E \) 為 \( q \times m \) 矩陣。那麼
(a) \( A(B + C) = AB + AC \) 且 \( (D + E)A = DA + EA \)
(b) \( a(AB) = (aA)B = A(aB) \) 對於所有的純量 \( a \in F \)
(c) \( I_m A = A = A I_n \)
(d) 如果 \( V, W \) 與 \( Z \) 是有限維向量空間,其對應的有序基底分別為 \( \alpha, \beta \) 與 \( \gamma \),且 \( T: V \to W \) 與 \( U: W \to Z \) 皆為線性變換。那麼 \( U(T) = UT \)。而在矩陣的觀點下,\( A(BC) = (AB)C \) 對於任何形狀允許相乘的矩陣皆成立(即矩陣乘法具結合律)。

證明:
我們僅證明 (a) 的第一部分與 (d) 的結合律。其餘部分的證明留作習題。
(a) 對於 \( 1 \le i \le m \) 且 \( 1 \le j \le p \),

$$ (A(B + C))_{ij} = \sum_{k=1}^n A_{ik}(B + C)_{kj} = \sum_{k=1}^n A_{ik}(B_{kj} + C_{kj}) $$ $$ = \sum_{k=1}^n (A_{ik} B_{kj} + A_{ik} C_{kj}) = \sum_{k=1}^n A_{ik} B_{kj} + \sum_{k=1}^n A_{ik} C_{kj} = (AB)_{ij} + (AC)_{ij} $$

所以 \( A(B + C) = AB + AC \)。

(d) 的結合律可以透過線性變換的合成結合律(定理 2.10(b))與定理 2.11 直接得出。令 \( T, U, S \) 為對應到矩陣 \( C, B, A \) 的線性變換(選擇適當維度的向量空間即可)。那麼

$$ A(BC) = [S]([U][T]) = [S][UT] = [S(UT)] = [(SU)T] = [SU][T] = ([S][U])[T] = (AB)C $$

(這也可以直接利用連加符號的代數運算來證明,這部分留作習題。) \( \blacksquare \)

除了能夠將兩個線性變換的合成表示為矩陣乘積之外,我們還可以使用矩陣乘法來計算一個向量在某個線性變換下的像。

定理 2.13
令 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta \) 與 \( \gamma \)。且令 \( T: V \to W \) 為線性變換。那麼,對於每個 \( u \in V \),我們有

$$ [T(u)]_\gamma = [T]_\beta^\gamma [u]_\beta $$

證明:
令 \( \beta = \{v_1, v_2, \dots, v_n\} \) 與 \( \gamma = \{w_1, w_2, \dots, w_m\} \),並假設對於某個 \( u \in V \),我們有 \( u = \sum_{j=1}^n a_j v_j \)。那麼

$$ T(u) = T\left(\sum_{j=1}^n a_j v_j\right) = \sum_{j=1}^n a_j T(v_j) $$

若 \( [T]_\beta^\gamma = B \),則 \( T(v_j) = \sum_{i=1}^m B_{ij} w_i \)。所以,

$$ T(u) = \sum_{j=1}^n a_j \left(\sum_{i=1}^m B_{ij} w_i\right) = \sum_{i=1}^m \left(\sum_{j=1}^n B_{ij} a_j\right) w_i $$

因此,\( [T(u)]_\gamma \) 的第 \( i \) 個元素是 \( \sum_{j=1}^n B_{ij} a_j \)。但是,這正好也是矩陣乘積 \( B[u]_\beta \) 的第 \( i \) 個元素。所以定理成立。 \( \blacksquare \)

我們現在將注意力轉向一類非常重要的線性變換。這些變換是直接利用矩陣乘法,從給定的矩陣所建構出來的。

定義:
令 \( A \) 為一個具有體 \( F \) 中元素的 \( m \times n \) 矩陣。我們將定義為 \( L_A(x) = Ax \)(即矩陣 \( A \) 與行向量 \( x \) 的矩陣乘積)的映射 \( L_A: F^n \to F^m \),稱為一個左乘變換 (left-multiplication transformation)

範例 2
舉例來說,如果 \( A = \begin{pmatrix} 1 & 2 & 1 \\ 0 & 1 & 2 \end{pmatrix} \),那麼 \( L_A: \mathbb{R}^3 \to \mathbb{R}^2 \) 是由下列式子給出:

$$ L_A \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 1 & 2 & 1 \\ 0 & 1 & 2 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} x_1 + 2x_2 + x_3 \\ x_2 + 2x_3 \end{pmatrix} $$

下一個定理確立了關於左乘變換的幾個實用性質。這些性質在後續章節中會經常被我們使用。

定理 2.15
令 \( A \) 為一個具有體 \( F \) 中元素的 \( m \times n \) 矩陣。那麼左乘變換 \( L_A: F^n \to F^m \) 是線性的。此外,如果 \( B \) 是任何其他(具有 \( F \) 中元素的)\( m \times n \) 矩陣,且 \( \beta \) 與 \( \gamma \) 分別為 \( F^n \) 與 \( F^m \) 的標準有序基底,那麼我們有下列性質:
(a) \( [L_A]_\beta^\gamma = A \)
(b) \( L_A = L_B \) 若且唯若 \( A = B \)
(c) \( L_{A+B} = L_A + L_B \) 且 \( L_{cA} = cL_A \) 對於所有 \( c \in F \) 皆成立
(d) 如果 \( T: F^n \to F^m \) 是線性的,那麼存在唯一的一個 \( m \times n \) 矩陣 \( C \) 使得 \( T = L_C \)。事實上,\( C = [T]_\beta^\gamma \)。
(e) 如果 \( E \) 是一個 \( n \times p \) 矩陣,那麼 \( L_{AE} = L_A L_E \)
(f) 如果 \( m = n \),那麼 \( L_{I_n} = I_{F^n} \)

證明:
\( L_A \) 是線性的這一點,直接從矩陣乘法對加法的分配律以及純量乘法的性質得出(這將作為習題留給讀者)。
(a) 因為 \( \beta = \{e_1, e_2, \dots, e_n\} \) 是 \( F^n \) 的標準有序基底,我們知道 \( L_A(e_j) = Ae_j \) 正好是矩陣 \( A \) 的第 \( j \) 行。由於 \( \gamma \) 是 \( F^m \) 的標準有序基底,\( [L_A(e_j)]_\gamma = Ae_j \)。因此,\( [L_A]_\beta^\gamma \) 的第 \( j \) 行就是 \( A \) 的第 \( j \) 行,所以 \( [L_A]_\beta^\gamma = A \)。
(b) 如果 \( L_A = L_B \),那麼由 (a) 可知,\( A = [L_A]_\beta^\gamma = [L_B]_\beta^\gamma = B \)。反之,如果 \( A = B \),那麼顯然 \( L_A = L_B \)。
(c) 對於任何 \( x \in F^n \),\( L_{A+B}(x) = (A+B)x = Ax + Bx = L_A(x) + L_B(x) = (L_A + L_B)(x) \)。純量乘法的部分也以類似的方式證明。
(d) 令 \( C = [T]_\beta^\gamma \)。根據定理 2.13(第 84 頁),\( [T(x)]_\gamma = [T]_\beta^\gamma [x]_\beta = C x \) 對於所有 \( x \in F^n \) 皆成立。因為 \( \gamma \) 是標準有序基底,\( T(x) = [T(x)]_\gamma = Cx = L_C(x) \)。唯一性由 (b) 保證。
(e) 對於任何 \( x \in F^p \),\( L_{AE}(x) = (AE)x = A(Ex) = A(L_E(x)) = L_A(L_E(x)) = (L_A L_E)(x) \)。
(f) 對於任何 \( x \in F^n \),\( L_{I_n}(x) = I_n x = x = I_{F^n}(x) \)。 \( \blacksquare \)

這些屬性使我們能夠用非常簡潔優雅的方式,來證明例如矩陣乘法結合律等看似繁瑣的性質。

定理 2.16
令 \( A, B \) 與 \( C \) 為使得乘積 \( A(BC) \) 有定義的矩陣。那麼 \( (AB)C \) 也是有定義的,且 \( A(BC) = (AB)C \);也就是說,矩陣乘法具結合律。

證明:
從乘積 \( A(BC) \) 有定義的假設可以推導出,若 \( C \) 為 \( n \times p \) 矩陣,則 \( B \) 必為 \( m \times n \),\( A \) 必為 \( q \times m \) 矩陣。因此乘積 \( (AB)C \) 也是有定義的,且維度皆為 \( q \times p \)。我們利用左乘變換來證明它們相等。
根據定理 2.15(e),我們有

$$ L_{A(BC)} = L_A L_{BC} = L_A (L_B L_C) $$

以及

$$ L_{(AB)C} = L_{AB} L_C = (L_A L_B) L_C $$

由於函數的合成具備結合律,所以 \( L_A (L_B L_C) = (L_A L_B) L_C \)。因此 \( L_{A(BC)} = L_{(AB)C} \)。根據定理 2.15(b),這意味著 \( A(BC) = (AB)C \)。 \( \blacksquare \)


習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。
    (a) 對於所有可相乘的矩陣 \( A \) 與 \( B \),\( AB = BA \)。
    (b) 對於所有使得乘積有定義的矩陣 \( A, B \) 與 \( C \),\( A(BC) = (AB)C \)。
    (c) 如果 \( A \) 與 \( B \) 是 \( n \times n \) 矩陣,那麼 \( (A+B)^2 = A^2 + 2AB + B^2 \)。
    (d) 對於線性變換 \( T \) 與 \( U \),合成變換 \( TU \) 與 \( UT \) 總是同時有定義或同時未定義。
    (e) 如果 \( T \) 與 \( U \) 分別是具有矩陣表示 \( A \) 與 \( B \) 的線性變換,那麼 \( TU \) 的矩陣表示是 \( AB \)。
    (f) 令 \( A \) 為一個 \( m \times n \) 矩陣,那麼 \( L_A \) 是從 \( F^n \) 映至 \( F^m \) 的線性變換。
  2. $$ A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \\ 0 & 1 \end{pmatrix}, \quad B = \begin{pmatrix} 4 & 3 \\ 2 & 1 \end{pmatrix}, \quad C = \begin{pmatrix} 1 & 0 & 2 \\ 3 & -1 & 1 \end{pmatrix} $$
    計算下列有定義的乘積,若無定義請說明原因:
    (a) \( AB \)
    (b) \( BA \)
    (c) \( AC \)
    (d) \( CA \)
    (e) \( BC \)
    (f) \( CB \)
  3. 令 \( T: \mathbb{R}^2 \to \mathbb{R}^3 \) 與 \( U: \mathbb{R}^3 \to \mathbb{R}^2 \) 定義為
    $$ T(a_1, a_2) = (a_1 - a_2, a_1, 2a_1 + a_2) $$
    以及
    $$ U(a_1, a_2, a_3) = (a_1 + a_2 + a_3, a_1 - a_2) $$
    令 \( \alpha \) 與 \( \beta \) 分別為 \( \mathbb{R}^2 \) 與 \( \mathbb{R}^3 \) 的標準有序基底。
    (a) 計算 \( [T]_\alpha^\beta \) 與 \( [U]_\beta^\alpha \)。
    (b) 找出 \( UT(a_1, a_2) \) 的公式。
    (c) 計算 \( [UT]_\alpha \)。
    (d) 驗證 \( [UT]_\alpha = [U]_\beta^\alpha [T]_\alpha^\beta \)。
  4. 證明定理 2.10(線性變換合成的分配律與純量性質)。
  5. 證明定理 2.12(矩陣乘法的分配律與純量性質)。
  6. 令 \( A \) 為一個 \( n \times n \) 矩陣。我們定義 \( A^1 = A \) 且對於 \( k \ge 1 \),\( A^{k+1} = A^k A \)。我們定義 \( A^0 = I_n \)。
    證明對於任何非負整數 \( p \) 與 \( q \),\( A^p A^q = A^{p+q} \) 且 \( (A^p)^q = A^{pq} \)。
  7. 一個 \( n \times n \) 矩陣 \( A \) 若對於某個正整數 \( k \) 滿足 \( A^k = O \)(零矩陣),則稱為冪零矩陣 (nilpotent matrix)
    (a) 如果 \( A \) 是冪零矩陣,證明必定存在一個正整數 \( m \le n \) 使得 \( A^m = O \)。
    (b) 舉出一個非零的冪零矩陣例子。
  8. 定義矩陣 \( A \) 的跡 (trace) \( \text{tr}(A) \) 為其對角線項之和,即 \( \text{tr}(A) = \sum_{i=1}^n A_{ii} \)。
    令 \( A \) 為一個 \( m \times n \) 矩陣,且 \( B \) 為一個 \( n \times m \) 矩陣。證明 \( \text{tr}(AB) = \text{tr}(BA) \)。
  9. 令 \( A \) 與 \( B \) 為 \( n \times n \) 矩陣。證明如果 \( A \) 是一個可逆矩陣,那麼 \( \text{tr}(A^{-1}BA) = \text{tr}(B) \)。
  10. 令 \( V \) 為一個維度大於 1 的向量空間,且 \( T: V \to V \) 為一個線性變換。證明如果對於所有的 \( U \in \mathcal{L}(V) \) 皆有 \( TU = UT \),那麼存在一個純量 \( c \) 使得 \( T = cI_V \)。
  11. 令 \( A \) 與 \( B \) 為 \( n \times n \) 矩陣,使得 \( AB = O \)。證明 \( R(L_B) \subseteq N(L_A) \),並由此推導出 \( \text{rank}(A) + \text{rank}(B) \le n \)。
  12. 假設 \( V \) 是一個有限維向量空間,且 \( T \in \mathcal{L}(V) \)。證明 \( T^2 = T \) 若且唯若存在 \( V \) 的一個基底 \( \beta \),使得 \( [T]_\beta \) 是一個對角矩陣,且其對角線上的項皆為 0 或 1。
  13. (矩陣乘法的行與列觀點)令 \( A \) 為 \( m \times n \) 矩陣,且 \( B \) 為 \( n \times p \) 矩陣。
    (a) 證明 \( AB \) 的第 \( j \) 行等於 \( A \) 乘以 \( B \) 的第 \( j \) 行(即 \( A B^{(j)} \),其中 \( B^{(j)} \) 是 \( B \) 的第 \( j \) 行)。
    (b) 證明 \( AB \) 的第 \( i \) 列等於 \( A \) 的第 \( i \) 列乘以 \( B \)。
  14. 令 \( A \) 為 \( m \times n \) 矩陣,且 \( B \) 為 \( n \times p \) 矩陣。證明 \( AB \) 的每一行都可以寫成 \( A \) 的各行之線性組合;同理,\( AB \) 的每一列都可以寫成 \( B \) 的各列之線性組合。

2.4 可逆性與同構 (Invertibility and Isomorphisms)

在附錄 B 中我們曾回顧,一個函數具有反函數 (inverse) 的先決條件是它必須是一對一 (one-to-one) 且映成 (onto) 的。在本節中,我們將把這個概念應用於線性變換,並探討它在矩陣上的相對應意義。

定義: 令 \( V \) 與 \( W \) 為向量空間,且令 \( T: V \to W \) 為線性變換。如果存在一個函數 \( U: W \to V \) 使得 \( TU = I_W \) 且 \( UT = I_V \),則稱變換 \( T \) 為可逆的 (invertible)。如果 \( T \) 是可逆的,那麼使得此條件成立的函數 \( U \) 是唯一的,並記為 \( T^{-1} \)。

由函數的基礎性質可知,\( T \) 是可逆的,若且唯若 \( T \) 是一對一且映成的(也就是說,\( T \) 是一個對射 bijection)。因此,如果 \( T \) 是可逆的,對於 \( W \) 中的每一個向量 \( y \),皆存在 \( V \) 中唯一的一個向量 \( x \) 使得 \( T(x) = y \);並且,我們定義 \( T^{-1}(y) = x \)。

下一個定理表明,可逆線性變換的反函數,同樣也是一個線性變換。

定理 2.17 令 \( V \) 與 \( W \) 為向量空間,且令 \( T: V \to W \) 為線性且可逆的變換。那麼 \( T^{-1}: W \to V \) 也是線性的。

證明:
令 \( y_1, y_2 \in W \) 且 \( c \in F \)。因為 \( T \) 是一對一且映成的,所以在 \( V \) 中存在唯一的向量 \( x_1 \) 與 \( x_2 \) 使得 \( T(x_1) = y_1 \) 且 \( T(x_2) = y_2 \)。也就是說,\( x_1 = T^{-1}(y_1) \) 且 \( x_2 = T^{-1}(y_2) \)。
因為 \( T \) 是線性的,我們有

$$ T(cx_1 + x_2) = cT(x_1) + T(x_2) = cy_1 + y_2 $$

由此可知

$$ T^{-1}(cy_1 + y_2) = cx_1 + x_2 = cT^{-1}(y_1) + T^{-1}(y_2) $$

這證明了 \( T^{-1} \) 是線性的。 \( \blacksquare \)

這使我們能自然地將線性變換的可逆性概念,推廣到其矩陣表示上。

定義: 令 \( A \) 為一個 \( n \times n \) 矩陣。如果存在一個 \( n \times n \) 矩陣 \( B \) 使得 \( AB = BA = I \)(其中 \( I \) 是 \( n \times n \) 單位矩陣),則稱 \( A \) 為可逆的 (invertible)

如同函數的反函數,如果這樣一個矩陣 \( B \) 存在,那麼它是唯一的(見習題 4)。我們將這個唯一的矩陣稱為 \( A \) 的反矩陣 (inverse),並記為 \( A^{-1} \)。

以下的定理將線性變換的可逆性與其矩陣表示的可逆性緊密地連結在一起。

定理 2.18 令 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta \) 與 \( \gamma \)。令 \( T: V \to W \) 為線性變換。那麼 \( T \) 是可逆的,若且唯若其矩陣表示 \( [T]_\beta^\gamma \) 是一個可逆矩陣。此外,在可逆的情況下,我們有

$$ [T^{-1}]_\gamma^\beta = ([T]_\beta^\gamma)^{-1} $$

證明:
假設 \( T \) 是可逆的。根據定理 2.17,\( T^{-1}: W \to V \) 是線性的。所以由定理 2.11(第 82 頁),我們得到

$$ [T^{-1}]_\gamma^\beta [T]_\beta^\gamma = [T^{-1}T]_\beta^\beta = [I_V]_\beta = I_n $$

(其中 \( n = \dim(V) \))。同理

$$ [T]_\beta^\gamma [T^{-1}]_\gamma^\beta = [TT^{-1}]_\gamma^\gamma = [I_W]_\gamma = I_m $$

(其中 \( m = \dim(W) \))。因為 \( I_n \) 是方陣,所以必定有 \( m = n \)。因此 \( [T]_\beta^\gamma \) 是一個 \( n \times n \) 的可逆矩陣,且其反矩陣為 \( [T^{-1}]_\gamma^\beta \)。

反之,假設 \( A = [T]_\beta^\gamma \) 是可逆的,這意味著存在一個 \( n \times n \) 矩陣 \( B \) 使得 \( AB = BA = I_n \)。根據定理 2.6(第 73 頁),存在一個線性變換 \( U: W \to V \) 使得 \( [U]_\gamma^\beta = B \)。那麼

$$ [UT]_\beta^\beta = [U]_\gamma^\beta [T]_\beta^\gamma = BA = I_n = [I_V]_\beta $$

這意味著 \( UT = I_V \)。同理,

$$ [TU]_\gamma^\gamma = [T]_\beta^\gamma [U]_\gamma^\beta = AB = I_n = [I_W]_\gamma $$

這意味著 \( TU = I_W \)。因此 \( T \) 是可逆的,且 \( U = T^{-1} \)。 \( \blacksquare \)

推論 1: 令 \( V \) 為一個具有有序基底 \( \beta \) 的有限維向量空間,且令 \( T \in \mathcal{L}(V) \)。那麼 \( T \) 是可逆的,若且唯若 \( [T]_\beta \) 是可逆矩陣。此外,\( [T^{-1}]_\beta = ([T]_\beta)^{-1} \)。

推論 2: 令 \( A \) 是一個 \( n \times n \) 矩陣。那麼 \( A \) 是可逆的,若且唯若左乘變換 \( L_A \) 是可逆的。此外,\( (L_A)^{-1} = L_{A^{-1}} \)。

這兩個推論的證明直接源自於定理 2.18 與先前的定義,此處留作習題。

現在,我們來看看兩個重要的矩陣性質。如果 \( A \) 與 \( B \) 都是 \( n \times n \) 的可逆矩陣,那麼乘積 \( AB \) 也是可逆的,且

$$ (AB)^{-1} = B^{-1} A^{-1} $$

(請注意順序的反轉)。同樣地,如果 \( A \) 是可逆的,那麼其轉置矩陣 \( A^t \) 也是可逆的,且

$$ (A^t)^{-1} = (A^{-1})^t $$

同構 (Isomorphisms)
我們已經看到,藉由選擇有序基底,我們可以將 \( n \) 維向量空間中的每一個向量,與 \( F^n \) 中的一個 \( n \)-元組產生對應。這種對應關係不僅僅是集合間的一對一映射;更重要的是,它還完美地保留了向量空間的代數結構(加法與純量乘法)。這種「保留結構」的對射,在代數中被稱為同構。

定義: 令 \( V \) 與 \( W \) 為向量空間。如果在 \( V \) 與 \( W \) 之間存在一個可逆的線性變換 \( T: V \to W \),則稱 \( V \) 與 \( W \) 是同構的 (isomorphic)。這個線性變換 \( T \) 稱為從 \( V \) 映至 \( W \) 的同構 (isomorphism)

如果 \( V \) 與 \( W \) 是同構的,這意味著從抽象的代數觀點來看,它們實際上是同一個空間,只是元素的名稱或外觀不同而已。

定理 2.19 令 \( V \) 與 \( W \) 為(在體 \( F \) 上的)有限維向量空間。那麼 \( V \) 與 \( W \) 是同構的,若且唯若 \( \dim(V) = \dim(W) \)。

證明:
假設 \( V \) 與 \( W \) 是同構的,且令 \( T: V \to W \) 為一個同構。那麼 \( T \) 是線性的,且為一對一及映成。因為 \( T \) 是一對一的,\( \text{nullity}(T) = 0 \);因為 \( T \) 是映成的,\( R(T) = W \),所以 \( \text{rank}(T) = \dim(W) \)。根據維度定理(第 69 頁),我們有

$$ \dim(V) = \text{nullity}(T) + \text{rank}(T) = 0 + \dim(W) = \dim(W) $$

反之,假設 \( \dim(V) = \dim(W) \),且令 \( \beta = \{v_1, v_2, \dots, v_n\} \) 與 \( \gamma = \{w_1, w_2, \dots, w_n\} \) 分別為 \( V \) 與 \( W \) 的基底。根據定理 2.6,存在一個線性變換 \( T: V \to W \) 使得對於 \( i = 1, 2, \dots, n \) 皆有 \( T(v_i) = w_i \)。根據第 71 頁的定理 2.2,

$$ R(T) = \text{span}(T(\beta)) = \text{span}(\gamma) = W $$

所以 \( T \) 是映成的。因為 \( \dim(V) = \dim(W) \),根據定理 2.5(第 70 頁),\( T \) 也是一對一的。因此 \( T \) 是一個同構,所以 \( V \) 與 \( W \) 是同構的。 \( \blacksquare \)

推論: 令 \( V \) 為在體 \( F \) 上的向量空間。那麼 \( V \) 與 \( F^n \) 同構,若且唯若 \( \dim(V) = n \)。

這個推論告訴我們,只要給定維度 \( n \) 與純量體 \( F \),基本上就只有一個 \( n \) 維向量空間(除了同構意義上的差別)。這也是為什麼我們經常可以將抽象的有限維向量空間問題,轉換為對 \( F^n \) 的矩陣運算來處理。

定義: 令 \( \beta \) 為 \( n \) 維向量空間 \( V \) 的一個有序基底。我們定義 \( \Phi_\beta: V \to F^n \) 為 \( \Phi_\beta(x) = [x]_\beta \)。此函數 \( \Phi_\beta \) 稱為 \( V \) 相對於 \( \beta \) 的標準表示 (standard representation)

根據 2.2 節習題 8 的結果,\( \Phi_\beta \) 是一個線性變換。此外,這是一個從 \( V \) 映至 \( F^n \) 的同構。我們將這個事實與定理 2.19 的證明過程聯繫起來,可以看到座標向量映射正是實現這種同構的橋樑。

最後,我們來看一個關於線性變換空間 \( \mathcal{L}(V, W) \) 的漂亮結果。我們已經知道每個從 \( V \) 映至 \( W \) 的線性變換都可以用一個矩陣來表示。這不僅僅是一種方便的記號,它實際上建立了一個同構。

定理 2.20 令 \( V \) 與 \( W \) 為(在體 \( F \) 上的)有限維向量空間,其維度分別為 \( n \) 與 \( m \)。令 \( \beta \) 與 \( \gamma \) 分別為 \( V \) 與 \( W \) 的有序基底。那麼定義為 \( \Phi(T) = [T]_\beta^\gamma \) 的函數 \( \Phi: \mathcal{L}(V, W) \to M_{m \times n}(F) \) 是一個同構。

證明:
我們已經在定理 2.8(第 80 頁)中證明了 \( \Phi \) 是線性的。我們現在必須證明 \( \Phi \) 是一對一且映成的。
若 \( \Phi(T) = O \)(零矩陣),那麼對於所有 \( x \in V \),\( T(x) = 0 \)。因此 \( T = T_0 \)(零變換),這意味著 \( N(\Phi) = \{T_0\} \),所以 \( \Phi \) 是一對一的。
為了證明 \( \Phi \) 是映成的,令 \( A \) 為一個任意的 \( m \times n \) 矩陣,且令 \( \beta = \{v_1, v_2, \dots, v_n\} \) 與 \( \gamma = \{w_1, w_2, \dots, w_m\} \)。根據定理 2.6,存在一個線性變換 \( T: V \to W \) 使得

$$ T(v_j) = \sum_{i=1}^m A_{ij} w_i \quad \text{對於 } j = 1, 2, \dots, n $$

由此定義可知 \( [T]_\beta^\gamma = A \),所以 \( \Phi(T) = A \)。因此 \( \Phi \) 是映成的。 \( \blacksquare \)

推論: 令 \( V \) 與 \( W \) 為有限維向量空間,維度分別為 \( n \) 與 \( m \)。那麼 \( \mathcal{L}(V, W) \) 是一個有限維向量空間,且 \( \dim(\mathcal{L}(V, W)) = mn \)。

習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。
    (a) 函數 \( T: V \to W \) 是可逆的,若且唯若 \( T \) 是一對一且映成的。
    (b) 如果 \( T: V \to W \) 是線性的且為可逆的,那麼 \( T^{-1} \) 也是線性的。
    (c) 如果 \( T: V \to W \) 是可逆的,那麼 \( V \) 與 \( W \) 是同構的。
    (d) 如果 \( V \) 與 \( W \) 是同構的有限維向量空間,那麼它們具有相同的維度。
    (e) 如果 \( V \) 與 \( W \) 是具有相同維度的有限維向量空間,那麼它們是同構的。
    (f) 一個 \( n \times n \) 矩陣 \( A \) 是可逆的,若且唯若左乘變換 \( L_A \) 是可逆的。
    (g) 如果 \( A \) 與 \( B \) 是 \( n \times n \) 矩陣,那麼 \( (AB)^{-1} = A^{-1}B^{-1} \)。
    (h) 可逆矩陣的反矩陣是唯一的。
    (i) 每個向量空間都與某個整數 \( n \) 的 \( F^n \) 同構。
  2. 判斷下列各題中的向量空間 \( V \) 與 \( W \) 是否同構。請說明理由。
    (a) \( V = M_{2 \times 2}(\mathbb{R}) \) 且 \( W = P_3(\mathbb{R}) \)。
    (b) \( V = M_{m \times n}(F) \) 且 \( W = M_{n \times m}(F) \)。
    (c) \( V = \{f(x) \in P_3(\mathbb{R}) : f(0) = 0\} \) 且 \( W = \mathbb{R}^3 \)。
    (d) \( V = \{A \in M_{2 \times 2}(\mathbb{R}) : \text{tr}(A) = 0\} \) 且 \( W = \mathbb{R}^4 \)。
    (e) \( V = \{A \in M_{2 \times 2}(\mathbb{R}) : A^t = -A\} \) 且 \( W = \mathbb{R}^1 \)。
  3. 對於下列定義的各個線性變換 \( T \),判斷 \( T \) 是否可逆,如果可逆,請計算 \( T^{-1} \)。
    (a) \( T: \mathbb{R}^2 \to \mathbb{R}^2 \) 定義為 \( T(a_1, a_2) = (a_1 + a_2, a_1 - a_2) \)。
    (b) \( T: P_2(\mathbb{R}) \to P_2(\mathbb{R}) \) 定義為 \( T(f(x)) = f(x) + f'(x) \)。
    (c) \( T: M_{2 \times 2}(\mathbb{R}) \to M_{2 \times 2}(\mathbb{R}) \) 定義為 \( T(A) = A^t \)。
    (d) \( T: \mathbb{R}^3 \to \mathbb{R}^3 \) 定義為 \( T(a_1, a_2, a_3) = (a_1, a_1 + a_2, a_1 + a_2 + a_3) \)。
    (e) \( T: \mathbb{R}^2 \to \mathbb{R}^3 \) 定義為 \( T(a_1, a_2) = (a_1 + a_2, a_1, a_2) \)。
  4. 證明矩陣 \( A \) 如果有反矩陣,那麼反矩陣是唯一的。也就是說,如果 \( AB = BA = I \) 且 \( AC = CA = I \),證明 \( B = C \)。
  5. 證明如果 \( A \) 與 \( B \) 為 \( n \times n \) 的可逆矩陣,那麼乘積 \( AB \) 也是可逆的,且 \( (AB)^{-1} = B^{-1}A^{-1} \)。
  6. 證明如果 \( A \) 是可逆矩陣,那麼 \( A^t \) 也是可逆的,且 \( (A^t)^{-1} = (A^{-1})^t \)。
  7. 令 \( A \) 為一個 \( n \times n \) 矩陣。證明 \( A \) 是可逆的若且唯若 \( A \) 與 \( I_n \) 的秩 (rank) 相同(亦即 \( \text{rank}(A) = n \))。
  8. 證明定理 2.18 的推論 1 與推論 2。
  9. 令 \( V \) 與 \( W \) 為向量空間。證明「與...同構 (is isomorphic to)」是一個等價關係 (equivalence relation)。也就是說,證明:
    (a) \( V \) 與 \( V \) 同構。
    (b) 如果 \( V \) 與 \( W \) 同構,那麼 \( W \) 與 \( V \) 同構。
    (c) 如果 \( V \) 與 \( W \) 同構,且 \( W \) 與 \( Z \) 同構,那麼 \( V \) 與 \( Z \) 同構。
  10. 令 \( V \) 與 \( W \) 為有限維向量空間,且令 \( T: V \to W \) 為一個同構。令 \( \beta = \{v_1, v_2, \dots, v_n\} \) 為 \( V \) 的基底。證明 \( T(\beta) = \{T(v_1), T(v_2), \dots, T(v_n)\} \) 是 \( W \) 的基底。
  11. 令 \( T: V \to W \) 為線性變換,其中 \( V \) 與 \( W \) 是有限維的。證明如果 \( T \) 是一個同構,那麼 \( \text{rank}(T) = \dim(V) = \dim(W) \)。
  12. 令 \( A \) 與 \( B \) 為 \( n \times n \) 矩陣使得 \( AB = I_n \)。
    (a) 利用定理 2.15 與 2.4 證明 \( L_B \) 是一對一的。
    (b) 利用定理 2.5 證明 \( L_B \) 是一個同構。
    (c) 證明 \( B \) 是可逆的且 \( B^{-1} = A \)。這說明在方陣的情況下,只需驗證單邊反矩陣即可證明其為反矩陣。
  13. 假設 \( V \) 是一個維度為 \( n \) 的有限維向量空間。證明如果 \( T: V \to V \) 是一個線性變換且具有左反函數 (left inverse)(即存在 \( U \in \mathcal{L}(V) \) 使得 \( UT = I_V \)),那麼 \( T \) 是可逆的且 \( T^{-1} = U \)。
  14. 令 \( V \) 與 \( W \) 為有限維向量空間,並令 \( T: V \to W \) 為線性變換。
    (a) 證明如果 \( T \) 是一對一的,那麼存在一個線性變換 \( U: W \to V \) 使得 \( UT = I_V \)。
    (b) 證明如果 \( T \) 是映成的,那麼存在一個線性變換 \( U: W \to V \) 使得 \( TU = I_W \)。
  15. 令 \( V \) 為一個無限維的向量空間。請給出一個線性變換 \( T: V \to V \) 的例子,使得 \( T \) 有左反函數但沒有右反函數;再給出一個有右反函數但沒有左反函數的例子。
  16. 證明一個 \( n \times n \) 矩陣 \( A \) 是可逆的若且唯若它的各行 (columns) 在 \( F^n \) 中形成一個基底。
  17. 令 \( A \) 為一個 \( n \times n \) 矩陣,證明如果 \( A^2 = O \)(零矩陣),那麼 \( I_n - A \) 是可逆的,並且計算其反矩陣。更一般地說,如果 \( A^k = O \) 對於某個正整數 \( k \) 成立(亦即 \( A \) 為冪零矩陣),證明 \( I_n - A \) 是可逆的。
  18. 令 \( T: V \to W \) 為線性且可逆的變換。證明如果 \( V_1 \) 是 \( V \) 的子空間,那麼 \( T(V_1) \) 是 \( W \) 的子空間,並且 \( \dim(V_1) = \dim(T(V_1)) \)。
  19. 令 \( A \) 與 \( B \) 為 \( n \times n \) 矩陣。如果 \( A \) 是可逆的,證明 \( \text{rank}(AB) = \text{rank}(B) \) 且 \( \text{rank}(BA) = \text{rank}(B) \)。
  20. 證明如果 \( A \) 與 \( B \) 是相似矩陣 (similar matrices)(即存在可逆矩陣 \( Q \) 使得 \( B = Q^{-1}AQ \)),那麼 \( \text{tr}(A) = \text{tr}(B) \)。
  21. 令 \( T, U \in \mathcal{L}(V) \)。證明如果 \( T \) 與 \( U \) 皆為可逆的,那麼 \( TU \) 也是可逆的,且 \( (TU)^{-1} = U^{-1}T^{-1} \)。
  22. 令 \( V \) 為有限維向量空間。證明對於任何 \( T \in \mathcal{L}(V) \),下列敘述等價:
    (a) \( T \) 是可逆的。
    (b) \( \text{nullity}(T) = 0 \)。
    (c) \( \text{rank}(T) = \dim(V) \)。
  23. 在 \( M_{n \times n}(\mathbb{R}) \) 中,考慮所有主對角線項不為零的對角矩陣集合。證明這個集合在矩陣乘法下形成一個群 (group)。
  24. 令 \( V \) 為有限維向量空間。令 \( W_1 \) 與 \( W_2 \) 為 \( V \) 的子空間,且 \( \dim(W_1) = \dim(W_2) \)。證明必定存在一個同構 \( T: V \to V \) 使得 \( T(W_1) = W_2 \)。
  25. 令 \( \Phi: \mathcal{L}(V, W) \to M_{m \times n}(F) \) 為定理 2.20 中定義的同構 \( \Phi(T) = [T]_\beta^\gamma \)。證明這不僅是向量空間的同構,在 \( V=W \) 的情況下,它還滿足 \( \Phi(TU) = \Phi(T)\Phi(U) \),這表明了線性變換的代數結構與方陣的代數結構是完全一致的。

2.5 座標轉換矩陣 (The Change of Coordinate Matrix)

在幾何學與物理學的許多應用中,為向量空間選擇一個合適的基底來簡化問題是非常重要的。例如,在分析某個線性變換時,如果我們能找到一個基底,使得該變換的矩陣表示是對角矩陣(或盡可能簡單的形式),那麼相關的計算與理論推導都會變得容易許多。當我們將基底從 \( \beta \) 更改為 \( \beta' \) 時,向量的座標以及線性變換的矩陣表示會如何改變呢?這就是本節要探討的核心問題。

首先,我們來看看一個向量在兩個不同基底下的座標向量之間有什麼關係。

定理 2.22 令 \( \beta \) 與 \( \beta' \) 為有限維向量空間 \( V \) 的兩個有序基底。令 \( Q = [I_V]_{\beta'}^\beta \)。那麼
(a) \( Q \) 是一個可逆矩陣。
(b) 對於任何 \( x \in V \),我們有 \( [x]_\beta = Q[x]_{\beta'} \)。

證明:
(a) 因為恆等變換 \( I_V \) 是可逆的,根據定理 2.18(第 101 頁),它的矩陣表示 \( Q = [I_V]_{\beta'}^\beta \) 也是可逆的。
(b) 對於任何 \( x \in V \),根據定理 2.13(第 84 頁),我們有

$$ [x]_\beta = [I_V(x)]_\beta = [I_V]_{\beta'}^\beta [x]_{\beta'} = Q[x]_{\beta'} $$

這完成了證明。 \( \blacksquare \)

定義: 定理 2.22 中的矩陣 \( Q = [I_V]_{\beta'}^\beta \) 稱為從 \( \beta' \) 到 \( \beta \) 的座標轉換矩陣 (change of coordinate matrix)

請注意,\( Q \) 的第 \( j \) 行(column)正是 \( \beta' \) 中第 \( j \) 個向量相對於基底 \( \beta \) 的座標向量。因為 \( Q \) 是可逆的,定理 2.22(b) 也可以寫成 \( [x]_{\beta'} = Q^{-1}[x]_\beta \)。由此可知,\( Q^{-1} \) 是從 \( \beta \) 到 \( \beta' \) 的座標轉換矩陣;也就是說,\( Q^{-1} = [I_V]_\beta^{\beta'} \)。

範例 1
在 \( \mathbb{R}^2 \) 中,令 \( \beta = \{(1, 1), (1, -1)\} \) 且 \( \beta' = \{(2, 4), (3, 1)\} \)。因為

$$ (2, 4) = 3(1, 1) - 1(1, -1) $$

$$ (3, 1) = 2(1, 1) + 1(1, -1) $$

從 \( \beta' \) 到 \( \beta \) 的座標轉換矩陣為

$$ Q = \begin{pmatrix} 3 & 2 \\ -1 & 1 \end{pmatrix} $$

對於向量 \( x = (a, b) \in \mathbb{R}^2 \),我們可以藉由解聯立方程式 \( (a, b) = c_1(2, 4) + c_2(3, 1) \) 來找到 \( [x]_{\beta'} \)。一個簡單的計算會得出 \( c_1 = \frac{-a + 3b}{10} \) 與 \( c_2 = \frac{4a - 2b}{10} \)。例如,如果 \( x = (4, -2) \),那麼 \( c_1 = -1 \) 且 \( c_2 = 2 \)。所以

$$ [x]_{\beta'} = \begin{pmatrix} -1 \\ 2 \end{pmatrix} $$

根據定理 2.22,我們有

$$ [x]_\beta = Q[x]_{\beta'} = \begin{pmatrix} 3 & 2 \\ -1 & 1 \end{pmatrix} \begin{pmatrix} -1 \\ 2 \end{pmatrix} = \begin{pmatrix} 1 \\ 3 \end{pmatrix} $$

讀者可以自行驗證 \( (4, -2) = 1(1, 1) + 3(1, -1) \),這證實了我們先前計算出的座標向量確實是正確的。

接下來我們探討,當我們更換基底時,線性變換的矩陣表示會如何改變。

定理 2.23 令 \( T \) 為有限維向量空間 \( V \) 上的一個線性算子(即 \( T: V \to V \) 為線性變換)。令 \( \beta \) 與 \( \beta' \) 為 \( V \) 的有序基底。令 \( Q \) 為從 \( \beta' \) 到 \( \beta \) 的座標轉換矩陣。那麼

$$ [T]_{\beta'} = Q^{-1}[T]_\beta Q $$

證明:
令 \( I \) 為 \( V \) 上的恆等變換。那麼 \( T = IT = TI \)。根據定理 2.11(第 82 頁),我們有

$$ Q[T]_{\beta'} = [I]_{\beta'}^\beta [T]_{\beta'}^{\beta'} = [IT]_{\beta'}^\beta = [TI]_{\beta'}^\beta = [T]_\beta^\beta [I]_{\beta'}^\beta = [T]_\beta Q $$

將方程式的兩邊左乘 \( Q^{-1} \) 即可得出

$$ [T]_{\beta'} = Q^{-1}[T]_\beta Q $$

\( \blacksquare \)

這個定理為我們提供了一個極具威力的方法,來計算線性變換在任何新基底下的矩陣表示。我們只需知道舊基底下的矩陣表示以及座標轉換矩陣即可。

範例 2
令 \( T \) 為 \( \mathbb{R}^2 \) 上對於直線 \( y = 2x \) 的鏡射(reflection)算子。這意味著對於直線上的任何向量 \( v \),\( T(v) = v \);而對於與直線垂直的任何向量 \( w \),\( T(w) = -w \)。我們希望找到 \( T \) 相對於標準基底 \( \beta = \{(1, 0), (0, 1)\} \) 的矩陣表示。
直接計算 \( [T]_\beta \) 是有些困難的。然而,如果我們選擇一個由這條直線上的一個向量,以及與這條直線垂直的一個向量所組成的基底 \( \beta' \),那麼 \( [T]_{\beta'} \) 的計算將會非常容易。
直線 \( y = 2x \) 上的一個向量為 \( (1, 2) \)。與 \( (1, 2) \) 正交(垂直)的一個向量為 \( (-2, 1) \)。令 \( \beta' = \{(1, 2), (-2, 1)\} \)。那麼

$$ T(1, 2) = (1, 2) = 1(1, 2) + 0(-2, 1) $$ $$ T(-2, 1) = -(-2, 1) = (2, -1) = 0(1, 2) - 1(-2, 1) $$

因此

$$ [T]_{\beta'} = \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} $$

令 \( Q \) 為從 \( \beta' \) 到 \( \beta \) 的座標轉換矩陣。那麼 \( Q \) 的各行(columns)正好是 \( (1, 2) \) 與 \( (-2, 1) \) 在標準基底 \( \beta \) 下的座標。也就是說,

$$ Q = \begin{pmatrix} 1 & -2 \\ 2 & 1 \end{pmatrix} $$

計算其反矩陣可得

$$ Q^{-1} = \frac{1}{5} \begin{pmatrix} 1 & 2 \\ -2 & 1 \end{pmatrix} $$

根據定理 2.23,我們有 \( [T]_{\beta'} = Q^{-1}[T]_\beta Q \),這等價於 \( [T]_\beta = Q[T]_{\beta'} Q^{-1} \)。因此

$$ [T]_\beta = \begin{pmatrix} 1 & -2 \\ 2 & 1 \end{pmatrix} \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} \frac{1}{5} \begin{pmatrix} 1 & 2 \\ -2 & 1 \end{pmatrix} = \frac{1}{5} \begin{pmatrix} -3 & 4 \\ 4 & 3 \end{pmatrix} $$

這個範例生動地展示了「尋找合適的基底來簡化矩陣表示」的力量。我們將在第 5 章中廣泛且深入地探討這個主題。

定理 2.23 中所出現的矩陣關係是非常普遍且重要的,因此我們給予它一個特殊的名稱。

定義: 令 \( A \) 與 \( B \) 為 \( n \times n \) 矩陣。如果存在一個可逆的 \( n \times n \) 矩陣 \( Q \) 使得 \( B = Q^{-1}AQ \),那麼我們稱矩陣 \( B \) 與矩陣 \( A \) 是相似的 (similar)

請注意,「相似 (similarity)」是 \( n \times n \) 矩陣集合上的一個等價關係 (equivalence relation)(見本節習題 4)。因此,如果 \( B \) 與 \( A \) 相似,我們也可以說 \( A \) 與 \( B \) 相似;或者更簡單地說,\( A \) 與 \( B \) 是相似的。

根據這個定義,定理 2.23 可以被重新表述為:如果 \( V \) 是一個有限維向量空間,且 \( T \in \mathcal{L}(V) \),那麼 \( T \) 在任何兩個有序基底下的矩陣表示皆為相似矩陣。反之亦然,如果兩個矩陣是相似的,那麼它們必定代表同一個線性算子在兩個不同的有序基底下的矩陣表示。這說明了「相似」不僅是一個代數操作,它在幾何與線性代數的本質上,代表著「同一個變換的不同視角」。

習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。假設 \( V \) 是一個有限維向量空間,且 \( \beta \) 與 \( \gamma \) 是 \( V \) 的有序基底。
    (a) 從 \( \beta \) 到 \( \gamma \) 的座標轉換矩陣是 \( [I_V]_\beta^\gamma \)。
    (b) 如果 \( x \in V \),那麼 \( [x]_\beta = [I_V]_\beta^\gamma [x]_\gamma \)。
    (c) 如果 \( T \) 是 \( V \) 上的一個線性算子,那麼 \( [T]_\beta = [I_V]_\beta^\gamma [T]_\gamma [I_V]_\gamma^\beta \)。
    (d) 任何座標轉換矩陣都是可逆的。
    (e) 兩個在同一個有序基底下表示同一個線性算子的矩陣,必定是相似矩陣。
    (f) 如果矩陣 \( A \) 與 \( B \) 是相似的,那麼 \( A \) 是可逆的若且唯若 \( B \) 是可逆的。
    (g) 如果矩陣 \( A \) 與 \( B \) 是相似的,那麼 \( A^2 \) 與 \( B^2 \) 也是相似的。
  2. 在下列各題中,找出從基底 \( \beta \) 到基底 \( \gamma \) 的座標轉換矩陣:
    (a) 在 \( \mathbb{R}^2 \) 中,\( \beta = \{(1, 1), (1, -1)\} \) 且 \( \gamma = \{(2, 4), (3, 1)\} \)。
    (b) 在 \( \mathbb{R}^2 \) 中,\( \beta = \{(1, 2), (2, 3)\} \) 且 \( \gamma = \{(1, 0), (0, 1)\} \)。
    (c) 在 \( P_2(\mathbb{R}) \) 中,\( \beta = \{x^2, x, 1\} \) 且 \( \gamma = \{1, x, x^2\} \)。
    (d) 在 \( P_2(\mathbb{R}) \) 中,\( \beta = \{1, x, x^2\} \) 且 \( \gamma = \{a_0, a_0 + a_1 x, a_0 + a_1 x + a_2 x^2\} \),其中 \( a_0, a_1, a_2 \) 皆為非零的實數。
  3. 令 \( V \) 為有限維向量空間,且 \( T \) 為 \( V \) 上的一個線性算子。證明如果是 \( V \) 的一個基底 \( \beta \) 使得 \( [T]_\beta \) 是對角矩陣,那麼對任何與 \( [T]_\beta \) 相似的矩陣而言,它也必定是對角矩陣。這個敘述正確嗎?請說明理由或給出反例。
  4. 證明矩陣的「相似 (similarity)」關係是一個等價關係 (equivalence relation)。也就是說,證明:
    (a) 任何一個 \( n \times n \) 矩陣 \( A \) 都與自己相似。
    (b) 如果 \( A \) 與 \( B \) 相似,那麼 \( B \) 與 \( A \) 相似。
    (c) 如果 \( A \) 與 \( B \) 相似,且 \( B \) 與 \( C \) 相似,那麼 \( A \) 與 \( C \) 相似。
  5. 證明如果矩陣 \( A \) 與 \( B \) 是相似的,那麼 \( \text{tr}(A) = \text{tr}(B) \)。
  6. 令 \( V \) 為一個有限維向量空間,並令 \( \beta \) 與 \( \gamma \) 為 \( V \) 的有序基底。證明對於 \( V \) 上的任何線性算子 \( T \),\( \text{tr}([T]_\beta) = \text{tr}([T]_\gamma) \)。這說明了我們可以良好地定義一個線性算子的跡 (trace),即 \( \text{tr}(T) = \text{tr}([T]_\beta) \),因為它並不依賴於基底的選擇。
  7. 令 \( A \) 與 \( B \) 為 \( n \times n \) 的可逆矩陣。證明 \( AB \) 與 \( BA \) 是相似矩陣。
  8. 令 \( A \) 為一個 \( n \times n \) 矩陣。證明如果 \( A \) 相似於一個純量矩陣 \( cI \)(其中 \( c \) 為純量,且 \( I \) 為單位矩陣),那麼 \( A = cI \)。
  9. 證明如果 \( A \) 與 \( B \) 相似,那麼對於任何正整數 \( k \),\( A^k \) 與 \( B^k \) 也是相似的。
  10. 令 \( V \) 為一個二維向量空間,且 \( \beta = \{v_1, v_2\} \) 是 \( V \) 的一個有序基底。如果一個線性算子 \( T: V \to V \) 在基底 \( \beta \) 下的矩陣表示為
    $$ [T]_\beta = \begin{pmatrix} a & b \\ c & d \end{pmatrix} $$
    證明 \( T \) 滿足方程式 \( T^2 - (a+d)T + (ad-bc)I = T_0 \),其中 \( T_0 \) 是零變換,且 \( I \) 是恆等變換。
  11. 延續上一題,證明對於任何 \( 2 \times 2 \) 矩陣 \( A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \),皆滿足 \( A^2 - (a+d)A + (ad-bc)I = O \),其中 \( O \) 是零矩陣。這個結果是著名的凱萊-哈密頓定理 (Cayley-Hamilton Theorem) 的二維特例。
  12. 令 \( Q \) 為從 \( \mathbb{R}^2 \) 的標準有序基底到有序基底 \( \beta = \{(1, 1), (1, -1)\} \) 的座標轉換矩陣。
    (a) 計算 \( Q \)。
    (b) 假設一個線性算子 \( T: \mathbb{R}^2 \to \mathbb{R}^2 \) 在標準有序基底下定義為 \( T(x, y) = (2x - y, x + 3y) \)。計算 \( [T]_\beta \)。
  13. 在 \( P_2(\mathbb{R}) \) 中,定義兩個線性算子 \( T \) 與 \( U \) 如下:
    $$ T(f(x)) = f'(x) \quad \text{且} \quad U(f(x)) = f(x) + x f'(x) $$
    令 \( \beta = \{1, x, x^2\} \) 為 \( P_2(\mathbb{R}) \) 的標準有序基底。
    (a) 計算 \( [T]_\beta \) 與 \( [U]_\beta \)。
    (b) 令 \( \gamma = \{1, 1+x, 1+x+x^2\} \) 為另一個有序基底。找出從 \( \beta \) 到 \( \gamma \) 的座標轉換矩陣 \( Q \)。
    (c) 利用 (b) 計算 \( [T]_\gamma \) 與 \( [U]_\gamma \)。
  14. 令 \( V \) 為有限維向量空間,並令 \( T \) 為 \( V \) 上的線性算子。證明如果 \( V \) 有一個基底 \( \beta \) 使得 \( [T]_\beta \) 是一個對角矩陣,那麼對於任何其他的基底 \( \gamma \),\( T \) 在 \( \gamma \) 下的矩陣表示 \( [T]_\gamma \) 必定相似於一個對角矩陣。

2.6* 對偶空間 (Dual Spaces)

在我們稍早的討論中,我們定義了 \( \mathcal{L}(V, W) \) 作為從向量空間 \( V \) 映至向量空間 \( W \) 的所有線性變換所構成的向量空間。一個特別重要且有趣的特例,發生在 \( W = F \)(純量體)的時候。

定義: 從向量空間 \( V \) 映至其純量體 \( F \) 的線性變換,稱為 \( V \) 上的線性泛函 (linear functional)。從 \( V \) 映至 \( F \) 的所有線性泛函所構成的向量空間 \( \mathcal{L}(V, F) \),稱為 \( V \) 的對偶空間 (dual space),並記為 \( V^* \)。

因此,\( V^* \) 是一個向量空間,它的元素是從 \( V \) 映至 \( F \) 的線性泛函。我們首先來看幾個線性泛函的範例。

範例 1
令 \( V = M_{n \times n}(F) \),並定義 \( f: V \to F \) 為 \( f(A) = \text{tr}(A) \),即矩陣 \( A \) 的跡 (trace)。由於跡運算保留了加法與純量乘法,所以 \( f \) 是一個線性泛函。

範例 2
令 \( V = C([a, b]) \) 為定義在閉區間 \( [a, b] \) 上的所有實值連續函數之向量空間。定義 \( f: V \to \mathbb{R} \) 為

$$ f(x) = \int_a^b x(t) dt $$

由微積分中積分的線性性質可知,\( f \) 是一個線性泛函。

範例 3
令 \( V \) 為一個有限維向量空間,且 \( \beta = \{x_1, x_2, \dots, x_n\} \) 是 \( V \) 的一個基底。對於任何 \( x \in V \),存在唯一的純量 \( a_1, a_2, \dots, a_n \in F \) 使得 \( x = \sum_{i=1}^n a_i x_i \)。我們定義 \( f_i: V \to F \) 為

$$ f_i(x) = a_i $$

也就是說,\( f_i(x) \) 是 \( x \) 在基底 \( \beta \) 下的第 \( i \) 個座標。可以輕易驗證 \( f_i \) 是一個線性泛函。我們稱 \( f_i \) 為相對於基底 \( \beta \) 的第 \( i \) 個座標函數 (coordinate function)。請注意,\( f_i(x_j) = \delta_{ij} \)(克羅內克 \( \delta \))。

如果 \( V \) 是一個維度為 \( n \) 的有限維向量空間,那麼根據定理 2.20 的推論(第 105 頁),我們有

$$ \dim(V^*) = \dim(\mathcal{L}(V, F)) = \dim(V) \cdot \dim(F) = n \cdot 1 = n $$

因此,\( V \) 與其對偶空間 \( V^* \) 具有相同的維度,所以它們是同構的 (isomorphic)。我們接下來將證明,對於 \( V \) 的每一個基底,都能自然地對應到 \( V^* \) 的一個基底。

定理 2.24
令 \( V \) 為一個有限維向量空間,且 \( \beta = \{x_1, x_2, \dots, x_n\} \) 是 \( V \) 的一個基底。那麼必定存在唯一一個 \( V^* \) 的基底 \( \beta^* = \{f_1, f_2, \dots, f_n\} \),使得對於 \( 1 \le i, j \le n \) 皆有 \( f_i(x_j) = \delta_{ij} \)。

證明:
對於每一個 \( i = 1, 2, \dots, n \),根據定理 2.6(第 73 頁),存在唯一一個線性變換 \( f_i: V \to F \) 使得 \( f_i(x_j) = \delta_{ij} \) 對於所有 \( j \) 皆成立。我們現在證明 \( \beta^* = \{f_1, f_2, \dots, f_n\} \) 是一個基底。因為 \( \dim(V^*) = n \),我們只需證明 \( \beta^* \) 是線性獨立的。
假設對於某些純量 \( c_1, c_2, \dots, c_n \),我們有

$$ \sum_{i=1}^n c_i f_i = 0 $$

(其中右邊的 \( 0 \) 代表零泛函)。將這個等式作用在基底向量 \( x_j \) 上,我們得到

$$ 0 = \left(\sum_{i=1}^n c_i f_i\right)(x_j) = \sum_{i=1}^n c_i f_i(x_j) = \sum_{i=1}^n c_i \delta_{ij} = c_j $$

因為這對所有的 \( j = 1, 2, \dots, n \) 皆成立,所以 \( \beta^* \) 是線性獨立的,因此它是 \( V^* \) 的一個基底。 \( \blacksquare \)

定義: 定理 2.24 中的基底 \( \beta^* = \{f_1, f_2, \dots, f_n\} \) 稱為 \( \beta \) 的對偶基底 (dual basis)

下一個定理清楚地展示了基底與其對偶基底之間優美的對稱關係。

定理 2.25
令 \( V \) 為一個有限維向量空間,且 \( \beta = \{x_1, x_2, \dots, x_n\} \) 是 \( V \) 的基底。令 \( \beta^* = \{f_1, f_2, \dots, f_n\} \) 為 \( \beta \) 的對偶基底。那麼
(a) 對於任何 \( x \in V \),我們有 \( x = \sum_{i=1}^n f_i(x)x_i \)。
(b) 對於任何 \( f \in V^* \),我們有 \( f = \sum_{i=1}^n f(x_i)f_i \)。

證明:
(a) 令 \( x \in V \)。因為 \( \beta \) 是 \( V \) 的基底,存在純量 \( a_1, a_2, \dots, a_n \) 使得 \( x = \sum_{j=1}^n a_j x_j \)。對於任何 \( i \),我們將 \( f_i \) 作用於 \( x \) 得到

$$ f_i(x) = f_i\left(\sum_{j=1}^n a_j x_j\right) = \sum_{j=1}^n a_j f_i(x_j) = \sum_{j=1}^n a_j \delta_{ij} = a_i $$

將 \( a_i = f_i(x) \) 代回原式,即得 \( x = \sum_{i=1}^n f_i(x)x_i \)。
(b) 留作習題(其證明手法與 (a) 完全對稱)。 \( \blacksquare \)

雙對偶空間 (The Double Dual Space)
既然 \( V^* \) 是一個向量空間,我們自然可以探討 \( V^* \) 的對偶空間,也就是從 \( V^* \) 映至 \( F \) 的所有線性泛函所構成的向量空間。我們將這個空間記為 \( V^{**} \),並稱之為 \( V \) 的雙對偶空間 (double dual space) 或二階對偶空間
對於任何 \( x \in V \),我們可以定義一個從 \( V^* \) 映至 \( F \) 的函數 \( \hat{x} \),其定義為:

$$ \hat{x}(f) = f(x) \quad \text{對於所有的 } f \in V^* $$

讀者可以輕易驗證 \( \hat{x} \) 是一個線性泛函,因此 \( \hat{x} \in V^{**} \)。

將 \( V \) 映射到 \( V^{**} \) 的過程提供了一個非常特殊的結果。在定理 2.19 中我們知道,任何維度為 \( n \) 的有限維向量空間都與 \( F^n \) 同構。但這種同構依賴於基底的選擇,我們稱之為「非自然的」。然而,從 \( V \) 到 \( V^{**} \) 的映射 \( x \mapsto \hat{x} \) 卻是一個不依賴任何基底選擇的同構!這種同構被稱為自然同構 (natural isomorphism)

定理 2.26
令 \( V \) 為一個有限維向量空間。定義映射 \( \psi: V \to V^{**} \) 為 \( \psi(x) = \hat{x} \)。那麼 \( \psi \) 是一個同構(即自然同構)。

證明:
首先證明 \( \psi \) 是線性的。對於任何 \( x, y \in V \),\( c \in F \) 以及 \( f \in V^* \):

$$ \psi(cx + y)(f) = \widehat{cx + y}(f) = f(cx + y) = cf(x) + f(y) = c\hat{x}(f) + \hat{y}(f) = (c\psi(x) + \psi(y))(f) $$

所以 \( \psi \) 是線性的。
接下來證明 \( \psi \) 是一對一的。假設 \( \psi(x) = 0 \)(零泛函),即對於所有的 \( f \in V^* \) 皆有 \( \hat{x}(f) = f(x) = 0 \)。如果 \( x \neq 0 \),我們總可以找到一個基底包含 \( x \),並構造出一個座標函數 \( f \) 使得 \( f(x) = 1 \neq 0 \),這就產生了矛盾。因此必有 \( x = 0 \)。因為 \( N(\psi) = \{0\} \),\( \psi \) 是一對一的。
最後,由於 \( \dim(V) = \dim(V^*) = \dim(V^{**}) \),根據定理 2.5(第 70 頁),一對一的線性變換在維度相同的空間之間必定是映成的。因此 \( \psi \) 是一個同構。 \( \blacksquare \)

轉置變換 (The Transpose of a Linear Transformation)
最後,我們來看線性變換在對偶空間中所對應的概念。

定義: 令 \( V \) 與 \( W \) 為向量空間,且 \( T: V \to W \) 為線性變換。我們定義 \( T \) 的轉置 (transpose) \( T^t: W^* \to V^* \) 如下:對於每一個 \( g \in W^* \),

$$ T^t(g) = gT $$

也就是說,\( T^t(g) \) 是一個從 \( V \) 映至 \( F \) 的函數,其作用方式為 \( (T^t(g))(x) = g(T(x)) \) 對於所有 \( x \in V \)。

因為 \( g \) 與 \( T \) 皆為線性,它們的合成 \( gT \) 也是線性的。所以 \( T^t(g) \in V^* \)。這確保了 \( T^t \) 的定義是良好的。不難證明 \( T^t \) 本身也是一個線性變換。

下一個定理漂亮地解釋了為什麼這個變換被稱為「轉置」。它指出 \( T^t \) 的矩陣表示,恰好就是 \( T \) 的矩陣表示的轉置矩陣!

定理 2.27
令 \( V \) 與 \( W \) 為有限維向量空間,其有序基底分別為 \( \beta \) 與 \( \gamma \)。令 \( T: V \to W \) 為線性變換。那麼

$$ [T^t]_{\gamma^*}^{\beta^*} = ([T]_\beta^\gamma)^t $$

證明:
令 \( \beta = \{x_1, x_2, \dots, x_n\} \) 且 \( \gamma = \{y_1, y_2, \dots, y_m\} \)。令 \( \beta^* = \{f_1, f_2, \dots, f_n\} \) 與 \( \gamma^* = \{g_1, g_2, \dots, g_m\} \) 分別為它們的對偶基底。
設 \( A = [T]_\beta^\gamma \)。那麼 \( T(x_j) = \sum_{i=1}^m A_{ij} y_i \)。
設 \( B = [T^t]_{\gamma^*}^{\beta^*} \)。我們需要證明 \( B_{ji} = A_{ij} \)。
根據定義,

$$ T^t(g_i) = \sum_{k=1}^n B_{ki} f_k $$

我們將等式兩邊同時作用於向量 \( x_j \) 上:
左邊 \( = (T^t(g_i))(x_j) = g_i(T(x_j)) = g_i\left(\sum_{k=1}^m A_{kj} y_k\right) = \sum_{k=1}^m A_{kj} g_i(y_k) = \sum_{k=1}^m A_{kj} \delta_{ik} = A_{ij} \)
右邊 \( = \left(\sum_{k=1}^n B_{ki} f_k\right)(x_j) = \sum_{k=1}^n B_{ki} f_k(x_j) = \sum_{k=1}^n B_{ki} \delta_{kj} = B_{ji} \)
因此,我們得到 \( B_{ji} = A_{ij} \),這意味著 \( [T^t]_{\gamma^*}^{\beta^*} = A^t = ([T]_\beta^\gamma)^t \)。 \( \blacksquare \)

習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。在所有子題中,假設 \( V \) 與 \( W \) 皆為在體 \( F \) 上的有限維向量空間。
    (a) 每個向量空間都與其對偶空間同構。
    (b) 每個有限維向量空間都與其對偶空間同構。
    (c) 每個有限維向量空間都與其雙對偶空間 (double dual space) 同構。
    (d) 對於從 \( V \) 映至 \( W \) 的任何線性變換 \( T \),我們有 \( \text{rank}(T) = \text{rank}(T^t) \)。
    (e) 對於有限維向量空間的任何基底,存在唯一一個對應的對偶基底。
    (f) 如果 \( V \) 是一個有限維向量空間,那麼 \( \dim(V) = \dim(V^*) \)。
    (g) 對偶空間 \( V^* \) 的元素是從 \( F \) 映至 \( V \) 的線性變換。
  2. 令 \( V = \mathbb{R}^2 \),並令 \( \beta = \{(1, 1), (2, 3)\} \) 為 \( V \) 的一個有序基底。找出 \( \beta \) 的對偶基底 \( \beta^* = \{f_1, f_2\} \)。也就是說,請給出 \( f_1(x, y) \) 與 \( f_2(x, y) \) 的明確數學公式。
  3. 令 \( V = P_2(\mathbb{R}) \),並定義 \( f_1, f_2, f_3 \in V^* \) 如下:
    $$ f_1(p(x)) = \int_0^1 p(t) dt $$ $$ f_2(p(x)) = \int_0^2 p(t) dt $$ $$ f_3(p(x)) = \int_0^{-1} p(t) dt $$
    證明 \( \{f_1, f_2, f_3\} \) 是 \( V^* \) 的一個基底,並找出 \( V \) 的一個基底 \( \beta \) 使得其對偶基底為 \( \beta^* = \{f_1, f_2, f_3\} \)。
  4. 完成定理 2.25 的 (b) 部分證明:證明對於任何 \( f \in V^* \),我們有 \( f = \sum_{i=1}^n f(x_i)f_i \)。
  5. 令 \( V \) 與 \( W \) 為向量空間,且 \( T, U: V \to W \) 為線性變換。證明轉置變換滿足下列性質:
    (a) \( (T + U)^t = T^t + U^t \)
    (b) \( (cT)^t = cT^t \) 對於所有純量 \( c \)
    (c) 如果 \( V, W \) 與 \( Z \) 為向量空間,且 \( T: V \to W \) 與 \( U: W \to Z \) 為線性變換,證明 \( (UT)^t = T^t U^t \)。
  6. 令 \( V \) 為一個有限維向量空間,且 \( W \) 為 \( V \) 的子空間。我們定義 \( W \) 的零化子 (annihilator) \( W^0 \) 為:
    $$ W^0 = \{f \in V^* : f(x) = 0 \text{ 對於所有 } x \in W\} $$
    (a) 證明 \( W^0 \) 是 \( V^* \) 的子空間。
    (b) 證明 \( \dim(W) + \dim(W^0) = \dim(V) \)。
    提示:選擇 \( W \) 的一個基底 \( \{x_1, \dots, x_k\} \) 並將其擴充為 \( V \) 的基底 \( \beta = \{x_1, \dots, x_n\} \)。考慮 \( \beta \) 在 \( V^* \) 中的對偶基底 \( \beta^* \),並證明 \( \beta^* \) 中的最後 \( n - k \) 個泛函構成了 \( W^0 \) 的基底。
  7. 證明若 \( W_1 \) 與 \( W_2 \) 皆為有限維向量空間 \( V \) 的子空間,則下列關於零化子的性質成立:
    (a) \( (W_1 + W_2)^0 = W_1^0 \cap W_2^0 \)
    (b) \( (W_1 \cap W_2)^0 = W_1^0 + W_2^0 \)
  8. 令 \( V \) 與 \( W \) 為有限維向量空間,且 \( T: V \to W \) 為線性變換。證明轉置變換 \( T^t \) 的零空間與值域滿足下列關係:
    (a) \( N(T^t) = (R(T))^0 \)
    (b) \( R(T^t) = (N(T))^0 \)
    (c) 利用 (a) 與 (b) 以及維度定理,證明 \( \text{rank}(T) = \text{rank}(T^t) \)。
  9. 利用習題 8 的結果與定理 2.27,證明對於任何 \( m \times n \) 矩陣 \( A \),它的秩與其轉置矩陣的秩相等(亦即 \( \text{rank}(A) = \text{rank}(A^t) \))。這個結果證明了矩陣的「列秩 (row rank)」總是等於其「行秩 (column rank)」。
  10. 令 \( V \) 為一個有限維向量空間。在定理 2.26 中,我們定義了映射 \( \psi: V \to V^{**} \) 為 \( \psi(x) = \hat{x} \)。
    (a) 證明 \( \psi \) 是一個線性變換。
    (b) 證明 \( \psi \) 是一對一的。
    (因為 \( \dim(V) = \dim(V^{**}) \),這意味著 \( \psi \) 必定也是映成的,因此這是一個自然同構。)
  11. 令 \( V \) 為一個不一定是有限維的向量空間,並定義 \( \psi: V \to V^{**} \) 如同定理 2.26。證明 \( \psi \) 是一對一的。
    提示:利用 1.7 節(極大線性獨立子集)的結果,證明對於任何非零向量 \( x \in V \),必定存在一個線性泛函 \( f \in V^* \) 使得 \( f(x) \neq 0 \)。
  12. 令 \( W \) 為有限維向量空間 \( V \) 的子空間。我們可以用自然同構將 \( W \) 視為 \( V^{**} \) 的子空間。證明在這種等同視角下,\( (W^0)^0 = W \)。
  13. 在 \( P_n(\mathbb{R}) \) 中,給定 \( n+1 \) 個相異的實數 \( c_0, c_1, \dots, c_n \)。對於每一個 \( i = 0, 1, \dots, n \),定義 \( f_i \in (P_n(\mathbb{R}))^* \) 為 \( f_i(p(x)) = p(c_i) \)。
    (a) 證明 \( \{f_0, f_1, \dots, f_n\} \) 是 \( (P_n(\mathbb{R}))^* \) 的一個基底。
    (b) 這個基底的「前對偶基底 (pre-dual basis)」是什麼?(亦即,找出 \( P_n(\mathbb{R}) \) 中的一個基底 \( \beta \),使得 \( \beta^* = \{f_0, f_1, \dots, f_n\} \))。這與拉格朗日插值公式有著直接的關聯。

2.7* 具常係數的齊次線性微分方程式 (Homogeneous Linear Differential Equations with Constant Coefficients)

在微積分與物理學中,我們經常遇到需要尋找滿足某個包含其自身導數之方程式的函數。這類方程式被稱為微分方程式 (differential equations)。線性代數的技術,特別是關於線性變換的零空間與維度的理論,可以非常優雅地應用於求解一類特定的微分方程式。

我們考慮形式如下的微分方程式:

$$ y^{(n)} + a_{n-1}y^{(n-1)} + \dots + a_1 y' + a_0 y = 0 \quad (1) $$

其中 \( y \) 代表一個未知函數,\( y^{(k)} \) 代表 \( y \) 的第 \( k \) 階導數(\( y' = y^{(1)} \)),且 \( a_0, a_1, \dots, a_{n-1} \) 為給定的常數(實數或複數)。方程式 (1) 被稱為一個具常係數的 \( n \) 階齊次線性微分方程式 (homogeneous linear differential equation of order \( n \) with constant coefficients)

我們的目標是找出所有滿足方程式 (1) 的函數 \( y \)。為了確保函數具有各階導數,我們將注意力集中在函數空間 \( \mathcal{F}(\mathbb{R}, \mathbb{C}) \) 的一個子空間 \( C^\infty \) 上。\( C^\infty \) 是由所有定義在實數線 \( \mathbb{R} \) 上,且具有任意階連續導數的複數值函數所組成的向量空間。

定義一個線性算子 \( D: C^\infty \to C^\infty \) 為 \( D(y) = y' \)。我們將 \( D \) 稱為微分算子 (differential operator)。利用 \( D \),我們可以將方程式 (1) 重寫為算子的形式。令 \( I \) 為 \( C^\infty \) 上的恆等算子,並定義算子 \( L: C^\infty \to C^\infty \) 為:

$$ L = D^n + a_{n-1}D^{n-1} + \dots + a_1 D + a_0 I \quad (2) $$

因為 \( L \) 是線性算子 \( D \) 與 \( I \) 的線性組合與合成,\( L \) 本身也是 \( C^\infty \) 上的一個線性算子。對於任何函數 \( y \in C^\infty \),我們有

$$ L(y) = (D^n + a_{n-1}D^{n-1} + \dots + a_1 D + a_0 I)(y) = y^{(n)} + a_{n-1}y^{(n-1)} + \dots + a_1 y' + a_0 y $$

因此,函數 \( y \) 是方程式 (1) 的解,若且唯若 \( L(y) = 0 \)。換句話說,(1) 的所有解所構成的集合,正是線性算子 \( L \) 的零空間 (null space) \( N(L) \)。

因為線性變換的零空間必然是一個子空間,我們立即得到一個重要的結論:方程式 (1) 的所有解構成 \( C^\infty \) 的一個子空間。我們稱這個子空間為方程式 (1) 的解空間 (solution space)

為了解決「找出這個解空間基底」的問題,我們將線性算子 \( L \) 與一個多項式聯繫起來。

定義: 對於給定的微分算子 \( L \)(如方程式 (2) 所示),我們定義其輔助多項式 (auxiliary polynomial) 或稱特徵多項式 (characteristic polynomial) \( p(t) \) 為:

$$ p(t) = t^n + a_{n-1}t^{n-1} + \dots + a_1 t + a_0 $$

請注意,\( L \) 可以被簡潔地寫成 \( p(D) \)。代數基本定理告訴我們,這個多項式的根將會給出解空間的關鍵資訊。

一階方程式
讓我們先從最簡單的 \( n=1 \) 情況開始:

$$ y' - cy = 0 \quad \text{或} \quad (D - cI)(y) = 0 $$

其中 \( c \) 是一個常數。這等價於解微分方程式 \( y' = cy \)。由微積分的知識可知,這個方程式的解具有形式 \( y(t) = k e^{ct} \),其中 \( k \) 是任意純量常數。因此,解空間是一維的,且以函數 \( e^{ct} \) 為基底。

定理 2.32 令 \( p(t) \) 為對應於線性微分算子 \( L \) 的輔助多項式。如果 \( p(t) \) 在複數體中可以完全分解為線性因式的乘積:

$$ p(t) = (t - c_1)(t - c_2) \dots (t - c_n) $$

那麼算子 \( L \) 可以被分解為:

$$ L = (D - c_1 I)(D - c_2 I) \dots (D - c_n I) $$

並且這些因式算子的順序可以任意交換。

定理 2.33 給定微分方程式 (1),假設其輔助多項式 \( p(t) \) 具有 \( n \) 個相異的根 \( c_1, c_2, \dots, c_n \)。那麼函數集合

$$ \{e^{c_1 t}, e^{c_2 t}, \dots, e^{c_n t}\} $$

是該微分方程式解空間的一個基底。因此,解空間的維度恰為 \( n \)。

證明:
我們首先證明對於每一個 \( i = 1, 2, \dots, n \),\( y = e^{c_i t} \) 都是方程式的解。因為定理 2.32 保證了算子的乘積是可交換的,我們可以將 \( L \) 寫成 \( L = Q(D - c_i I) \),其中 \( Q \) 是其餘 \( n-1 \) 個因式的乘積算子。
因為 \( (D - c_i I)(e^{c_i t}) = c_i e^{c_i t} - c_i e^{c_i t} = 0 \),所以 \( L(e^{c_i t}) = Q(0) = 0 \)。因此這 \( n \) 個函數皆包含在解空間 \( N(L) \) 中。
接下來,我們必須證明這些函數是線性獨立的。這可以透過對 \( n \) 進行數學歸納法來嚴格證明。因為我們有 \( n \) 個線性獨立的解,且可以證明任何 \( n \) 階線性微分方程式的解空間維度必然為 \( n \)(這需要存在唯一性定理的輔助,此處將其視為已知),所以這 \( n \) 個函數必定構成解空間的基底。 \( \blacksquare \)

範例 1
考慮二階微分方程式 \( y'' - 3y' + 2y = 0 \)。
其對應的輔助多項式為 \( p(t) = t^2 - 3t + 2 = (t - 1)(t - 2) \)。
多項式的根為 \( c_1 = 1 \) 與 \( c_2 = 2 \)。這兩個根是相異的。根據定理 2.33,解空間的基底為 \( \{e^t, e^{2t}\} \)。因此,方程式的一般解 (general solution) 可表為所有解的線性組合:

$$ y(t) = k_1 e^t + k_2 e^{2t} $$

其中 \( k_1 \) 與 \( k_2 \) 為任意常數。

當輔助多項式有「重根」時,情況會稍微複雜一些。假設 \( c \) 是多項式的一個 \( m \) 重根。那麼因式 \( (t - c)^m \) 會出現在 \( p(t) \) 中,對應的微分算子為 \( (D - cI)^m \)。為了補足維度,我們需要找到 \( m \) 個對應於這個重根的線性獨立解。

定理 2.34 如果常數 \( c \) 是輔助多項式 \( p(t) \) 的一個 \( m \) 重根,那麼下列 \( m \) 個函數:

$$ e^{ct}, t e^{ct}, t^2 e^{ct}, \dots, t^{m-1} e^{ct} $$

皆為微分方程式 \( L(y) = 0 \) 的線性獨立解。

綜合定理 2.33 與 2.34,我們得到了求解任何「具常係數齊次線性微分方程式」解空間基底的完整演算法:
找出輔助多項式的所有根及其重數 (multiplicity)。對於每一個 \( m \) 重根 \( c \),將 \( \{e^{ct}, t e^{ct}, \dots, t^{m-1} e^{ct}\} \) 加入基底中。所有這些函數集合的聯集,將會無遺漏地構成整個解空間的一個基底,且解空間的維度恰好等於 \( n \)(方程式的最高階數)。

範例 2
考慮三階微分方程式 \( y''' - 3y'' + 3y' - y = 0 \)。
輔助多項式為 \( p(t) = t^3 - 3t^2 + 3t - 1 = (t - 1)^3 \)。
我們解得一個三重根 \( c = 1 \)(即重數 \( m = 3 \))。
因此,解空間的基底為 \( \{e^t, t e^t, t^2 e^t\} \)。其一般解為這三者的線性組合:

$$ y(t) = k_1 e^t + k_2 t e^t + k_3 t^2 e^t $$

這個應用完美地展示了線性代數中「基底 (basis)」與「維度 (dimension)」的強大概念,是如何被用來將微分方程式的解結構化。從線性代數的視角來看,求解微分方程式不過就是在尋找一個特定微分算子的零空間基底而已。

習題 (Exercises)

  1. 將下列敘述標示為真 (True) 或假 (False)。
    (a) 每個具常係數的 \( n \) 階齊次線性微分方程式的解集合,皆為 \( C^\infty \) 的一個 \( n \) 維子空間。
    (b) 具常係數的齊次線性微分方程式的解空間,是某個線性微分算子的零空間。
    (c) 具常係數的齊次線性微分方程式的輔助多項式 (auxiliary polynomial),必定是一個具有實數係數的多項式。
    (d) 任何一個微分算子都是一個線性算子。
    (e) 如果一個具有常係數的齊次線性微分方程式之輔助多項式有重根 \( c \),那麼任何形式為 \( t^k e^{ct} \)(其中 \( k \) 為非負整數)的函數必定是該方程式的解。
    (f) 任何具常係數的齊次線性微分方程式的解,都可以寫成形式為 \( e^{ct} \) 或 \( t^k e^{ct} \) 的函數之線性組合。
  2. 找出下列各微分方程式之解空間的基底:
    (a) \( y'' - 5y' + 6y = 0 \)
    (b) \( y''' - 4y'' + 4y' = 0 \)
    (c) \( y'' - 4y' + 4y = 0 \)
    (d) \( y''' + 2y'' + y' = 0 \)
    (e) \( y^{(4)} - 2y^{(2)} + y = 0 \)
    (f) \( y'' + 4y = 0 \)
    (g) \( y'' - 2y' + 2y = 0 \)
  3. 找出下列各微分方程式之解空間的基底,其中假定函數為實值函數:
    (a) \( y'' - 4y' + 5y = 0 \)
    (b) \( y'' - 2y' + 5y = 0 \)
    (c) \( y''' + y' = 0 \)
    (d) \( y^{(4)} + 2y^{(2)} + y = 0 \)
  4. 求解下列的初值問題 (initial value problems)
    (a) \( y'' - 4y' + 3y = 0 \) 且滿足 \( y(0) = 1, y'(0) = 1 \)
    (b) \( y'' - 6y' + 9y = 0 \) 且滿足 \( y(0) = 2, y'(0) = 0 \)
    (c) \( y'' + 4y = 0 \) 且滿足 \( y(0) = 1, y'(0) = 4 \)
    (d) \( y''' - y'' - y' + y = 0 \) 且滿足 \( y(0) = 1, y'(0) = 2, y''(0) = 3 \)
  5. 令 \( L \) 為一個具有純量體 \( F \) 的 \( n \) 階線性微分算子,且令 \( p(t) \) 為其輔助多項式。證明 \( L(e^{ct}) = p(c)e^{ct} \) 對於所有的 \( c \in F \) 皆成立。
  6. 利用習題 5 的結果證明:如果 \( c \) 是輔助多項式 \( p(t) \) 的一個根,那麼 \( y(t) = e^{ct} \) 是 \( L(y) = 0 \) 的一個解。
  7. 證明定理 2.32:如果輔助多項式可以分解為 \( p(t) = (t - c_1)(t - c_2) \dots (t - c_n) \),那麼算子 \( L \) 可以分解為 \( L = (D - c_1 I)(D - c_2 I) \dots (D - c_n I) \),且這些因式可以任意對調。
  8. 證明若 \( f_1, f_2, \dots, f_k \in C^\infty \) 是線性獨立的,那麼 \( \{e^{ct} f_1, e^{ct} f_2, \dots, e^{ct} f_k\} \) 也是線性獨立的。利用此結果來證明定理 2.34。

下列習題介紹了朗斯基行列式 (Wronskian) 的重要概念,用於判定函數的線性獨立性。

  1. 定義: 令 \( f_1, f_2, \dots, f_n \) 為 \( C^\infty \) 中的 \( n \) 個函數。我們定義這 \( n \) 個函數的朗斯基行列式 (Wronskian) \( W(f_1, f_2, \dots, f_n)(t) \) 為下列 \( n \times n \) 矩陣的行列式:
    $$ W(f_1, f_2, \dots, f_n)(t) = \det \begin{pmatrix} f_1(t) & f_2(t) & \dots & f_n(t) \\ f_1'(t) & f_2'(t) & \dots & f_n'(t) \\ \vdots & \vdots & \ddots & \vdots \\ f_1^{(n-1)}(t) & f_2^{(n-1)}(t) & \dots & f_n^{(n-1)}(t) \end{pmatrix} $$
    證明:如果存在某個 \( t_0 \in \mathbb{R} \) 使得 \( W(f_1, f_2, \dots, f_n)(t_0) \neq 0 \),那麼函數集合 \( \{f_1, f_2, \dots, f_n\} \) 是線性獨立的。
  2. 令 \( c_1, c_2, \dots, c_n \) 為相異的實數。令 \( f_i(t) = e^{c_i t} \) 對於 \( i = 1, 2, \dots, n \)。
    (a) 證明 \( W(f_1, f_2, \dots, f_n)(t) = e^{(c_1 + c_2 + \dots + c_n)t} \det(V) \),其中 \( V \) 是一個范德蒙矩陣 (Vandermonde matrix),其定義為 \( V_{ij} = (c_j)^{i-1} \)。
    (b) 利用范德蒙行列式的性質(在後續章節會詳細討論,或可直接套用其不為零的性質),推導出 \( W(f_1, f_2, \dots, f_n)(t) \) 處處不為零。
    (c) 結合習題 9 與 (b) 的結果,提供定理 2.33(即相異根對應之指數函數的線性獨立性)的另一種證明方式。
  3. 考慮微分方程式 \( y'' - y = 0 \)。
    (a) 找出此方程式解空間的基底。
    (b) 證明函數 \( \cosh(t) = \frac{e^t + e^{-t}}{2} \) 與 \( \sinh(t) = \frac{e^t - e^{-t}}{2} \) 也是此解空間的基底。
    (c) 找出從 (a) 中找出的基底映射到 (b) 中基底的座標轉換矩陣。
  4. 假設我們希望找到一個滿足非齊次 (nonhomogeneous) 微分方程式 \( L(y) = g(t) \) 的解,其中 \( L \) 是一個具常係數的線性微分算子,而 \( g(t) \) 是給定的連續函數。
    (a) 證明如果 \( y_p(t) \) 是此方程式的一個特解 (particular solution),且 \( y_h(t) \) 是對應的齊次方程式 \( L(y) = 0 \) 的任何一個解,那麼 \( y_p(t) + y_h(t) \) 也是 \( L(y) = g(t) \) 的解。
    (b) 證明 \( L(y) = g(t) \) 的解集合可以寫成 \( y_p + N(L) = \{y_p + y : y \in N(L)\} \) 的形式。

第 2 章 定義索引 (INDEX OF DEFINITIONS FOR CHAPTER 2)

  • 零化子 (Annihilator)
  • 輔助多項式 / 特徵多項式 (Auxiliary polynomial / Characteristic polynomial)
  • 座標轉換矩陣 (Change of coordinate matrix)
  • 座標函數 (Coordinate function)
  • 座標向量 (Coordinate vector)
  • 微分方程式 (Differential equation)
  • 微分算子 (Differential operator)
  • 雙對偶空間 / 二階對偶空間 (Double dual space)
  • 對偶基底 (Dual basis)
  • 對偶空間 (Dual space)
  • 恆等變換 (Identity transformation)
  • 單位矩陣 (Identity matrix)
  • 反矩陣 (Inverse of a matrix)
  • 反函數 / 逆變換 (Inverse of a linear transformation)
  • 可逆矩陣 (Invertible matrix)
  • 可逆線性變換 (Invertible linear transformation)
  • 同構 (Isomorphic / Isomorphism)
  • 克羅內克 \( \delta \) (Kronecker delta)
  • 左乘變換 (Left-multiplication transformation)
  • 線性泛函 (Linear functional)
  • 線性變換 (Linear transformation)
  • 矩陣表示 (Matrix representation)
  • 零度 (Nullity)
  • 零空間 (Null space)
  • 有序基底 (Ordered basis)
  • 投影 (Projection)
  • 值域 (Range)
  • 秩 (Rank)
  • 鏡射 (Reflection)
  • 旋轉 (Rotation)
  • 相似矩陣 (Similar matrices)
  • 標準表示 (Standard representation)
  • 線性變換的轉置 (Transpose of a linear transformation)
  • 零變換 (Zero transformation)

第二章 集合論的一些基本概念

2.1 簡介

在討論數學的任何分支時,使用集合論的符號和術語都是很有幫助的。這門學科由布林(Boole)和康托爾(Cantor)在 19 世紀後半葉發展起來,對 20 世紀數學的發展產生了深遠的影響。它將許多看似無關的概念統一起來,並以優雅且系統化的方式,幫助將許多數學概念簡化至其邏輯基礎。

我們不會試圖對集合論進行系統性的處理,而是僅限於討論一些更基本的概念。希望進一步探索該主題的讀者可以參考本章末尾的參考文獻。

將一組物件視為單一實體的收集將被稱為「集合(set)」。該收集中的物件將被稱為集合的「元素(elements)」或「成員(members)」,並說它們「屬於(belong to)」或「包含於(be contained in)」該集合。反過來,集合將被說成「包含(contain)」或「由其元素組成(be composed of)」。在大多數情況下,我們感興趣的是數學物件的集合;也就是說,數字、點、函數、曲線等物件的集合。然而,由於集合論的許多內容並不依賴於收集中個別物件的性質,因此透過討論其元素可以是任何種類物件的集合,我們在思維上獲得了極大的精簡。正是因為這種一般性的特質,集合論在推動數學發展方面才有了如此強大的影響力。

2.2 符號

集合通常用大寫字母表示:
$A, B, C, ..., X, Y, Z$
而元素用小寫字母表示:$a, b, c, ..., x, y, z$。我們寫作 $x \in S$ 來表示「x 是 S 的一個元素」或「x 屬於 S」。如果 x 不屬於 S,我們寫作 $x \notin S$。我們有時透過在大括號中顯示元素來指定集合;例如,小於 10 的正偶數集合記為 $\{2, 4, 6, 8\}$。如果 S 是所有滿足性質 P 的 x 的收集,我們藉由寫出以下符號來簡要地表示:
$S = \{x : x \text{ 滿足 } P\}$

從一個給定的集合中,我們可以形成新的集合,稱為給定集合的「子集(subsets)」。例如,由小於 10 且可被 4 整除的正整數所組成的集合,即 $\{4, 8\}$,是小於 10 的偶數集合的子集。一般來說,我們說集合 A 是 B 的一個子集,並寫作 $A \subseteq B$,只要 A 的每一個元素也屬於 B。陳述 $A \subseteq B$ 並不排除 $B \subseteq A$ 的可能性。事實上,我們同時有 $A \subseteq B$ 和 $B \subseteq A$ 若且唯若 A 和 B 具有相同的元素。在這種情況下,我們將稱集合 A 和 B 相等,並寫作 $A = B$。如果 A 和 B 不相等,我們寫作 $A \ne B$。如果 $A \subseteq B$ 但 $A \ne B$,那麼我們說 A 是 B 的一個「真子集(proper subset)」。

考慮一個不包含任何元素的集合是方便的;這個集合被稱為「空集合(empty set)」,我們同意稱其為每一個集合的子集。讀者可能會發現將集合想像為一個包含某些物件(其元素)的盒子會有所幫助。那麼空集合就是一個空盒子。我們用符號 $\emptyset$ 來表示空集合。

2.3 有序對

假設我們有一個由兩個元素 a 和 b 組成的集合;也就是集合 $\{a, b\}$。根據我們對相等的定義,這個集合與集合 $\{b, a\}$ 是相同的,因為不涉及順序問題。然而,也有必要考慮順序很重要的兩個元素的集合。例如,在平面的解析幾何中,點的座標 $(x, y)$ 代表一對有序的數字。點 $(3, 4)$ 與點 $(4, 3)$ 是不同的,而集合 $\{3, 4\}$ 則與集合 $\{4, 3\}$ 相同。當我們希望將兩個元素 a 和 b 的集合視為有順序時,我們將把元素括在括號中:$(a, b)$。那麼 a 稱為第一個元素,b 稱為第二個元素。給出有序對物件 $(a, b)$ 概念的純集合論定義是可能的。其中一個定義如下:
定義 2.1. $(a, b) = \{\{a\}, \{a, b\}\}$。

這個定義指出 $(a, b)$ 是一個包含兩個元素的集合,即 $\{a\}$ 和 $\{a, b\}$。使用這個定義,我們可以證明以下定理:
定理 2.2. $(a, b) = (c, d)$ 若且唯若 $a = c$ 且 $b = d$。
這個定理表明定義 2.1 是一個「合理」的有序對定義,意思是物件 a 已經與物件 b 區分開來。定理 2.2 的證明是一個有益的習題。(參見習題 2.1。)

2.4 兩個集合的笛卡兒乘積 (Cartesian Product)

定義 2.3. 給定兩個集合 A 和 B,所有使得 $a \in A$ 且 $b \in B$ 的有序對 $(a, b)$ 所組成的集合,被稱為 A 和 B 的笛卡兒乘積,並記為 $A \times B$。

例子。如果 R 表示所有實數的集合,那麼 $R \times R$ 就是所有複數的集合。

2.5 關係與函數 (Relations and Functions)

令 x 和 y 表示實數,使得有序對 $(x, y)$ 可以被認為代表 xy 平面上一個點(或一個複數)的直角座標。我們經常會遇到像這樣的表達式
$xy = 1$,
$x^2 + y^2 = 1$,
$x^2 + y^2 \le 1$,
$x < y$.
這些表達式中的每一個都定義了實數有序對 $(x, y)$ 的某個集合,也就是所有滿足該表達式的對 $(x, y)$ 所組成的集合。這樣的一個有序對集合被稱為「平面關係(plane relation)」。在 xy 平面上繪製出的對應點集合被稱為該關係的「圖形(graph)」。

「關係」的概念可以相當一般化地闡述,使得對 $(x, y)$ 中的物件 x 和 y 不必是數字,而可以是任何種類的物件。
定義 2.4. 任何有序對的集合都被稱為關係。

如果 S 是一個關係,在 S 中的對 $(x, y)$ 作為第一個成員出現的所有元素 x 的集合被稱為 S 的「定義域(domain)」,記為 $\mathfrak{D}(S)$。第二個成員 y 的集合被稱為 S 的「值域(range)」,記為 $\mathfrak{R}(S)$。

像方程式 $xy=1$ 這樣定義的關係是一種稱為「函數(function)」的特殊關係。
定義 2.5. 函數 F 是一個有序對 $(x, y)$ 的集合,其中沒有任何兩個有序對具有相同的第一個成員。也就是說,如果 $(x, y) \in F$ 且 $(x, z) \in F$,那麼 $y = z$。

函數的定義要求,對於 F 的定義域中的每一個 x,都恰好存在一個 y 使得 $(x, y) \in F$。我們習慣稱 y 為 F 在 x 的「值(value)」,並寫成
$y = F(x)$
而不是 $(x, y) \in F$ 來表示對 $(x, y)$ 在集合 F 中。

除了藉由指定函數 F 包含的有序對來描述函數之外,通常更好的做法是描述 F 的定義域,然後對於定義域中的每個 x,描述函數值 $F(x)$ 是如何取得的。在這方面,我們有以下定理,其證明留作練習。

定理 2.6. 兩個函數 F 和 G 相等若且唯若:
a) $\mathfrak{D}(F) = \mathfrak{D}(G)$ (F 和 G 具有相同的定義域),並且
b) 對於 $\mathfrak{D}(F)$ 中的每一個 x,都有 $F(x) = G(x)$。

2.6 關於函數的進一步術語

當定義域 $\mathfrak{D}(F)$ 是 R 的一個子集時,F 被稱為一個實變數的函數(function of one real variable)。如果 $\mathfrak{D}(F)$ 是 C(複數系統)的一個子集,那麼 F 被稱為複變函數(function of a complex variable)。

如果 $\mathfrak{D}(F)$ 是笛卡兒乘積 $A \times B$ 的一個子集,那麼 F 被稱為雙變數函數(function of two variables)。在這種情況下,我們將函數值記為 $F(a, b)$ 而不是 $F((a, b))$。一個兩個實變數的函數是指其定義域為 $R \times R$ 子集的函數。

如果 S 是 $\mathfrak{D}(F)$ 的一個子集,我們說 F 定義在 S 上。在這種情況下,使得 $x \in S$ 的 $F(x)$ 的集合被稱為 S 在 F 下的「像(image)」,並記為 $F(S)$。如果 T 是任何包含 $F(S)$ 的集合,那麼 F 也被稱為從 S 到 T 的一個「映射(mapping)」。這通常藉由寫出
$F : S \rightarrow T$
來表示。如果 $F(S) = T$,該映射被說成是「映成(onto)」T。S 到自身的映射有時稱為「轉換(transformation)」。

例如,考慮由方程式 $F(z) = z^2$ 定義的複變函數。這個函數將複數 z 平面上形式為 $0 \le \arg(z) \le \alpha \le \pi/2$ 的每一個扇形 S 映射到由不等式 $0 \le \arg[F(z)] \le 2\alpha$ 所描述的扇形 $F(S)$ 上。

如果兩個函數 F 和 G 滿足包含關係 $G \subseteq F$,我們說 G 是 F 的「限制(restriction)」或 F 是 G 的「擴張(extension)」。特別是,如果 S 是 $\mathfrak{D}(F)$ 的一個子集,並且如果 G 由方程式
$G(x) = F(x)$ 對於所有 S 中的 x
所定義,那麼我們稱 G 為 F 到 S 的限制。該函數 G 由那些使得 $x \in S$ 的對 $(x, F(x))$ 組成。它的定義域是 S 且它的值域是 $F(S)$。

2.7 一對一函數與反函數 (One-to-one Functions and Inverses)

定義 2.7. 令 F 為定義在 S 上的一個函數。我們說 F 在 S 上是「一對一的(one-to-one)」,若且唯若對於 S 中的每一個 x 和 y,
$F(x) = F(y)$ 蘊含 $x = y$。

這等同於說,在 S 上一對一的函數會將不同的函數值分配給 S 中不同的成員。這樣的函數也被稱為單射(injective)。它們很重要,因為正如我們馬上就會看到的,它們具有反函數。然而,在陳述反函數的定義之前,先引入一個更一般的概念,即「反關係(converse of a relation)」的概念是很方便的。

定義 2.8. 給定一個關係 S,由以下所定義的新關係 $\tilde{S}$:
$\tilde{S} = \{(a, b) : (b, a) \in S\}$
被稱為 S 的反關係。

因此,一個有序對 $(a, b)$ 屬於 $\tilde{S}$ 若且唯若元素互換後的對 $(b, a)$ 屬於 S。當 S 是一個平面關係時,這僅僅意味著 $\tilde{S}$ 的圖形是 S 的圖形關於直線 $y = x$ 的反射。在由 $x < y$ 定義的關係中,其反關係由 $y < x$ 所定義。

定義 2.9. 假設關係 F 是一個函數。考慮其反關係 $\tilde{F}$,它可能是一個函數,也可能不是。如果 $\tilde{F}$ 也是一個函數,那麼 $\tilde{F}$ 被稱為 F 的「反函數(inverse)」,並記為 $F^{-1}$。

下一個定理告訴我們,在其定義域上一對一的函數總是具有反函數。

定理 2.10. 如果函數 F 在其定義域上是一對一的,那麼 $\tilde{F}$ 也是一個函數。
證明. 為了證明 $\tilde{F}$ 是一個函數,我們必須證明如果 $(x, y) \in \tilde{F}$ 且 $(x, z) \in \tilde{F}$,那麼 $y = z$。但是 $(x, y) \in \tilde{F}$ 意味著 $(y, x) \in F$;也就是說,$x = F(y)$。類似地,$(x, z) \in \tilde{F}$ 意味著 $x = F(z)$。因此 $F(y) = F(z)$,而且由於我們假設 F 是一對一的,這蘊含了 $y = z$。因此,$\tilde{F}$ 是一個函數。

註:相同的論證顯示,如果 F 在 $\mathfrak{D}(F)$ 的一個子集 S 上是一對一的,那麼 F 到 S 的限制具有一個反函數。

2.8 合成函數 (Composite Functions)

定義 2.11. 給定兩個函數 F 和 G,使得 $\mathfrak{R}(F) \subseteq \mathfrak{D}(G)$,我們可以形成一個新函數,即 G 和 F 的合成 $G \circ F$,定義如下:對於 F 定義域中的每一個 x,$(G \circ F)(x) = G[F(x)]$。

由於 $\mathfrak{R}(F) \subseteq \mathfrak{D}(G)$,元素 $F(x)$ 在 G 的定義域中,因此考慮 $G[F(x)]$ 是有意義的。一般來說,$G \circ F = F \circ G$ 並不成立。事實上,$F \circ G$ 可能是沒有意義的,除非 G 的值域包含在 F 的定義域中。然而,結合律
$H \circ (G \circ F) = (H \circ G) \circ F$
只要方程式的兩邊都有意義,就總是成立的。(驗證這一點對讀者來說將是一個有趣的習題。參見習題 2.4。)

2.9 數列 (Sequences)

在定義於整數子集上的函數中,有幾個重要的例子。
定義 2.12. 所謂 n 項的有限數列,我們指的是一個定義域為數字集合 $\{1, 2, ..., n\}$ 的函數 F。
F 的值域是集合 $\{F(1), F(2), F(3), ..., F(n)\}$,習慣上寫作 $\{F_1, F_2, F_3, ..., F_n\}$。值域的元素稱為數列的「項(terms)」,當然,它們可以是任何種類的任意物件。

定義 2.13. 所謂無窮數列,我們指的是一個定義域為所有正整數集合 $\{1, 2, 3, ...\}$ 的函數 F。F 的值域,也就是集合 $\{F(1), F(2), F(3), ...\}$,也寫作 $\{F_1, F_2, F_3, ...\}$,且函數值 $F_n$ 被稱為數列的第 n 項。

為了簡潔起見,我們經常使用符號 $\{F_n\}$ 來表示第 n 項為 $F_n$ 的無窮數列。
令 $S = \{s_n\}$ 為一個無窮數列,並令 k 是一個定義域為正整數集合、值域為正整數子集的函數。假設 k 是「保序的(order-preserving)」,也就是說,假設
$k(m) < k(n)$,如果 $m < n$。
那麼合成函數 $s \circ k$ 對於所有整數 $n \ge 1$ 都有定義,並且對於每一個這樣的 n,我們有
$(s \circ k)(n) = s_{k(n)}$
這樣的一個合成函數被稱為 s 的一個「子數列(subsequence)」。同樣地,為了簡潔,我們經常使用符號 $\{s_{k(n)}\}$ 或 $\{s_{k_n}\}$ 來表示 $\{s_n\}$ 的這個第 n 項為 $s_{k(n)}$ 的子數列。
例子。令 $s = \{1/n\}$ 並令 k 定義為 $k(n) = 2^n$。那麼 $s \circ k = \{1/2^n\}$。

2.10 對等(等勢)集合 (Similar (Equinumerous) Sets)

定義 2.14. 兩個集合 A 和 B 被稱為相似或等勢的(similar, or equinumerous),且我們寫作
$A \sim B$
若且唯若存在一個一對一函數 F,其定義域為集合 A,值域為集合 B。

我們也說 F 在集合 A 和 B 之間建立了一對一的對應關係。顯然,每一個集合 A 都與其自身相似(取 F 為「恆等」函數,使得對於所有 A 中的 x,$F(x) = x$)。此外,如果 $A \sim B$,那麼 $B \sim A$,因為如果 F 是一個使 A 與 B 相似的一對一函數,那麼 $F^{-1}$ 就會使 B 與 A 相似。同樣地,如果 $A \sim B$ 且 $B \sim C$,那麼 $A \sim C$。

2.11 有限與無限集合 (Finite and Infinite Sets)

一個集合 S 被稱為有限的(finite),並且被說成包含 n 個元素,如果
$S \sim \{1, 2, ..., n\}$。
整數 n 被稱為 S 的基數(cardinal number)。證明如果 $\{1, 2, ..., n\} \sim \{1, 2, ..., m\}$ 那麼 $m = n$ 是一個簡單的練習。因此,有限集合的基數是良好定義的。空集合也被認為是有限的。它的基數被定義為 0。

非有限的集合被稱為無限集合(infinite sets)。兩者之間主要的差異在於,無限集合必然與其本身的某個真子集相似,而有限集合不可能與其本身的任何真子集相似。例如,所有正整數的集合 $Z^+$ 與由 2 的次方組成的真子集 $\{2, 4, 8, 16, ...\}$ 是相似的。使它們相似的一對一函數 F 由對於 $Z^+$ 中的每一個 x,$F(x) = 2^x$ 來定義。

2.12 可數與不可數集合 (Countable and Uncountable Sets)

一個集合 S 如果與所有正整數的集合等勢,則被稱為可數無限的(countably infinite);也就是說,如果
$S \sim \{1, 2, 3, ...\}$。
在這種情況下,存在一個函數 f 在正整數與 S 的元素之間建立了一對一的對應關係;因此集合 S 可以如下展示:
$S = \{f(1), f(2), f(3), ...\}$
我們經常使用下標並將 $f(k)$ 記為 $a_k$(或類似符號),然後寫作 $S = \{a_1, a_2, a_3, ...\}$。這裡重要的是,這個對應關係使我們能夠使用正整數作為 S 中元素的「標籤(labels)」。一個可數無限的集合被說成具有基數 $\aleph_0$(讀作:aleph nought)。

定義 2.15. 一個集合 S 被稱為「可數的(countable)」,如果它是有限的或是可數無限的。一個不可數的集合被稱為「不可數的(uncountable)」。

定理 2.16. 可數集合的每一個子集都是可數的。
證明. 令 S 為給定的可數集合,並假設 $A \subseteq S$。如果 A 是有限的,就沒有什麼需要證明的了,所以我們可以假設 A 是無限的(這意味著 S 也是無限的)。令 $S = \{s_n\}$ 是一個具有不同項的無窮數列,使得
$S = \{s_1, s_2, ...\}$
在正整數上定義一個函數如下:
令 $k(1)$ 為使得 $s_m \in A$ 的最小正整數 m。假設 $k(1), k(2), ..., k(n-1)$ 已經被定義,令 $k(n)$ 為使得 $s_m \in A$ 的最小正整數 $m > k(n-1)$。那麼 k 是保序的:$m > n$ 蘊含 $k(m) > k(n)$。形成合成函數 $s \circ k$。$s \circ k$ 的定義域是正整數集合,而 $s \circ k$ 的值域是 A。此外,$s \circ k$ 是一對一的,因為
$s[k(n)] = s[k(m)]$
蘊含
$s_{k(n)} = s_{k(m)}$,
這蘊含 $k(n) = k(m)$,而這又蘊含 $n = m$。這證明了本定理。

2.13 實數系統的不可數性

下一個定理表明存在著不可數的無限集合。
定理 2.17. 所有實數的集合是不可數的。
證明. 我們只需證明滿足 $0 < x < 1$ 的 x 的集合是不可數的即可。如果這個區間內的實數是可數的,那麼就會有一個數列 $s = \{s_n\}$,其各項構成了整個區間。我們將藉由在該區間內構造一個不是這個數列中的項的實數,來證明這是不可能的。將每一個 $s_n$ 寫成無限小數:
$s_n = 0.u_{n,1}u_{n,2}u_{n,3}...$
其中每個 $u_{n,i}$ 是 $0, 1, ..., $ 或 9。考慮具有以下小數展開式的實數 y
$y = 0.v_1v_2v_3...$
其中
$v_n = \begin{cases} 1, & \text{如果 } u_{n,n} \ne 1, \\ 2, & \text{如果 } u_{n,n} = 1. \end{cases}$
那麼數列 $\{s_n\}$ 中的任何項都不可能等於 y,因為 y 在第一位小數上與 $s_1$ 不同,在第二位小數上與 $s_2$ 不同,...,在第 n 位小數上與 $s_n$ 不同。(像 $s_n = 0.1999...$ 和 $y = 0.2000...$ 這樣的情況在這裡不可能發生,因為 $v_n$ 的選取方式。)由於 $0 < y < 1$,定理得證。

定理 2.18. 令 $Z^+$ 表示所有正整數的集合。那麼笛卡兒乘積 $Z^+ \times Z^+$ 是可數的。
證明. 在 $Z^+ \times Z^+$ 上定義一個函數 f 如下:
如果 $(m, n) \in Z^+ \times Z^+$,則 $f(m, n) = 2^m 3^n$。
那麼 f 在 $Z^+ \times Z^+$ 上是一對一的,且 f 的值域是 $Z^+$ 的一個子集。

2.14 集合代數 (Set Algebra)

給定兩個集合 $A_1$ 和 $A_2$,我們定義一個新集合,稱為 $A_1$ 和 $A_2$ 的聯集,記為 $A_1 \cup A_2$,如下所示:
定義 2.19. 聯集 $A_1 \cup A_2$ 是由那些屬於 $A_1$ 或屬於 $A_2$ 或同時屬於兩者的元素所組成的集合。

這等於說 $A_1 \cup A_2$ 由那些至少屬於集合 $A_1$、$A_2$ 其中之一的元素所組成。因為在這個定義中不涉及順序問題,所以聯集 $A_1 \cup A_2$ 與 $A_2 \cup A_1$ 是相同的;也就是說,集合的加法滿足交換律。該定義的措辭也使得集合的加法滿足結合律:
$A_1 \cup (A_2 \cup A_3) = (A_1 \cup A_2) \cup A_3$。

聯集的定義可以擴展到任何有限或無限的集合收集:
定義 2.20. 如果 F 是一個任意的集合收集,那麼 F 中所有集合的聯集被定義為由那些至少屬於 F 中的一個集合的元素所組成的集合,並記為
$\bigcup_{A \in F} A$。
如果 F 是一個有限的集合收集,$F = \{A_1, ..., A_n\}$,我們寫作
$\bigcup_{A \in F} A = \bigcup_{k=1}^n A_k = A_1 \cup A_2 \cup \cdot\cdot\cdot \cup A_n$。
如果 F 是一個可數收集,$F = \{A_1, A_2, ...\}$,我們寫作
$\bigcup_{A \in F} A = \bigcup_{k=1}^{\infty} A_k = A_1 \cup A_2 \cup \cdot\cdot\cdot$

定義 2.21. 如果 F 是一個任意的集合收集,F 中所有集合的交集被定義為由那些屬於 F 中的每一個集合的元素所組成的集合,並記為
$\bigcap_{A \in F} A$。
兩個集合 $A_1$ 和 $A_2$ 的交集記為 $A_1 \cap A_2$,並由那些兩集合所共有的元素組成。如果 $A_1$ 和 $A_2$ 沒有共同的元素,那麼 $A_1 \cap A_2$ 就是空集合,且 $A_1$ 和 $A_2$ 被稱為「互斥的(disjoint)」。如果 F 是一個有限收集(如上),我們寫作
$\bigcap_{A \in F} A = \bigcap_{k=1}^n A_k = A_1 \cap A_2 \cap \cdot\cdot\cdot \cap A_n$
而如果 F 是一個可數收集,我們寫作
$\bigcap_{A \in F} A = \bigcap_{k=1}^{\infty} A_k = A_1 \cap A_2 \cap \cdot\cdot\cdot$

如果收集中的集合沒有共同的元素,它們的交集就是空集合。當然,即使 F 不是可數的,我們關於聯集和交集的定義仍然適用。由於我們定義聯集和交集的方式,交換律和結合律會自動得到滿足。

定義 2.22. A 相對於 B 的「補集(complement)」,記為 $B - A$,被定義為集合
$B - A = \{x : x \in B, 但 x \notin A\}$。
請注意,只要 $A \subseteq B$,就有 $B - (B - A) = A$。同時請注意,如果 $B \cap A$ 是空集合,則 $B - A = B$。

定理 2.23. 令 F 為一個集合的收集。那麼對於任何集合 B,我們有
$B - \bigcup_{A \in F} A = \bigcap_{A \in F} (B - A)$
以及
$B - \bigcap_{A \in F} A = \bigcup_{A \in F} (B - A)$。
證明. 令 $S = \bigcup_{A \in F} A$,$T = \bigcap_{A \in F} (B - A)$。如果 $x \in B - S$,那麼 $x \in B$,但 $x \notin S$。因此,x 屬於 F 中的至少一個 A 是不正確的;因此 x 不屬於 F 中的任何 A。因此,對於 F 中的每一個 A,$x \in B - A$。但這蘊含 $x \in T$,所以 $B - S \subseteq T$。反轉這些步驟,我們得到 $T \subseteq B - S$,這證明了 $B - S = T$。為了證明第二個陳述,使用類似的論證即可。

2.15 可數集合的可數收集

定義 2.24. 如果 F 是一個集合的收集,使得 F 中任意兩個不同的集合都是互斥的,那麼 F 就被稱為一個互斥集合的收集。

定理 2.25. 如果 F 是一個由互斥集合組成的可數收集,比方說 $F = \{A_1, A_2, ...\}$,使得每一個集合 $A_n$ 都是可數的,那麼聯集 $\bigcup_{k=1}^{\infty} A_k$ 也是可數的。
證明. 令 $A_n = \{a_{1,n}, a_{2,n}, a_{3,n} ...\}$,$n = 1, 2, ...$,並令 $S = \bigcup_{k=1}^{\infty} A_k$。那麼 S 中的每一個元素 x 都在 F 的至少一個集合中,因此對於某一對整數 $(m, n)$,有 $x = a_{m,n}$。因為 F 是一個互斥集合的收集,所以對 $(m, n)$ 被 x 唯一決定。因此,藉由如果 $x = a_{m,n}$ ($x \in S$)則 $f(x) = (m, n)$ 所定義的函數 f,其定義域為 S。值域 $f(S)$ 是 $Z^+ \times Z^+$(其中 $Z^+$ 是正整數集合)的一個子集,因此是可數的。但 f 是一對一的,因此 $S \sim f(S)$,這意味著 S 也是可數的。

定理 2.26. 如果 $F = \{A_1, A_2, ...\}$ 是一個可數的集合收集,令 $G = \{B_1, B_2, ...\}$,其中 $B_1 = A_1$,且對於 $n > 1$,
$B_n = A_n - \bigcup_{k=1}^{n-1} A_k$
那麼 G 是一個互斥集合的收集,並且我們有
$\bigcup_{k=1}^{\infty} A_k = \bigcup_{k=1}^{\infty} B_k$。
證明. 每個集合 $B_n$ 的建構方式使其與先前的集合 $B_1, B_2, ..., B_{n-1}$ 沒有共同的元素。因此 G 是一個互斥集合的收集。令 $A = \bigcup_{k=1}^{\infty} A_k$ 且 $B = \bigcup_{k=1}^{\infty} B_k$。我們將證明 $A = B$。首先,如果 $x \in A$,那麼對於某個 k,有 $x \in A_k$。如果 n 是最小的這樣一個 k,那麼 $x \in A_n$ 但 $x \notin \bigcup_{k=1}^{n-1} A_k$,這意味著 $x \in B_n$ 從而 $x \in B$。因此 $A \subseteq B$。反之,如果 $x \in B$,那麼對於某個 n,有 $x \in B_n$,因此對於同一個 n,也有 $x \in A_n$。因此 $x \in A$,這證明了 $B \subseteq A$。

利用定理 2.25 和 2.26,我們立即得到
定理 2.27. 如果 F 是可數集合的一個可數收集,那麼 F 中所有集合的聯集也是一個可數集合。

例子 1. 所有有理數的集合 Q 是一個可數集合。
證明. 令 $A_n$ 表示所有分母為 n 的正有理數集合。所有正有理數的集合等於 $\bigcup_{k=1}^{\infty} A_k$。由此可知 Q 是可數的,因為每一個 $A_n$ 都是可數的。

例子 2. 具有有理端點的區間的集合 S 是一個可數集合。
證明. 令 $\{x_1, x_2, ...\}$ 表示有理數的集合,並令 $A_n$ 為左端點為 $x_n$ 且右端點為有理數的所有區間的集合。那麼 $A_n$ 是可數的且 $S = \bigcup_{k=1}^{\infty} A_k$。


習題

2.1 證明定理 2.2。提示:$(a, b) = (c, d)$ 意味著 $\{\{a\}, \{a, b\}\} = \{\{c\}, \{c, d\}\}$。現在求助於集合相等的定義。

2.2 令 S 為一個關係,並令 $\mathfrak{D}(S)$ 為其定義域。關係 S 被說成是:
i) 具反身性的(reflexive),如果 $a \in \mathfrak{D}(S)$ 蘊含 $(a, a) \in S$。
ii) 具對稱性的(symmetric),如果 $(a, b) \in S$ 蘊含 $(b, a) \in S$。
iii) 具遞移性的(transitive),如果 $(a, b) \in S$ 且 $(b, c) \in S$ 蘊含 $(a, c) \in S$。
一個同時具備對稱性、反身性和遞移性的關係被稱為「等價關係(equivalence relation)」。如果 S 是由所有滿足下列條件的實數對 $(x, y)$ 組成的集合,判斷 S 具有上述哪些性質:
a) $x \le y$
b) $x < y$
c) $x < |y|$
d) $x^2 + y^2 = 1$
e) $x^2 + y^2 < 0$
f) $x^2 + x = y^2 + y$

2.3 下列函數 F 和 G 是由給定的方程式對所有實數 x 所定義。在可以形成合成函數 $G \circ F$ 的每種情況下,給出 $G \circ F$ 的定義域,以及 $(G \circ F)(x)$ 的公式(或多個公式):
a) $F(x) = 1 - x$, $G(x) = x^2 + 2x$.
b) $F(x) = x + 5$, $G(x) = |x|/x$(如果 $x \ne 0$), $G(0) = 1$.
c) $F(x) = \begin{cases} 2x, & \text{如果 } 0 \le x \le 1, \\ 1, & \text{其他情況}, \end{cases}$
$G(x) = \begin{cases} x^2, & \text{如果 } 0 \le x \le 1, \\ 0, & \text{其他情況}. \end{cases}$
如果 $G(x)$ 和 $G[F(x)]$ 給定如下,求 $F(x)$:
d) $G(x) = x^3$, $G[F(x)] = x^3 - 3x^2 + 3x - 1$.
e) $G(x) = 3 + x + x^2$, $G[F(x)] = x^2 - 3x + 5$.

2.4 給定三個函數 F, G, H,為了使下列四個合成函數能被定義,必須對它們的定義域施加什麼限制?
$G \circ F$, $H \circ G$, $H \circ (G \circ F)$, $(H \circ G) \circ F$.
假設 $H \circ (G \circ F)$ 和 $(H \circ G) \circ F$ 可以被定義,證明結合律:
$H \circ (G \circ F) = (H \circ G) \circ F$.

2.5 證明下列聯集和交集的集合論恆等式:
a) $A \cup (B \cup C) = (A \cup B) \cup C$, $A \cap (B \cap C) = (A \cap B) \cap C$.
b) $A \cap (B \cup C) = (A \cap B) \cup (A \cap C)$.
c) $(A \cup B) \cap (A \cup C) = A \cup (B \cap C)$.
d) $(A \cup B) \cap (B \cup C) \cap (C \cup A) = (A \cap B) \cup (A \cap C) \cup (B \cap C)$.
e) $A \cap (B - C) = (A \cap B) - (A \cap C)$.
f) $(A - C) \cap (B - C) = (A \cap B) - C$.
g) $(A - B) \cup B = A$ 若且唯若 $B \subseteq A$.

2.6 令 $f: S \rightarrow T$ 是一個函數。如果 A 和 B 是 S 的任意子集,證明
$f(A \cup B) = f(A) \cup f(B)$ 且 $f(A \cap B) \subseteq f(A) \cap f(B)$.
推廣至任意的聯集與交集。

2.7 令 $f: S \rightarrow T$ 是一個函數。如果 $Y \subseteq T$,我們用 $f^{-1}(Y)$ 表示 S 中被 f 映射到 Y 裡的最大子集。也就是說,
$f^{-1}(Y) = \{x : x \in S \text{ 且 } f(x) \in Y\}$.
集合 $f^{-1}(Y)$ 被稱為 Y 在 f 下的「反像(inverse image)」。對於 S 的任意子集 X 和 T 的任意子集 Y,證明下列陳述:
a) $X \subseteq f^{-1}[f(X)]$,
b) $f[f^{-1}(Y)] \subseteq Y$,
c) $f^{-1}[Y_1 \cup Y_2] = f^{-1}(Y_1) \cup f^{-1}(Y_2)$,
d) $f^{-1}(Y_1 \cap Y_2) = f^{-1}(Y_1) \cap f^{-1}(Y_2)$,
e) $f^{-1}(T - Y) = S - f^{-1}(Y)$.
f) 將 (c) 和 (d) 推廣至任意的聯集與交集。

2.8 參考習題 2.7。證明對於 T 的每一個子集 Y 都有 $f[f^{-1}(Y)] = Y$,若且唯若 $T = f(S)$。

2.9 令 $f: S \rightarrow T$ 是一個函數。證明下列陳述是等價的。
a) f 在 S 上是一對一的。
b) 對於 S 的所有子集 A, B,都有 $f(A \cap B) = f(A) \cap f(B)$。
c) 對於 S 的每一個子集 A,都有 $f^{-1}[f(A)] = A$。
d) 對於 S 的所有互斥子集 A 和 B,它們的像 $f(A)$ 和 $f(B)$ 也是互斥的。
e) 對於 S 的所有滿足 $B \subseteq A$ 的子集 A 和 B,我們有 $f(A - B) = f(A) - f(B)$。

2.10 證明如果 $A \sim B$ 且 $B \sim C$,則 $A \sim C$。

2.11 如果 $\{1, 2, ..., n\} \sim \{1, 2, ..., m\}$,證明 $m = n$。

2.12 如果 S 是一個無限集合,證明 S 包含一個可數無限的子集。提示:在 S 中選擇一個元素 $a_1$ 並考慮 $S - \{a_1\}$。

2.13 證明每一個無限集合 S 都包含一個與 S 相似的真子集。

2.14 如果 A 是一個可數集合而 B 是一個不可數集合,證明 $B - A$ 與 B 相似。

2.15 如果一個實數是代數方程式 $f(x) = 0$ 的根,其中 $f(x) = a_0 + a_1x + \cdot\cdot\cdot + a_nx^n$ 是一個具有整數係數的多項式,則稱該實數為「代數數(algebraic number)」。證明所有具整數係數的多項式集合是可數的,並由此推導出代數數集合也是可數的。

2.16 令 S 為一個包含 n 個元素的有限集合,並令 T 為 S 的所有子集之收集。證明 T 是一個有限集合並求 T 中元素的數量。

2.17 令 R 表示實數集合,並令 S 表示定義域為 R 的所有實值函數的集合。證明 S 和 R 不是等勢的。提示:假設 $S \sim R$ 並令 f 是一個使得 $f(R) = S$ 的一對一函數。如果 $a \in R$,令 $g_a = f(a)$ 為 S 中對應於實數 a 的實值函數。現在由方程式 $h(x) = 1 + g_x(x)$ (若 $x \in R$) 定義 h,並證明 $h \notin S$。

2.18 令 S 為其項均為整數 0 和 1 的所有數列的收集。證明 S 是不可數的。

2.19 證明下列集合是可數的:
a) 複數平面上具有有理數半徑和有理數座標圓心的所有圓的集合,
b) 任何由長度為正的互斥區間所組成的收集。

2.20 令 f 為對區間 $0 \le x \le 1$ 中每一個 x 有定義的實值函數。假設存在一個正數 M 具有以下性質:對於區間 $0 \le x \le 1$ 中任意有限個點 $x_1, x_2, ..., x_n$ 的選擇,其總和
$|f(x_1) + \cdot\cdot\cdot + f(x_n)| \le M$
令 S 為在 $0 \le x \le 1$ 中使得 $f(x) \ne 0$ 的那些 x 的集合。證明 S 是可數的。

2.21 找出以下證明「所有正長度區間的集合為可數」的謬誤之處:
令 $\{x_1, x_2, ...\}$ 表示有理數的可數集合,並令 I 為任何長度為正的區間。那麼 I 包含無限多個有理點 $x_n$,但在這些點中,會存在一個下標 n 最小的點。藉由方程式 $F(I) = n$ 定義一個函數 F,其中 $x_n$ 是區間 I 中具有最小下標的有理數。這個函數在所有區間的集合與正整數的一個子集之間建立了一對一的對應關係。因此,所有區間的集合是可數的。

2.22 令 S 表示給定集合 T 的所有子集的收集。令 $f : S \rightarrow R$ 為一個定義在 S 上的實值函數。函數 f 如果只要 A 和 B 是 T 的互斥子集就滿足 $f(A \cup B) = f(A) + f(B)$,則稱其為「加性的(additive)」。如果 f 是加性的,證明對於任意兩個子集 A 和 B,我們有
$f(A \cup B) = f(A) + f(B - A)$
並且
$f(A \cup B) = f(A) + f(B) - f(A \cap B)$

2.23 參考習題 2.22。假設 f 是加性的,並假設下列關係對 T 的兩個特定子集 A 和 B 成立:
$f(A \cup B) = f(A') + f(B') - f(A')f(B')$
$f(A \cap B) = f(A)f(B)$, $f(A) + f(B) \ne f(T)$
其中 $A' = T - A$,$B' = T - B$。證明這些關係決定了 $f(T)$,並計算 $f(T)$ 的值。

第 2 章 線性變換與矩陣

線性代數 - 第 2 章 第 2 章 線性變換與矩陣 (Linear Transformations and Matrices) 2.1 線性變換、零空間與值域 (Linear Transformation...