第 2 章 線性變換與矩陣 (Linear Transformations and Matrices)
2.1 線性變換、零空間與值域
2.2 線性變換的矩陣表示
2.3 線性變換的合成與矩陣乘法
2.4 可逆性與同構
2.5 座標轉換矩陣
2.6* 對偶空間
2.7* 常係數齊次線性微分方程
在第 1 章中,我們相當詳細地發展了抽象向量空間的理論。現在很自然地要考慮定義在向量空間上,並在某種意義上「保留」其結構的函數。這些特殊的函數被稱為線性變換(linear transformations),它們在純數學與應用數學中大量出現。在微積分中,微分與積分運算為我們提供了兩個最重要的線性變換例子(見 2.1 節的例 6 和例 7)。這兩個例子使我們能夠將微分與積分方程中的許多問題,重新表述為特定向量空間上的線性變換問題(見 2.7 節與 5.2 節)。在幾何學中,旋轉、鏡射與投影(見 2.1 節的例 2、3 和 4)為我們提供了另一類線性變換。之後我們將使用這些變換來研究 \mathbb{R}^n 中的剛體運動(rigid motions,見 6.10 節)。
在後續的章節中,我們會看到線性變換在物理學和社會科學中出現的更多例子。
在本章中,我們假設所有的向量空間都是定義在一個共同的體(field)F 上。
2.1 線性變換、零空間與值域 (LINEAR TRANSFORMATIONS, NULL SPACES, AND RANGES)
在本節中,我們將探討許多線性變換的例子。這些變換中的許多例子將在後續章節進行更詳細的研究。
回顧一下,定義域為 V 且對應域為 W 的函數 T,我們將其記為 T: V \to W。(見附錄 B。)
定義。 設 V 與 W 為同一個體 F 上的向量空間。如果對於所有 x, y \in V 及 c \in F,以下條件皆成立,則我們稱函數 T: V \to W 為從 V 到 W 的線性變換(linear transformation):
(a) T(x + y) = T(x) + T(y),且
(b) T(cx) = cT(x)。
如果基礎的體 F 是有理數體,則 (a) 可推導出 (b)(見習題 38),但在一般情況下,(a) 與 (b) 在邏輯上是獨立的。見習題 39 和 40。我們通常直接稱 T 為線性的(linear)。
讀者應驗證函數 T: V \to W 的以下性質(見習題 7)。
- 若 T 是線性的,則 T(0) = 0。
- T 是線性的,若且唯若對所有 x, y \in V 及 c \in F,T(cx + y) = cT(x) + T(y)。
- 若 T 是線性的,則對所有 x, y \in V,T(x - y) = T(x) - T(y)。
- T 是線性的,若且唯若對於 x_1, x_2, \dots, x_n \in V 及 a_1, a_2, \dots, a_n \in F,我們有 T(\sum_{i=1}^n a_i x_i) = \sum_{i=1}^n a_i T(x_i)。
我們通常使用性質 2 來證明一個給定的變換是線性的。
例 1
定義 T: \mathbb{R}^2 \to \mathbb{R}^2 為 T(a_1, a_2) = (2a_1 + a_2, a_1)。
為了證明 T 是線性的,令 c \in \mathbb{R} 且 x, y \in \mathbb{R}^2,其中 x = (b_1, b_2) 且 y = (d_1, d_2)。
因為 cx + y = (cb_1 + d_1, cb_2 + d_2),我們有
T(cx + y) = (2(cb_1 + d_1) + cb_2 + d_2, cb_1 + d_1)。
又
cT(x) + T(y) = c(2b_1 + b_2, b_1) + (2d_1 + d_2, d_1)
= (2cb_1 + cb_2 + 2d_1 + d_2, cb_1 + d_1)
= (2(cb_1 + d_1) + cb_2 + d_2, cb_1 + d_1)。
因此 T 是線性的。
如同我們將在第 6 章所見,線性代數在幾何學上的應用既廣且多。其主要原因在於多數重要的幾何變換都是線性的。我們現在考慮的三個特定變換分別為旋轉、鏡射與投影。我們將它們的線性證明留給讀者。
例 2
對於任意角度 \theta,定義 T_\theta: \mathbb{R}^2 \to \mathbb{R}^2 的規則為:若 (a_1, a_2) \neq (0,0),則 T_\theta(a_1, a_2) 是將向量 (a_1, a_2) 逆時針旋轉 \theta 所得的向量,並且定義 T_\theta(0,0) = (0,0)。那麼 T_\theta: \mathbb{R}^2 \to \mathbb{R}^2 是一個線性變換,稱為旋轉 \theta 角(rotation by \theta)。
我們來決定 T_\theta 的明確公式。固定一個 \mathbb{R}^2 中的非零向量 (a_1, a_2)。令 \alpha 為 (a_1, a_2) 與正 x 軸的夾角(見圖 2.1(a)),並令 r = \sqrt{a_1^2 + a_2^2}。那麼 a_1 = r \cos \alpha 且 a_2 = r \sin \alpha。此外,T_\theta(a_1, a_2) 的長度為 r,並且與正 x 軸的夾角為 \alpha + \theta。由此可知
T_\theta(a_1, a_2) = (r \cos(\alpha + \theta), r \sin(\alpha + \theta))
= (r \cos \alpha \cos \theta - r \sin \alpha \sin \theta, r \cos \alpha \sin \theta + r \sin \alpha \cos \theta)
= (a_1 \cos \theta - a_2 \sin \theta, a_1 \sin \theta + a_2 \cos \theta)。
最後,觀察到這個相同的公式對於 (a_1, a_2) = (0,0) 也成立。現在可以像例 1 那樣輕易證明 T_\theta 是線性的。
例 3
定義 T: \mathbb{R}^2 \to \mathbb{R}^2 為 T(a_1, a_2) = (a_1, -a_2)。T 稱為對 x 軸的鏡射(reflection)。(見圖 2.1(b)。)
例 4
定義 T: \mathbb{R}^2 \to \mathbb{R}^2 為 T(a_1, a_2) = (a_1, 0)。T 稱為在 x 軸上的投影(projection)。(見圖 2.1(c)。)
我們現在來看一些線性變換的其他例子。
例 5
定義 T: M_{m \times n}(F) \to M_{n \times m}(F) 為 T(A) = A^t,其中 A^t 是 A 的轉置矩陣,其定義在 1.3 節。由 1.3 節的習題 3 可知,T 是一個線性變換。
例 6
令 V 表示定義在實數線上且具有任意階導數的所有實數值函數的集合。很容易證明 V 是一個在 \mathbb{R} 上的向量空間。(見 1.3 節的習題 16。)定義 T: V \to V 為 T(f) = f',即 f 的導數。為證明 T 是線性的,令 g, h \in V 且 a \in \mathbb{R}。現在 T(ag + h) = (ag + h)' = ag' + h' = aT(g) + T(h)。所以藉由前述的性質 2,T 是線性的。
例 7
令 V = C(\mathbb{R}),即在 \mathbb{R} 上所有連續實數值函數所成的向量空間。令 a, b \in \mathbb{R},且 a < b。定義 T: V \to \mathbb{R} 為對所有 f \in V,T(f) = \int_a^b f(t) dt。那麼 T 是一個線性變換,因為函數的線性組合的定積分,等於這些函數之定積分的相同線性組合。
在本書後續內容中經常出現的兩個非常重要的線性變換例子,值得給予專屬的符號,它們分別是恆等變換與零變換。
對於向量空間 V 與 W(在 F 上),我們定義恆等變換(identity transformation)I_V: V \to V 為對所有 x \in V,I_V(x) = x,並定義零變換(zero transformation)T_0: V \to W 為對所有 x \in V,T_0(x) = 0。顯然這兩個變換都是線性的。我們經常將 I_V 簡寫為 I。
我們現在將注意力轉向與線性變換相關的兩個非常重要的集合:值域和零空間。對這些集合的判定使我們能夠更密切地檢視線性變換的內在性質。
定義。 令 V 與 W 為向量空間,且 T: V \to W 是線性的。我們定義 T 的零空間(null space 或 kernel)N(T) 為 V 中所有使得 T(x) = 0 的向量 x 的集合;也就是說,N(T) = \{x \in V : T(x) = 0\}。
我們定義 T 的值域(range 或 image)R(T) 為 W 中由 V 裡所有向量在 T 之下的映射(images)所組成的子集;也就是說,R(T) = \{T(x) : x \in V\}。
例 8
令 V 與 W 為向量空間,且 I: V \to V 及 T_0: V \to W 分別為恆等變換與零變換。那麼 N(I) = \{0\},R(I) = V,N(T_0) = V,且 R(T_0) = \{0\}。
例 9
令 T: \mathbb{R}^3 \to \mathbb{R}^2 為定義成 T(a_1, a_2, a_3) = (a_1 - a_2, 2a_3) 的線性變換。我們將驗證 N(T) = \{(a, a, 0) : a \in \mathbb{R}\} 以及 R(T) = \mathbb{R}^2 留作習題。
在例 8 和例 9 中,我們看到每個線性變換的值域與零空間都是一個子空間。下一個結果表明這在一般情況下都是正確的。
定理 2.1。 令 V 與 W 為向量空間且 T: V \to W 是線性的。那麼 N(T) 與 R(T) 分別是 V 與 W 的子空間。
證明。 為了使符號清晰,我們使用符號 0_V 與 0_W 來分別表示 V 與 W 的零向量。
因為 T(0_V) = 0_W,我們有 0_V \in N(T)。令 x, y \in N(T) 且 c \in F。那麼 T(x + y) = T(x) + T(y) = 0_W + 0_W = 0_W,並且 T(cx) = cT(x) = c 0_W = 0_W。因此 x + y \in N(T) 且 cx \in N(T),所以 N(T) 是 V 的子空間。
因為 T(0_V) = 0_W,我們有 0_W \in R(T)。現在令 x, y \in R(T) 且 c \in F。那麼存在 V 中的 v 和 w 使得 T(v) = x 且 T(w) = y。所以 T(v + w) = T(v) + T(w) = x + y 並且 T(cv) = cT(v) = cx。因此 x + y \in R(T) 且 cx \in R(T),所以 R(T) 是 W 的子空間。■
下一個定理提供了一個方法來尋找線性變換值域的生成集(spanning set)。完成這一步後,利用 1.6 節例 6 的技巧,就能輕易找到值域的基底。
定理 2.2。 令 V 與 W 為向量空間,且 T: V \to W 是線性的。如果 \beta = \{v_1, v_2, \dots, v_n\} 是 V 的一個基底,那麼
R(T) = span(T(\beta)) = span(\{T(v_1), T(v_2), \dots, T(v_n)\})。
證明。 顯然對每個 i 都有 T(v_i) \in R(T)。因為 R(T) 是一個子空間,由定理 1.5(第 31 頁)可知 R(T) 包含了 span(\{T(v_1), T(v_2), \dots, T(v_n)\}) = span(T(\beta))。現在假設 w \in R(T)。那麼對於某個 v \in V,有 w = T(v)。因為 \beta 是 V 的基底,我們可以把 v 寫成 v = \sum_{i=1}^n a_i v_i,其中 a_1, a_2, \dots, a_n \in F。因為 T 是線性的,可得出 w = T(v) = \sum_{i=1}^n a_i T(v_i) \in span(T(\beta))。所以 R(T) 包含於 span(T(\beta)) 中。■
應注意的是,如果 \beta 是無限的,定理 2.2 也成立,亦即 R(T) = span(\{T(v) : v \in \beta\})。(見習題 34。)
下一個例子說明了定理 2.2 的用處。
例 10
定義線性變換 T: P_2(\mathbb{R}) \to M_{2 \times 2}(\mathbb{R}) 為 T(f(x)) = \begin{pmatrix} f(1) - f(2) & 0 \\ 0 & f(0) \end{pmatrix}。
因為 \beta = \{1, x, x^2\} 是 P_2(\mathbb{R}) 的基底,我們有
R(T) = span(T(\beta)) = span(\{T(1), T(x), T(x^2)\})
= span\left(\left\{ \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}, \begin{pmatrix} -1 & 0 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} -3 & 0 \\ 0 & 0 \end{pmatrix} \right\}\right)
= span\left(\left\{ \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}, \begin{pmatrix} -1 & 0 \\ 0 & 0 \end{pmatrix} \right\}\right)。
這樣我們就找到了 R(T) 的基底,因此 dim(R(T)) = 2。
現在假設我們要尋找 N(T) 的基底。注意 f(x) \in N(T) 若且唯若 T(f(x)) = O(2 \times 2 零矩陣)。也就是說,f(x) \in N(T) 若且唯若
\begin{pmatrix} f(1) - f(2) & 0 \\ 0 & f(0) \end{pmatrix} = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}。
令 f(x) = a + bx + cx^2。那麼 0 = f(1) - f(2) = (a + b + c) - (a + 2b + 4c) = -b - 3c
並且 0 = f(0) = a。
因此 f(x) = a + bx + cx^2 = -3cx + cx^2 = c(-3x + x^2)。
所以 N(T) 的一個基底是 \{-3x + x^2\}。請注意在這個例子中 dim(N(T)) + dim(R(T)) = 1 + 2 = 3 = dim(P_2(\mathbb{R}))。
在定理 2.3 中,我們將會看到類似的結果在一般情況下也是成立的。
誠如在第 1 章中一樣,我們用維度(dimension)來衡量一個子空間的「大小」。零空間與值域非常重要,因此我們為它們各自的維度賦予特殊的名稱。
定義。 令 V 與 W 為向量空間,且 T: V \to W 是線性的。如果 N(T) 與 R(T) 是有限維的,那麼我們將 N(T) 與 R(T) 的維度分別定義為 T 的核次數(nullity,記為 nullity(T))與 T 的秩(rank,記為 rank(T))。
反思線性變換的作用,我們直覺上可以看出核次數越大,秩就越小。換句話說,有越多的向量被映射到 0,值域就越小。同樣的啟發式推論告訴我們秩越大,核次數越小。秩與核次數之間的這種平衡在下一個恰當被稱為維度定理的定理中變得更加精確。
定理 2.3(維度定理 Dimension Theorem)。 令 V 與 W 為向量空間,且 T: V \to W 是線性的。如果 V 是有限維的,那麼
nullity(T) + rank(T) = dim(V)。
證明。 假設 dim(V) = n,dim(N(T)) = k,且 \{v_1, v_2, \dots, v_k\} 是 N(T) 的基底。根據定理 1.11 的推論(第 51 頁),我們可以將 \{v_1, v_2, \dots, v_k\} 擴充為 V 的一個基底 \beta = \{v_1, v_2, \dots, v_n\}。我們主張 S = \{T(v_{k+1}), T(v_{k+2}), \dots, T(v_n)\} 是 R(T) 的基底。
首先我們證明 S 生成 R(T)。使用定理 2.2 以及對 1 \le i \le k 有 T(v_i) = 0 的事實,我們得到
R(T) = span(\{T(v_1), T(v_2), \dots, T(v_n)\})
= span(\{T(v_{k+1}), T(v_{k+2}), \dots, T(v_n)\}) = span(S)。
現在我們證明 S 是線性獨立的。假設有 b_{k+1}, b_{k+2}, \dots, b_n \in F 使得 \sum_{i=k+1}^n b_i T(v_i) = 0。利用 T 是線性的事實,我們有
T\left(\sum_{i=k+1}^n b_i v_i\right) = 0。
所以 \sum_{i=k+1}^n b_i v_i \in N(T)。因此存在 c_1, c_2, \dots, c_k \in F 使得
\sum_{i=k+1}^n b_i v_i = \sum_{i=1}^k c_i v_i
或者 \sum_{i=1}^k (-c_i)v_i + \sum_{i=k+1}^n b_i v_i = 0。
因為 \beta 是 V 的基底,我們得到對所有 i 皆有 b_i = 0。因此 S 是線性獨立的。注意這個論證也證明了 T(v_{k+1}), T(v_{k+2}), \dots, T(v_n) 都是相異的;因此 rank(T) = n - k。■
如果我們將維度定理應用到例 9 中的線性變換 T,我們有 nullity(T) + 2 = 3,所以 nullity(T) = 1。
讀者應複習附錄 B 中介紹的「一對一」(one-to-one)與「映成」(onto)的概念。有趣的是,對於線性變換來說,這兩個概念都與變換的秩和核次數有密切關聯。這將在接下來的兩個定理中被證明。
定理 2.4。 令 V 與 W 為向量空間,且 T: V \to W 是線性的。那麼 T 是一對一的,若且唯若 N(T) = \{0\}。
證明。 假設 T 是一對一的且 x \in N(T)。那麼 T(x) = 0 = T(0)。因為 T 是一對一的,我們有 x = 0。因此 N(T) = \{0\}。
現在假設 N(T) = \{0\},並假設 T(x) = T(y)。那麼 0 = T(x) - T(y) = T(x - y)(由第 65 頁的性質 3 得知)。因此 x - y \in N(T) = \{0\}。所以 x - y = 0,即 x = y。這意味著 T 是一對一的。■
讀者應觀察到,定理 2.4 允許我們得出例 9 中定義的變換不是一對一的結論。
令人驚訝的是,在一個重要的特殊情況下,一對一和映成的條件是等價的。
定理 2.5。 令 V 與 W 為維度相等的有限維向量空間,且 T: V \to W 是線性的。那麼下列各項是等價的。
(a) T 是一對一的。
(b) T 是映成的。
(c) rank(T) = dim(V)。
證明。 由維度定理,我們有 nullity(T) + rank(T) = dim(V)。現在,利用定理 2.4,我們知道 T 是一對一的,若且唯若 N(T) = \{0\},若且唯若 nullity(T) = 0,若且唯若 rank(T) = dim(V),若且唯若 rank(T) = dim(W),且若且唯若 dim(R(T)) = dim(W)。由定理 1.11(第 50 頁)可知,這個等式等價於 R(T) = W,而這正是 T 為映成的定義。■
我們注意到,如果 V 不是有限維的,且 T: V \to V 是線性的,那麼一對一和映成不一定是等價的。(見習題 15、16 與 21。)
在定理 2.4 和 2.5 中,T 的線性特質是必要的,因為很容易構造出從 \mathbb{R} 映射到 \mathbb{R} 的函數,它不是一對一卻是映成,反之亦然。
接下來的兩個例子利用前面的定理來決定給定的線性變換是否為一對一或映成。
例 11
令 T: P_2(\mathbb{R}) \to P_3(\mathbb{R}) 為定義成
T(f(x)) = 2f'(x) + \int_0^x 3f(t) dt 的線性變換。
現在
R(T) = span(\{T(1), T(x), T(x^2)\}) = span(\{3x, 2 + \frac{3}{2}x^2, 4x + x^3\})。
因為 \{3x, 2 + \frac{3}{2}x^2, 4x + x^3\} 是線性獨立的,rank(T) = 3。因為 dim(P_3(\mathbb{R})) = 4,T 不是映成的。由維度定理可知,nullity(T) + 3 = 3。所以 nullity(T) = 0,因此 N(T) = \{0\}。我們從定理 2.4 得出 T 是一對一的結論。
例 12
令 T: F^2 \to F^2 為定義成 T(a_1, a_2) = (a_1 + a_2, a_1) 的線性變換。
很容易看出 N(T) = \{0\},所以 T 是一對一的。因此定理 2.5 告訴我們 T 必定也是映成的。
在習題 14 中提到,如果 T 是線性的且為一對一,那麼子集 S 是線性獨立的,若且唯若 T(S) 是線性獨立的。例 13 說明了這個結果的應用。
例 13
令 T: P_2(\mathbb{R}) \to \mathbb{R}^3 為定義成 T(a_0 + a_1 x + a_2 x^2) = (a_0, a_1, a_2) 的線性變換。
顯然 T 是線性且為一對一的。令 S = \{2 - x + 3x^2, x + x^2, 1 - 2x^2\}。那麼 S 在 P_2(\mathbb{R}) 中是線性獨立的,因為 T(S) = \{(2, -1, 3), (0, 1, 1), (1, 0, -2)\} 在 \mathbb{R}^3 中是線性獨立的。
在例 13 中,我們將多項式向量空間中的一個性質轉移到了三元組(3-tuples)向量空間中的一個性質。我們稍後將更充分地利用這種技巧。
線性變換最重要的性質之一,是它完全由其在基底上的作用來決定。這個結果可由下一個定理及其推論得出,並且在全書中經常被使用。
定理 2.6。 令 V 與 W 為在體 F 上的向量空間,並假設 \{v_1, v_2, \dots, v_n\} 是 V 的一個基底。對於 W 中的 w_1, w_2, \dots, w_n,存在恰好一個線性變換 T: V \to W 使得對 i = 1, 2, \dots, n 皆有 T(v_i) = w_i。
證明。 令 x \in V。那麼 x = \sum_{i=1}^n a_i v_i,其中 a_1, a_2, \dots, a_n 是唯一的純量。定義 T: V \to W 為 T(x) = \sum_{i=1}^n a_i w_i。
(a) T 是線性的:假設 u, v \in V 且 d \in F。那麼我們可以將 u 和 v 寫成
u = \sum_{i=1}^n b_i v_i 且 v = \sum_{i=1}^n c_i v_i
其中 b_1, b_2, \dots, b_n, c_1, c_2, \dots, c_n 為某些純量。因此 du + v = \sum_{i=1}^n (db_i + c_i)v_i。
所以 T(du + v) = \sum_{i=1}^n (db_i + c_i)w_i = d \sum_{i=1}^n b_i w_i + \sum_{i=1}^n c_i w_i = dT(u) + T(v)。
(b) 顯然對 i = 1, 2, \dots, n 都有 T(v_i) = w_i。
(c) T 的唯一性:假設 U: V \to W 是線性的,並且對 i = 1, 2, \dots, n 都有 U(v_i) = w_i。那麼對於 x \in V 且 x = \sum_{i=1}^n a_i v_i,我們有
U(x) = \sum_{i=1}^n a_i U(v_i) = \sum_{i=1}^n a_i w_i = T(x)。
因此 U = T。■
推論。 令 V 與 W 為向量空間,並假設 V 具有一個有限基底 \{v_1, v_2, \dots, v_n\}。如果 U, T: V \to W 都是線性的,且對 i = 1, 2, \dots, n 都有 U(v_i) = T(v_i),那麼 U = T。
例 14
令 T: \mathbb{R}^2 \to \mathbb{R}^2 為定義成 T(a_1, a_2) = (2a_2 - a_1, 3a_1) 的線性變換,並假設 U: \mathbb{R}^2 \to \mathbb{R}^2 也是線性的。如果我們知道 U(1,2) = (3,3) 且 U(1,1) = (1,3),那麼 U = T。這可由前述的推論以及 \{(1,2), (1,1)\} 是 \mathbb{R}^2 的一個基底這個事實推導出來。
2.1 習題 (Exercises 2.1)
1. 將下列敘述標記為真(True)或假(False)。在每一小題中,假設 V 與 W 為(在體 F 上的)有限維向量空間,且 T 是從 V 到 W 的函數。
(a) 如果 T 是線性的,那麼 T 會保留和(sums)與純量乘積(scalar products)。
(b) 如果 T(x+y) = T(x) + T(y),那麼 T 是線性的。
(c) T 是一對一的,若且唯若使得 T(x) = 0 的唯一向量是 x = 0。
(d) 如果 T 是線性的,那麼 T(0_V) = 0_W。
(e) 如果 T 是線性的,那麼 nullity(T) + rank(T) = dim(W)。
(f) 如果 T 是線性的,那麼 T 會將 V 的線性獨立子集映射到 W 的線性獨立子集上。
(g) 如果 T, U: V \to W 都是線性的,並且在 V 的某個基底上相等,那麼 T = U。
(h) 給定 V 中的 x_1, x_2 以及 W 中的 y_1, y_2,必定存在一個線性變換 T: V \to W 使得 T(x_1) = y_1 且 T(x_2) = y_2。
對於第 2 至 6 題,證明 T 是一個線性變換,並找出 N(T) 與 R(T) 的基底。接著計算 T 的核次數(nullity)與秩(rank),並驗證維度定理。最後,使用本節中適當的定理來決定 T 是否為一對一或映成。
2. 定義 T: \mathbb{R}^3 \to \mathbb{R}^2 為 T(a_1, a_2, a_3) = (a_1 - a_2, 2a_3)。
3. 定義 T: \mathbb{R}^2 \to \mathbb{R}^3 為 T(a_1, a_2) = (a_1 + a_2, 0, 2a_1 - a_2)。
4. 定義 T: M_{2 \times 3}(F) \to M_{2 \times 2}(F) 為 T\begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{pmatrix} = \begin{pmatrix} 2a_{11} - a_{12} & a_{13} + 2a_{12} \\ 0 & 0 \end{pmatrix}。
5. 定義 T: P_2(\mathbb{R}) \to P_3(\mathbb{R}) 為 T(f(x)) = xf(x) + f'(x)。
6. 定義 T: M_{n \times n}(F) \to F 為 T(A) = tr(A)。回顧(第 1.3 節的例 4)tr(A) = \sum_{i=1}^n A_{ii}。
7. 證明第 65 頁上的性質 1、2、3 和 4。
8. 證明例 2 和例 3 中的變換是線性的。
9. 在本題中,T: \mathbb{R}^2 \to \mathbb{R}^2 是一個函數。對於下列每一小題,說明為何 T 不是線性的。
(a) T(a_1, a_2) = (1, a_2)
(b) T(a_1, a_2) = (a_1, a_1^2)
(c) T(a_1, a_2) = (\sin a_1, 0)
(d) T(a_1, a_2) = (|a_1|, a_2)
(e) T(a_1, a_2) = (a_1 + 1, a_2)
10. 假設 T: \mathbb{R}^2 \to \mathbb{R}^2 是線性的,T(1,0) = (1,4),且 T(1,1) = (2,5)。那麼 T(2,3) 是什麼?T 是一對一的嗎?
11. 證明存在一個線性變換 T: \mathbb{R}^2 \to \mathbb{R}^3 使得 T(1,1) = (1,0,2) 且 T(2,3) = (1,-1,4)。那麼 T(8,11) 是什麼?
12. 是否存在一個線性變換 T: \mathbb{R}^3 \to \mathbb{R}^2 使得 T(1,0,3) = (1,1) 且 T(-2,0,-6) = (2,1)?
13. 令 V 與 W 為向量空間,令 T: V \to W 是線性的,並令 \{w_1, w_2, \dots, w_k\} 是從 R(T) 取出的 k 個向量所組成的線性獨立集。證明如果選擇 S = \{v_1, v_2, \dots, v_k\} 使得對於 i = 1, 2, \dots, k 皆有 T(v_i) = w_i,那麼 S 是線性獨立的。解答請參考 goo.gl/kmaQS2。
14. 令 V 與 W 為向量空間且 T: V \to W 是線性的。
(a) 證明 T 是一對一的,若且唯若 T 將 V 的線性獨立子集映射到 W 的線性獨立子集。
(b) 假設 T 是一對一的,且 S 是 V 的一個子集。證明 S 是線性獨立的,若且唯若 T(S) 是線性獨立的。
(c) 假設 \beta = \{v_1, v_2, \dots, v_n\} 是 V 的一個基底,且 T 是一對一且映成的。證明 T(\beta) = \{T(v_1), T(v_2), \dots, T(v_n)\} 是 W 的一個基底。
15. 回顧第 11 頁中 P(\mathbb{R}) 的定義。定義 T: P(\mathbb{R}) \to P(\mathbb{R}) 為 T(f(x)) = \int_0^x f(t) dt。證明 T 是線性且為一對一的,但不是映成的。
16. 令 T: P(\mathbb{R}) \to P(\mathbb{R}) 定義為 T(f(x)) = f'(x)。回顧 T 是線性的。證明 T 是映成的,但不是一對一的。
17. 令 V 與 W 為有限維向量空間,且 T: V \to W 是線性的。
(a) 證明如果 dim(V) < dim(W),那麼 T 不可能是映成的。
(b) 證明如果 dim(V) > dim(W),那麼 T 不可能是一對一的。
18. 給出一個線性變換 T: \mathbb{R}^2 \to \mathbb{R}^2 的例子,使得 N(T) = R(T)。
19. 給出向量空間 V 與 W 以及從 V 到 W 的兩個相異線性變換 T 和 U 的例子,使得 N(T) = N(U) 且 R(T) = R(U)。
20. 令 V 與 W 為向量空間,其子空間分別為 V_1 與 W_1。如果 T: V \to W 是線性的,證明 T(V_1) 是 W 的子空間,且 \{x \in V : T(x) \in W_1\} 是 V 的子空間。
21. 令 V 為 1.2 節例 5 中所描述的數列向量空間。定義函數 T, U: V \to V 為 T(a_1, a_2, \dots) = (a_2, a_3, \dots) 且 U(a_1, a_2, \dots) = (0, a_1, a_2, \dots)。T 和 U 分別被稱為 V 上的左移(left shift)與右移(right shift)算子。
(a) 證明 T 和 U 是線性的。
(b) 證明 T 是映成的,但不是一對一的。
(c) 證明 U 是一對一的,但不是映成的。
22. 令 T: \mathbb{R}^3 \to \mathbb{R} 是線性的。證明存在純量 a, b, c 使得對所有 (x,y,z) \in \mathbb{R}^3 皆有 T(x,y,z) = ax + by + cz。你能將此結果推廣至 T: F^n \to F 嗎?請陳述並證明對於 T: F^n \to F^m 的類似結果。
23. 令 T: \mathbb{R}^3 \to \mathbb{R} 是線性的。在幾何上描述 T 的零空間的可能性。提示:使用習題 22。
24. 令 T: V \to W 是線性的,b \in W,且 K = \{x \in V : T(x) = b\} 是非空的。證明如果 s \in K,那麼 K = \{s\} + N(T)。(關於子集和的定義見第 22 頁。)
接下來的定義用於習題 25-28 與習題 31 中。
定義。 令 V 為向量空間,且 W_1 與 W_2 為 V 的子空間使得 V = W_1 \oplus W_2。(回顧第 22 頁給出的直和定義。)定義函數 T: V \to V 為 T(x) = x_1,其中 x = x_1 + x_2 且 x_1 \in W_1, x_2 \in W_2,則稱 T 為 V 在 W_1 上沿著 W_2 的投影(projection on W_1 along W_2)。
25. 令 T: \mathbb{R}^2 \to \mathbb{R}^2。為下列每一小題附上圖形。
(a) 找出 T(a,b) 的公式,其中 T 表示在 y 軸上沿著 x 軸的投影。
(b) 找出 T(a,b) 的公式,其中 T 表示在 y 軸上沿著直線 L = \{(s,s) : s \in \mathbb{R}\} 的投影。
26. 令 T: \mathbb{R}^3 \to \mathbb{R}^3。
(a) 如果 T(a,b,c) = (a,b,0),證明 T 是在 xy 平面上沿著 z 軸的投影。
(b) 找出 T(a,b,c) 的公式,其中 T 表示在 z 軸上沿著 xy 平面的投影。
(c) 如果 T(a,b,c) = (a-c, b, 0),證明 T 是在 xy 平面上沿著直線 L = \{(a,0,a) : a \in \mathbb{R}\} 的投影。
27. 使用上述定義中的符號,假設 T: V \to V 是在 W_1 上沿著 W_2 的投影。
(a) 證明 T 是線性的且 W_1 = \{x \in V : T(x) = x\}。
(b) 證明 W_1 = R(T) 且 W_2 = N(T)。
(c) 描述當 W_1 = V 時的 T。
(d) 描述當 W_1 是零子空間時的 T。
28. 假設 W 是有限維向量空間 V 的子空間。
(a) 證明存在一個子空間 W' 與函數 T: V \to V,使得 T 是在 W 上沿著 W' 的投影。
(b) 給出一個向量空間 V 及其子空間 W 的例子,使得有兩個在 W 上沿著兩個(相異)子空間的投影。
接下來的定義用於習題 29-33 中。
定義。 令 V 為向量空間,且 T: V \to V 是線性的。如果對於每個 x \in W 都有 T(x) \in W,即 T(W) \subseteq W,則稱 V 的子空間 W 是 T-不變的(T-invariant)。如果 W 是 T-不變的,我們定義 T 在 W 上的限制(restriction)為函數 T_W: W \to W,其定義為對所有 x \in W,T_W(x) = T(x)。
習題 29-33 假設 W 是向量空間 V 的子空間,且 T: V \to V 是線性的。警告:除非明確聲明,否則不要假設 W 是 T-不變的或 T 是一個投影。
29. 證明子空間 \{0\}, V, R(T) 和 N(T) 都是 T-不變的。
30. 如果 W 是 T-不變的,證明 T_W 是線性的。
31. 假設 T 是在 W 上沿著某個子空間 W' 的投影。證明 W 是 T-不變的,並且 T_W = I_W。
32. 假設 V = R(T) \oplus W 且 W 是 T-不變的。
(a) 證明 W \subseteq N(T)。
(b) 證明如果 V 是有限維的,那麼 W = N(T)。
(c) 舉例說明如果 V 不是有限維的,則 (b) 的結論不一定成立。
33. 假設 W 是 T-不變的。證明 N(T_W) = N(T) \cap W 且 R(T_W) = T(W)。
34. 證明當 \beta 是無限時的定理 2.2,即 R(T) = span(\{T(v) : v \in \beta\})。
35. 證明以下定理 2.6 的推廣:令 V 與 W 為同一個體上的向量空間,並令 \beta 為 V 的一個基底。那麼對於任何函數 f: \beta \to W,存在恰好一個線性變換 T: V \to W 使得對所有 x \in \beta 皆有 T(x) = f(x)。
習題 36 和 37 需要第 22 頁中給出的直和定義。
36. 令 V 為有限維向量空間且 T: V \to V 是線性的。
(a) 假設 V = R(T) + N(T)。證明 V = R(T) \oplus N(T)。
(b) 假設 R(T) \cap N(T) = \{0\}。證明 V = R(T) \oplus N(T)。
(在每一小題中請仔細說明在哪裡用到了有限維這個條件。)
37. 令 V 和 T 的定義如習題 21。
(a) 證明 V = R(T) + N(T),但 V 不是這兩個空間的直和。因此上述習題 36(a) 的結果在不假設 V 是有限維的情況下無法被證明。
(b) 在 V 上找出一個線性算子 T_1,使得 R(T_1) \cap N(T_1) = \{0\},但 V 不是 R(T_1) 和 N(T_1) 的直和。推論 V 是有限維這點在習題 36(b) 中也是必要的。
38. 向量空間 V 和 W 之間的函數 T: V \to W 如果對所有 x, y \in V 都滿足 T(x+y) = T(x) + T(y),則稱其為可加的(additive)。證明如果 V 和 W 是在有理數體上的向量空間,那麼任何從 V 到 W 的可加函數都是線性變換。
39. 令 T: \mathbb{C} \to \mathbb{C} 是定義為 T(z) = \bar{z} 的函數。證明 T 是可加的(如習題 38 所定義),但不是線性的。
40. 證明存在一個可加函數 T: \mathbb{R} \to \mathbb{R}(如習題 38 所定義)但它不是線性的。提示:令 V 為實數集合,將其視為有理數體上的向量空間。由定理 1.13 的推論(第 61 頁),V 具有一個基底 \beta。令 x 和 y 為 \beta 中兩個相異向量,並定義 f: \beta \to V 為 f(x) = y, f(y) = x,且其他情況下 f(z) = z。由習題 35,存在一個線性變換 T: V \to V 使得對所有 u \in \beta 有 T(u) = f(u)。那麼 T 是可加的,但對於 c = y/x,T(cx) \neq cT(x)。
41. 證明定理 2.6 及其推論在 V 為無限維時也成立。
接下來的習題需要熟悉第 1.3 節習題 31 中商空間(quotient space)的定義。
42. 令 V 為一個向量空間且 W 為 V 的一個子空間。定義映射 \eta: V \to V/W 為對 v \in V,\eta(v) = v + W。
(a) 證明 \eta 是一個從 V 映成(onto) V/W 的線性變換,且 N(\eta) = W。
(b) 假設 V 是有限維的。使用 (a) 和維度定理推導出一個關聯 dim(V), dim(W) 和 dim(V/W) 的公式。
(c) 閱讀維度定理的證明。將解出 (b) 的方法與第 1.6 節習題 35 中概述的推導相同結果的方法進行比較。
2.2 線性轉換的矩陣表示 (The Matrix Representation of a Linear Transformation)
定義。 設 V 是一個有限維向量空間。V 的一個有序基底 (ordered basis) 是被賦予特定順序的基底;也就是說,V 的有序基底是 V 中生成 V 的線性獨立向量的有限序列。
範例 1
在 F^3 中,\beta = \{e_1, e_2, e_3\} 可以被視為一個有序基底。另外 \gamma = \{e_2, e_1, e_3\} 也是一個有序基底,但作為有序基底而言 \beta \neq \gamma。
對於向量空間 F^n,我們稱 \{e_1, e_2, \dots, e_n\} 為 F^n 的標準有序基底 (standard ordered basis)。類似地,對於向量空間 P_n(F),我們稱 \{1, x, \dots, x^n\} 為 P_n(F) 的標準有序基底。
既然我們已經有了有序基底的概念,我們就可以將 n 維向量空間中的抽象向量與 n 元組 (n-tuples) 建立認同。這種認同是透過使用接下來介紹的座標向量來提供的。
定義。 設 \beta = \{u_1, u_2, \dots, u_n\} 是有限維向量空間 V 的一個有序基底。對於 x \in V,設 a_1, a_2, \dots, a_n 為唯一的純量,使得 x = \sum_{i=1}^n a_i u_i。
我們定義 x 相對於 \beta 的座標向量 (coordinate vector),記為 [x]_\beta,為
[x]_\beta = \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}
請注意,在前述定義中 [u_i]_\beta = e_i。證明對應關係 x \to [x]_\beta 提供了一個從 V 到 F^n 的線性轉換將留作習題。我們會在第 2.4 節中更詳細地研究這個轉換。
範例 2
設 V = P_2(R),並設 \beta = \{1, x, x^2\} 為 V 的標準有序基底。如果 f(x) = 4 + 6x - 7x^2,那麼 [f]_\beta = \begin{pmatrix} 4 \\ 6 \\ -7 \end{pmatrix}。
現在讓我們繼續進行之前提過的線性轉換的矩陣表示。假設 V 和 W 分別是具有有序基底 \beta = \{v_1, v_2, \dots, v_n\} 和 \gamma = \{w_1, w_2, \dots, w_m\} 的有限維向量空間。設 T: V \to W 為線性的。那麼對於每個 j = 1, 2, \dots, n,存在唯一的純量 a_{ij} \in F (i = 1, 2, \dots, m) 使得
T(v_j) = \sum_{i=1}^m a_{ij} w_i \quad \text{對於 } j = 1, 2, \dots, n \text{。}
定義。 使用上述符號,我們稱由 A_{ij} = a_{ij} 所定義的 m \times n 矩陣 A 為 T 在有序基底 \beta 和 \gamma 中的矩陣表示 (matrix representation),並寫成 A = [T]_\beta^\gamma。如果 V = W 且 \beta = \gamma,則我們簡單寫作 A = [T]_\beta。
請注意,A 的第 j 行(column)就只是 [T(v_j)]_\gamma。同時觀察到,如果 U: V \to W 是一個線性轉換使得 [U]_\beta^\gamma = [T]_\beta^\gamma,那麼由定理 2.6 的推論(第 73 頁)可知 U = T。
我們在接下來的幾個範例中說明 [T]_\beta^\gamma 的計算。
範例 3
設 T: R^2 \to R^3 為定義如下的線性轉換:
T(a_1, a_2) = (a_1 + 3a_2, 0, 2a_1 - 4a_2)
並設 \beta 和 \gamma 分別為 R^2 和 R^3 的標準有序基底。現在
T(e_1) = T(1, 0) = (1, 0, 2) = 1e_1 + 0e_2 + 2e_3
T(e_2) = T(0, 1) = (3, 0, -4) = 3e_1 + 0e_2 - 4e_3
因此
[T]_\beta^\gamma = \begin{pmatrix} 1 & 3 \\ 0 & 0 \\ 2 & -4 \end{pmatrix}
(請注意,我們使用了相同的符號 e_i 來表示 R^2 和 R^3 中的標準基底向量。上下文通常會指示 e_i 所在的空間。)
如果我們改變 R^3 的基底,矩陣表示也會改變。例如,設 \gamma' 為 R^3 的有序基底 \{e_3, e_2, e_1\}。那麼
T(e_1) = (1, 0, 2) = 2e_3 + 0e_2 + 1e_1
T(e_2) = (3, 0, -4) = -4e_3 + 0e_2 + 3e_1
所以
[T]_\beta^{\gamma'} = \begin{pmatrix} 2 & -4 \\ 0 & 0 \\ 1 & 3 \end{pmatrix}
範例 4
設 T: P_3(R) \to P_2(R) 為由 T(f(x)) = f'(x) 定義的線性轉換。設 \beta 和 \gamma 分別為 P_3(R) 和 P_2(R) 的標準有序基底。我們來計算 [T]_\beta^\gamma。
\beta = \{1, x, x^2, x^3\} 且 \gamma = \{1, x, x^2\}。
T(1) = 0 = 0 \cdot 1 + 0 \cdot x + 0 \cdot x^2
T(x) = 1 = 1 \cdot 1 + 0 \cdot x + 0 \cdot x^2
T(x^2) = 2x = 0 \cdot 1 + 2 \cdot x + 0 \cdot x^2
T(x^3) = 3x^2 = 0 \cdot 1 + 0 \cdot x + 3 \cdot x^2
因此,
[T]_\beta^\gamma = \begin{pmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \end{pmatrix}
現在我們將注意力轉向在線性轉換的集合上定義加法和純量乘法的運算。
定義。 設 T, U: V \to W 是任意函數,其中 V 和 W 是在體 F 上的向量空間,並且設 a \in F。我們定義函數 T+U: V \to W 為
(T+U)(x) = T(x) + U(x) \quad \text{對所有 } x \in V
以及 aT: V \to W 為
(aT)(x) = aT(x) \quad \text{對所有 } x \in V
這些對 T+U 和 aT 的定義是向量空間函數的標準定義;但在這種情況下,我們可以證明如果 T 和 U 都是線性的,則 T+U 和 aT 也是線性的。
定理 2.7。 設 V 和 W 為在體 F 上的向量空間,並設 T, U: V \to W 為線性的。
(a) 對於所有的 a \in F,aT + U 是線性的。
(b) 使用前面定義中的加法和純量乘法運算,所有從 V 到 W 的線性轉換的集合構成一個在 F 上的向量空間。
證明。
(a) 設 x, y \in V 且 c \in F。那麼
(aT+U)(cx+y) = (aT)(cx+y) + U(cx+y)
= a(T(cx+y)) + U(cx+y)
= a(cT(x)+T(y)) + cU(x) + U(y)
= acT(x) + aT(y) + cU(x) + U(y)
= c(aT(x) + U(x)) + (aT(y) + U(y))
= c(aT+U)(x) + (aT+U)(y)。
所以 aT+U 是線性的。
(b) 要驗證向量空間的公理是否成立是直截了當的,因此留給讀者。(請注意,V 到 W 的零向量是零轉換 T_0)。
定義。 設 V 和 W 為在體 F 上的向量空間。我們將所有從 V 到 W 的線性轉換所構成的向量空間記為 \mathcal{L}(V, W)。在 V=W 的情況下,我們寫作 \mathcal{L}(V) 而不是 \mathcal{L}(V, W)。
我們現在有兩個向量空間 \mathcal{L}(V,W) 以及 M_{m \times n}(F)。我們已經看到,藉由指定基底 \beta 和 \gamma,每個從 V 到 W 的線性轉換會對應到一個特定的 m \times n 矩陣 [T]_\beta^\gamma。我們接下來的結果表明這兩個空間的結構有著深刻的聯繫。
定理 2.8。 設 V 和 W 是在 F 上的有限維向量空間,分別具有有序基底 \beta 和 \gamma,並設 T, U \in \mathcal{L}(V, W) 且 a \in F。那麼
(a) [T+U]_\beta^\gamma = [T]_\beta^\gamma + [U]_\beta^\gamma
(b) [aT]_\beta^\gamma = a[T]_\beta^\gamma
證明。
設 \beta = \{v_1, v_2, \dots, v_n\} 且 \gamma = \{w_1, w_2, \dots, w_m\}。為了證明 (a),假設 [T]_\beta^\gamma = A 且 [U]_\beta^\gamma = B。那麼對於每個 j \in \{1, \dots, n\},
(T+U)(v_j) = T(v_j) + U(v_j) = \sum_{i=1}^m A_{ij} w_i + \sum_{i=1}^m B_{ij} w_i = \sum_{i=1}^m (A_{ij} + B_{ij}) w_i
因此 [T+U]_\beta^\gamma 的第 (i, j) 項是 A_{ij} + B_{ij}。這剛好也是 A+B 的第 (i, j) 項,這證明了 (a)。(b) 的證明留作習題。
這確保了從 \mathcal{L}(V, W) 到 M_{m \times n}(F) 的對應 T \mapsto [T]_\beta^\gamma 能夠保留加法和純量乘法的運算。
範例 5
設 V = R^3 且 W = R^2,並分別具有標準有序基底 \beta 和 \gamma。假設 T 和 U 是從 V 到 W 的線性轉換,定義如下:
T(a_1, a_2, a_3) = (a_1 - a_2, 2a_3)
以及
U(a_1, a_2, a_3) = (a_1 + 2a_2 - a_3, 3a_1 + a_2)
那麼
[T]_\beta^\gamma = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 0 & 2 \end{pmatrix} \quad \text{且} \quad [U]_\beta^\gamma = \begin{pmatrix} 1 & 2 & -1 \\ 3 & 1 & 0 \end{pmatrix}
如果我們計算 T+U,我們得到
(T+U)(a_1, a_2, a_3) = (2a_1 + a_2 - a_3, 3a_1 + a_2 + 2a_3)
所以
[T+U]_\beta^\gamma = \begin{pmatrix} 2 & 1 & -1 \\ 3 & 1 & 2 \end{pmatrix} = \begin{pmatrix} 1 & -1 & 0 \\ 0 & 0 & 2 \end{pmatrix} + \begin{pmatrix} 1 & 2 & -1 \\ 3 & 1 & 0 \end{pmatrix} = [T]_\beta^\gamma + [U]_\beta^\gamma
類似地,對於任何純量 a,
(aT)(a_1, a_2, a_3) = a(a_1 - a_2, 2a_3) = (aa_1 - aa_2, 2aa_3)
所以
[aT]_\beta^\gamma = \begin{pmatrix} a & -a & 0 \\ 0 & 0 & 2a \end{pmatrix} = a\begin{pmatrix} 1 & -1 & 0 \\ 0 & 0 & 2 \end{pmatrix} = a[T]_\beta^\gamma
以下是 2.2 節習題的完整翻譯:
習題
- 標示下列敘述為真(True)或假(False)。假設 V 與 W 為有限維度的向量空間,且分別具有有序基底 \beta 與 \gamma,而 T, U: V \to W 為線性轉換。
(a) 對於任意純量 a,aT + U 是從 V 到 W 的線性轉換。
(b) [T]_\beta^\gamma = [U]_\beta^\gamma 意味著 T = U。
(c) 若 m = \dim(V) 且 n = \dim(W),則 [T]_\beta^\gamma 是一個 m \times n 矩陣。
(d) [T + U]_\beta^\gamma = [T]_\beta^\gamma + [U]_\beta^\gamma。
(e) \mathcal{L}(V, W) 是一個向量空間。
(f) \mathcal{L}(V, W) = \mathcal{L}(W, V)。 - 令 \beta 與 \gamma 分別為 R^n 與 R^m 的標準有序基底。對於下列每個線性轉換 T: R^n \to R^m,計算 [T]_\beta^\gamma。
(a) T: R^2 \to R^3,定義為 T(a_1, a_2) = (2a_1 - a_2, 3a_1 + 4a_2, a_1)。
(b) T: R^3 \to R^2,定義為 T(a_1, a_2, a_3) = (2a_1 + 3a_2 - a_3, a_1 + a_3)。
(c) T: R^3 \to R,定義為 T(a_1, a_2, a_3) = 2a_1 + a_2 - 3a_3。
(d) T: R^3 \to R^3,定義為 T(a_1, a_2, a_3) = (2a_2 + a_3, -a_1 + 4a_2 + 5a_3, a_1 + a_3)。
(e) T: R^n \to R^n,定義為 T(a_1, a_2, \dots, a_n) = (a_1, a_1, \dots, a_1)。
(f) T: R^n \to R^n,定義為 T(a_1, a_2, \dots, a_n) = (a_n, a_{n-1}, \dots, a_1)。
(g) T: R^n \to R,定義為 T(a_1, a_2, \dots, a_n) = a_1 + a_n。 - 令 T: R^2 \to R^3 定義為 T(a_1, a_2) = (a_1 - a_2, a_1, 2a_1 + a_2)。令 \beta 為 R^2 的標準有序基底,且 \gamma = \{(1, 1, 0), (0, 1, 1), (2, 2, 3)\}。計算 [T]_\beta^\gamma。若 \alpha = \{(1, 2), (2, 3)\},計算 [T]_\alpha^\gamma。
- 定義 T: M_{2 \times 2}(R) \to P_2(R) 為 T\left(\begin{pmatrix} a & b \\ c & d \end{pmatrix}\right) = (a + b) + (2d)x + bx^2。令 \beta = \left\{\begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}\right\} 且 \gamma = \{1, x, x^2\}。計算 [T]_\beta^\gamma。
- 令 \alpha = \left\{\begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}\right\},\beta = \{1, x, x^2\} 且 \gamma = \{1\}。
(a) 定義 T: M_{2 \times 2}(F) \to M_{2 \times 2}(F) 為 T(A) = A^t。計算 [T]_\alpha。
(b) 定義 T: P_2(R) \to M_{2 \times 2}(R) 為 T(f(x)) = \begin{pmatrix} f'(0) & 2f(1) \\ 0 & f''(3) \end{pmatrix},其中 ' 表示微分。計算 [T]_\beta^\alpha。
(c) 定義 T: M_{2 \times 2}(F) \to F 為 T(A) = \text{tr}(A)。計算 [T]_\alpha^\gamma。
(d) 定義 T: P_2(R) \to R 為 T(f(x)) = f(2)。計算 [T]_\beta^\gamma。
(e) 若 A = \begin{pmatrix} 1 & -2 \\ 0 & 4 \end{pmatrix},計算 [A]_\alpha。
(f) 若 f(x) = 3 - 6x + x^2,計算 [f(x)]_\beta。
(g) 對於 a \in F,計算 [a]_\gamma。 - 完成定理 2.7 (b) 部分的證明。
- 證明定理 2.8 (b) 部分。
- 令 V 為一個具備有序基底 \beta 的 n 維向量空間。定義 T: V \to F^n 為 T(x) = [x]_\beta。證明 T 是線性的。
- 令 V 為定義在實數體 R 上的複數向量空間。定義 T: V \to V 為 T(z) = \bar{z},其中 \bar{z} 是 z 的共軛複數。證明 T 是線性的,並計算 [T]_\beta,其中 \beta = \{1, i\}。(回顧 2.1 節習題 39,若將 V 視為定義在複數體 C 上的向量空間,則 T 不是線性的。)
- 令 V 為一個具備有序基底 \beta = \{v_1, v_2, \dots, v_n\} 的向量空間。定義 v_0 = 0。根據定理 2.6(第 73 頁),存在一個線性轉換 T: V \to V 使得對於 j = 1, 2, \dots, n 皆滿足 T(v_j) = v_j + v_{j-1}。計算 [T]_\beta。
- 令 V 為一個 n 維向量空間,且 T: V \to V 為一個線性轉換。假設 W 是 V 的一個 T-不變子空間(T-invariant subspace,見 2.1 節習題)其維度為 k。證明存在 V 的一個基底 \beta,使得 [T]_\beta 具有以下形式:
\begin{pmatrix} A & B \\ O & C \end{pmatrix}
其中 A 是一個 k \times k 矩陣,而 O 是一個 (n - k) \times k 的零矩陣。
12. 令 \beta = \{v_1, v_2, \dots, v_n\} 為向量空間 V 的一個基底,且 T: V \to V 為一個線性轉換。證明 [T]_\beta 為上三角矩陣(upper triangular matrix)若且唯若對 j = 1, 2, \dots, n 皆有 T(v_j) \in \text{span}(\{v_1, v_2, \dots, v_j\})。請造訪 goo.gl/k9ZrQb 查看解答。
13. 令 V 為一個有限維向量空間,且 T 是沿著 W' 到 W 上的投影(projection on W along W'),其中 W 與 W' 為 V 的子空間。(參見 2.1 節第 76 頁習題中的定義)。試求 V 的一個有序基底 \beta,使得 [T]_\beta 是一個對角矩陣。
14. 令 V 與 W 為向量空間,且 T 與 U 為從 V 到 W 的非零線性轉換。若 R(T) \cap R(U) = \{0\},證明 \{T, U\} 是 \mathcal{L}(V, W) 中的一個線性獨立(linearly independent)子集。
15. 令 V = P(R),且對於 j \ge 1 定義 T_j(f(x)) = f^{(j)}(x),其中 f^{(j)}(x) 為 f(x) 的第 j 階導數。證明對於任何正整數 n,集合 \{T_1, T_2, \dots, T_n\} 是 \mathcal{L}(V) 中的一個線性獨立子集。
16. 令 V 與 W 為向量空間,且 S 為 V 的一個子集。定義 S^0 = \{T \in \mathcal{L}(V, W): \text{對所有 } x \in S \text{,} T(x) = 0\}。證明下列敘述:
(a) S^0 是 \mathcal{L}(V, W) 的一個子空間。
(b) 若 S_1 與 S_2 為 V 的子集,且 S_1 \subseteq S_2,則 S_2^0 \subseteq S_1^0。
(c) 若 V_1 與 V_2 為 V 的子空間,則 (V_1 \cup V_2)^0 = (V_1 + V_2)^0 = V_1^0 \cap V_2^0。
17. 令 V 與 W 為使得 \dim(V) = \dim(W) 的向量空間,且 T: V \to W 為線性轉換。證明存在 V 與 W 的有序基底 \beta 與 \gamma,使得 [T]_\beta^\gamma 是一個對角矩陣。
2.3 線性變換的合成與矩陣乘法
在第 2.2 節中,我們學習了如何將矩陣與線性變換聯繫起來,使得矩陣的加法與純量乘法分別對應於變換的加法與純量乘法。現在出現一個問題:線性變換合成的矩陣表示,與各個相關線性變換的矩陣表示之間有何關聯?試圖回答這個問題引出了矩陣乘法的定義。我們使用更方便的符號 UT 而不是 U \circ T 來表示線性變換 U 和 T 的合成(見附錄B)。
我們的第一個結果顯示,線性變換的合成也是線性的。
定理 2.9。設 V、W 和 Z 為同一個體 F 上的向量空間,且 T: V \rightarrow W 與 U: W \rightarrow Z 為線性變換。則 UT: V \rightarrow Z 亦為線性。
證明。設 x, y \in V 且 a \in F。則 UT(ax+y) = U(T(ax+y)) = U(aT(x)+T(y)) = aU(T(x)) + U(T(y)) = a(UT)(x) + UT(y)。
下列定理列出了線性變換合成的一些性質。
定理 2.10。設 V 為一個向量空間。設 T, U_1, U_2 \in \mathcal{L}(V)。則:
(a) T(U_1+U_2) = TU_1 + TU_2 且 (U_1+U_2)T = U_1T + U_2T。
(b) T(U_1U_2) = (TU_1)U_2。
(c) TI = IT = T。
(d) 對所有純量 a,a(U_1U_2) = (aU_1)U_2 = U_1(aU_2)。
證明。習題。
對於定義域與對應域不相等的線性變換,也會有更一般的結果成立(見習題 8)。
如果 T \in \mathcal{L}(V),在某些情況下將 T 與自身進行一次或多次合成是很自然的。例如,在第 2.1 節的例 6 中,我們考慮了由 T(f) = f^{\prime} 定義的線性變換 T: V \rightarrow V,其中 V 代表實數線上所有具任意階導數的實數函數集合。在此脈絡下,TT(f) = T(f^{\prime}) = (f^{\prime})^{\prime} = f^{\prime\prime} 為 f 的二階導數,且 TTT(f) = f^{\prime\prime\prime} 為 f 的三階導數。在這種情況下,下列符號會很有用。
定義。設 V 為一個向量空間,且 T \in \mathcal{L}(V)。我們定義 T^0 = I、T^1 = T,且對於 k \ge 2,定義 T^k = T(T^{k-1})。
現在我們回到尋找線性變換合成之矩陣表示的問題。
設 V、W 和 Z 為有限維向量空間,其有序基底分別為 \alpha、\beta 和 \gamma。設 T: V \rightarrow W 與 U: W \rightarrow Z 為線性變換,且設 A = [U]_\beta^\gamma 以及 B = [T]_\alpha^\beta。我們希望定義這兩個矩陣的乘積 AB,使得 AB = [UT]_\alpha^\gamma。
設 \alpha = \{v_1, v_2, ..., v_n\} 且 \beta = \{w_1, w_2, ..., w_m\}。那麼,對於 1 \le j \le n,UT(v_j) = U(T(v_j)) = U(\sum_{k=1}^m B_{kj} w_k) = \sum_{k=1}^m B_{kj} U(w_k) = \sum_{k=1}^m B_{kj} (\sum_{i=1}^p A_{ik} z_i) = \sum_{i=1}^p (\sum_{k=1}^m A_{ik} B_{kj}) z_i。
因此,[UT]_\alpha^\gamma 中第 i 列第 j 行的元素為 \sum_{k=1}^m A_{ik} B_{kj}。這個事實啟發了我們對矩陣乘法的下列定義。
定義。設 A 為一個 m \times n 矩陣,B 為一個 n \times p 矩陣。我們定義 A 與 B 的乘積(記為 AB)為一個 m \times p 矩陣,使得對於 1 \le i \le m 且 1 \le j \le p,(AB)_{ij} = \sum_{k=1}^n A_{ik} B_{kj}。
注意到 (AB)_{ij} 是 A 的第 i 列與 B 的第 j 行之對應元素乘積的總和。這個定義的一些有趣應用將會在本節最後介紹。
讀者應該觀察到,要使乘積 AB 具有定義,對於 A 和 B 的相對大小是有限制的。下列口訣可能會有所幫助:「(m \times n) \cdot (n \times p) = (m \times p)」;也就是說,為了使乘積 AB 有定義,兩個「內部」維度必須相等,而兩個「外部」維度則會決定乘積的大小。
例 1
我們有 \begin{pmatrix}1&2&1\\ 0&4&-1\end{pmatrix}\begin{pmatrix}4\\ 2\\ 5\end{pmatrix} = \begin{pmatrix}1\cdot4+2\cdot2+1\cdot5\\ 0\cdot4+4\cdot2+(-1)\cdot5\end{pmatrix} = \begin{pmatrix}13\\ 3\end{pmatrix}。
再次注意符號關係 (2 \times 3) \cdot (3 \times 1) = 2 \times 1。
與函數合成的情況一樣,矩陣乘法不具有交換律。考慮下列兩個乘積:\begin{pmatrix}1&1\\ 0&0\end{pmatrix}\begin{pmatrix}0&1\\ 1&0\end{pmatrix} = \begin{pmatrix}1&1\\ 0&0\end{pmatrix} 與 \begin{pmatrix}0&1\\ 1&0\end{pmatrix}\begin{pmatrix}1&1\\ 0&0\end{pmatrix} = \begin{pmatrix}0&0\\ 1&1\end{pmatrix}。
我們如此選擇矩陣乘法的定義是為了使下一個定理成立。
定理 2.11。設 V、W 和 Z 為有限維向量空間,其有序基底分別為 \alpha、\beta 和 \gamma。設 T: V \rightarrow W 與 U: W \rightarrow Z 為線性變換。則 [UT]_\alpha^\gamma = [U]_\beta^\gamma[T]_\alpha^\beta。
推論。設 V 為具備有序基底 \beta 的有限維向量空間。設 T, U \in \mathcal{L}(V)。則 [UT]_\beta = [U]_\beta[T]_\beta。
我們在下一個例子中說明定理 2.11。
例 2
設 U: P_3(R) \rightarrow P_2(R) 與 T: P_2(R) \rightarrow P_3(R) 分別為由 U(f(x)) = f^{\prime}(x) 與 T(f(x)) = \int_0^x f(t)dt 定義的線性變換。設 \alpha 和 \beta 分別為 P_3(R) 和 P_2(R) 的標準有序基底。根據微積分,可推得 UT = I,也就是 P_2(R) 上的恆等變換。為了說明定理 2.11,請觀察 [UT]_\beta = [U]_\alpha^\beta [T]_\beta^\alpha = \begin{pmatrix}0&1&0&0\\ 0&0&2&0\\ 0&0&0&3\end{pmatrix}\begin{pmatrix}0&0&0\\ 1&0&0\\ 0&\frac{1}{2}&0\\ 0&0&\frac{1}{3}\end{pmatrix} = \begin{pmatrix}1&0&0\\ 0&1&0\\ 0&0&1\end{pmatrix} = [I]_\beta。
下一個定理提供了定理 2.10 的 (a)、(c) 和 (d) 部分之類比結果。定理 2.10(b) 的類比在定理 2.16 中。同時觀察下一個定理的 (c) 部分,它說明了單位矩陣在 M_{n \times n}(F) 中扮演著乘法單位元素的角色。當語境清楚時,我們有時會省略 I_n 的下標 n。
定理 2.12。設 A 為 m \times n 矩陣,B 和 C 為 n \times p 矩陣,D 和 E 為 q \times m 矩陣。則
(a) A(B+C) = AB+AC 且 (D+E)A = DA+EA。
(b) 對於任意純量 a,a(AB) = (aA)B = A(aB)。
(c) I_m A = A = AI_n。
證明。我們證明 (a) 的前半部分與 (c),並將剩下的證明作為習題留給讀者(見習題 5)。
(a) 我們有 [A(B+C)]_{ij} = \sum_{k=1}^n A_{ik}(B+C)_{kj} = \sum_{k=1}^n A_{ik}(B_{kj}+C_{kj}) = \sum_{k=1}^n (A_{ik}B_{kj}+A_{ik}C_{kj}) = \sum_{k=1}^n A_{ik}B_{kj} + \sum_{k=1}^n A_{ik}C_{kj} = (AB)_{ij} + (AC)_{ij} = [AB+AC]_{ij}。因此 A(B+C) = AB+AC。
(c) 我們有 (I_mA)_{ij} = \sum_{k=1}^m (I_m)_{ik} A_{kj} = \sum_{k=1}^m \delta_{ik} A_{kj} = A_{ij}。
若 A = \begin{pmatrix}0&0\\ 1&0\end{pmatrix},那麼即使 A \ne O,A^2 = O(零矩陣)。因此,體中乘法的消去律並不適用於矩陣。為了解釋原因,假設消去律成立。那麼,從 A \cdot A = A^2 = O = A \cdot O,我們將得出 A = O 的結論,但這顯然是錯的。
定理 2.13。設 A 為 m \times n 矩陣,B 為 n \times p 矩陣。對於每一個 j,j=1,2,...,p,令 u_j 與 v_j 分別表示 AB 和 B 的第 j 行。則
(a) u_j = Av_j。
(b) v_j = Be_j,其中 e_j 是 F^p 的第 j 個標準向量。
證明。(a) 我們有 u_j 的第 i 個分量為 (AB)_{ij} = \sum_{k=1}^n A_{ik} B_{kj} = \sum_{k=1}^n A_{ik} (v_j)_k = (A v_j)_i。因此證明了 (a)。(b) 的證明留作習題。(見習題 6)。
根據定理 2.13 可推得(見習題 14),AB 的第 j 行是 A 的各行的線性組合,而此線性組合的係數即為 B 之第 j 行的元素。對於列也存在類似的結果;也就是說,AB 的第 i 列是 B 的各列的線性組合,而此線性組合的係數即為 A 之第 i 列的元素。
下一個結果為我們過去的許多工作提供了理論基礎。它同時運用了線性變換的矩陣表示以及矩陣乘法,以便於計算該變換在任何給定向量上的結果。
定理 2.14。設 V 與 W 為有限維向量空間,且分別具有有序基底 \beta 和 \gamma,並設 T: V \rightarrow W 為線性變換。則對於每一個 u \in V,我們有 [T(u)]_\gamma = [T]_\beta^\gamma [u]_\beta。
證明。固定 u \in V,定義線性變換 f: F \rightarrow V 為 f(a) = au,且定義 g: F \rightarrow W 為對所有 a \in F,g(a) = aT(u)。設 \alpha = \{1\} 為 F 的標準有序基底。注意到 g = Tf。將行向量視為矩陣並運用定理 2.11,我們得到:
[T(u)]_\gamma = [g(1)]_\gamma = [g]_\alpha^\gamma = [Tf]_\alpha^\gamma = [T]_\beta^\gamma [f]_\alpha^\beta = [T]_\beta^\gamma [f(1)]_\beta = [T]_\beta^\gamma [u]_\beta。
例 3
設 T: P_3(R) \rightarrow P_2(R) 為由 T(f(x)) = f^{\prime}(x) 定義的線性變換,且設 \beta 與 \gamma 分別為 P_3(R) 和 P_2(R) 的標準有序基底。若 A = [T]_\beta^\gamma,則由第 2.2 節的例 4,我們有 A = \begin{pmatrix}0&1&0&0\\ 0&0&2&0\\ 0&0&0&3\end{pmatrix}。
我們透過驗證 [T(p(x))]_\gamma = [T]_\beta^\gamma [p(x)]_\beta 來展示定理 2.14,其中 p(x) \in P_3(R) 為多項式 p(x) = 2 - 4x + x^2 + 3x^3。
令 q(x) = T(p(x));則 q(x) = p^{\prime}(x) = -4 + 2x + 9x^2。
因此 [T(p(x))]_\gamma = [q(x)]_\gamma = \begin{pmatrix}-4\\ 2\\ 9\end{pmatrix}。
且同時 [T]_\beta^\gamma [p(x)]_\beta = A [p(x)]_\beta = \begin{pmatrix}0&1&0&0\\ 0&0&2&0\\ 0&0&0&3\end{pmatrix}\begin{pmatrix}2\\ -4\\ 1\\ 3\end{pmatrix} = \begin{pmatrix}-4\\ 2\\ 9\end{pmatrix}。
我們在結束本節時介紹左乘變換 L_A,其中 A 是一個 m \times n 矩陣。這個變換可能是將變換的性質轉換為矩陣類似性質(反之亦然)的最重要工具。例如,我們用它來證明矩陣乘法具有結合律。
定義。設 A 為元素取自體 F 的 m \times n 矩陣。我們用 L_A 表示映射 L_A: F^n \rightarrow F^m,其定義為對每個行向量 x \in F^n 皆有 L_A(x) = Ax(即 A 與 x 的矩陣乘積)。我們稱 L_A 為左乘變換。
例 4
設 A = \begin{pmatrix}1&2&1\\ 0&1&2\end{pmatrix}。
則 A \in M_{2 \times 3}(R) 且 L_A: R^3 \rightarrow R^2。
若 x = \begin{pmatrix}1\\ 3\\ -1\end{pmatrix},則 L_A(x) = Ax = \begin{pmatrix}1&2&1\\ 0&1&2\end{pmatrix}\begin{pmatrix}1\\ 3\\ -1\end{pmatrix} = \begin{pmatrix}6\\ 1\end{pmatrix}。
我們在下一個定理中會看到,L_A 不僅是線性的,而且實際上它還有許多其他有用的性質。這些性質都很自然,因此很容易記憶。
定理 2.15。設 A 為元素取自 F 的 m \times n 矩陣。則左乘變換 L_A: F^n \rightarrow F^m 是線性的。此外,如果 B 是任何其他的 m \times n 矩陣(其元素取自 F),並且 \beta 和 \gamma 分別是 F^n 和 F^m 的標準有序基底,那麼我們有下列性質。
(a) [L_A]_\beta^\gamma = A。
(b) L_A = L_B 若且唯若 A = B。
(c) 對所有 a \in F,L_{A+B} = L_A + L_B 且 L_{aA} = aL_A。
(d) 如果 T: F^n \rightarrow F^m 是線性的,則存在唯一的一個 m \times n 矩陣 C 使得 T = L_C。事實上,C = [T]_\beta^\gamma。
(e) 如果 E 是一個 n \times p 矩陣,則 L_{AE} = L_A L_E。
(f) 如果 m = n,則 L_{I_n} = I_{F^n}。
證明。由定理 2.12 可以直接推得 L_A 為線性。
(a) [L_A]_\beta^\gamma 的第 j 行等於 L_A(e_j)。然而 L_A(e_j) = Ae_j,根據定理 2.13(b),這也等於 A 的第 j 行。所以 [L_A]_\beta^\gamma = A。
(b) 如果 L_A = L_B,那麼我們可以使用 (a) 來寫成 A = [L_A]_\beta^\gamma = [L_B]_\beta^\gamma = B。因此 A = B。其反向的證明是顯然的。
(c) 證明留作習題。(見習題 7)。
(d) 令 C = [T]_\beta^\gamma。由定理 2.14,對於所有 x \in F^n,我們有 [T(x)]_\gamma = [T]_\beta^\gamma[x]_\beta,即 T(x) = Cx = L_C(x)。所以 T = L_C。C 的唯一性可由 (b) 推得。
(e) 對於任意的 j (1 \le j \le p),我們可以多次應用定理 2.13 來注意到 (AE)e_j 是 AE 的第 j 行,且 AE 的第 j 行也等於 A(Ee_j)。所以 (AE)e_j = A(Ee_j)。因此 L_{AE}(e_j) = (AE)e_j = A(Ee_j) = L_A(Ee_j) = L_A(L_E(e_j))。由定理 2.6(第 73 頁)的推論可知,L_{AE} = L_A L_E。
(f) 證明留作習題。(見習題 7)。
我們現在使用左乘變換來證明矩陣乘法的結合律。
定理 2.16。設 A、B 和 C 為三個矩陣,且 A(BC) 具定義。則 (AB)C 亦有定義,且 A(BC) = (AB)C;也就是說,矩陣乘法具有結合律。
證明。證明 (AB)C 有定義這部分留給讀者練習。運用定理 2.15 的 (e) 部分以及函數合成的結合律(見附錄 B),我們有 L_{A(BC)} = L_A L_{BC} = L_A(L_B L_C) = (L_A L_B) L_C = L_{AB} L_C = L_{(AB)C}。因此由定理 2.15 的 (b) 部分可推得,A(BC) = (AB)C。
不用說,這個定理可以直接從矩陣乘法的定義證明(見習題 19)。然而,上述的證明提供了一個範例,展示了許多利用線性變換與矩陣之間關係的論證原型。
應用*
若想了解矩陣乘法在人口增長研究上的應用,請造訪 goo.gl/x5XDLw。
許多各式各樣有趣的應用與稱為關聯矩陣(incidence matrices)的特殊矩陣有關。關聯矩陣是一個方陣,其中所有元素不是 0 就是 1,而且為了方便起見,所有對角線元素皆為 0。如果我們在一個包含 n 個物件的集合(將其標記為 1, 2, ..., n)上有一種關係,那麼我們定義相關的關聯矩陣 A 為:若 i 與 j 相關,則 A_{ij} = 1;否則 A_{ij} = 0。
具體來說,假設我們有四個人,每個人都有一個通訊設備。如果這群人之間的關係是「可以傳送訊息給」,那麼若 i 可以發送訊息給 j 則 A_{ij} = 1,否則 A_{ij} = 0。
假設 A = \begin{pmatrix}0&1&0&0\\ 1&0&0&1\\ 0&1&0&1\\ 1&1&0&0\end{pmatrix}。因為 A_{34} = 1 且 A_{14} = 0,我們可以看出第 3 個人可以發送給第 4 個人,但第 1 個人無法發送給第 4 個人。
關於 A^2 的元素,我們獲得一個有趣的解釋。例如,考慮到
具有「任兩人皆可互相傳送訊息」性質之三個以上(含三個)的人的最大集合,稱為派系(clique)。判斷派系的問題是很困難的,但有一個簡單的方法可以決定某人是否屬於某個派系。如果我們定義一個新矩陣 B,若 i 與 j 可互相傳送訊息,則 B_{ij} = 1;否則 B_{ij} = 0。那麼可以證明(見習題 20),第 i 個人屬於一個派系,若且唯若 (B^3)_{ii} > 0。
例如,假設與某個關係相關的關聯矩陣為 A = \begin{pmatrix}0&1&0&1\\ 1&0&1&0\\ 1&1&0&1\\ 1&1&1&0\end{pmatrix}。為了決定哪些人屬於派系,我們構造先前描述的矩陣 B 並計算 B^3。在這個例子中,
B = \begin{pmatrix}0&1&0&1\\ 1&0&1&0\\ 0&1&0&1\\ 1&0&1&0\end{pmatrix} 且 B^3 = \begin{pmatrix}0&4&0&4\\ 4&0&4&0\\ 0&4&0&4\\ 4&0&4&0\end{pmatrix}。
因為 B^3 的所有對角線元素都是零,我們的結論是這個關係中不存在派系。
我們關於關聯矩陣使用的最後一個例子,涉及支配(dominance)的概念。如果群體間關係的關聯矩陣 A 具有此性質:對所有不同的對 i 與 j,A_{ij} = 1 若且唯若 A_{ji} = 0,則稱該關係為支配關係。也就是說,給定任意兩個人,恰好其中一人支配(或者用我們第一個例子的術語來說,能發送訊息給)另一人。因為 A 是一個關聯矩陣,所以對所有的 i 皆有 A_{ii} = 0。對於這樣的關係,可以證明(見習題 22),矩陣 A+A^2 存在一列[行],其中除了對角線元素之外,每個元素皆為正數。換句話說,至少有一人在一個或兩個階段內,能支配[被支配於]所有其他人。事實上,可以證明任何在第一階段支配最多人[被最多人支配]的人都具有這個性質。
例如,考慮矩陣
A = \begin{pmatrix}0&1&0&1&0\\ 0&0&1&0&0\\ 1&0&0&1&0\\ 0&1&0&0&1\\ 1&1&1&0&0\end{pmatrix}。讀者應驗證此矩陣對應於一種支配關係。
現有 A+A^2 = \begin{pmatrix}0&2&1&1&1\\ 1&0&1&1&0\\ 1&2&0&2&1\\ 1&2&2&0&1\\ 2&2&2&2&0\end{pmatrix}。
因此,第 1、3、4 和 5 個人至多在兩個階段內支配(能發送訊息給)所有其他人;而第 1、2、3 和 4 個人至多在兩個階段內被所有其他人支配(能收到來自所有其他人的訊息)。
習題
- 標示下列敘述為真(True)或假(False)。在每個子題中,V、W 與 Z 代表具有有序(有限)基底 \alpha、\beta 與 \gamma 的向量空間;T: V \to W 與 U: W \to Z 代表線性轉換;而 A 與 B 代表矩陣。
(a) [UT]_\alpha^\gamma = [T]_\alpha^\beta [U]_\beta^\gamma。
(b) 對所有 v \in V,[T(v)]_\beta = [T]_\alpha^\beta [v]_\alpha。
(c) 對所有 w \in W,[U(w)]_\gamma = [U]_\beta^\gamma [w]_\beta。
(d) [I_V]_\alpha = I。
(e) [T^2]_\alpha^\alpha = ([T]_\alpha^\alpha)^2。
(f) A^2 = I 意味著 A = I 或 A = -I。
(g) 存在某個矩陣 A 使得 T = L_A。
(h) A^2 = O 意味著 A = O,其中 O 代表零矩陣。
(i) L_{A+B} = L_A + L_B。
(j) 若 A 為方陣且對所有 i 與 j 皆有 A_{ij} = \delta_{ij},則 A = I。 - (a) 令 A, B, C, D 為原文書給定之矩陣。計算 A(2B + 3C)、(AB)D 以及 A(BD)。
(b) 令 A, B, C 為原文書給定之矩陣。計算 A^t、A^t B、BC^t、CB 以及 CA。 - 令 g(x) = 3 + x。令 T: P_2(R) \to P_2(R) 與 U: P_2(R) \to R^3 分別為定義如下的線性轉換:T(f(x)) = f'(x)g(x) + 2f(x) 且 U(a + bx + cx^2) = (a + b, c, a - b)。令 \beta 與 \gamma 分別為 P_2(R) 與 R^3 的標準有序基底。
(a) 直接計算 [U]_\beta^\gamma、[T]_\beta^\beta 與 [UT]_\beta^\gamma。接著使用定理 2.11 來驗證你的結果。
(b) 令 h(x) = 3 - 2x + x^2。計算 [h(x)]_\beta 與 [U(h(x))]_\gamma。接著使用 (a) 的 [U]_\beta^\gamma 與定理 2.14 來驗證你的結果。 - 對於下列每個子題,令 T 為 2.2 節習題 5 中對應子題所定義的線性轉換。使用定理 2.14 計算下列向量:
(a) [T(A)]_\alpha,其中 A = \begin{pmatrix} 1 & 4 \\ -1 & 6 \end{pmatrix}。
(b) [T(f(x))]_\alpha,其中 f(x) = 4 - 6x + 3x^2。
(c) [T(A)]_\gamma,其中 A = \begin{pmatrix} 1 & 3 \\ 2 & 4 \end{pmatrix}。
(d) [T(f(x))]_\gamma,其中 f(x) = 6 - x + 2x^2。
(註:矩陣數值依據原文書可能略有不同) - 完成定理 2.12 及其推論的證明。
- 證明定理 2.13 的 (b) 部分。
- 證明定理 2.15 的 (c) 與 (f) 部分。
- 證明定理 2.11。接著陳述並證明一個涉及定義域與對應域不相等的線性轉換的更一般性結果。
- 找出線性轉換 U, T: F^2 \to F^2 使得 UT = T_0(零轉換)但 TU \neq T_0。使用你的答案找出矩陣 A 與 B 使得 AB = O 但 BA \neq O。
- 令 A 為 n \times n 矩陣。證明 A 為對角矩陣若且唯若對所有 i 與 j 皆有 A_{ij} = \delta_{ij}A_{ij}。
- 令 V 為一個向量空間,且令 T: V \to V 為線性的。證明 T^2 = T_0 若且唯若 R(T) \subseteq N(T)。
- 令 V, W, Z 為向量空間,且令 T: V \to W 與 U: W \to Z 為線性的。
(a) 證明若 UT 為一對一(嵌射),則 T 也是一對一。U 也必須是一對一嗎?
(b) 證明若 UT 為映成(蓋射),則 U 也是映成。T 也必須是映成嗎?
(c) 證明若 U 與 T 皆為一對一且映成,則 UT 也是。 - 令 A 與 B 為 n \times n 矩陣。回顧 A 的跡數(trace)定義為 \text{tr}(A) = \sum_{i=1}^n A_{ii}。證明 \text{tr}(AB) = \text{tr}(BA) 且 \text{tr}(A) = \text{tr}(A^t)。
- 假設使用定理 2.13 中的符號。
(a) 假設 z 為 F^p 中的(行)向量。使用定理 2.13(b) 證明 Bz 是 B 的行向量的線性組合。特別是,若 z = (a_1, a_2, \dots, a_p)^t,則證明 Bz = \sum_{j=1}^p a_j v_j。
(b) 推廣 (a) 以證明 AB 的第 j 行是 A 的行向量的線性組合,且該線性組合的係數為 B 的第 j 行的對應元素。
(c) 對於任何列向量 w \in F^m,證明 wA 是 A 的列向量的線性組合,且該線性組合的係數為 w 的座標。提示:使用轉置運算的性質並應用於 (a)。
(d) 證明與 (b) 類似的關於列向量的結果:AB 的第 i 列是 B 的列向量的線性組合,且該線性組合的係數為 A 的第 i 列的元素。 - 令 A 與 B 為可定義乘積矩陣 AB 的矩陣,並令 u_j 與 v_j 分別代表 AB 與 B 的第 j 行。若對某些純量 c_1, c_2, \dots, c_k,有 v_p = c_1 v_{j_1} + c_2 v_{j_2} + \dots + c_k v_{j_k},證明 u_p = c_1 u_{j_1} + c_2 u_{j_2} + \dots + c_k u_{j_k}。請造訪 goo.gl/sRpves 查看解答。
- 令 V 為有限維向量空間,且令 T: V \to V 為線性的。
(a) 若 \text{rank}(T) = \text{rank}(T^2),證明 R(T) \cap N(T) = \{0\}。推導出 V = R(T) \oplus N(T)(參見 1.3 節的習題)。
(b) 證明對某個正整數 k,有 V = R(T^k) \oplus N(T^k)。 - 關於投影(projection)的定義及相關事實,請參見第 76-77 頁。令 V 為向量空間且 T: V \to V 為線性轉換。證明 T = T^2 若且唯若 T 是沿著 N(T) 在 W_1 = \{y : T(y) = y\} 上的投影。
- 令 \beta 為有限維向量空間 V 的一個有序基底,且令 T: V \to V 為線性的。證明對任何非負整數 k,[T^k]_\beta = ([T]_\beta)^k。
- 僅使用矩陣乘法的定義,證明矩陣乘法具有結合律。
- 對於關聯矩陣(incidence matrix)A,其相關矩陣 B 定義為:若 i 與 j 相關且 j 與 i 相關,則 B_{ij} = 1,否則 B_{ij} = 0。證明 i 屬於一個派系(clique)若且唯若 (B^3)_{ii} > 0。
- 使用習題 20 來決定對應於原文書中所列關聯矩陣 (a) 與 (b) 關係中的派系。
- 令 A 為一個與優勢關係(dominance relation)相關的關聯矩陣。證明矩陣 A + A^2 有一列(或一行)除了對角線元素外,所有元素皆為正。
- 證明矩陣
A = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 1 & 0 & 0 \end{pmatrix}
對應於一個優勢關係。使用習題 22 來決定哪些人在兩個階段內支配(或被支配)其他所有人。 - 令 A 為對應於一個優勢關係的 n \times n 關聯矩陣。決定 A 中非零元素的個數。
2.4 可逆性與同構
在函數的研究中,可逆性的概念很早就被引入了。幸運的是,函數的許多內在性質也為其反函數所共有。例如,在微積分中我們學到,連續或可微的性質通常會保留在反函數中。我們將在本節(定理 2.17)看到,線性變換的反函數也是線性的。這個結果對我們研究矩陣的反矩陣有極大的幫助。正如我們可以從第 2.3 節中預期的那樣,左乘變換 L_A 的反函數(如果存在的話)可以用來決定矩陣 A 的反矩陣性質。
在本節的其餘部分,我們將許多關於可逆性的結果應用到同構 (isomorphism) 的概念上。我們將會看到,相同維度的(在體 F 上的)有限維向量空間可以被視為是等同的。這些想法很快就會被精確地描述。
在附錄 B 中提出關於反函數的事實,對於線性變換當然也成立。儘管如此,我們還是重複一些定義以便在本節中使用。
定義。設 V 與 W 為向量空間,且 T: V \rightarrow W 為線性的。如果一個函數 U: W \rightarrow V 滿足 TU = I_W 且 UT = I_V,則稱 U 為 T 的反函數 (inverse)。如果 T 具有反函數,則稱 T 為可逆的 (invertible)。如附錄 B 所述,如果 T 是可逆的,那麼 T 的反函數是唯一的,並記為 T^{-1}。
下列事實對於可逆函數 T 與 U 皆成立:
- (TU)^{-1} = U^{-1}T^{-1}。
- (T^{-1})^{-1} = T;特別是,T^{-1} 亦為可逆。
我們經常使用一個事實:一個函數是可逆的,若且唯若它是一對一 (one-to-one) 且映成 (onto)。因此我們可以將定理 2.5 重述如下。
- 設 T: V \rightarrow W 為一線性變換,其中 V 與 W 是具有相等維度的有限維空間。則 T 為可逆,若且唯若 \text{rank}(T) = \dim(V)。
例 1
設 T: P_1(R) \rightarrow R^2 為由 T(a+bx) = (a,a+b) 所定義的線性變換。讀者可以直接驗證 T^{-1}: R^2 \rightarrow P_1(R) 的定義為 T^{-1}(c,d) = c+(d-c)x。觀察到 T^{-1} 也是線性的。如定理 2.17 所證明的,這在一般情況下皆成立。
定理 2.17。設 V 與 W 為向量空間,且 T: V \rightarrow W 為線性且可逆。則 T^{-1}: W \rightarrow V 亦為線性。
證明。設 y_1, y_2 \in W 且 c \in F。因為 T 是映成且一對一的,故存在唯一的向量 x_1 與 x_2 使得 T(x_1) = y_1 且 T(x_2) = y_2。因此 x_1 = T^{-1}(y_1) 且 x_2 = T^{-1}(y_2);所以
T^{-1}(cy_1+y_2) = T^{-1}[cT(x_1)+T(x_2)] = T^{-1}[T(cx_1+x_2)] = cx_1+x_2 = cT^{-1}(y_1)+T^{-1}(y_2)。
推論。設 T 為從 V 到 W 的可逆線性變換。則 V 為有限維,若且唯若 W 為有限維。在這種情況下,\dim(V) = \dim(W)。
證明。假設 V 為有限維。設 \beta = \{x_1, x_2, ..., x_n\} 為 V 的基底。根據定理 2.2(第 68 頁),T(\beta) 生成了 R(T) = W;因此藉由定理 1.9(第 45 頁),W 為有限維。反之,若 W 為有限維,那麼使用 T^{-1} 進行類似的論證可知 V 亦為有限維。
現在假設 V 與 W 皆為有限維。因為 T 為一對一且映成,我們有 \text{nullity}(T) = 0 且 \text{rank}(T) = \dim(R(T)) = \dim(W)。因此由維度定理(第 70 頁),可推得 \dim(V) = \dim(W)。
現在由定理 2.5(第 71 頁)可立即推得:如果 T 是在兩個維度相等(有限維)的向量空間之間的線性變換,那麼可逆、一對一與映成這三個條件是等價的。
我們現在準備好定義矩陣的反矩陣。讀者應當注意這與線性變換的反函數之間的類比關係。
定義。設 A 為一個 n \times n 矩陣。如果存在一個 n \times n 矩陣 B 使得 AB = BA = I,則稱 A 為可逆的 (invertible)。
如果 A 是可逆的,那麼使得 AB = BA = I 成立的矩陣 B 是唯一的。(如果 C 是另一個這樣的矩陣,那麼 C = CI = C(AB) = (CA)B = IB = B。)矩陣 B 稱為 A 的反矩陣 (inverse),並記為 A^{-1}。
例 2
讀者應驗證 \begin{pmatrix}5&7\\ 2&3\end{pmatrix} 的反矩陣是 \begin{pmatrix}3&-7\\ -2&5\end{pmatrix}。
在第 3.2 節中,我們將學習計算矩陣之反矩陣的技巧。在此,我們發展一些將矩陣的反矩陣與線性變換的反函數聯繫起來的結果。
定理 2.18。設 V 與 W 為具有有序基底 \beta 與 \gamma 的有限維向量空間。設 T: V \rightarrow W 為線性的。則 T 為可逆,若且唯若 [T]_\beta^\gamma 為可逆。此外,[T^{-1}]_\gamma^\beta = ([T]_\beta^\gamma)^{-1}。
證明。假設 T 是可逆的。由定理 2.17 的推論,我們有 \dim(V) = \dim(W)。令 n = \dim(V)。所以 [T]_\beta^\gamma 是一個 n \times n 矩陣。現在 T^{-1}: W \rightarrow V 滿足 TT^{-1} = I_W 與 T^{-1}T = I_V。因此
I_n = [I_V]_\beta = [T^{-1}T]_\beta = [T^{-1}]_\gamma^\beta [T]_\beta^\gamma。
同理,[T]_\beta^\gamma [T^{-1}]_\gamma^\beta = I_n。所以 [T]_\beta^\gamma 是可逆的且 ([T]_\beta^\gamma)^{-1} = [T^{-1}]_\gamma^\beta。
現在假設 A = [T]_\beta^\gamma 是可逆的。那麼存在一個 n \times n 矩陣 B 使得 AB = BA = I_n。由定理 2.6(第 73 頁),存在 U \in \mathcal{L}(W,V) 使得對於 j=1,2,...,n,
U(w_j) = \sum_{i=1}^n B_{ij}v_i
其中 \gamma=\{w_1, w_2, ..., w_n\} 且 \beta=\{v_1,v_2,...,v_n\}。由此可知 [U]_\gamma^\beta = B。為了證明 U = T^{-1},根據定理 2.11(第 89 頁)觀察:
[UT]_\beta = [U]_\gamma^\beta [T]_\beta^\gamma = BA = I_n = [I_V]_\beta。
所以 UT = I_V,同理可證 TU = I_W。
例 3
設 \beta 與 \gamma 分別為 P_1(R) 與 R^2 的標準有序基底。對於例 1 中的 T,我們有
[T]_\beta^\gamma = \begin{pmatrix}1&0\\ 1&1\end{pmatrix} 且 [T^{-1}]_\gamma^\beta = \begin{pmatrix}1&0\\ -1&1\end{pmatrix}。
我們可以透過矩陣乘法驗證這兩個矩陣互為反矩陣。
推論 1。設 V 為具有有序基底 \beta 的有限維向量空間,且設 T: V \rightarrow V 為線性的。則 T 為可逆,若且唯若 [T]_\beta 為可逆。此外,[T^{-1}]_\beta = ([T]_\beta)^{-1}。
證明。習題。
推論 2。設 A 為一個 n \times n 矩陣。則 A 為可逆,若且唯若 L_A 為可逆。此外,(L_A)^{-1} = L_{A^{-1}}。
證明。習題。
可逆性的概念可以用來將讀者可能已經觀察到的現象形式化,也就是說,某些向量空間除了其向量的表示形式之外,彼此之間非常相似。例如,在 M_{2\times 2}(F) 與 F^4 的情況下,如果我們將每個矩陣 \begin{pmatrix}a&b\\ c&d\end{pmatrix} 對應到 4-元組 (a, b, c, d),我們可以看出和與純量積以相似的方式對應;也就是說,就向量空間的結構而言,這兩個向量空間可以被認為是等同的或同構的 (isomorphic)。
定義。設 V 與 W 為向量空間。如果存在一個可逆的線性變換 T: V \rightarrow W,我們稱 V 同構於 (is isomorphic to) W。這樣的線性變換稱為從 V 到 W 的同構 (isomorphism)。
我們將「同構於」是一個等價關係(見附錄 A)的證明留作習題(見習題 13)。因此我們只需要說 V 與 W 是同構的。
例 4
定義 T: F^2 \rightarrow P_1(F) 為 T(a_1, a_2) = a_1 + a_2 x。我們很容易可以檢查出 T 是一個同構;所以 F^2 同構於 P_1(F)。
例 5
定義 T: P_3(R) \rightarrow M_{2\times 2}(R) 為
T(f) = \begin{pmatrix}f(1)&f(2)\\ f(3)&f(4)\end{pmatrix}
很容易可以驗證 T 是線性的。使用第 1.6 節中的拉格朗日插值公式,可以證明(與習題 22 比較)只有當 f 是零多項式時 T(f) = O。因此 T 是一對一的(見習題 11)。此外,因為 \dim(P_3(R)) = \dim(M_{2\times 2}(R)),由定理 2.5(第 71 頁)可推得 T 是可逆的。我們得到結論:P_3(R) 同構於 M_{2\times 2}(R)。
在例 4 與例 5 中,讀者可能已經觀察到同構的向量空間具有相等的維度。如下一個定理所示,這並非巧合。
定理 2.19。設 V 與 W 為(在同一個體上的)有限維向量空間。則 V 同構於 W,若且唯若 \dim(V) = \dim(W)。
證明。假設 V 同構於 W,且 T: V \rightarrow W 為從 V 到 W 的同構。根據定理 2.18 之前的引理,我們有 \dim(V) = \dim(W)。
現在假設 \dim(V) = \dim(W),並設 \beta = \{v_1, v_2, ..., v_n\} 與 \gamma = \{w_1, w_2, ..., w_n\} 分別為 V 與 W 的基底。根據定理 2.6(第 73 頁),存在 T: V \rightarrow W 使得 T 為線性且對於 i=1,2,...,n 皆有 T(v_i) = w_i。使用定理 2.2(第 68 頁),我們得到
R(T) = \text{span}(T(\beta)) = \text{span}(\gamma) = W。
所以 T 是映成。由定理 2.5(第 71 頁),我們知道 T 也是一對一。因此 T 是一個同構。
根據定理 2.18 的引理,如果 V 與 W 是同構的,那麼 V 與 W 要麼都是有限維,要麼都是無限維。
推論。設 V 為體 F 上的向量空間。則 V 同構於 F^n,若且唯若 \dim(V) = n。
到目前為止,我們已經將線性變換與它們的矩陣表示聯繫起來。我們現在可以證明:作為一個向量空間,兩個給定向量空間之間所有線性變換的集合可以被視為等同於適當的 m \times n 矩陣向量空間。
定理 2.20。設 V 與 W 分別為體 F 上維度為 n 與 m 的有限維向量空間,並設 \beta 與 \gamma 分別為 V 與 W 的有序基底。則由 \Phi_\beta^\gamma(T) = [T]_\beta^\gamma(對於 T \in \mathcal{L}(V, W))所定義的函數 \Phi_\beta^\gamma: \mathcal{L}(V, W) \rightarrow M_{m\times n}(F),是一個同構。
證明。由定理 2.8(第 83 頁),\Phi_\beta^\gamma 是線性的。因此我們必須證明 \Phi_\beta^\gamma 是一對一且映成的。如果我們證明了對於每個 m \times n 矩陣 A,存在唯一的線性變換 T: V \rightarrow W 使得 \Phi_\beta^\gamma(T) = A,這件事便完成了。設 \beta=\{v_1, v_2, ..., v_n\},\gamma=\{w_1, w_2, ..., w_m\},並設 A 為一給定的 m \times n 矩陣。根據定理 2.6(第 73 頁),存在唯一的線性變換 T: V \rightarrow W 使得對於 1 \le j \le n,
T(v_j) = \sum_{i=1}^m A_{ij}w_i
但這意味著 [T]_\beta^\gamma = A,即 \Phi_\beta^\gamma(T) = A。所以 \Phi_\beta^\gamma 是一個同構。
推論。設 V 與 W 分別為維度為 n 與 m 的有限維向量空間。則 \mathcal{L}(V, W) 為有限維,且其維度為 mn。
證明。這個證明可從定理 2.20 與 2.19,以及 \dim(M_{m\times n}(F)) = mn 的事實推得。
我們以一個結果作為本節的結尾,這使我們能更清楚地看出定義在抽象有限維向量空間上的線性變換與從 F^n 到 F^m 的線性變換之間的關係。我們首先為第 2.2 節中引入的變換 x \rightarrow [x]_\beta 命名。
定義。設 \beta 為在體 F 上的 n 維向量空間 V 的有序基底。V 關於 \beta 的標準表示 (standard representation) 是一個定義為對於每個 x \in V 皆有 \phi_\beta(x) = [x]_\beta 的函數 \phi_\beta: V \rightarrow F^n。
例 6
設 \beta = \{(1,0), (0,1)\} 且 \gamma = \{(1,2), (3,4)\}。我們很容易觀察到 \beta 與 \gamma 是 R^2 的有序基底。對於 x = (1, -2),我們有
\phi_\beta(x) = [x]_\beta = \begin{pmatrix}1\\ -2\end{pmatrix} 且 \phi_\gamma(x) = [x]_\gamma = \begin{pmatrix}-5\\ 2\end{pmatrix}。
我們之前觀察到 \phi_\beta 是一個線性變換。下一個定理告訴我們更多。
定理 2.21。對於任何具備有序基底 \beta 的有限維向量空間 V,\phi_\beta 是一個同構。
證明。習題。
這個定理為我們提供了一個替代證明,說明 n 維向量空間同構於 F^n(見定理 2.19 的推論)。
設 V 與 W 分別為維度 n 與 m 的向量空間,並設 T: V \rightarrow W 為一個線性變換。定義 A = [T]_\beta^\gamma,其中 \beta 與 \gamma 分別是 V 與 W 的任意有序基底。我們現在能夠使用 \phi_\beta 與 \phi_\gamma 來研究線性變換 T 與 L_A: F^n \rightarrow F^m 之間的關係。
讓我們先考慮圖 2.2。請注意,有兩個線性變換的合成可將 V 映射到 F^m:
- 利用 \phi_\beta 將 V 映射到 F^n,並接著執行變換 L_A;這產生了合成 L_A \phi_\beta。
- 利用 T 將 V 映射到 W,並接著執行 \phi_\gamma,以獲得合成 \phi_\gamma T。
這兩個合成在圖中由虛線箭頭描繪。透過對定理 2.14(第 92 頁)進行簡單的重述,我們可以得出結論:
L_A \phi_\beta = \phi_\gamma T
也就是說,這個圖是「交換的」(commutes)。啟發式地看,這種關係表明在透過 \phi_\beta 與 \phi_\gamma 分別將 V 與 W 等同於 F^n 與 F^m 之後,我們可以將 T「等同於」L_A。這個圖讓我們可以把對抽象向量空間的操作轉換為對 F^n 與 F^m 的操作。
例 7
回顧在第 2.2 節的例 4 中定義的線性變換 T: P_3(R) \rightarrow P_2(R)(即 T(f(x)) = f^{\prime}(x))。設 \beta 與 \gamma 分別為 P_3(R) 與 P_2(R) 的標準有序基底,並設 \phi_\beta: P_3(R) \rightarrow R^4 與 \phi_\gamma: P_2(R) \rightarrow R^3 為對應的 P_3(R) 與 P_2(R) 的標準表示。若 A = [T]_\beta^\gamma,則
A = \begin{pmatrix}0&1&0&0\\ 0&0&2&0\\ 0&0&0&3\end{pmatrix}
考慮多項式 p(x) = 2+x-3x^2+5x^3。我們將證明 L_A \phi_\beta(p(x)) = \phi_\gamma T(p(x))。現在
L_A \phi_\beta(p(x)) = \begin{pmatrix}0&1&0&0\\ 0&0&2&0\\ 0&0&0&3\end{pmatrix}\begin{pmatrix}2\\ 1\\ -3\\ 5\end{pmatrix} = \begin{pmatrix}1\\ -6\\ 15\end{pmatrix}
但由於 T(p(x)) = p^{\prime}(x) = 1-6x+15x^2,我們有
\phi_\gamma T(p(x)) = \begin{pmatrix}1\\ -6\\ 15\end{pmatrix}。
所以 L_A \phi_\beta(p(x)) = \phi_\gamma T(p(x))。
試著用不同的多項式 p(x) 重複例 7。
以下是 2.4 節習題的完整翻譯:
習題
1. 將下列敘述標示為真(True)或假(False)。在每個子題中,假設 V 與 W 分別為具有有序(有限)基底 \alpha 與 \beta 的向量空間,T: V \rightarrow W 為線性變換,且 A 與 B 為矩陣。
(a) ([T]_\alpha^\beta)^{-1} = [T^{-1}]_\alpha^\beta。
(b) T 為可逆若且唯若 T 是一對一且映成的。
(c) T = L_A,其中 A = [T]_\alpha^\beta。
(d) M_{2\times 3}(F) 同構於 F^5。
(e) P_n(F) 同構於 P_m(F) 若且唯若 n=m。
(f) AB=I 意味著 A 與 B 皆為可逆。
(g) 若 A 為可逆,則 (A^{-1})^{-1} = A。
(h) A 為可逆若且唯若 L_A 為可逆。
(i) A 必須是方陣才可能具有反矩陣。
2. 對於下列每一個線性變換 T,判斷 T 是否可逆並說明你的理由。
(a) 定義 T: R^2 \rightarrow R^3 為 T(a_1, a_2) = (a_1-2a_2, a_2, 3a_1+4a_2)。
(b) 定義 T: R^2 \rightarrow R^3 為 T(a_1, a_2) = (3a_1-a_2, a_2, 4a_1)。
(c) 定義 T: R^3 \rightarrow R^3 為 T(a_1, a_2, a_3) = (3a_1-2a_3, a_2, 3a_1+4a_2)。
(d) 定義 T: P_3(R) \rightarrow P_2(R) 為 T(p(x)) = p^{\prime}(x)。
(e) 定義 T: M_{2 \times 2}(R) \rightarrow P_2(R) 為 T\begin{pmatrix} a & b \\ c & d \end{pmatrix} = a + 2bx + (c+d)x^2。
(f) 定義 T: M_{2 \times 2}(R) \rightarrow M_{2 \times 2}(R) 為 T\begin{pmatrix} a & b \\ c & d \end{pmatrix} = \begin{pmatrix} a+b & a \\ c & c+d \end{pmatrix}。
3. 下列哪幾對向量空間是同構的?請說明理由。
(a) F^3 與 P_3(F)。
(b) F^4 與 P_3(F)。
(c) M_{2\times 2}(R) 與 P_3(R)。
(d) V = \{A \in M_{2 \times 2}(R) : \text{tr}(A) = 0\} 與 R^4。
4. 設 A 與 B 為 n \times n 可逆矩陣。證明 AB 為可逆且 (AB)^{-1} = B^{-1}A^{-1}。
5. 設 A 為可逆。證明 A^t 為可逆且 (A^t)^{-1} = (A^{-1})^t。
6. 證明若 A 是可逆的且 AB=O,則 B=O。
7. 設 A 為 n \times n 矩陣。
(a) 假設 A^2 = O。證明 A 不可逆。
(b) 假設對於某個非零的 n \times n 矩陣 B 滿足 AB = O。A 可能可逆嗎?請解釋。
8. 證明定理 2.18 的推論 1 與推論 2。
9. 設 A 與 B 為 n \times n 矩陣,使得 AB 為可逆。
(a) 證明 A 與 B 皆為可逆。提示:參見第 2.3 節習題 12。
(b) 舉一個例子說明:即便非方陣依定義不可逆,但非方陣的乘積卻可能是可逆的。
10. 設 A 與 B 為 n \times n 矩陣,使得 AB = I_n。
(a) 利用習題 9 推導出 A 與 B 都是可逆的結論。
(b) 證明 A = B^{-1}(且因此 B = A^{-1})。(我們實際上是在說,對於方陣而言,「單邊」反矩陣就是「雙邊」反矩陣。)
(c) 敘述並證明在有限維向量空間上的線性變換也有類似的結果。
11. 驗證例 5 中的變換是一對一的。
12. 證明定理 2.21。
13. 設 \sim 表示「同構於」。證明 \sim 是所有佈於體 F 的向量空間之類 (class) 上的一個等價關係 (equivalence relation)。
14. 設 V = \left\{ \begin{pmatrix} a & a+b \\ 0 & c \end{pmatrix} : a,b,c \in F \right\}。構造一個從 V 到 F^3 的同構映射。
15. 設 V 與 W 為 n 維向量空間,且 T: V \rightarrow W 為一個線性變換。假設 \beta 為 V 的一個基底。證明 T 是一個同構,若且唯若 T(\beta) 是 W 的一個基底。
16. 設 B 為一個 n \times n 可逆矩陣。定義 \Phi: M_{n \times n}(F) \rightarrow M_{n \times n}(F) 為 \Phi(A) = B^{-1}AB。證明 \Phi 是一個同構。
17. 設 V 與 W 為有限維向量空間,且 T: V \rightarrow W 為一個同構。設 V_0 為 V 的子空間。
(a) 證明 T(V_0) 是 W 的子空間。
(b) 證明 \dim(V_0) = \dim(T(V_0))。
18. 用多項式 p(x) = 1+x+2x^2+x^3 重複例 7。
19. 在第 2.1 節的例 5 中,定義為對每個 M \in M_{2 \times 2}(R),皆有 T(M) = M^t 的映射 T: M_{2 \times 2}(R) \rightarrow M_{2 \times 2}(R) 是一個線性變換。令 \beta = \{E^{11}, E^{12}, E^{21}, E^{22}\},如第 1.6 節例 3 所述,它是 M_{2 \times 2}(R) 的一個基底。
(a) 計算 [T]_\beta。
(b) 驗證 L_A \phi_\beta(M) = \phi_\beta T(M),其中 A = [T]_\beta 且 M = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}。
20. 設 T: V \rightarrow W 為從 n 維向量空間 V 到 m 維向量空間 W 的線性變換。設 \beta 與 \gamma 分別為 V 與 W 的有序基底。證明 \text{rank}(T) = \text{rank}(L_A) 且 \text{nullity}(T) = \text{nullity}(L_A),其中 A = [T]_\beta^\gamma。提示:將習題 17 應用於圖 2.2。
21. 設 V 與 W 分別為具備有序基底 \beta = \{v_1, v_2, ..., v_n\} 與 \gamma = \{w_1, w_2, ..., w_m\} 的有限維向量空間。根據定理 2.6 (第 73 頁),存在線性變換 T_{ij}: V \rightarrow W 使得
T_{ij}(v_k) = \begin{cases} w_i & \text{若 } k=j \\ 0 & \text{若 } k \neq j \end{cases}。
首先證明 \{T_{ij}: 1 \le i \le m, 1 \le j \le n\} 是 \mathcal{L}(V, W) 的一個基底。接著令 M^{ij} 為在第 i 列第 j 行的元素為 1,其他元素皆為 0 的 m \times n 矩陣,並證明 \Phi_\beta^\gamma(T_{ij}) = M^{ij}。
22. 設 c_0, c_1, ..., c_n 為來自無窮體 F 的相異純量。定義 T: P_n(F) \rightarrow F^{n+1} 為 T(f) = (f(c_0), f(c_1), ..., f(c_n))。證明 T 是一個同構。提示:使用與 c_0, c_1, ..., c_n 相關的拉格朗日多項式 (Lagrange polynomials)。
23. 設 W 表示在 F 中所有只有有限多個非零項的序列所成的向量空間(定義見第 1.6 節習題 18),並設 Z = P(F)。定義 T: W \rightarrow Z 為 T(\sigma) = \sum_{i=0}^n \sigma(i)x^i,其中 n 是使得 \sigma(n) \ne 0 的最大整數。證明 T 是一個同構。
以下習題需要熟悉第 1.3 節習題 31 中定義的商空間 (quotient space) 概念,以及第 2.1 節的習題 42。
24. 設 V 與 Z 為向量空間,且 T: V \rightarrow Z 為一個映成的線性變換。定義映射 \overline{T}: V/N(T) \rightarrow Z 為對任意在 V/N(T) 中的陪集 (coset) v+N(T),皆有 \overline{T}(v+N(T)) = T(v)。
(a) 證明 \overline{T} 是良好定義的 (well-defined);也就是說,證明若 v+N(T) = v^{\prime}+N(T),則 T(v) = T(v^{\prime})。
(b) 證明 \overline{T} 是線性的。
(c) 證明 \overline{T} 是一個同構。
(d) 證明圖 2.3 所示的圖是可交換的;也就是說,證明 T = \overline{T}\eta。
25. 設 V 為在體 F 上的一個非零向量空間,並假設 S 是 V 的一個基底。(由第 1.7 節定理 1.13 的推論可知,每個向量空間都有一個基底。)令 \mathcal{C}(S,F) 表示所有除了 S 中有限多個向量外,皆滿足 f(s) = 0 的函數 f \in \mathcal{F}(S,F) 所成的向量空間。(見第 1.3 節習題 14。)定義 \Psi: \mathcal{C}(S,F) \rightarrow V,若 f 是零函數,則 \Psi(f) = 0,否則 \Psi(f) = \sum_{s \in S, f(s) \ne 0} f(s)s。證明 \Psi 是一個同構。因此每個非零向量空間都可以被視為一個函數空間。
2.5 座標轉換矩陣
在許多數學領域中,變數變換常被用來簡化表達式的外觀。例如,在微積分中,2xe^{x^2} 的反導數可以藉由變數變換 u=x^2 來求得。結果得到的表達式形式非常簡單,很容易就能看出其反導數:\int 2xe^{x^2} dx = \int e^u du = e^u + c = e^{x^2} + c。
同樣地,在幾何學中,變數變換
x = \frac{2}{\sqrt{5}}x' - \frac{1}{\sqrt{5}}y'
y = \frac{1}{\sqrt{5}}x' + \frac{2}{\sqrt{5}}y'
可用來將方程式 2x^2 - 4xy + 5y^2 = 1 轉換成較簡單的方程式 (x')^2 + 6(y')^2 = 1,在這個形式下,很容易就能看出這是一個橢圓的方程式。(見圖 2.4。)
我們將在第 6.5 節中看到如何決定這種變數變換。從幾何學的角度來看,這種變數變換實際上對應於 R^2 的基底變換,新基底為 \beta^{\prime} = \{\frac{1}{\sqrt{5}}\begin{pmatrix}2\\ 1\end{pmatrix}, \frac{1}{\sqrt{5}}\begin{pmatrix}-1\\ 2\end{pmatrix}\},並且這個變數變換實際上是將點 P 相對於標準有序基底 \beta = \{e_1, e_2\} 的座標向量 [P]_\beta = \begin{pmatrix}x\\ y\end{pmatrix},轉換為點 P 相對於新的旋轉基底 \beta^{\prime} 的座標向量 [P]_{\beta^{\prime}} = \begin{pmatrix}x^{\prime}\\ y^{\prime}\end{pmatrix}。
這時產生了一個自然的問題:如何將相對於一個基底的座標向量轉換為相對於另一個基底的座標向量?注意到聯繫新舊座標的方程組可以用矩陣方程式表示為
\begin{pmatrix}x\\ y\end{pmatrix} = \frac{1}{\sqrt{5}}\begin{pmatrix}2&-1\\ 1&2\end{pmatrix}\begin{pmatrix}x'\\ y'\end{pmatrix}。
同時也注意到,矩陣
Q = \frac{1}{\sqrt{5}}\begin{pmatrix}2&-1\\ 1&2\end{pmatrix}
等於 [I_V]_{\beta'}^\beta,其中 I 表示 R^2 上的恆等變換。因此對所有 v \in R^2,皆有 [v]_\beta = Q[v]_{\beta'}。一個類似的結果在一般情況下也成立。
定理 2.22。設 \beta 與 \beta' 為有限維向量空間 V 的兩個有序基底,且設 Q = [I_V]_{\beta'}^\beta。則:
(a) Q 為可逆的。
(b) 對於任意 v \in V,[v]_\beta = Q[v]_{\beta'}。
證明。(a) 因為 I_V 為可逆的,所以根據定理 2.18(第 102 頁),Q 為可逆的。(b) 對於任意 v \in V,由定理 2.14(第 92 頁)推得
[v]_\beta = [I_V(v)]_\beta = [I_V]_{\beta'}^\beta [v]_{\beta'} = Q[v]_{\beta'}。
在定理 2.22 中定義的矩陣 Q = [I_V]_{\beta'}^\beta 稱為座標轉換矩陣 (change of coordinate matrix)。因為定理的 (b) 部分,我們說 Q 將 \beta' 座標轉換為 \beta 座標。觀察到如果 \beta = \{x_1, x_2, ..., x_n\} 且 \beta' = \{x_1', x_2', ..., x_n'\},那麼對於 j=1,2,...,n,
x_j' = \sum_{i=1}^n Q_{ij} x_i。
也就是說,Q 的第 j 行是 [x_j']_\beta。
例 1
在 R^2 中,設 \beta = \{(1,1), (1,-1)\} 且 \beta' = \{(2,4), (3,1)\}。因為
(2,4) = 3(1,1) - 1(1,-1)
且
(3,1) = 2(1,1) + 1(1,-1),
將 \beta' 座標轉換為 \beta 座標的矩陣為
Q = \begin{pmatrix}3&2\\ -1&1\end{pmatrix}。
因此,舉例來說,
[(2,4)]_\beta = Q[(2,4)]_{\beta'} = Q\begin{pmatrix}1\\ 0\end{pmatrix} = \begin{pmatrix}3\\ -1\end{pmatrix}。
在本節的其餘部分,我們僅考慮將向量空間 V 映射到自身的線性變換。這樣的線性變換稱為 V 上的線性算子 (linear operator)。現在假設 T 為有限維向量空間 V 上的線性算子,並且 \beta 與 \beta' 為 V 的有序基底。那麼 T 可以用矩陣 [T]_\beta 與 [T]_{\beta'} 來表示。這些矩陣之間有什麼關聯呢?下一個定理利用座標轉換矩陣提供了一個簡單的答案。
定理 2.23。設 T 為有限維向量空間 V 上的線性算子,並且 \beta 與 \beta' 為 V 的有序基底。假設 Q 為將 \beta' 座標轉換為 \beta 座標的座標轉換矩陣。則
[T]_{\beta'} = Q^{-1}[T]_\beta Q。
證明。設 I 為 V 上的恆等變換。那麼 T = IT = TI,因此,根據定理 2.11(第 89 頁),
Q[T]_{\beta'} = [I]_{\beta'}^\beta [T]_{\beta'}^{\beta'} = [IT]_{\beta'}^\beta = [TI]_{\beta'}^\beta = [T]_\beta^\beta [I]_{\beta'}^\beta = [T]_\beta Q。
所以 [T]_{\beta'} = Q^{-1}[T]_\beta Q。
例 2
設 T 為 R^2 上的線性算子,定義為
T\begin{pmatrix}a\\ b\end{pmatrix} = \begin{pmatrix}3a-b\\ a+3b\end{pmatrix}
並設 \beta 與 \beta' 為例 1 中的有序基底。讀者應驗證
[T]_\beta = \begin{pmatrix}3&1\\ -1&3\end{pmatrix}。
在例 1 中,我們看到將 \beta' 座標轉換為 \beta 座標的座標轉換矩陣為
Q = \begin{pmatrix}3&2\\ -1&1\end{pmatrix}
而且很容易驗證
Q^{-1} = \frac{1}{5}\begin{pmatrix}1&-2\\ 1&3\end{pmatrix}。
因此,根據定理 2.23,
[T]_{\beta'} = Q^{-1}[T]_\beta Q = \begin{pmatrix}4&1\\ -2&2\end{pmatrix}。
為了說明這是正確的矩陣,我們可以驗證每個 \beta' 的向量在 T 之下的像,是 \beta' 向量的線性組合,且此線性組合的係數即為該對應行的元素。例如,\beta' 中第二個向量的像是
T\begin{pmatrix}3\\ 1\end{pmatrix} = \begin{pmatrix}8\\ 6\end{pmatrix} = 1\begin{pmatrix}2\\ 4\end{pmatrix} + 2\begin{pmatrix}3\\ 1\end{pmatrix}。
注意到這個線性組合的係數就是 [T]_{\beta'} 第二行的元素。
如下一個例子所示,應用定理 2.23 來計算 [T]_\beta 通常是很有用的。
例 3
回顧第 2.1 節例 3 中關於 x 軸的鏡射。要得到規則 (x,y) \rightarrow (x,-y) 是很容易的。我們現在來推導較不明顯的規則:關於直線 y=2x 的鏡射 T。(見圖 2.5。)我們希望找出針對任意在 R^2 中的 (a,b),其 T(a,b) 的表達式。因為 T 是線性的,它完全由它在 R^2 某個基底上的值所決定。顯然地,T(1,2) = (1,2) 且 T(-2,1) = -(-2,1) = (2,-1)。因此,如果我們令
\beta^{\prime} = \{\begin{pmatrix}1\\ 2\end{pmatrix}, \begin{pmatrix}-2\\ 1\end{pmatrix}\},
那麼 \beta' 是 R^2 的一個有序基底,且
[T]_{\beta'} = \begin{pmatrix}1&0\\ 0&-1\end{pmatrix}。
令 \beta 為 R^2 的標準有序基底,並令 Q 為將 \beta' 座標轉換為 \beta 座標的矩陣。則
Q = \begin{pmatrix}1&-2\\ 2&1\end{pmatrix}
而且 Q^{-1}[T]_\beta Q = [T]_{\beta'}。我們可以解出這個方程式得到 [T]_\beta = Q[T]_{\beta'}Q^{-1}。因為
Q^{-1} = \frac{1}{5}\begin{pmatrix}1&2\\ -2&1\end{pmatrix},
讀者可以驗證出
[T]_\beta = \frac{1}{5}\begin{pmatrix}-3&4\\ 4&3\end{pmatrix}。
因為 \beta 是標準有序基底,由此可知 T 就是由 [T]_\beta 進行左乘。因此對於 R^2 中的任意 (a,b),我們有
T\begin{pmatrix}a\\ b\end{pmatrix} = \frac{1}{5}\begin{pmatrix}-3&4\\ 4&3\end{pmatrix}\begin{pmatrix}a\\ b\end{pmatrix} = \frac{1}{5}\begin{pmatrix}-3a+4b\\ 4a+3b\end{pmatrix}。
下一個推論包含了定理 2.23 一個有用的特例,其證明留作習題。
推論。設 A \in M_{n \times n}(F),且設 \gamma 為 F^n 的有序基底。則 [L_A]_\gamma = Q^{-1}AQ,其中 Q 是一個 n \times n 矩陣,它的第 j 行是 \gamma 的第 j 個向量。
例 4
設
A = \begin{pmatrix}2&1&0\\ 1&1&3\\ 0&-1&0\end{pmatrix}
且設
\gamma = \{\begin{pmatrix}-1\\ 0\\ 0\end{pmatrix}, \begin{pmatrix}2\\ 1\\ 0\end{pmatrix}, \begin{pmatrix}1\\ 1\\ 1\end{pmatrix}\},
它是 R^3 的一個有序基底。令 Q 為第 j 行為 \gamma 之第 j 個向量的 3 \times 3 矩陣。則
Q = \begin{pmatrix}-1&2&1\\ 0&1&1\\ 0&0&1\end{pmatrix} 且 Q^{-1} = \begin{pmatrix}-1&2&-1\\ 0&1&-1\\ 0&0&1\end{pmatrix}。
所以根據前面的推論,
[L_A]_\gamma = Q^{-1}AQ = \begin{pmatrix}0&2&8\\ -1&4&6\\ 0&-1&-1\end{pmatrix}。
在定理 2.23 中矩陣 [T]_{\beta'} 與 [T]_\beta 之間的關係將會是第 5、6、7 章進一步研究的主題。不過,我們現在先介紹這種關係的名稱。
定義。設 A 與 B 為 M_{n \times n}(F) 中的矩陣。如果存在一個可逆矩陣 Q 使得 B = Q^{-1}AQ,我們就稱 B 相似於 (similar to) A。
觀察到「相似於」這個關係是一個等價關係(見習題 9)。因此我們只需要說 A 和 B 是相似的 (similar)。
另外也請注意,在這個術語下,定理 2.23 可以陳述如下:如果 T 是有限維向量空間 V 上的線性算子,並且 \beta 與 \beta' 是 V 的任意有序基底,那麼 [T]_{\beta'} 相似於 [T]_\beta。
定理 2.23 可以推廣到容許 T: V \rightarrow W 的情況,其中 V 與 W 是不同的空間。在這種情況下,我們可以在 V 以及 W 中變換基底(見習題 8)。
習題
1. 將下列敘述標示為真(True)或假(False)。
(a) 假設 \beta=\{x_{1},x_{2},...,x_{n}\} 與 \beta^{\prime}=\{x_{1}^{\prime},x_{2}^{\prime},...,x_{n}^{\prime}\} 為一向量空間的有序基底,且 Q 為將 \beta^{\prime} 座標轉換為 \beta 座標的座標轉換矩陣。則 Q 的第 j 行為 [x_{j}]_{\beta^{\prime}}。
(b) 每個座標轉換矩陣都是可逆的。
(c) 設 T 為有限維向量空間 V 上的線性算子,設 \beta 與 \beta^{\prime} 為 V 的有序基底,且設 Q 為將 \beta^{\prime} 座標轉換為 \beta 座標的座標轉換矩陣。則 [T]_{\beta}=Q[T]_{\beta^{\prime}}Q^{-1}。
(d) 矩陣 A, B\in M_{n\times n}(F) 稱為相似的,如果存在某個 Q\in M_{n\times n}(F) 使得 B=Q^{t}AQ。
(e) 設 T 為有限維向量空間 V 上的線性算子。則對於 V 的任意有序基底 \beta 與 \gamma,[T]_{\beta} 相似於 [T]_{\gamma}。
2. 對於下列每一對 R^{2} 的有序基底 \beta 與 \beta^{\prime},找出將 \beta^{\prime} 座標轉換為 \beta 座標的座標轉換矩陣。
(a) \beta=\{e_{1},e_{2}\} 與 \beta^{\prime}=\{(a_{1},a_{2}),(b_{1},b_{2})\}
(b) \beta=\{(-1,3),(2,-1)\} 與 \beta^{\prime}=\{(0,10),(5,0)\}
(c) \beta=\{(2,5),(-1,-3)\} 與 \beta^{\prime}=\{e_{1},e_{2}\}
(d) \beta=\{(-4,3),(2,-1)\} 與 \beta^{\prime}=\{(2,1),(-4,1)\}
3. 對於下列每一對 P_{2}(R) 的有序基底 \beta 與 \beta^{\prime},找出將 \beta^{\prime} 座標轉換為 \beta 座標的座標轉換矩陣。
(a) \beta=\{x^{2},x,1\} 與 \beta^{\prime}=\{a_{2}x^{2}+a_{1}x+a_{0},b_{2}x^{2}+b_{1}x+b_{0},c_{2}x^{2}+c_{1}x+c_{0}\}
(b) \beta=\{1,x,x^{2}\} 與 \beta^{\prime}=\{a_{2}x^{2}+a_{1}x+a_{0},b_{2}x^{2}+b_{1}x+b_{0},c_{2}x^{2}+c_{1}x+c_{0}\}
(c) \beta=\{2x^{2}-x,3x^{2}+1,x^{2}\} 與 \beta^{\prime}=\{1,x,x^{2}\}
(d) \beta=\{x^{2}-x+1,x+1,x^{2}+1\} 與 \beta^{\prime}=\{x^{2}+x+4,4x^{2}-3x+2,2x^{2}+3\}
(e) \beta=\{x^{2}-x,x^{2}+1,x-1\} 與 \beta^{\prime}=\{5x^{2}-2x-3,-2x^{2}+5x+5,2x^{2}-x-3\}
(f) \beta=\{2x^{2}-x+1,x^{2}+3x-2,-x^{2}+2x+1\} 與 \beta^{\prime}=\{9x-9,x^{2}+21x-2,3x^{2}+5x+2\}
4. 設 T 為定義在 R^{2} 上的線性算子,其定義為
T\begin{pmatrix}a\\ b\end{pmatrix}=\begin{pmatrix}2a+b\\ a-3b\end{pmatrix}
令 \beta 為 R^{2} 的標準有序基底,且令 \beta^{\prime}=\{\begin{pmatrix}1\\ 1\end{pmatrix},\begin{pmatrix}1\\ 2\end{pmatrix}\}。
利用定理 2.23 以及
\begin{pmatrix}1&1\\ 1&2\end{pmatrix}^{-1}=\begin{pmatrix}2&-1\\ -1&1\end{pmatrix}
這個事實,來求出 [T]_{\beta^{\prime}}。
5. 設 T 為定義在 P_{1}(R) 上的線性算子,其定義為 T(p(x))=p^{\prime}(x)(即 p(x) 的導數)。令 \beta=\{1,x\} 且 \beta^{\prime}=\{1+x,1-x\}。利用定理 2.23 以及
\begin{pmatrix}1&1\\ 1&-1\end{pmatrix}^{-1}=\begin{pmatrix}\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&-\frac{1}{2}\end{pmatrix}
這個事實,來求出 [T]_{\beta^{\prime}}。
6. 對於下列每一個矩陣 A 與有序基底 \beta,求出 [L_{A}]_{\beta}。同時,找出一可逆矩陣 Q 使得 [L_{A}]_{\beta}=Q^{-1}AQ。
(a) A=\begin{pmatrix}1&3\\ 1&1\end{pmatrix} 且 \beta=\{\begin{pmatrix}1\\ 1\end{pmatrix},\begin{pmatrix}1\\ 2\end{pmatrix}\}
(b) A=\begin{pmatrix}1&2\\ 2&1\end{pmatrix} 且 \beta=\{\begin{pmatrix}1\\ 1\end{pmatrix},\begin{pmatrix}1\\ -1\end{pmatrix}\}
(c) A=\begin{pmatrix}1&1&-1\\ 2&0&1\\ 1&1&0\end{pmatrix} 且 \beta=\{\begin{pmatrix}1\\ 1\\ 1\end{pmatrix},\begin{pmatrix}1\\ 0\\ 1\end{pmatrix},\begin{pmatrix}1\\ 1\\ 2\end{pmatrix}\}
(d) A=\begin{pmatrix}13&1&4\\ 1&13&4\\ 4&4&10\end{pmatrix} 且 \beta=\{\begin{pmatrix}1\\ 1\\ -2\end{pmatrix},\begin{pmatrix}1\\ -1\\ 0\end{pmatrix},\begin{pmatrix}1\\ 1\\ 1\end{pmatrix}\}
7. 在 R^{2} 中,設 L 為直線 y=mx,其中 m\ne0。找出 T(x,y) 的表達式,其中
(a) T 為 R^{2} 關於 L 的鏡射。
(b) T 為沿著垂直於 L 的直線在 L 上的投影。(參見 2.1 節習題中關於投影的定義。)
8. 證明下列定理 2.23 的推廣。設 T:V\rightarrow W 為從有限維向量空間 V 到有限維向量空間 W 的線性變換。設 \beta 與 \beta^{\prime} 為 V 的有序基底,且設 \gamma 與 \gamma^{\prime} 為 W 的有序基底。則 [T]_{\beta^{\prime}}^{\gamma^{\prime}}=P^{-1}[T]_{\beta}^{\gamma}Q,其中 Q 是將 \beta^{\prime} 座標轉換為 \beta 座標的矩陣,而 P 是將 \gamma^{\prime} 座標轉換為 \gamma 座標的矩陣。
9. 證明「相似於」是 M_{n\times n}(F) 上的一個等價關係。
10.
(a) 證明若 A 與 B 為相似的 n\times n 矩陣,則 \text{tr}(A)=\text{tr}(B)。提示:利用 2.3 節的習題 13。
(b) 你將如何定義有限維向量空間上線性算子的跡數 (trace)?請證明你的定義是良好定義的 (well-defined)。
11. 設 V 為具備有序基底 \alpha、\beta 與 \gamma 的有限維向量空間。
(a) 證明若 Q 與 R 分別為將 \alpha 座標轉換為 \beta 座標以及將 \beta 座標轉換為 \gamma 座標的座標轉換矩陣,則 RQ 即為將 \alpha 座標轉換為 \gamma 座標的座標轉換矩陣。
(b) 證明若 Q 將 \alpha 座標轉換為 \beta 座標,則 Q^{-1} 將 \beta 座標轉換為 \alpha 座標。
12. 證明定理 2.23 的推論。
13. 設 V 為體 F 上的有限維向量空間,且設 \beta=\{x_{1},x_{2},...,x_{n}\} 為 V 的一個有序基底。設 Q 為一個元素取自 F 的 n\times n 可逆矩陣。對於 1\le j\le n,定義
x_{j}^{\prime}=\sum_{i=1}^{n}Q_{ij}x_{i},
並令 \beta^{\prime}=\{x_{1}^{\prime},x_{2}^{\prime},...,x_{n}^{\prime}\}。證明 \beta^{\prime} 是 V 的一個基底,並因此推導出 Q 就是將 \beta^{\prime} 座標轉換為 \beta 座標的座標轉換矩陣。造訪 goo.gl/vsxsGH 以獲取解答。
14. 證明習題 8 的反向敘述:若 V 與 W 為分別具有有序基底 \beta 與 \gamma 的有限維向量空間,且 T:V\rightarrow W 為線性的,那麼如果 P 與 Q 為適當大小的可逆矩陣,則分別存在 V 與 W 的有序基底 \beta^{\prime} 與 \gamma^{\prime},使得 [T]_{\beta^{\prime}}^{\gamma^{\prime}}=P^{-1}[T]_{\beta}^{\gamma}Q。
提示:令 V=F^{n},W=F^{m},T=L_{A},且令 \beta 與 \gamma 分別為 F^{n} 與 F^{m} 的標準有序基底。接著應用習題 13 的結果,分別透過 Q 與 P 從 \beta 與 \gamma 中得出有序基底 \beta^{\prime} 與 \gamma^{\prime}。
2.6 對偶空間 (Dual Spaces)*
在本節中,我們專門探討從向量空間 V 映射到其純量體 F(本身可視為 F 上維度為 1 的向量空間)的線性變換。這種線性變換被稱為 V 上的線性泛函 (linear functional)。我們通常使用字母 f, g, h, \dots 來表示線性泛函。正如我們將在例 1 中看到的,定積分為數學中線性泛函提供了一個最重要的例子。
定義。對於 F 上的向量空間 V,我們將 V 的對偶空間 (dual space) 定義為向量空間 \mathcal{L}(V, F),記為 V^*。
因此,V^* 是由 V 上所有線性泛函組成的向量空間,其加法和純量乘法運算與 2.2 節中定義的相同。請注意,如果 V 是有限維的,那麼根據定理 2.20 的推論,我們有
dim(V^*) = dim(\mathcal{L}(V, F)) = dim(V) \cdot dim(F) = dim(V)。
因此,根據定理 2.19,V 和 V^* 是同構的 (isomorphic)。我們也將 V^* 的對偶空間定義為 V 的雙對偶空間 (double dual) V^{**}。在定理 2.26 中我們將證明,在 V 是有限維的情況下,V 和 V^{**} 之間存在一種自然的等同關係。
定理 2.24。假設 V 是一個具有有序基底 \beta = \{x_1, x_2, \dots, x_n\} 的有限維向量空間。令 f_i (1 \le i \le n) 為前述關於 \beta 的第 i 個座標函數 (coordinate function),並令 \beta^* = \{f_1, f_2, \dots, f_n\}。那麼 \beta^* 是 V^* 的一個有序基底,且對於任何 f \in V^*,我們有
f = \sum_{i=1}^n f(x_i)f_i。
證明。令 f \in V^*。因為 dim(V^*) = n,我們只需要證明 f = \sum_{i=1}^n f(x_i)f_i,由此可知 \beta^* 生成了 V^*,並根據替換定理的推論 2(a) 成為一個基底。令 g = \sum_{i=1}^n f(x_i)f_i。對於 1 \le j \le n,我們有
g(x_j) = (\sum_{i=1}^n f(x_i)f_i)(x_j) = \sum_{i=1}^n f(x_i)f_i(x_j) = \sum_{i=1}^n f(x_i)\delta_{ij} = f(x_j)。
因此,根據定理 2.6 的推論,f = g。
定義。使用定理 2.24 的符號,我們稱滿足 f_i(x_j) = \delta_{ij} (1 \le i, j \le n) 的 V^* 的有序基底 \beta^* = \{f_1, f_2, \dots, f_n\} 為 \beta 的對偶基底 (dual basis)。
現在假設 V 和 W 分別是 F 上維度為 n 和 m 的向量空間,且分別具有有序基底 \beta 和 \gamma。在 2.4 節中,我們證明了線性變換 T: V \to W 和(在 F 上的)m \times n 矩陣之間存在透過對應關係 T \leftrightarrow [T]_\beta^\gamma 的一對一對應。對於形式為 A = [T]_\beta^\gamma 的矩陣,產生了一個問題:是否存在一個與 T 以某種自然方式相關聯的線性變換 U,使得 U 在某個基底下的矩陣表示可以寫作 A^t?。當然,如果 m \ne n,U 不可能是從 V 到 W 的線性變換。我們現在應用我們已經學到的關於對偶空間的知識來回答這個問題。
定理 2.25。令 V 和 W 為 F 上的有限維向量空間,並分別具有有序基底 \beta 和 \gamma。對於任何線性變換 T: V \to W,映射 T^t: W^* \to V^* 定義為對所有 g \in W^*,T^t(g) = gT,這是一個線性變換,且具有性質 [T^t]_{\gamma^*}^{\beta^*} = ([T]_\beta^\gamma)^t。
證明。對於 g \in W^*,顯然 T^t(g) = gT 是 V 上的一個線性泛函,因此屬於 V^*。因此 T^t 將 W^* 映射到 V^*。我們將證明 T^t 是線性變換的過程留給讀者練習。
為完成證明,令 \beta = \{x_1, x_2, \dots, x_n\} 和 \gamma = \{y_1, y_2, \dots, y_m\},其對偶基底分別為 \beta^* = \{f_1, f_2, \dots, f_n\} 和 \gamma^* = \{g_1, g_2, \dots, g_m\}。為方便起見,令 A = [T]_\beta^\gamma。要找到 [T^t]_{\gamma^*}^{\beta^*} 的第 j 行,我們首先將 T^t(g_j) 表示為 \beta^* 中向量的線性組合。根據定理 2.24,我們有
T^t(g_j) = g_jT = \sum_{s=1}^n (g_jT)(x_s)f_s。
所以 [T^t]_{\gamma^*}^{\beta^*} 的第 i 列、第 j 行的元素為
(g_jT)(x_i) = g_j(T(x_i)) = g_j(\sum_{k=1}^m A_{ki}y_k) = \sum_{k=1}^m A_{ki}g_j(y_k) = \sum_{k=1}^m A_{ki}\delta_{jk} = A_{ji}。
因此 [T^t]_{\gamma^*}^{\beta^*} = A^t。
定義。在定理 2.25 中定義的線性變換 T^t 被稱為 T 的轉置 (transpose)。顯然,T^t 是滿足 [U]_{\gamma^*}^{\beta^*} = ([T]_\beta^\gamma)^t 的唯一線性變換 U。
我們用下一個例子來說明定理 2.25。
例 5
定義 T: P_1(R) \to R^2 為 T(p(x)) = (p(0), p(2))。令 \beta 和 \gamma 分別為 P_1(R) 和 R^2 的標準有序基底。顯然,
[T]_\beta^\gamma = \begin{pmatrix} 1 & 0 \\ 1 & 2 \end{pmatrix}。
我們直接從定義來計算 [T^t]_{\gamma^*}^{\beta^*}。令 \beta^* = \{f_1, f_2\} 且 \gamma^* = \{g_1, g_2\}。假設 [T^t]_{\gamma^*}^{\beta^*} = \begin{pmatrix} a & b \\ c & d \end{pmatrix}。那麼 T^t(g_1) = af_1 + cf_2。所以
T^t(g_1)(1) = (af_1 + cf_2)(1) = af_1(1) + cf_2(1) = a(1) + c(0) = a。
但同時
(T^t(g_1))(1) = g_1(T(1)) = g_1(1, 1) = 1。
所以 a=1。使用類似的計算,我們得到 c=0, b=1 和 d=2。因此直接計算得出
[T^t]_{\gamma^*}^{\beta^*} = \begin{pmatrix} 1 & 1 \\ 0 & 2 \end{pmatrix} = ([T]_\beta^\gamma)^t,
這與定理 2.25 所預測的一致。
我們現在關注於證明任何有限維向量空間 V 都可以自然地與其雙對偶空間 V^{**} 等同起來。實際上,V 和 V^{**} 之間存在一種同構關係,它不依賴於這兩個向量空間的任何基底選擇。
對於向量 x \in V,我們定義 \hat{x}: V^* \to F 為對所有 f \in V^*,\hat{x}(f) = f(x)。很容易驗證 \hat{x} 是 V^* 上的一個線性泛函,所以 \hat{x} \in V^{**}。對應關係 x \leftrightarrow \hat{x} 讓我們能夠定義 V 和 V^{**} 之間所需的同構。
引理。令 V 為有限維向量空間,且 x \in V。如果對所有 f \in V^* 都有 \hat{x}(f) = 0,則 x = 0。
證明。假設 x \ne 0。我們將證明存在 f \in V^* 使得 \hat{x}(f) \ne 0。選擇 V 的一個有序基底 \beta = \{x_1, x_2, \dots, x_n\} 使得 x_1 = x。令 \{f_1, f_2, \dots, f_n\} 為 \beta 的對偶基底。那麼 f_1(x_1) = 1 \ne 0。令 f = f_1 即可完成證明。
定理 2.26。令 V 為有限維向量空間,並定義 \psi: V \to V^{**} 為 \psi(x) = \hat{x}。那麼 \psi 是一個同構。
證明。
(a) \psi 是線性的:令 x, y \in V 且 c \in F。對於 f \in V^*,我們有
\psi(cx + y)(f) = f(cx + y) = cf(x) + f(y) = c\hat{x}(f) + \hat{y}(f) = (c\hat{x} + \hat{y})(f)。
因此 \psi(cx + y) = c\hat{x} + \hat{y} = c\psi(x) + \psi(y)。
(b) \psi 是一對一的:假設對於某個 x \in V,\psi(x) 是 V^* 上的零泛函。那麼對每個 f \in V^*,\hat{x}(f) = 0。根據前述引理,我們得出 x=0 的結論。
(c) \psi 是同構:這由 (b) 以及 dim(V) = dim(V^{**}) 這個事實得出。
推論。令 V 是一個具有對偶空間 V^* 的有限維向量空間。那麼 V^* 的每一個有序基底都是 V 中某個基底的對偶基底。
證明。令 \{f_1, f_2, \dots, f_n\} 為 V^* 的一個有序基底。我們可以結合定理 2.24 和定理 2.26 來推論,對於 V^* 的這個基底,在 V^{**} 中存在一個對偶基底 \{\hat{x}_1, \hat{x}_2, \dots, \hat{x}_n\};也就是說,對所有 i 和 j,\delta_{ij} = \hat{x}_i(f_j) = f_j(x_i)。因此 \{f_1, f_2, \dots, f_n\} 即為 \{x_1, x_2, \dots, x_n\} 的對偶基底。
雖然本節中的許多概念(例如對偶空間的存在性)可以擴展到 V 不是有限維的情況,但只有有限維向量空間能透過映射 x \to \hat{x} 與其雙對偶空間同構。實際上,對於無限維向量空間,V、V^* 和 V^{**} 這三者之中沒有任何兩個是同構的。
習題
1. 將下列敘述標示為真(True)或假(False)。假設所有向量空間皆為有限維。
(a) 每個線性變換都是一個線性泛函。
(b) 定義在體上的一個線性泛函可以被表示為一個 1 \times 1 矩陣。
(c) 每個向量空間都與其對偶空間同構。
(d) 每個向量空間都與某個向量空間的對偶空間同構。
(e) 若 T 是從 V 映成至 V^* 的同構映射,且 \beta 為 V 的有限有序基底,則 T(\beta) = \beta^*。
(f) 若 T 是從 V 到 W 的線性變換,則 (T^t)^t 的定義域為 V^{**}。
(g) 若 V 同構於 W,則 V^* 同構於 W^*。
(h) 函數的導數可以被視為在可微函數之向量空間上的一個線性泛函。
2. 對於下列在向量空間 V 上的函數 f,判斷哪些是線性泛函。
(a) V=P(R);f(p(x))=2p^{\prime}(0)+p^{\prime\prime}(1),其中 ' 表示微分。
(b) V=R^2;f(x,y)=(2x,4y)。
(c) V=M_{2\times 2}(F);f(A)=\text{tr}(A)。
(d) V=R^3;f(x,y,z)=x^2+y^2+z^2。
(e) V=P(R);f(p(x))=\int_0^1 p(t)dt。
(f) V=M_{2\times 2}(F);f(A)=A_{11}。
3. 對於下列每個向量空間 V 與基底 \beta,求出 V^* 的對偶基底 \beta^* 中每個向量的顯式公式,如例 4 所示。
(a) V=R^3;\beta=\{(1,0,1), (1,2,1), (0,0,1)\}。
(b) V=P_2(R);\beta=\{1,x,x^2\}。
4. 設 V=R^3,並定義 f_1, f_2, f_3 \in V^* 如下:
f_1(x,y,z)=x-2y,f_2(x,y,z)=x+y+z,f_3(x,y,z)=y-3z。
證明 \{f_1, f_2, f_3\} 是 V^* 的一個基底,然後找出 V 的一個基底,使得 \{f_1, f_2, f_3\} 是它的對偶基底。
5. 設 V=P_1(R),且對於 p(x) \in V,定義 f_1, f_2 \in V^* 為:
f_1(p(x)) = \int_0^1 p(t)dt 且 f_2(p(x)) = \int_0^2 p(t)dt。
證明 \{f_1, f_2\} 是 V^* 的一個基底,並找出 V 的一個基底使得它為其對偶基底。
6. 定義 f \in (R^2)^* 為 f(x,y)=2x+y,並定義 T: R^2 \rightarrow R^2 為 T(x,y)=(3x+2y, x)。
(a) 計算 T^t(f)。
(b) 計算 [T^t]_{\beta^*},其中 \beta 是 R^2 的標準有序基底,且 \beta^*=\{f_1, f_2\} 是對偶基底,計算方式為找出純量 a, b, c, 與 d 使得 T^t(f_1) = af_1 + cf_2 且 T^t(f_2) = bf_1 + df_2。
(c) 計算 [T]_\beta 與 ([T]_\beta)^t,並將你的結果與 (b) 進行比較。
7. 設 V=P_1(R) 且 W=R^2 分別具有標準有序基底 \beta 與 \gamma。定義 T: V \rightarrow W 為
T(p(x)) = (p(0)-2p(1), p(0)+p^{\prime}(0)),
其中 p^{\prime}(x) 是 p(x) 的導數。
(a) 對於定義為 f(a,b)=a-2b 的 f \in W^*,計算 T^t(f)。
(b) 不使用定理 2.25,計算 [T^t]_{\gamma^*}^{\beta^*}。
(c) 計算 [T]_\beta^\gamma 及其轉置矩陣,並將你的結果與 (b) 進行比較。
8. 設 \{u,v\} 為 R^3 中的線性獨立集。證明通過原點的平面 \{su+tv: s,t \in R\} 可以等同於 (R^3)^* 中某個向量的零空間。
9. 證明一個函數 T: F^n \rightarrow F^m 是線性的,若且唯若存在 f_1, f_2, ..., f_m \in (F^n)^* 使得對於所有的 x \in F^n,皆有 T(x)=(f_1(x),f_2(x),...,f_m(x))。
提示:若 T 是線性的,定義對於 x \in F^n,f_i(x)=(g_iT)(x);也就是說,對於 1 \le i \le m,f_i=T^t(g_i),其中 \{g_1, g_2, ..., g_m\} 是 F^m 之標準有序基底的對偶基底。
10. 設 V=P_n(F),且 c_0, c_1, ..., c_n 為體 F 中的相異純量。
(a) 對於 0 \le i \le n,定義 f_i \in V^* 為 f_i(p(x)) = p(c_i)。證明 \{f_0, f_1, ..., f_n\} 是 V^* 的一個基底。提示:對此集合的任意等於零變換之線性組合,將其應用於 p(x) = (x-c_1)(x-c_2)\cdots(x-c_n) 上,並推導出第一個係數為零。
(b) 利用定理 2.26 的推論以及 (a) 來證明,存在唯一的多項式 p_0(x), p_1(x), ..., p_n(x) 使得對於 0 \le i, j \le n 皆有 p_i(c_j) = \delta_{ij}。這些多項式即為第 1.6 節中定義的拉格朗日多項式。
(c) 對於任意純量 a_0, a_1, ..., a_n(不一定相異),推導出存在唯一的一個次數至多為 n 的多項式 q(x),使得對於 0 \le i \le n 皆有 q(c_i) = a_i。事實上,q(x) = \sum_{i=0}^n a_i p_i(x)。
(d) 推導出拉格朗日插值公式:
對於任意 p(x) \in V,p(x) = \sum_{i=0}^n p(c_i) p_i(x)。
(e) 證明 \int_a^b p(t)dt = \sum_{i=0}^n p(c_i) d_i,其中 d_i = \int_a^b p_i(t)dt。現在假設對於 i=0,1,...,n,c_i = a + \frac{i(b-a)}{n}。當 n=1 時,前述結果即為計算多項式定積分的梯形法則。當 n=2 時,此結果即為計算多項式定積分的辛普森法則。
11. 設 V 與 W 為體 F 上的有限維向量空間,且 \psi_1 與 \psi_2 分別為定義如定理 2.26 中,V 與 V^{**} 之間,以及 W 與 W^{**} 之間的同構映射。設 T: V \rightarrow W 為線性的,並定義 T^{tt} = (T^t)^t。證明圖 2.6 中描繪的圖是可交換的(即證明 \psi_2 T = T^{tt} \psi_1)。請造訪 goo.gl/Lkd6XZ 以獲取解答。
12. 設 V 為具備有序基底 \beta 的有限維向量空間。證明 \psi(\beta) = \beta^{**},其中 \psi 的定義同定理 2.26。
在習題 13 到 17 中,V 表示佈於體 F 上的有限維向量空間。對於 V 的每一個子集 S,定義 S 的零化子 (annihilator) S^0 為 S^0 = \{f \in V^*: \text{對所有 } x \in S \text{ 皆有 } f(x) = 0\}。
13. (a) 證明 S^0 是 V^* 的子空間。
(b) 若 W 為 V 的子空間且 x \notin W,證明存在 f \in W^0 使得 f(x) \ne 0。
(c) 證明 (S^0)^0 = \text{span}(\psi(S)),其中 \psi 的定義同定理 2.26。
(d) 對於子空間 W_1 與 W_2,證明 W_1 = W_2 若且唯若 W_1^0 = W_2^0。
(e) 對於子空間 W_1 與 W_2,證明 (W_1 + W_2)^0 = W_1^0 \cap W_2^0。
14. 證明若 W 為 V 的子空間,則 \dim(W) + \dim(W^0) = \dim(V)。提示:將 W 的一個有序基底 \{x_1, x_2, ..., x_k\} 擴充為 V 的一個有序基底 \beta = \{x_1, x_2, ..., x_n\}。令 \beta^* = \{f_1, f_2, ..., f_n\}。證明 \{f_{k+1}, f_{k+2}, ..., f_n\} 是 W^0 的一個基底。
15. 假設 W 是一個有限維向量空間且 T: V \rightarrow W 是線性的。證明 N(T^t) = (R(T))^0。
16. 利用習題 14 與 15 推導出,對於任意 A \in M_{m \times n}(F),\text{rank}(L_{A^t}) = \text{rank}(L_A)。
在習題 17 到 20 中,假設 V 與 W 為有限維向量空間。(然而,可以證明這些習題對於所有向量空間 V 與 W 都成立。)
17. 設 T 為 V 上的一個線性算子,且 W 為 V 的一個子空間。證明 W 是 T-不變的(如 2.1 節習題中所定義)若且唯若 W^0 是 T^t-不變的。
18. 設 V 為體 F 上的一個非零向量空間,且設 S 為 V 的一個基底。(由第 1.7 節中定理 1.13 的推論可知,每個向量空間都有一個基底。)令 \Phi: V^* \rightarrow \mathcal{F}(S, F) 為定義作 \Phi(f) = f_S 的映射,即 f 限制在 S 上的函數。證明 \Phi 是一個同構。提示:應用第 2.1 節的習題 35。
19. 設 V 為一個非零向量空間,且設 W 為 V 的一個真子空間(即 W \ne V)。
(a) 設 g \in W^* 且 v \in V 滿足 v \notin W。證明對於任意純量 a,存在一個函數 f \in V^* 使得 f(v) = a 且對於所有在 W 中的 x 皆有 f(x) = g(x)。提示:在無窮維的情況下,利用第 1.7 節的習題 4 以及第 2.1 節的習題 35。
(b) 利用 (a) 來證明,存在一個非零線性泛函 f \in V^* 使得對於所有 x \in W,皆有 f(x) = 0。
20. 設 V 與 W 為同一個體上的非零向量空間,且 T: V \rightarrow W 為一個線性變換。
(a) 證明 T 是映成若且唯若 T^t 是一對一。
(b) 證明 T^t 是映成若且唯若 T 是一對一。
提示:在無窮維的情況下,將習題 19 用於證明的某些部分。
2.7 具常數係數的齊次線性微分方程式*
作為本節的引言,考慮以下物理問題。將一個質量為 m 的重物懸掛在垂直的彈簧上,讓其伸展直到作用在重物上的力達到平衡。假設重物現在是靜止的,並設定一個 xy-座標系,使重物位於原點,彈簧位於正 y 軸上(見圖 2.7)。
假設在某個時間,例如 t=0,重物沿著 y 軸被向下拉動距離 s 後釋放,彈簧接著開始震盪。
我們來描述彈簧的運動。在任何時間 t \ge 0,令 F(t) 表示作用在重物上的力,y(t) 表示重物沿 y 軸的位置。例如,y(0) = -s。y 對時間的二階導數 y^{\prime\prime}(t) 是重物在時間 t 的加速度;因此,根據牛頓第二運動定律,
F(t) = my^{\prime\prime}(t)。 (1)
我們合理地假設作用在重物上的力完全來自彈簧的張力,且此力滿足虎克定律 (Hooke's law):作用在重物上的力與其偏離平衡位置的位移成正比,但方向相反。若 k>0 為比例常數,則虎克定律指出
F(t) = -ky(t)。 (2)
結合 (1) 與 (2),我們得到 my^{\prime\prime} = -ky,即
y^{\prime\prime} + \frac{k}{m}y = 0。 (3)
表達式 (3) 是一個微分方程式的例子。一個包含未知函數 y=y(t) 的微分方程式是包含 y、t 以及 y 的導數的方程式。如果該微分方程式具有以下形式:
a_n y^{(n)} + a_{n-1}y^{(n-1)} + \cdots + a_1 y^{(1)} + a_0 y = f, (4)
其中 a_0, a_1, \dots, a_n 與 f 皆為 t 的函數,且 y^{(k)} 表示 y 的 k 階導數,則稱此方程式為線性的 (linear)。函數 a_i 稱為微分方程式 (4) 的係數 (coefficients)。因此,(3) 是一個係數為常數且函數 f 恆為零的線性微分方程式的例子。當 f 恆為零時,(4) 被稱為齊次的 (homogeneous)。
在本節中,我們應用所學的線性代數來解具常數係數的齊次線性微分方程式。若 a_n \ne 0,我們說微分方程式 (4) 的階數 (order) 為 n。在此情況下,我們將兩邊同除以 a_n 以獲得一個新的、但等價的方程式
y^{(n)} + b_{n-1}y^{(n-1)} + \cdots + b_1 y^{(1)} + b_0 y = 0,
其中 b_i = a_i/a_n 對 i=0,1,\dots,n-1。基於這個觀察,我們總是假設 (4) 中的係數 a_n 為 1。
(4) 的一個解 (solution) 是一個函數,當代入 y 時,能使 (4) 化為恆等式。
例 1
函數 y(t) = \sin\sqrt{k/m}t 是 (3) 的一個解,因為對所有 t,
y^{\prime\prime}(t) + \frac{k}{m}y(t) = -\frac{k}{m}\sin\sqrt{\frac{k}{m}}t + \frac{k}{m}\sin\sqrt{\frac{k}{m}}t = 0。
然而請注意,將 y(t)=t 代入 (3) 會得到
y^{\prime\prime}(t) + \frac{k}{m}y(t) = \frac{k}{m}t,
這並不恆為零。因此 y(t)=t 不是 (3) 的解。
在我們的微分方程式研究中,將解視為實數變數的複數值函數會很有用,即使在物理意義上對我們有意義的解是實數值的。這種觀點的便利性將在稍後變得清晰。因此,我們關注的向量空間是 \mathcal{F}(R,C)(定義於 1.2 節的例 3)。為了將實數變數的複數值函數視為微分方程式的解,我們必須定義對這類函數微分的意義。給定一個實數變數 t 的複數值函數 x \in \mathcal{F}(R,C),存在唯一的一對實數值函數 x_1 與 x_2 使得 x(t) = x_1(t) + ix_2(t) 對所有 t \in R 皆成立。我們稱 x_1 為 x 的實部 (real part),x_2 為 x 的虛部 (imaginary part)。若 x_1 與 x_2 皆可微,則我們定義 x 的導數為 x'(t) = x_1'(t) + ix_2'(t)。
例 2
假設 x(t) = \cos 2t + i \sin 2t。則
x'(t) = -2 \sin 2t + 2i \cos 2t。
我們接著找出 x^2 的實部與虛部。因為
x^2(t) = (\cos 2t + i \sin 2t)^2 = (\cos^2 2t - \sin^2 2t) + i(2 \sin 2t \cos 2t)
= \cos 4t + i \sin 4t,
所以 x^2(t) 的實部為 \cos 4t,虛部為 \sin 4t。
下一個定理指出我們可以將研究限制在一個比 \mathcal{F}(R,C) 小得多的向量空間。它的證明在例 3 中進行了說明,包含了一個簡單的數學歸納法論證,我們在此省略。
定理 2.27。具常數係數的齊次線性微分方程式的任何解都具有任意階的導數;也就是說,如果 x 是這類方程式的一個解,那麼對每個正整數 k,x^{(k)} 皆存在。
例 3
為了說明定理 2.27,考慮方程式
y^{(2)} + 4y = 0。
顯然,要成為一個解,函數 y 必須具備二階導數。然而,如果 y 是一個解,那麼
y^{(2)} = -4y。
因此,因為 y^{(2)} 是一個具有二階導數的函數 y 的常數倍,所以 y^{(2)} 必然具備二階導數。因此 y^{(4)} 存在;事實上,
y^{(4)} = -4y^{(2)}。
因為 y^{(4)} 是我們已經證明至少具有二階導數之函數的常數倍,所以它也至少具有二階導數;因此 y^{(6)} 存在。以這種方式繼續,我們可以證明任何解都具備任意階的導數。
定義。我們用 C^\infty 來表示 \mathcal{F}(R,C) 中所有具備任意階導數的函數所組成的集合。
證明 C^\infty 是 \mathcal{F}(R,C) 的子空間並因此是佈於 C 的向量空間是一個簡單的習題。有鑑於定理 2.27,這正是我們感興趣的向量空間。對於 x \in C^\infty,x 的導數 x' 也位於 C^\infty 中。我們可以使用微分運算來定義一個映射 D: C^\infty \rightarrow C^\infty,定義為
對於 x \in C^\infty,D(x) = x'。
很容易證明 D 是一個線性算子。更一般地說,考慮任意佈於 C 的多項式
p(t) = a_n t^n + a_{n-1}t^{n-1} + \cdots + a_1 t + a_0。
如果我們用 D 替換 t,我們就得到了一個線性算子
p(D) = a_n D^n + a_{n-1}D^{n-1} + \cdots + a_1 D + a_0 I,
稱為微分算子 (differential operator)。這個算子的階數就是多項式 p(t) 的次數。(此多項式在 D 中的運算性質與一般的多項式運算性質相似;見附錄 E。)如果我們設定 a_n = 1,那麼一個具常數係數的 n 階齊次線性微分方程式
y^{(n)} + a_{n-1}y^{(n-1)} + \cdots + a_1 y^{(1)} + a_0 y = 0,
可以使用微分算子改寫為
(D^n + a_{n-1}D^{n-1} + \cdots + a_1 D + a_0 I)(y) = 0。
定義。給定上述的微分方程式,複係數多項式
p(t) = t^n + a_{n-1}t^{n-1} + \cdots + a_1 t + a_0
被稱為與該方程式相關的輔助多項式 (auxiliary polynomial)。
例如,(3) 具有輔助多項式
p(t) = t^2 + \frac{k}{m}。
任何具常數係數的齊次線性微分方程式都可以被改寫為
p(D)(y) = 0,
其中 p(t) 是與該方程式相關的輔助多項式。很明顯,這個方程式暗示了以下定理。
定理 2.28。具常數係數的齊次線性微分方程式的所有解之集合,與 p(D) 的零空間 (null space) 重合,其中 p(t) 是與該方程式相關的輔助多項式。
證明。習題。
推論。具常數係數的齊次線性微分方程式的所有解之集合是 C^\infty 的一個子空間。
基於上述推論,我們稱具常數係數的齊次線性微分方程式的解的集合為該方程式的解空間 (solution space)。描述這樣一個空間的一種實用方法是使用基底。我們現在研究一類特定函數,它們在尋找這些解空間的基底時非常有用。
對於實數 s,我們熟悉實數 e^s,其中 e 是自然對數為 1 的唯一數字(即 \ln e = 1)。例如,我們知道指數的某些性質,即
e^{s+t} = e^s e^t 以及 e^{-t} = \frac{1}{e^t}
對於任何實數 s 和 t 皆成立。我們現在將 e 的次方的定義擴展到包含複數,使得這些性質得以保留。
定義。令 c = a + ib 是一個實部為 a 且虛部為 b 的複數。我們定義
e^c = e^a (\cos b + i \sin b)。
特例
e^{ib} = \cos b + i \sin b
稱為尤拉公式 (Euler's formula)。
例如,當 c = 2 + i(\pi/3),
e^c = e^2 \left(\cos \frac{\pi}{3} + i \sin \frac{\pi}{3}\right) = e^2 \left(\frac{1}{2} + i\frac{\sqrt{3}}{2}\right)。
藉由這個定義,我們可以定義一種新的複數值函數類型 f: R \rightarrow C。對於固定的複數 c = a + ib,定義 f(t) = e^{ct} 對所有 t \in R。此類函數被稱為指數函數 (exponential function)。因為 ct = at + i(bt),所以
e^{ct} = e^{at}(\cos bt + i \sin bt)。
從這個方程式可知,指數函數的實部和虛部分別為 e^{at}\cos bt 與 e^{at}\sin bt。因為這兩個函數處處可微,所以指數函數也處處可微。下一個定理指出指數函數的導數也是人們熟悉的結果。
定理 2.29。對於任何指數函數 f(t) = e^{ct},都有 f'(t) = c e^{ct}。
證明。習題。
我們可以使用指數函數來描述所有一階齊次線性微分方程式的解。回想一下,這種方程式的階數是其輔助多項式的次數。因此一階方程式的形式為
y' + a_0 y = 0。 (5)
定理 2.30。(5) 的解空間為 1 維的,且具有 \{e^{-a_0 t}\} 作為基底。
證明。很明顯 (5) 具有 e^{-a_0 t} 作為一個解。假設 x(t) 是 (5) 的任何一個解。則
x'(t) = -a_0 x(t) 對所有 t \in R 皆成立。
定義
z(t) = e^{a_0 t}x(t)。
對 z 微分可得
z'(t) = (e^{a_0 t})' x(t) + e^{a_0 t} x'(t) = a_0 e^{a_0 t} x(t) - a_0 e^{a_0 t} x(t) = 0。
(請注意,熟悉的微分乘法法則對實數變數的複數值函數依然成立。此證明的理由雖然直接,但涉及繁瑣的計算。)
因為 z' 恆為零,所以 z 是一個常數函數。(同樣地,這個對實數值函數眾所周知的事實,對複數值函數也是成立的。其證明依賴於實數情況,涉及分別觀察 z 的實部與虛部。)因此存在一個複數 k 使得
z(t) = e^{a_0 t}x(t) = k 對所有 t \in R。
所以
x(t) = k e^{-a_0 t}。
我們的結論是,(5) 的任何解都是 e^{-a_0 t} 的純量倍數。
陳述定理 2.30 的另一種方式如下。
推論。對於任何複數 c,微分算子 D - cI 的零空間具有 \{e^{ct}\} 作為基底。
我們接下來關注階數大於 1 的微分方程式。給定一個 n 階具常數係數的齊次線性微分方程式
y^{(n)} + a_{n-1}y^{(n-1)} + \cdots + a_1 y^{(1)} + a_0 y = 0,
其輔助多項式
p(t) = t^n + a_{n-1}t^{n-1} + \cdots + a_1 t + a_0
可以分解成 1 次多項式的乘積,即
p(t) = (t - c_1)(t - c_2)\cdots(t - c_n),
其中 c_1, c_2, \dots, c_n 是(不一定相異的)複數。(這是附錄 D 代數基本定理的結果。)因此
p(D) = (D - c_1 I)(D - c_2 I)\cdots(D - c_n I)。
算子 D - c_i I 是可以相互交換的,所以,藉由習題 9,我們知道對所有的 i,N(D - c_i I) \subseteq N(p(D))。
由於 N(p(D)) 與給定微分方程式的解空間重合,我們可以從前面的推論推導出以下結果。
定理 2.31。令 p(t) 為具常數係數的齊次線性微分方程式的輔助多項式。對於任何複數 c,如果 c 是 p(t) 的零點,那麼 e^{ct} 是該微分方程式的解。
例 4
給定微分方程式
y^{\prime\prime} - 3y' + 2y = 0,
它的輔助多項式是
p(t) = t^2 - 3t + 2 = (t - 1)(t - 2)。
因此,根據定理 2.31,e^t 與 e^{2t} 都是此微分方程式的解,因為 c=1 和 c=2 是 p(t) 的零點。由於微分方程式的解空間是 C^\infty 的子空間,因此 \text{span}(\{e^t, e^{2t}\}) 位於該解空間中。我們可以輕易證明 \{e^t, e^{2t}\} 是線性獨立的。因此,如果我們能證明解空間是 2 維的,我們就能得出 \{e^t, e^{2t}\} 是該解空間的一個基底的結論。這個結果是下一個定理的推論。
定理 2.32。對於任何 n 階微分算子 p(D),p(D) 的零空間是 C^\infty 中一個 n 維的子空間。
作為定理 2.32 證明的前置作業,我們建立兩個引理。
引理 1。微分算子 D - cI: C^\infty \rightarrow C^\infty 對任何複數 c 都是映成的 (onto)。
證明。令 v \in C^\infty。我們希望找到一個 u \in C^\infty 使得 (D - cI)u = v。
令 w(t) = v(t)e^{-ct} 對於 t \in R。顯然,w \in C^\infty,因為 v 和 e^{-ct} 都位於 C^\infty 中。令 w_1 和 w_2 分別為 w 的實部和虛部。那麼 w_1 和 w_2 是連續的,因為它們可微。因此它們具有反導數,分別設為 W_1 和 W_2。令 W: R \rightarrow C 定義為
W(t) = W_1(t) + iW_2(t) 對於 t \in R。
那麼 W \in C^\infty,且 W 的實部和虛部分別為 W_1 和 W_2。此外,W' = w。最後,令 u: R \rightarrow C 定義為
u(t) = W(t)e^{ct} 對於 t \in R。顯然 u \in C^\infty,且因為
(D - cI)u(t) = u'(t) - cu(t)
= W'(t)e^{ct} + W(t)c e^{ct} - cW(t)e^{ct}
= w(t)e^{ct}
= v(t)e^{-ct}e^{ct}
= v(t),
我們有 (D - cI)u = v。
引理 2。令 V 為向量空間,並假設 T 和 U 是 V 上的線性算子,使得 U 為映成 (onto),且 T 和 U 的零空間為有限維。那麼 TU 的零空間是有限維的,且
\dim(N(TU)) = \dim(N(T)) + \dim(N(U))。
證明。令 p = \dim(N(T))、q = \dim(N(U)),並令 \{u_1, u_2, \dots, u_p\} 與 \{v_1, v_2, \dots, v_q\} 分別為 N(T) 和 N(U) 的基底。因為 U 是映成的,對於每個 i (1 \le i \le p),我們可以選擇一個向量 w_i \in V 使得 U(w_i) = u_i。注意 w_i 皆是相異的。此外,對於任何 i 和 j,w_i \ne v_j,否則 u_i = U(w_i) = U(v_j) = 0 — 這會產生矛盾。因此集合
\beta = \{w_1, w_2, \dots, w_p, v_1, v_2, \dots, v_q\}
包含 p+q 個相異向量。為了完成引理的證明,我們只需證明 \beta 是 N(TU) 的基底即可。
我們首先證明 \beta 生成 (generates) N(TU)。因為對於 \beta 中的任何 w_i 和 v_j,皆有
TU(w_i) = T(u_i) = 0 且 TU(v_j) = T(0) = 0,所以 \beta \subseteq N(TU)。
現在假設 v \in N(TU)。那麼 0 = TU(v) = T(U(v))。因此 U(v) \in N(T)。所以存在純量 a_1, a_2, \dots, a_p 使得
U(v) = a_1 u_1 + a_2 u_2 + \cdots + a_p u_p
= a_1 U(w_1) + a_2 U(w_2) + \cdots + a_p U(w_p)
= U(a_1 w_1 + a_2 w_2 + \cdots + a_p w_p)。
因此
U(v - (a_1 w_1 + a_2 w_2 + \cdots + a_p w_p)) = 0。
因此,v - (a_1 w_1 + a_2 w_2 + \cdots + a_p w_p) 位於 N(U) 中。這意味著存在純量 b_1, b_2, \dots, b_q 使得
v - (a_1 w_1 + a_2 w_2 + \cdots + a_p w_p) = b_1 v_1 + b_2 v_2 + \cdots + b_q v_q,
即
v = a_1 w_1 + a_2 w_2 + \cdots + a_p w_p + b_1 v_1 + b_2 v_2 + \cdots + b_q v_q。
因此 \beta 生成 N(TU)。
為了證明 \beta 是線性獨立的,考慮任意純量 a_1, a_2, \dots, a_p, b_1, b_2, \dots, b_q 使得
a_1 w_1 + a_2 w_2 + \cdots + a_p w_p + b_1 v_1 + b_2 v_2 + \cdots + b_q v_q = 0。 (6)
對 (6) 的兩側應用 U,我們獲得
a_1 u_1 + a_2 u_2 + \cdots + a_p u_p = 0。
因為 \{u_1, u_2, \dots, u_p\} 是線性獨立的,所以 a_i 皆為零。因此 (6) 簡化為
b_1 v_1 + b_2 v_2 + \cdots + b_q v_q = 0。
同樣地,\{v_1, v_2, \dots, v_q\} 的線性獨立性意味著 b_i 都是零。我們的結論是 \beta 是 N(TU) 的一個基底。因此 N(TU) 為有限維,且 \dim(N(TU)) = p + q = \dim(N(T)) + \dim(N(U))。
定理 2.32 的證明。我們對微分算子 p(D) 的階數進行數學歸納法證明。一階的情況與定理 2.30 一致。對某個整數 n>1,假設定理 2.32 對任何小於 n 階的微分算子成立,並考慮一個 n 階的微分算子 p(D)。多項式 p(t) 可以被分解為兩個多項式的乘積如下:
p(t) = q(t)(t - c),
其中 q(t) 是一個 n-1 次多項式,而 c 是一個複數。因此給定的微分算子可以改寫為
p(D) = q(D)(D - cI)。
現在,根據引理 1,D - cI 是映成的,且根據定理 2.30 的推論,\dim(N(D - cI)) = 1。此外,根據歸納法假設,\dim(N(q(D))) = n - 1。因此,根據引理 2,我們得出結論:
\dim(N(p(D))) = \dim(N(q(D))) + \dim(N(D - cI))
= (n - 1) + 1 = n。
推論。任何 n 階具常數係數的齊次線性微分方程式的解空間,皆為 C^\infty 的一個 n 維子空間。
定理 2.32 的推論將尋找 n 階具常數係數的齊次線性微分方程式所有解的問題,化簡為尋找方程式的 n 個線性獨立解。根據第 1 章的結果,任何這樣的集合必定為解空間的基底。下一個定理使我們能快速找到許多這類方程式的基底。證明的提示在習題中提供。
定理 2.33。給定 n 個相異複數 c_1, c_2, \dots, c_n,指數函數集合 \{e^{c_1 t}, e^{c_2 t}, \dots, e^{c_n t}\} 是線性獨立的。
證明。習題。(見習題 10。)
推論。對於任何 n 階具常數係數的齊次線性微分方程式,如果輔助多項式有 n 個相異的零點 c_1, c_2, \dots, c_n,那麼 \{e^{c_1 t}, e^{c_2 t}, \dots, e^{c_n t}\} 就是該微分方程式解空間的一個基底。
證明。習題。(見習題 10。)
例 5
我們來找微分方程式
y^{\prime\prime} + 5y' + 4y = 0
的所有解。因為輔助多項式分解為 (t+4)(t+1),所以它有兩個相異零點,-1 與 -4。因此 \{e^{-t}, e^{-4t}\} 是解空間的基底。所以給定方程式的任何解都具有此形式
y(t) = b_1 e^{-t} + b_2 e^{-4t}
其中 b_1 和 b_2 為唯一的純量。
例 6
我們來找微分方程式
y^{\prime\prime} + 9y = 0
的所有解。輔助多項式 t^2 + 9 分解為 (t-3i)(t+3i),並因此具有相異零點 c_1 = 3i 與 c_2 = -3i。因此 \{e^{3it}, e^{-3it}\} 是解空間的基底。因為
\cos 3t = \frac{1}{2}(e^{3it} + e^{-3it}) 以及 \sin 3t = \frac{1}{2i}(e^{3it} - e^{-3it}),
由習題 7 可知 \{\cos 3t, \sin 3t\} 也是這個解空間的基底。這個基底比原先的基底更有優勢,因為它由熟悉的正弦和餘弦函數組成,完全不涉及虛數 i。使用後者的基底,我們可知給定方程式的任何解都具有此形式
y(t) = b_1 \cos 3t + b_2 \sin 3t
其中 b_1 和 b_2 為唯一的純量。
接下來考慮微分方程式
y^{\prime\prime} + 2y' + y = 0,
其輔助多項式為 (t+1)^2。根據定理 2.31,e^{-t} 是這個方程式的解。根據定理 2.32 的推論,它的解空間為二維的。為了獲得解空間的基底,我們需要一個與 e^{-t} 線性獨立的解。讀者可以驗證 t e^{-t} 就是一個這樣的解。下面的引理推廣了這個結果。
引理。對於任何給定的複數 c 及任何正整數 n,
(D - cI)^n (t^k e^{ct}) = 0
對於 k=0, 1, \dots, n-1 成立。因此,集合
\beta = \{e^{ct}, t e^{ct}, \dots, t^{n-1} e^{ct}\}
是微分方程式 (D - cI)^n (y) = 0 解空間的一個基底。
證明。此引理的第一部分可以藉由對 n 進行數學歸納法直接證明(見習題 11)。它得出 \beta 是解空間的子集。
我們接下來證明 \beta 是線性獨立的。考慮 \beta 中向量的任意線性組合使其和為 0,即
b_0 e^{ct} + b_1 t e^{ct} + \cdots + b_{n-1} t^{n-1} e^{ct} = 0 (7)
其中 b_0, b_1, \dots, b_{n-1} 為某些純量。在 (7) 中兩側除以 e^{ct},我們獲得
b_0 + b_1 t + \cdots + b_{n-1} t^{n-1} = 0。 (8)
因此 (8) 的左邊必須是零多項式函數。我們得出結論,係數 b_0, b_1, \dots, b_{n-1} 皆為零。所以 \beta 是線性獨立的,因此是解空間的一個基底。
例 7
我們尋找微分方程式
y^{(4)} - 4y^{(3)} + 6y^{(2)} - 4y^{(1)} + y = 0
的所有解。因為輔助多項式是
t^4 - 4t^3 + 6t^2 - 4t + 1 = (t - 1)^4,
藉由前面的引理我們可以立即得出結論:\{e^t, t e^t, t^2 e^t, t^3 e^t\} 是解空間的基底。所以任何給定微分方程式的解 y 具有此形式
y(t) = b_1 e^t + b_2 t e^t + b_3 t^2 e^t + b_4 t^3 e^t
其中 b_1、b_2、b_3 和 b_4 為唯一的純量。
最一般的情況陳述在下一個定理中。
定理 2.34。給定一個具常數係數的齊次線性微分方程式,其輔助多項式為
(t - c_1)^{n_1}(t - c_2)^{n_2}\cdots(t - c_k)^{n_k}
其中 n_1, n_2, \dots, n_k 為正整數,且 c_1, c_2, \dots, c_k 為相異複數。那麼以下集合是此方程式解空間的一個基底:
\{e^{c_1 t}, te^{c_1 t}, \dots, t^{n_1-1}e^{c_1 t}, \dots, e^{c_k t}, te^{c_k t}, \dots, t^{n_k-1}e^{c_k t}\}
證明。習題。
例 8
微分方程式
y^{(3)} - 4y^{(2)} + 5y^{(1)} - 2y = 0
具有輔助多項式
t^3 - 4t^2 + 5t - 2 = (t - 1)^2(t - 2)。
根據定理 2.34,\{e^t, t e^t, e^{2t}\} 是此微分方程式解空間的基底。因此任何解 y 具有形式
y(t) = b_1 e^t + b_2 t e^t + b_3 e^{2t}
其中 b_1、b_2 與 b_3 為唯一的純量。
以下是 2.7 節習題(根據所提供的文本內容)的完整翻譯:
習題
1. 將下列敘述標示為真(True)或假(False)。
(a) 一個具常數係數的 n 階齊次線性微分方程式的解集合,是 C^\infty 的一個 n 維子空間。
(b) 具常數係數的齊次線性微分方程式的解空間是某個微分算子的零空間。
(c) 具常數係數的齊次線性微分方程式的輔助多項式,是該微分方程式的一個解。
(d) 具常數係數的齊次線性微分方程式的任何解皆具有 ae^{ct} 或 at^ke^{ct} 的形式,其中 a 與 c 為複數,且 k 為正整數。
(e) 給定一個具常數係數的齊次線性微分方程式,其解的任何線性組合也是該方程式的解。
(f) 對於任何輔助多項式為 p(t) 的具常數係數齊次線性微分方程式,若 c_1, c_2, \dots, c_k 是 p(t) 的相異零點,則 \{e^{c_1t}, e^{c_2t}, \dots, e^{c_kt}\} 是該微分方程式解空間的基底。
(g) 給定任何多項式 p(t) \in P(C),必定存在一個具常數係數的齊次線性微分方程式,其輔助多項式即為 p(t)。
2. 對於下列每個子題,判斷該敘述為真或假。請以證明或反例(視何者適用)來證明你的主張。
(a) C^\infty 的任何有限維子空間,都是某個具常數係數的齊次線性微分方程式的解空間。
(b) 存在一個具常數係數的齊次線性微分方程式,其解空間具有基底 \{t, t^2\}。
(c) 對於任何具常數係數的齊次線性微分方程式,若 x 是該方程式的解,則其導數 x' 也是解。
(註:原文本在此處有缺失,直接跳至以下片段)
(b) N(D^3+3D^2+3D-I)
(c) N(D^3+6D^2+8D)
5. 證明 C^\infty 是 \mathcal{F}(R,C) 的子空間。
6. (a) 證明 D: C^\infty \rightarrow C^\infty 是一個線性算子。
(b) 證明任何微分算子都是 C^\infty 上的線性算子。
7. 證明若 \{x, y\} 是佈於 C 之向量空間的基底,則 \{\frac{1}{2}(x+y), \frac{1}{2i}(x-y)\} 也是基底。
8. 考慮一個二階具常數係數的齊次線性微分方程式,其輔助多項式具有相異的共軛複數根 a+ib 與 a-ib,其中 a, b \in R。證明 \{e^{at}\cos bt, e^{at}\sin bt\} 是解空間的一個基底。
9. 假設 \{U_1, U_2, \dots, U_n\} 是一個在向量空間 V 上的兩兩可交換線性算子(即對所有 i, j,皆滿足 U_i U_j = U_j U_i 的算子)所成的集合。證明對於任意 i (1 \le i \le n),
N(U_i) \subseteq N(U_1 U_2 \cdots U_n)。
10. 證明定理 2.33 及其推論。提示:對於定理 2.33,對 n 使用數學歸納法。在歸納步驟中,設 a_1, a_2, \dots, a_n 為使得 \sum_{i=1}^n a_i e^{c_i t} = 0 的純量。將此方程式兩邊同乘 e^{-c_n t},並將所得之方程式對 t 進行微分。對於推論,請使用定理 2.31、2.33 與 2.32。請造訪 goo.gl/oKTEbV 以獲取解答。
11. 證明定理 2.34。提示:首先驗證所聲稱的基底位於解空間中。接著對 k 進行數學歸納法,以驗證此集合是線性獨立的,作法如下。k=1 的情況即為定理 2.34 之前的引理。假設該定理對 k-1 個相異的 c_i 皆成立,將算子 (D-c_k I)^{n_k} 應用於此聲稱基底中和為 0 的任何線性組合上。
12. 設 V 為一個 n 階具常數係數的齊次線性微分方程式之解空間,其輔助多項式為 p(t)。證明若 p(t) = g(t)h(t),其中 g(t) 與 h(t) 皆為正次數的多項式,則
N(h(D)) = R(g(D_V)) = g(D)(V),
其中 D_V: V \rightarrow V 的定義為對 x \in V 皆有 D_V(x) = x'。提示:首先證明 g(D)(V) \subseteq N(h(D))。接著證明這兩個空間具有相同的有限維度。
13. 一個微分方程式
y^{(n)} + a_{n-1}y^{(n-1)} + \dots + a_1 y^{(1)} + a_0 y = x
被稱為具常數係數的非齊次(nonhomogeneous)線性微分方程式,其中 a_i 為常數,且 x 是一個不恆為零的函數。
(a) 證明對任意 x \in C^\infty,存在 y \in C^\infty 使得 y 是該微分方程式的解。提示:使用定理 2.32 的引理 1 來證明,對於任意多項式 p(t),線性算子 p(D): C^\infty \rightarrow C^\infty 是映成的(onto)。
(b) 設 V 為齊次線性方程式 y^{(n)} + a_{n-1}y^{(n-1)} + \dots + a_1 y^{(1)} + a_0 y = 0 的解空間。證明若 z 是相關之非齊次線性微分方程式的任何解,則該非齊次線性微分方程式的所有解之集合為
\{z + y : y \in V\}。
14. 給定任意一個 n 階具常數係數的齊次線性微分方程式,證明對於任何解 x 及任意 t_0 \in R,若
x(t_0) = x'(t_0) = \dots = x^{(n-1)}(t_0) = 0,則 x = 0(零函數)。
提示:對 n 使用數學歸納法如下。首先證明 n=1 情況的結論。接著假設它對 n-1 階的方程式成立,並考慮一個具有輔助多項式 p(t) 的 n 階微分方程式。將 p(t) 分解為 p(t) = q(t)(t-c),並令 z = q(D)x。證明 z(t_0) = 0 且 z' - cz = 0,以得出 z = 0 的結論。現在應用歸納法假設。
(註:原文本中未出現第 15 題,直接接續第 16 題)
16. 鐘擺運動(Pendular Motion)。眾所周知,鐘擺的運動可由下列微分方程式近似:
\theta'' + \frac{g}{l}\theta = 0,
其中 \theta(t) 是在時間 t 時鐘擺與垂直線所夾的角(以弧度為單位)(見圖 2.8),其解釋為:若從讀者的視角來看,鐘擺位於垂直線的右側,則 \theta 為正;若位於左側,則 \theta 為負。此處 l 為鐘擺長度,而 g 為重力加速度的大小。變數 t 與常數 l、g 必須使用相容的單位(例如,t 以秒為單位,l 以公尺為單位,g 以公尺/秒平方為單位)。
(a) 將此方程式的任意解表示為兩個實數值解的線性組合。
(b) 找出滿足以下條件之該方程式的唯一解:
\theta(0) = \theta_0 > 0 且 \theta'(0) = 0。
(這些條件的意義在於,在時間 t=0 時,鐘擺從偏離垂直線 \theta_0 的位置被釋放。)
(c) 證明鐘擺來回擺動一圈需要 2\pi\sqrt{l/g} 單位的時間。(此時間稱為鐘擺的週期。)
17. 無阻尼的彈簧週期運動(Periodic Motion of a Spring without Damping)。找出方程式 (3) 的一般解,該方程式描述了忽略摩擦力的彈簧週期運動。
18. 有阻尼的彈簧週期運動(Periodic Motion of a Spring with Damping)。由 (3) 的解所描述的理想週期運動,是由於忽略了摩擦力的結果。然而在現實中,作用於運動上存在一種摩擦力,其與運動速度成正比,但作用方向相反。為將此摩擦力(稱為阻尼力)納入考量,對 (3) 所作的修改如下:
my'' + ry' + ky = 0,
其中 r > 0 是比例常數。
(a) 找出此方程式的一般解。
(b) 找出 (a) 中滿足初始條件 y(0) = 0 與 y'(0) = v_0(初始速度)的唯一解。
(c) 對於 (b) 中的 y(t),證明震盪的振幅遞減至零;也就是說,證明 \lim_{t \to \infty} y(t) = 0。
19. 在我們對微分方程式的研究中,我們已將解視為複數值函數,即使能用來描述物理運動的函數是實數值的。請為這種做法提出合理的解釋。
20. 下列各部分不涉及線性代數,為求完整性而包含於此。
(a) 證明定理 2.27。提示:對一個解所擁有的導數階數使用數學歸納法。
(b) 對於任意 c, d \in C,證明
e^{c+d} = e^c e^d 且 e^{-c} = \frac{1}{e^c}。
(c) 證明定理 2.28。
(d) 證明定理 2.29。
(e) 證明實變數之複數值函數微分的乘法法則:對於在 \mathcal{F}(R,C) 中的任何可微函數 x 與 y,其乘積 xy 亦為可微的,並且
(xy)' = x'y + xy'。
提示:將微分法則應用於 xy 的實部與虛部。
(f) 證明若 x \in \mathcal{F}(R,C) 且 x' = 0,則 x 是一個常數函數。
以下是 2.7 節末尾(即第 2 章結尾)的「名詞定義索引(Index of Definitions)」完整翻譯:
第 2 章 名詞定義索引(INDEX OF DEFINITIONS FOR CHAPTER 2)
- Auxiliary polynomial (輔助多項式) 132
- Change of coordinate matrix (座標轉換矩陣) 112
- Clique (派系) 95
- Coefficients of a differential equation (微分方程式的係數) 129
- Coordinate function (座標函數) 120
- Coordinate vector relative to a basis (相對於某基底的座標向量) 80
- Differential equation (微分方程式) 129
- Differential operator (微分算子) 131
- Dimension theorem (維度定理) 70
- Dominance relation (支配關係) 96
- Double dual (雙對偶) 120
- Dual basis (對偶基底) 121
- Dual space (對偶空間) 120
- Euler's formula (尤拉公式) 133
- Exponential function (指數函數) 133
- Fourier coefficient (傅立葉係數) 119
- Homogeneous linear differential equation (齊次線性微分方程式) 129
- Identity matrix (單位矩陣) 82
- Identity transformation (恆等變換) 67
- Incidence matrix (關聯矩陣) 94
- Inverse of a linear transformation (線性變換的反函數) 100
- Inverse of a matrix (矩陣的反矩陣) 101
- Invertible linear transformation (可逆線性變換) 100
- Invertible matrix (可逆矩陣) 101
- Isomorphic vector spaces (同構的向量空間) 103
- Isomorphism (同構) 103
- Kronecker delta (克羅內克函數 / Kronecker delta) 82
- Left-multiplication transformation (左乘變換) 93
- Linear functional (線性泛函) 119
- Linear operator (線性算子) 113
- Linear transformation (線性變換) 65
- Matrix representing a linear transformation (線性變換的矩陣表示) 80
- Nonhomogeneous differential equation (非齊次微分方程式) 142
- Nullity of a linear transformation (線性變換的零度 / 零維數) 70
- Null space (零空間) 67
- Ordered basis (有序基底) 79
- Order of a differential equation (微分方程式的階數) 129
- Order of a differential operator (微分算子的階數) 131
- Product of matrices (矩陣的乘積) 88
- Projection on a subspace (在子空間上的投影) 76
- Projection on the x-axis (在 x 軸上的投影) 66
- Range (值域) 67
- Rank of a linear transformation (線性變換的秩) 70
- Reflection about the x-axis (關於 x 軸的鏡射) 66
- Rotation (旋轉) 66
- Similar matrices (相似矩陣) 116
- Solution to a differential equation (微分方程式的解) 129
- Solution space of a homogeneous differential equation (齊次微分方程式的解空間) 132
- Standard ordered basis for F^n (F^n 的標準有序基底) 79
- Standard ordered basis for P_n(F) (P_n(F) 的標準有序基底) 79
- Standard representation of a vector space with respect to a basis (向量空間關於某基底的標準表示) 105
- Transpose of a linear transformation (線性變換的轉置) 122
- Zero transformation (零變換) 67