1.1 線性矢量空間基礎(chǔ)?在這一節(jié)我們會(huì)學(xué)習(xí)線性矢量空間(linear vector spaces). 你們肯定對(duì)基礎(chǔ)物理中那些用于表示速度、力、位移、扭矩等的大小與方向的箭頭頗為熟悉了. 你們知道它們是如何相加的, 也知道它們?nèi)绾闻c一個(gè)標(biāo)量相乘, 并且知道這兩個(gè)運(yùn)算所遵循的規(guī)則. 比如說, 你們知道標(biāo)量乘法滿足分配律(原書第二版中是結(jié)合律, 應(yīng)為筆誤. —— 譯者注): 矢量和的倍數(shù)等于其倍數(shù)的和. 我們要做的就是從這些簡(jiǎn)單的例子出發(fā)抽象出一組基本特征或者說公理, 服從這組特征(或者公理)的任意對(duì)象的集合就構(gòu)成一個(gè)線性矢量空間(按照現(xiàn)在的習(xí)慣, 我們或稱線性空間, 或稱矢量空間. —— 譯者注). 關(guān)鍵在于在推廣時(shí)保留哪些性質(zhì): 如果你們保留得太多, 就不會(huì)有其他滿足這些性質(zhì)的例子; 但是保留的太少, 就又不會(huì)從這些公理中得到有趣的結(jié)果. ?下面我們將看到的就是經(jīng)過數(shù)學(xué)家們精心挑選后構(gòu)成矢量空間所必須的性質(zhì)的列表. 當(dāng)你們閱讀它們的時(shí)候, 請(qǐng)將其與你們熟悉的“箭頭世界”相比較, 確保它們確實(shí)是你們所熟悉的這些矢量所滿足的性質(zhì). 但是也請(qǐng)注意, 這些性質(zhì)當(dāng)中, “箭頭世界”中每個(gè)矢量都有其大小和方向的這一要求明顯缺失了, 而這是我們第一次聽到矢量這個(gè)概念后腦海中第一個(gè)也是最為顯著的特征. 因此你們或許會(huì)這樣認(rèn)為: 舍棄該要求就是倒洗澡水時(shí)將孩子一同倒掉(Throw the baby out with the baby bath water, 這是一則廣泛流傳的俗語, 意思是不分精華糟粕而全盤否定. —— 譯者注). 然而, 你們有充足的時(shí)間欣賞這一選擇背后的智慧, 因?yàn)槟銈儗?huì)看到在矢量空間這一標(biāo)題之下, 各種思想的偉大統(tǒng)一以及綜合. 你們會(huì)看到一些矢量空間的例子, 它們包含一些我們無法直觀感受的對(duì)象, 它們既沒有大小, 也沒有方向. 雖說你們應(yīng)該對(duì)前面所述印象深刻, 但是煩請(qǐng)牢記, 通過箭頭來思考這些推廣, 并借此直覺來證明定理或者至少預(yù)見到它們, 這樣做并非壞事.
?記住這些要求有一個(gè)很棒的方法, 那就是順其自然(因?yàn)樗鼈儩M足的不過是我們希望加法和乘法所具有的運(yùn)算律罷了. —— 譯者注).
?如果這個(gè)數(shù)域由所有實(shí)數(shù)構(gòu)成, 我們就得到了一個(gè)實(shí)矢量空間(real vector space); 如果由所有復(fù)數(shù)構(gòu)成, 我們就得到復(fù)矢量空間(complex vector space). 但是矢量本身既非實(shí)數(shù)也非復(fù)數(shù) —— 這一形容詞是對(duì)標(biāo)量而言的. ?我們要注意, 上述公理可以推出
它們的證明留作下面的習(xí)題. 它們的證明不是必須的, 但是你們必須知道這些結(jié)論.
?注意, 我們現(xiàn)在正在使用一個(gè)新的符號(hào)來表示一個(gè)一般的矢量. 這個(gè)東西讀作ket (雖然按理這里應(yīng)該寫成右矢, 但是通常我們還是習(xí)慣于將右矢讀作ket. —— 譯者注), 稱作右矢(ket), 這一命名源于Dirac, 稍后我們會(huì)詳細(xì)討論他的這套記號(hào). 作為讓你們擺脫“矢量是箭頭”的這一有限觀念的第一步, 我有意不采用的這套記號(hào)來表示矢量. 然而, 在你們看到足夠的非箭頭矢量并做好丟開“拐杖”的準(zhǔn)備之前, 我并不反對(duì)你們將與類似箭頭的物件聯(lián)系起來. ?你們應(yīng)當(dāng)驗(yàn)證箭頭的集合確實(shí)構(gòu)成前面公理所確定的矢量空間. 接下來是一些你應(yīng)當(dāng)知道的關(guān)鍵想法. 矢量空間由箭頭組成, 其典型元素形如和, 它們的加法是我們所熟悉的: 取第二個(gè)箭頭的尾部, 將其放置到第一個(gè)箭頭的頂端, 它們的和就如圖1.1所示. ![]() ?而箭頭與標(biāo)量的標(biāo)量乘法就是將其拉伸一個(gè)因子. 這是一個(gè)實(shí)矢量空間, 因?yàn)槔煲粋€(gè)復(fù)數(shù)因子是沒有意義的. (如果是負(fù)數(shù), 我們可以將其解釋為改變箭頭的方向并拉伸一個(gè)因子.) 因?yàn)檫@些作用于箭頭的操作會(huì)給出更多的箭頭, 我們就有了封閉性. 加法和標(biāo)量乘法顯然具有所有需要其滿足的結(jié)合律和分配律特征. 零矢量是長(zhǎng)度為零的箭頭, 而一個(gè)箭頭的加法逆元就是與其方向相反且長(zhǎng)度相同的箭頭. ?于是所有箭頭的集合就是一個(gè)矢量空間, 但是我們不能瞎擺弄(tamper)它. 比如說, 所有沿著軸正方向的箭頭就不構(gòu)成矢量空間, 因?yàn)樗鼈儧]有加法逆元. ?請(qǐng)注意, 到目前為止, 我們都還沒有提到大小以及方向. 其原因在于雖然箭頭具有這些特性, 但是矢量空間的元素卻不必如此. 然而除非我能夠向你們提供一些例子, 否則該陳述毫無意義. ?考察所有矩陣的集合, 我們知道它們?nèi)绾蜗嗉? 也知道如何將它們與標(biāo)量相乘(即四個(gè)矩陣元都乘以該標(biāo)量). 其加法規(guī)則和數(shù)乘規(guī)則也服從封閉性、結(jié)合律以及分配律. 零矢量就是零矩陣, 即所有矩陣元都是零的矩陣. 而一個(gè)矩陣的加法逆元就是其對(duì)應(yīng)矩陣元相反數(shù)構(gòu)成的矩陣. 你們必須承認(rèn)現(xiàn)在我們確實(shí)得到了一個(gè)一般的矢量空間, 它由一些明顯沒有長(zhǎng)度和方向的東西組成(當(dāng)然, 我們可以人為加上長(zhǎng)度和方向, 這只要規(guī)定參考方向, 然后取內(nèi)積和模即可, 因此原文為沒有明顯的長(zhǎng)度和方向. 我修改了一下語句使其語氣更為獨(dú)斷論一點(diǎn). —— 譯者注). 當(dāng)我們希望強(qiáng)調(diào)矩陣是一個(gè)矢量空間的元素之時(shí), 我們就可以稱其為ket 4或者說. ?第二個(gè)例子我們來考察定義在區(qū)間上的所有函數(shù). 我們定義其與標(biāo)量相乘的結(jié)果為. 而加法則定義為逐點(diǎn)相加: 函數(shù)和的和在點(diǎn)處的函數(shù)值為. 零矢量就是處處為零的那個(gè)函數(shù)(即零函數(shù)), 而的加法逆元就是.
?下一個(gè)概念就是矢量組的線性無關(guān)性(linear independence). 首先考察形式為 的線性關(guān)系(我們將的左邊稱作矢量組的線性組合. —— 譯者注). ?不失一般性, 我們可以假設(shè)左邊不含的倍數(shù)項(xiàng), 因?yàn)槿绻筮叴嬖谶@么一項(xiàng), 我們就可以將其移到右邊, 將其與相加我們就再一次得到了. (這里我們用到了的任意倍均為的事實(shí).)
?方程告訴我們線性無關(guān)組中任意元素都不可能用其它元素(線性)表示出來. 另一方面, 如果矢量組是線性相關(guān)的, 這樣的關(guān)系就會(huì)存在, 并且至少有兩個(gè)非零的系數(shù). 比方說我們?cè)O(shè), 則我們就可以寫下 這樣我們就將用其它矢量表示出來了. ?一個(gè)具體的例子是這樣的(注意這里是在箭頭空間中討論問題. —— 譯者注): 我們考察平面上兩個(gè)不平行的矢量和, 它們就構(gòu)成一個(gè)線性無關(guān)組. 我們沒有辦法將其中一個(gè)矢量寫成另一個(gè)矢量的倍數(shù), 或者等價(jià)地說, 不可能將它們組合起來得到零矢量. 另一方面, 如果它們相互平行, 那么我們顯然可以將一個(gè)矢量寫成另一個(gè)矢量的倍數(shù), 或者等價(jià)地, 將它們組合起來得到. ?注意我這里說的是而不是. 嚴(yán)格地說, 這樣做是不正確的, 因?yàn)槭噶肯嗉拥玫降谋厝皇且粋€(gè)矢量而不是一個(gè)數(shù). 然而, 將零矢量簡(jiǎn)單地寫成是一種很常見的行為. ?假設(shè)我們?cè)谶@個(gè)平面上引入第三個(gè)矢量. 如果它平行于前兩個(gè)矢量中的任意一個(gè), 我們自然就得到了一組線性相關(guān)的矢量, 因此讓我們假設(shè)并非如此. 但即便如此, 我們?nèi)匀豢梢詳喽ㄟ@三個(gè)矢量是線性相關(guān)的. 這是因?yàn)槲覀兛梢詫⑺麄冎械囊粋€(gè) —— 比方說—— 寫成另外兩個(gè)矢量的線性組合. 要找到該組合, 我們首先從的尾部沿著的方向畫一條線. 然后從的頂端畫一條與反向平行的線. 這兩條線必然相交, 因?yàn)楦鶕?jù)假設(shè), 和彼此不平行. 兩條線的交點(diǎn)就可以告訴我們希望得到的和的倍數(shù)是多少: 我們從的尾部出發(fā)通過的合適倍數(shù)抵達(dá), 從的頂端出發(fā)通過的合適倍數(shù)抵達(dá).
?鑒于早先的討論, 我們知道平面是二維的, 而所有不限于該平面的箭頭的集合定義了一個(gè)三維矢量空間. 那矩陣的全體呢? 它們構(gòu)成了一個(gè)四維的矢量空間. 這里有一個(gè)證明: 下面的矢量是線性無關(guān)的: 因?yàn)樗鼈冎虚g任意三個(gè)的線性組合都不可能給出第四個(gè)矢量, 畢竟第四個(gè)矢量中非零矩陣元所在的位置處其余三個(gè)矢量的矩陣元都是零. 因此這個(gè)矢量空間至少是四維的. 維數(shù)可以更高一點(diǎn)嗎? 不可以! 因?yàn)槿我庖粋€(gè)矩陣都可以用它們四個(gè)表示出來: ?如果標(biāo)量都是實(shí)數(shù), 我們就得到了一個(gè)實(shí)四維空間, 如果它們都是復(fù)數(shù), 則我們就得到了一個(gè)復(fù)四維空間.
?茲證明如下: 如果存在一個(gè)矢量使得其不成立, 則我們將其加入到已有的線性無關(guān)矢量組中就得到個(gè)線性無關(guān)矢量構(gòu)成的矢量組, 根據(jù)定義這在維空間中是不可能的.
?于是, 在上面的定義下, 定理1可以寫作 其中這些矢量構(gòu)成一組基.
?假設(shè)這個(gè)展開不唯一, 我們就可以找到第二個(gè)展開式 用減去我們就得到(也就是給第二個(gè)式子乘以標(biāo)量, 然后兩個(gè)式子相加) 這就推出 因?yàn)榛噶渴蔷€性無關(guān)的, 它們之間只存在平凡的線性關(guān)系. 注意給定一組基后分量是唯一的, 但是如果我們換一組基, 對(duì)應(yīng)的分量就會(huì)發(fā)生改變. 我們將視作是抽象矢量, 它自身存在, 且滿足與其它矢量的各種關(guān)系. 當(dāng)我們選定好一組基后, 抽象矢量就以其分量表示出來, 而矢量之間的關(guān)系就用分量之間滿足的關(guān)系表示. 打個(gè)比方, 假想平面上有三個(gè)箭頭, 和, 它們之間依照箭頭的加法法則滿足. 到目前為止我們還沒有選定好一組基, 我們也不需要一組基來證明這些矢量構(gòu)成一個(gè)閉合三角形. 現(xiàn)在, 我們選定一組基, 并且將每個(gè)矢量以其分量表示. 那么這些分量就會(huì)滿足, . 如果我們選擇另一組基, 這些分量的數(shù)值也會(huì)發(fā)生變化, 但是它們之間的關(guān)系 —— 表示這個(gè)量與其余兩個(gè)矢量之和相等 —— 在新的分量下仍舊成立. ?在非箭頭矢量的情況下, 如初等情形那樣將它們的分量相加以實(shí)現(xiàn)矢量相加要?dú)w功于那些公理. 如果 且 則 這里我們用到了那些公理(確切地說, 用到了交換律來將同一基的倍數(shù)放到一起, 然后逆用分配律提出因子. —— 譯者注)來重組那些項(xiàng). 最終結(jié)論如下:
?這里沒有提到將一個(gè)矢量的尾部添加到另一個(gè)矢量的頂端等操作, 因?yàn)橐话愕氖噶坎]有頂部和尾部. 當(dāng)然, 如果我們處理的是箭頭, 并希望求它們的和, 我們既可以采用基于它們尾部與頂部的慣常操作, 也可以在一組基下簡(jiǎn)單地將它們的分量相加. ?同樣的方式, 我們有 換句話說,
1.2 內(nèi)積空間?有了矩陣和函數(shù)的例子, 你現(xiàn)在應(yīng)該可以相信存在其元素沒有預(yù)先定義的長(zhǎng)度以及方向的矢量空間了. 但是, 我們可以構(gòu)造出這樣一些量, 它們與箭頭情形下箭頭的長(zhǎng)度與夾角滿足相同的性質(zhì). 第一步是定義箭頭點(diǎn)積的合理類比. 在箭頭的情形中, 點(diǎn)積定義為 由此我們可以得到箭頭的長(zhǎng)度為, 而兩個(gè)箭頭和夾角的余弦值為. 現(xiàn)在你可能會(huì)這樣反對(duì): 如果點(diǎn)積本身需要用到長(zhǎng)度和夾角, 我們又怎么可以用點(diǎn)積來定義長(zhǎng)度和夾角呢? 其回答是這樣的: 回憶點(diǎn)積可以由分量給出其與等價(jià)的第二種表達(dá)式: 我們的目標(biāo)是在已經(jīng)有矢量在一組基下的分量這一概念之后, 為點(diǎn)積的一般情況定義一個(gè)類似的公式. 為此, 我們回憶上面的點(diǎn)積之主要特征:
?點(diǎn)積線性性質(zhì)的示意圖見圖1.2. ![]() ?我們希望在任意兩個(gè)矢量和之間定義一種點(diǎn)積的推廣, 并稱之為內(nèi)積(inner product)或者標(biāo)量積(scalar product). 我們用符號(hào)來表示它(確切地說, 是, 我們把中間的兩條豎線合并為一條了. —— 譯者注). 它依舊是一個(gè)依賴于兩個(gè)矢量的數(shù)(通常是復(fù)數(shù)). 我們要求其滿足下述公理:
?注意, 我們目前還沒有給出一個(gè)可以用來實(shí)際計(jì)算標(biāo)量積的具體規(guī)則 —— 我們只是要求我們提出的任何一個(gè)計(jì)算規(guī)則都必須滿足這些性質(zhì). 為了找到這樣一條規(guī)則, 讓我們首先熟悉熟悉公理. 第一條公理和點(diǎn)積所滿足的第一條公理稍有不同, 這使得內(nèi)積對(duì)參與運(yùn)算的兩個(gè)因子的順序很是敏感, 不同的順序之間相差了一個(gè)復(fù)共軛. 在實(shí)矢量空間中, 這條公理就給出了兩個(gè)矢量交換時(shí)點(diǎn)積所滿足的對(duì)稱性. 就目前而言, 我們需要注意到這條公理保證了是實(shí)數(shù). ?第二條公理則指出不僅是實(shí)數(shù), 它還是半正定的, 它只在矢量自身為零時(shí)等于零. 如果我們要將矢量的長(zhǎng)度定義為該矢量與其自身內(nèi)積的算術(shù)平方根(就如同點(diǎn)積那樣), 那么這個(gè)內(nèi)積最好是實(shí)數(shù), 并且對(duì)于所有非零矢量為正數(shù). (因此第二條公理保證了這樣定義是合理的. —— 譯者注) ?最后一條公理表述了當(dāng)標(biāo)量積的第二項(xiàng)中出現(xiàn)矢量的線性疊加(linear superposition)時(shí)內(nèi)積的線性性質(zhì). 我們業(yè)已討論其于箭頭情形時(shí)的有效性(圖1.2). ?那當(dāng)內(nèi)積的第一個(gè)因子中出現(xiàn)線性疊加時(shí) —— 也就是—— 又是怎么樣呢? 這由第一條公理予以確定: 這就給出了內(nèi)積關(guān)于其第一個(gè)因子的反線性(antilinearity)性質(zhì)(通常數(shù)學(xué)書中也稱之為共軛線性性質(zhì). —— 譯者注). 換句話說, 如果矢量的線性疊加出現(xiàn)在內(nèi)積的第二個(gè)因子中, 則它關(guān)于另一個(gè)矢量的內(nèi)積就是各自內(nèi)積的線性疊加, 如果矢量的線性疊加出現(xiàn)在內(nèi)積的第一個(gè)因子中, 則它關(guān)于另一個(gè)矢量的內(nèi)積就是各自內(nèi)積系數(shù)取復(fù)共軛后再線性疊加. 這種不對(duì)稱性在實(shí)矢量空間中是見不到的, 但是隨著課程的進(jìn)行你會(huì)慢慢熟悉它. ?讓我們繼續(xù)討論內(nèi)積. 即便我們目前試圖擺脫“矢量就是箭頭”這一觀念的限制, 在尋求點(diǎn)積這一概念的推廣時(shí)我們?nèi)耘f要使用一些相同的術(shù)語.
?我們也經(jīng)常將內(nèi)積或者標(biāo)量積稱作點(diǎn)積(但我在翻譯之時(shí)都盡可能在非箭頭情形避免使用點(diǎn)積一詞了. 不過不排除某些地方我沒注意到. —— 譯者注). ?現(xiàn)在我們就可以準(zhǔn)備得出用分量表述的內(nèi)積的具體公式了. 給定矢量和如下: 由內(nèi)積滿足的公理我們可以得到 要想更進(jìn)一步, 我們就必須知道基矢之間的內(nèi)積. 這就取決于基矢的具體細(xì)節(jié), 而我們唯一能夠確定的就是它們是線性無關(guān)的. 此情況對(duì)箭頭也是成立的. 考察這樣一個(gè)二維問題: 基矢是兩個(gè)線性無關(guān)且彼此不垂直的箭頭. 如果我們將所有箭頭用這一組基表示, 那么它們之中的任意兩個(gè)箭頭的點(diǎn)積就是一個(gè)雙重求和, 其展開后有四項(xiàng)(由基矢之間的四個(gè)可能的點(diǎn)積確定), 這正如所述. 然而, 如果我們使用的是像和這樣的正交歸一基, 則只有像這樣的對(duì)角項(xiàng)幸存, 從而我們就得到了那個(gè)熟悉的結(jié)果: , 它只和分量有關(guān). ?對(duì)于一般的非箭頭情形, 我們調(diào)用定理3.
?我們暫且將證明擱置一邊, 現(xiàn)在先假定具體的正交化方案已經(jīng)實(shí)現(xiàn), 從而當(dāng)前的基矢是正交歸一的: 這里稱作Kronecker delta符號(hào)(Kronecker delta symbol). 將其代入, 由于Kronecker符號(hào)的特性, 我們看到雙重求和坍縮到了單個(gè)求和: 從現(xiàn)在開始, 這就是我們將會(huì)使用的內(nèi)積形式. ?現(xiàn)在你可以理解第一條公理了: 如果不是對(duì)第一個(gè)因子分量取復(fù)共軛, 甚至都不會(huì)是實(shí)數(shù), 更別提是正數(shù)了. 但是現(xiàn)在, 它由下式給出: 只有零矢量時(shí)上式可以取到等號(hào). 因此, 將視作是矢量長(zhǎng)度或者范數(shù)的平方是合理的. ?考察, 因?yàn)槭噶吭诮o定一組基后由它的分量唯一確定, 在這組基下我們就可以將其寫成一個(gè)列矢量: 類似地, 現(xiàn)在內(nèi)積就由表示的列矢量的共軛轉(zhuǎn)置(transpose conjugate)與表示的列矢量之矩陣乘積給出(沒有學(xué)過線性代數(shù)的人可能會(huì)被這里的矩陣乘積嚇住, 于是跑去專門學(xué)習(xí)線性代數(shù). 然而只要對(duì)比與, 我們就可以看到矩陣乘積大概是怎么樣的了. —— 譯者注): |
|
|