一、線性代數(shù)
萬事萬物都可以被抽象成某些特征的組合,線性代數(shù)的本質(zhì)是將具體事物抽象為數(shù)學(xué)對象,描述其靜態(tài)和動態(tài)的特征。 常見概念標量(scalar)一個標量 a 可以是整數(shù)、實數(shù)或復(fù)數(shù) 向量(vector)多個標量 a1,a2,?,an 按一定順序組成一個序列。通常用一維數(shù)組表示,例如語音信號 矩陣(matrix)矩陣包含向量,一個m*n的矩陣,可以看成是由n個m維的列向量構(gòu)成,也可以看成是由m個n維的行向量構(gòu)成。通過用二維數(shù)組表示,例如灰度圖像 張量(tensor)張量就是高階的矩陣,如果把三階魔方的每一個小方塊看作一個數(shù),它就是個 3×3×3 的張量,3×3 的矩陣則恰是這個魔方的一個面,也就是張量的一個切片。通過用三維乃至更高維度的數(shù)組表示,例如RGB圖像 范數(shù)(norm)對單個向量大小的度量,描述的是向量自身的性質(zhì),將向量映射為一個非負的數(shù)值。 內(nèi)積(inner product)兩個向量之間的相對位置,即向量之間的夾角。計算的則是兩個向量之間的關(guān)系 線性空間(linear space)一個集合,元素是具有相同維數(shù)的向量(可以是有限個或無限個), 并且定義了加法和數(shù)乘等結(jié)構(gòu)化的運算 內(nèi)積空間(inner product space)定義了內(nèi)積運算的線性空間 正交基(orthogonal basis)在內(nèi)積空間中,一組兩兩正交的向量。正交基的作用就是給內(nèi)積空間定義出經(jīng)緯度。?旦描述內(nèi)積空間的正交基確定了,向量和點之間的對應(yīng)關(guān)系也就隨之確定。 標準正交基(orthonormal basis)正交基中基向量的范數(shù)單位長度都是1 線性變換(linear mapping)線性變換描述了向量或者作為參考系的坐標系的變化,可以用矩陣表示;
更通俗的理解是:在空間里將一個物體拉伸、旋轉(zhuǎn)到另外的一個形狀 二、概率論
同線性代數(shù)一樣,概率論也代表一種看待世界的方式,關(guān)注的焦點是生活中的不確定性和可能性。 兩大學(xué)派頻率學(xué)派(Frequentists)頻率派認為參數(shù)是客觀存在,不會改變,雖然未知,但卻是固定值。只是觀察者的我們無從知曉,因此在計算具體事件的概率時,要先確定分布的類型和參數(shù),以此為基礎(chǔ)進行概率推演 貝葉斯學(xué)派(Bayesians)貝葉斯派則認為參數(shù)是隨機值,固定的先驗分布是不存在的。假設(shè)本身取決于觀察結(jié)果,數(shù)據(jù)的作用就是對假設(shè)做出不斷修正,使觀察者對概率的主觀認識更加接近客觀實際。 頻率派最常關(guān)心的是似然函數(shù),而貝葉斯派最常關(guān)心的是后驗分布。 兩種概率估計方法極大似然估計法(maximum likelihood estimation)思想是使訓(xùn)練數(shù)據(jù)出現(xiàn)的概率最大化,依此確定概率分布中的未知參數(shù),估計出的概率分布也就符合訓(xùn)練訓(xùn)練數(shù)據(jù)的分布。 最大后驗概率法(maximum a posteriori estimation)思想是根據(jù)訓(xùn)練數(shù)據(jù)和已知的其他條件,使未知參數(shù)出現(xiàn)的可能性最大化,并選取最可能的未知參數(shù)取值作為估計值。 舉例說明好學(xué)生和差學(xué)生打架
極大似然是尋找一組參數(shù)使得觀測數(shù)據(jù)出現(xiàn)的概率最大,最大后驗是尋找當前觀測數(shù)據(jù)下出現(xiàn)概率最大的一組參數(shù)。 兩種隨機變量離散型隨機變量(discrete random variable)在一定區(qū)間內(nèi)取值有有限個或者可數(shù)個,例如某些地區(qū)人口的出生數(shù) 連續(xù)型隨機變量(continuous random variable)在一定區(qū)間內(nèi)變量取值有無限個,數(shù)值無法一一列舉出來,例如某些地區(qū)的房價 |
|
|