多媒體技術(shù)教程（林福宗）第10章MPEG電視

百眼通 2014-09-29

展開全文

　　MPEG-1和-2 Video標(biāo)準(zhǔn)有許多共同之處，基本概念類似，數(shù)據(jù)壓縮編碼方法基本相同，都采用以圖像塊作為基本單元進(jìn)行變換、量化和移動補(bǔ)償?shù)燃夹g(shù)來獲得高壓縮比。MPEG-4 Video部分采用內(nèi)容基編碼技術(shù)，它除與MPEG-1和-2 Video向后兼容外，還引入了電視圖像對象(VO)的概念，在某些應(yīng)用場合下，對場景中的圖像分別進(jìn)行編碼可以獲得很高的壓縮比而服務(wù)質(zhì)量也能滿足要求。下面將簡要介紹這些標(biāo)準(zhǔn)中壓縮電視圖像數(shù)據(jù)的基本方法。

10.1 電視圖像的數(shù)據(jù)率

10.1.1 ITU-R BT.601標(biāo)準(zhǔn)數(shù)據(jù)率

　　按照奈奎斯特(Nyquist)采樣理論，模擬電視信號經(jīng)過采樣(把連續(xù)的時(shí)間信號變成離散的時(shí)間信號)和量化(把連續(xù)的幅度變成離散的幅度信號)之后，數(shù)字電視信號的數(shù)據(jù)量大得驚人，當(dāng)前的存儲器和網(wǎng)絡(luò)都還沒有足夠的能力支持這種數(shù)據(jù)傳輸率，因此就要對數(shù)字電視信號進(jìn)行壓縮。
　　為了在PAL、NTSC和SECAM彩色電視制之間確定一個(gè)共同的數(shù)字化參數(shù)，早在1982年國際無線電咨詢委員會(CCIR)就制定了演播室質(zhì)量的數(shù)字電視編碼標(biāo)準(zhǔn)，這就是非常有名的ITU-R BT.601標(biāo)準(zhǔn)。按照這個(gè)標(biāo)準(zhǔn)，使用4:2:2的采樣格式，亮度信號Y的采樣頻率選擇為13.5 MHz/s，而色差信號Cr和Cb的采樣頻率選擇為6.75 MHz/s，在傳輸數(shù)字電視信號通道上的數(shù)據(jù)傳輸率就達(dá)到為270 Mb/s(兆比特/秒)！，即
　　亮度(Y):
　　　858樣本/行×525行/幀×30幀/秒×10比特/樣本 ≌ 135兆比特/秒(NTSC)
　　　864樣本/行×625行/幀×25幀/秒×10比特/樣本 ≌ 135兆比特/秒(PAL)
　　Cr (R-Y):
　　　429樣本/行×525行/幀×30幀/秒×10比特/樣本 ≌ 68兆比特/秒(NTSC)
　　　429樣本/行×625行/幀×25幀/秒×10比特/樣本 ≌ 68兆比特/秒(PAL)
　　Cb (B-Y):
　　　429樣本/行×525行/幀×30幀/秒×10比特/樣本 ≌ 68兆比特/秒(NTSC)
　　　429樣本/行×625行/幀×25幀/秒×10比特/樣本 ≌ 68兆比特/秒(PAL)
　　總計(jì): 27兆樣本/秒×10比特/樣本 = 270兆比特/秒
　　實(shí)際上，在熒光屏上顯示出來的有效圖像的數(shù)據(jù)傳輸率并沒有那么高，
　　　亮度(Y)： 720×480×30×10 ≌ 104 Mb/s (NTSC)
　　　　　　　　720×576×25×10 ≌ 104 Mb/s (PAL)
　　　色差(Cr，Cb)：2×360×480×30×10 ≌ 104 Mb/s (NTSC)
　　　　　　　　　　2×360×576×25×10 ≌ 104 Mb/s (PAL)
　　　總計(jì): ～ 207 Mb/s
　　如果每個(gè)樣本的采樣精度由10比特降為8比特，彩色數(shù)字電視信號的數(shù)據(jù)傳輸率就降為166 Mb/s。

10.1.2 電視圖像數(shù)據(jù)率的估算

　　如果考慮使用Video-CD存儲器來存儲數(shù)字電視，由于它的數(shù)據(jù)傳輸率可達(dá)到1.4112 Mb/s，分配給電視信號的數(shù)據(jù)傳輸率為1.15 Mb/s，這就意味MPEG電視編碼器的輸出數(shù)據(jù)率要達(dá)到1.15 Mb/s。顯而易見，如果存儲166 Mb/s的數(shù)字電視信號就需要對它進(jìn)行高度壓縮，壓縮比高達(dá)166/1.15 ≌ 144:1。
　　MPEG-1電視圖像壓縮技術(shù)不能達(dá)到這樣高的壓縮比。為此首先把NTSC和PAL數(shù)字電視轉(zhuǎn)換成公用中分辨率格式CIF(Common Intermediate Format)的數(shù)字電視，這種格式相當(dāng)于VHS(Video Home System)的質(zhì)量，于是彩色數(shù)字電視的數(shù)據(jù)傳輸率就減小到
　　　　352×240×30×8×1.5 ≌ 30 Mb/s (NTSC)
　　　　352×288×25×8×1.5 ≌ 30 Mb/s (PAL)。
　　把這種彩色電視信號存儲到CD盤上所需要的壓縮比為：30/1.15 ≌ 26:1。這就是MPEG-1技術(shù)所能獲得的壓縮比。

10.1.3 電視圖像數(shù)據(jù)率的估算

　　根據(jù)當(dāng)前成熟的壓縮技術(shù)，電視圖像的數(shù)據(jù)率壓縮成平均為3.5 Mb/s ～ 4.7 Mb/s時(shí)非專家難于區(qū)分電視圖像在壓縮前后的之間差別。如果使用DVD-Video存儲器來存儲數(shù)字電視，它的數(shù)據(jù)傳輸率雖然可以達(dá)到10.08 Mb/s，但一張4.7 GB的單面單層DVD盤要存放133分鐘的電視節(jié)目，按照數(shù)字電視信號的平均數(shù)據(jù)傳輸率為4.1 Mb/s來計(jì)算，壓縮比要達(dá)到：166/4.10 ≌ 40:1。
　　如果電視圖像的子采樣使用4:2:0格式，每個(gè)樣本的精度為8比特，數(shù)字電視信號的數(shù)據(jù)傳輸率就減小到124 Mb/s，即
　　　　720×480×30×8×1.5 ≌ 124 Mb/s (NTSC)
　　　　720×576×25×8×1.5 ≌ 124 Mb/s (PAL)
　　使用DVD-Video來存儲720×480×30或者720×576×25的數(shù)字電視圖像所需要的壓縮比為：124/4.1 ≌ 30:1。

10.2 數(shù)據(jù)壓縮算法

10.2.1 簡介

　　電視圖像數(shù)據(jù)壓縮利用的各種特性和采用的方法歸納在表10-1中。從表中可以看到，電視圖像本身在時(shí)間上和空間上都含有許多冗余信息，圖像自身的構(gòu)造也有冗余性。此外，正如前面所介紹的，利用人的視覺特性也可對圖像進(jìn)行壓縮，這叫做視覺冗余。

表10-1 電視圖像壓縮利用的各種冗余信息

種類		內(nèi)容	目前用的主要方法
統(tǒng)計(jì)	空間冗余	像素間的相關(guān)性	變換編碼，預(yù)測編碼
特性	時(shí)間冗余	時(shí)間方向上的相關(guān)性	幀間預(yù)測，移動補(bǔ)償
圖像構(gòu)造冗余		圖像本身的構(gòu)造	輪廓編碼，區(qū)域分割
知識冗余		收發(fā)兩端對人物的共有認(rèn)識	基于知識的編碼
視覺冗余		人的視覺特性	非線性量化，位分配
其他		不確定性因素

　　MPEG-Video圖像壓縮技術(shù)基本方法和方法可以歸納成兩個(gè)要點(diǎn)：
　?、?在空間方向上，圖像數(shù)據(jù)壓縮采用JPEG(Joint Photographic Experts Group)壓縮算法來去掉冗余信息。
　?、?在時(shí)間方向上，圖像數(shù)據(jù)壓縮采用移動補(bǔ)償(motion compensation)算法來去掉冗余信息。
　　為了在保證圖像質(zhì)量基本不降低而又能夠獲得高的壓縮比，MPEG專家組定義了三種圖像：幀內(nèi)圖像I(intra)，預(yù)測圖像P(predicted)和雙向預(yù)測圖像B(bidirectionally interpolated )，典型的排列如圖10-01所示。這三種圖像將采用三種不同的算法進(jìn)行壓縮。

圖10-01 MPEG專家組定義的三種圖像

10.2.2 幀內(nèi)圖像I的壓縮編碼算法

　　幀內(nèi)圖像I不參照任何過去的或者將來的其他圖像幀，壓縮編碼采用類似JPEG壓縮算法，它的框圖如圖10-02所示。如果電視圖像是用RGB空間表示的，則首先把它轉(zhuǎn)換成YCrCb空間表示的圖像。每個(gè)圖像平面分成8×8的圖塊，對每個(gè)圖塊進(jìn)行離散余弦變換DCT(discrete Cosine Transform)。DCT變換后經(jīng)過量化的交流分量系數(shù)按照Zig-zag的形狀排序，然后再使用無損壓縮技術(shù)進(jìn)行編碼。DCT變換后經(jīng)過量化的直流分量系數(shù)用差分脈沖編碼DPCM(DifferentialPulse Code Modulation)，交流分量系數(shù)用行程長度編碼RLE(run-length encoding)，然后再用霍夫曼(Huffman)編碼或者用算術(shù)編碼。它的編碼框圖如圖10-2所示。

圖10-02 幀內(nèi)圖像I的壓縮編碼算法框圖
(引自Simon Fraser University School of Computing Science, Dr. Ze-Nian Li,
http://fas./cs/undergrad/CourseMaterials/CMPT365/material/notes/contents.html)

10.2.3 預(yù)測圖像P的壓縮編碼算法

　　預(yù)測圖像的編碼也是以圖像宏塊(macroblock)為基本編碼單元，一個(gè)宏塊定義為I×J像素的圖像塊，一般取16×16。預(yù)測圖像P使用兩種類型的參數(shù)來表示：一種參數(shù)是當(dāng)前要編碼的圖像宏塊與參考圖像的宏塊之間的差值，另一種參數(shù)是宏塊的移動矢量。移動矢量的概念可用圖10-03表示。

圖10-03 移動矢量的概念

　　求解差值的方法如圖10-04所示。假設(shè)編碼圖像宏塊MPI是參考圖像宏塊MRJ的最佳匹配塊，它們的差值就是這兩個(gè)宏塊中相應(yīng)像素值之差。對所求得的差值進(jìn)行彩色空間轉(zhuǎn)換，并作4:1:1的子采樣得到Y(jié)，Cr和Cb分量值，然后仿照J(rèn)PEG壓縮算法對差值進(jìn)行編碼，計(jì)算出的移動矢量也要進(jìn)行霍夫曼編碼。

圖10-04 預(yù)測圖像P的壓縮編碼算法框圖

　　求解移動矢量的方法定義在圖10-05中。在求兩個(gè)宏塊差值之前，需要找出編碼圖像中的預(yù)測圖像編碼宏塊MPI相對于參考圖像中的參考宏塊MRJ所移動的距離和方向，這就是移動矢量(motion vector)。

圖10-5 移動矢量的算法框圖

　　要使預(yù)測圖像更精度，就要求找到與參考宏塊MRJ最佳匹配的預(yù)測圖像編碼宏塊MPI。所謂最佳匹配是指這兩個(gè)宏塊之間的差值最小。通常以絕對值A(chǔ)E(absolute difference)最小作為匹配判據(jù)，
　　　， (i＝j＝16)
　　有些學(xué)者提出了以均方誤差MSE(mean-square error)最小作為匹配判據(jù)，
　　　， (i＝j＝16)
　　也有些學(xué)者提出以平均絕對幀差MAD(mean of the absolute frame difference)最小作為匹配判據(jù)，
　　　， (i＝j＝16)
其中，dx和dy分別是參考宏塊MRJ的移動矢量d(dx,dy)在X和Y方向上的矢量。
　　從以上分析可知，對預(yù)測圖像的編碼實(shí)際上就是尋找最佳匹配圖像宏塊，找到最佳宏塊之后就找到了最佳移動矢量d(dx,dy)。
　　為減少搜索次數(shù)，現(xiàn)在已開發(fā)出許多簡化算法用來尋找最佳宏塊，下面介紹其中的三種。
　　1. 二維對數(shù)搜索法(2D-logarithmic search)
　　這種方法采用的匹配判據(jù)是MSE為最小。它的搜索策略是當(dāng)沿著最小失真方向搜索。二維對數(shù)搜索方法如圖10-06所示。在搜索時(shí)，每移動一次就檢查5個(gè)搜索點(diǎn)。如果最小失真在中央或在邊界，就減少搜索點(diǎn)之間的距離。在這個(gè)例子中，步驟1，2，…，5得到的近似移動矢量d為(i，j-2)、(i，j-4)、(i+2，j-4)、(i+2，j-5)和(i+2，j-6)，最后得到的移動矢量為d(i+2，j-6)。

圖10-06 二維對數(shù)搜索法

　　2. 三步搜索法(three-step search)
　　這種搜索法與二維對數(shù)搜索法很接近。不過在開始搜索時(shí)，搜索點(diǎn)離(i，j)這個(gè)中心點(diǎn)很遠(yuǎn)，第一步就測試8個(gè)搜索點(diǎn)，如圖10-07所示。在這個(gè)例子中，點(diǎn)(i+3，j-3)作為第一個(gè)近似的移動矢量d1；第二步，搜索點(diǎn)偏離(i+3，j-3)較近，找到的點(diǎn)假定為(i+3，j-5)；第三步給出了最后的移動矢量為d(i+2，j-6)。本例采用MAD作為匹配判據(jù)。

圖10-07 三步搜索法

　　3. 對偶搜索法(conjugate search)
　　這是一個(gè)很有效的搜索方法，該法使用MAD作為匹配判據(jù)，示于圖10-08。在第一次搜索時(shí)，通過計(jì)算點(diǎn)(i-1，j)、(i，j)和(i+1，j)處的MAD值來決定i方向上的最小失真。如果計(jì)算結(jié)果表明點(diǎn)(i+1，j)處的MAD為最小，就計(jì)算點(diǎn)(i+2，j)處的MAD，并從(i，j)，(i+1，j)和(i+2，j)的MAD中找出最小值。按這種方法一直進(jìn)行下去，直到在i方向上找到最小MAD值及其對應(yīng)的點(diǎn)。
　　在這個(gè)例子中，假定在i方向上找到的點(diǎn)為(i+2，j)。在i方向上找到最小MAD值對應(yīng)的點(diǎn)之后，就沿j方向去找最小MAD值對應(yīng)的點(diǎn)，方法與i方向的搜索方法相同。最后得到的移動矢量為d(i+2，j-6)。

圖10-08 對偶搜索法

　　在整個(gè)MPEG圖像壓縮過程中，尋找最佳匹配宏塊要占據(jù)相當(dāng)多的計(jì)算時(shí)間，匹配得越好，重構(gòu)的圖像質(zhì)量越高。

10.2.4 雙向預(yù)測圖像B的壓縮編碼算法

　　雙向預(yù)測圖像B的壓縮編碼框圖如圖10-09所示。具體計(jì)算方法與預(yù)測圖像P的算法類似，這里不再重復(fù)。

圖10-09 雙向預(yù)測圖像B的壓縮編碼算法框圖[5]

10.2.5 電視圖像的結(jié)構(gòu)

　　MPEG編碼器算法允許選擇I圖像的頻率和位置。I圖像的頻率是指每秒鐘出現(xiàn)I圖像的次數(shù)，位置是指時(shí)間方向上幀所在的位置。一般情況下，I圖像的頻率為2。MPEG編碼器也允許在一對I圖像或者P圖像之間選擇B圖像的數(shù)目。I圖像、P圖像和B圖像數(shù)目的選擇依據(jù)主要是根節(jié)目的內(nèi)容。例如，對于快速運(yùn)動的圖像，I圖像的頻率可以選擇高一些，B圖像的數(shù)目可以選擇少一點(diǎn)；對于滿速運(yùn)動的圖像I圖像的頻率可以低一點(diǎn)，而B圖像的數(shù)目可以選擇多一點(diǎn)。此外，在實(shí)際應(yīng)用中還要考慮媒體的速率。
　　一個(gè)典型的I、P、B圖像安排如圖10－10所示。編碼參數(shù)為：幀內(nèi)圖像I的距離為N=15，預(yù)測圖像(P)的距離為M=3。

圖10-10 MPEG電視幀編排

　　I、P和B圖像壓縮后的大小如表10-02所示，單位為比特。從表中可以看到，I幀圖像的數(shù)據(jù)量最大，而B幀圖像的數(shù)據(jù)量最小。

表10-2 MPEG三種圖像的壓縮后的典型值(比特)

圖像類型	I	P	B	平均數(shù)據(jù)/幀
MPEG-1 CIF 格式(1.15 Mb/s)	150 000	50 000	20 000	38 000
MPEG-2 601 格式(4.00 Mb/s)	400 000	200 000	80 000	130 000

10.3 MPEG-2的配置和等級

　　在MPEG-2標(biāo)準(zhǔn)化階段，考慮到要適應(yīng)不同數(shù)據(jù)速率設(shè)備的應(yīng)用，MPEG專家組定義了三種質(zhì)量不同的編碼方式：信噪比可變性(Signal-to-Noise Scalability)，空間分辨率可變性(Spatial Scalability)和時(shí)間分辨率可變性(Temporal Scalability)。
　　信噪比可變性SNR(Signal-to-Noise scalability)是指圖像質(zhì)量的折中，對于數(shù)據(jù)率比較低的解碼器使用比較低的信噪比，而對數(shù)據(jù)率比較高的解碼器則使用比較高的信噪比；空間分辨率可變性(Spatial scalability)是指圖像的空間分辨率的折中，對于低速率的接受器使用比較低的圖像分辨率，而對于數(shù)據(jù)率比較高的接受器使用比較高的圖像分辨率；時(shí)間分辨率可變性(Temporal Scalability)是指圖像在時(shí)間方向上分辨率的折中，與空間分辨率類似。
　　MPEG-2為此引入了“配置(Profiles)”和參數(shù)“等級(Levels)”的概念。每種配置定義一套新的算法，而每一個(gè)等級指定一套參數(shù)范圍(如圖像大小、幀速率和位速率)。MPEG-2規(guī)定的配置規(guī)格如表10-03所示，等級規(guī)格如表10-04所示。

表10-03 MPEG-2的配置

配置(Profile)	算法(Algorithms)
High(高檔)	●支持由空間分辨率可變配置(Spatial Scalable Profile)提供的所有功能和其他規(guī)定功能　●子采樣格式：YUV 4:2:2 用于進(jìn)一步提高圖像質(zhì)量
Spatial scalable(空間分辨率可變)	●支持信噪比可變配置(SNR Scalable Profile)提供的所有功能和空間分辨率可變(Spatial scalable coding)算法(2層) 　●子采樣格式：YUV：4:2:0
SNR scalable (信噪比可變)	●支持基本配置(Main Profile)提供的所有功能和信噪比可變編碼(SNR scalable coding)算法(2層) 　●子采樣格式：YUV：4:2:0
Main(基本)	●非可變速率編碼算法支持隨機(jī)存取，B圖像預(yù)測方式　●子采樣格式：YUV：4:2:0
Simple(簡化)	●除不支持基本配置(Main Profile)提供的B圖像預(yù)測功能外，基本配置的其他所有功能都支持　●子采樣格式：YUV：4:2:0

表10-04 MPEG-2的等級

等級(Level)	參數(shù)(Parameters)	說明
HIGH (高級)	1920 samples/line	1920 樣本/行
	1152 lines/frame	1152 行/幀
	60 frames/s	60 幀/秒
	80 Mb/s	80 兆比特/秒
HIGH 1440 (高級1440)	1440 samples/line	1440 樣本/行
	1152 lines/frame	1152 行/幀
	60 frames/s	60 幀/秒
	60 Mb/s	60 兆比特/秒
MAIN (基本級)	720 samples/line	720 樣本/行
	576 lines/frame	576 行/幀
	30 frames/s	30 幀/秒
	15 Mb/s	15 兆比特/秒
LOW (低級)	352 samples/line	352 樣本/行
	288 lines/frame	288 行/幀
	30 frames/s	30 幀/秒
	4 Mb/s	4 兆比特/秒

　　由配置(profile)和參數(shù)等級(level)組合起來的MPEG-2所支持的各種電視規(guī)格如表10-05所示。前者定義質(zhì)量的可變性(scalability)和彩色空間分辨率的句法子集，后者定義圖像分辨率和每種配置的最大位速率的參數(shù)集。例如，當(dāng)前使用得最普遍的描述符是MP@ML (Main Profile, Main Level)，可譯成“基本配置@基本級電視”或者“基本句法子集@基本參數(shù)級”，它指的是具有這種特性的電視：幀速率為30幀/秒，分辨率為720×576×30，子采樣格式為4:2:0，位速率達(dá)15 Mb/s。MPEG-2標(biāo)準(zhǔn)期待大多數(shù)MPEG-2設(shè)備都能夠支持這種電視。又如，MP@HL (Main Profile, High Level)描述符指的是幀速率為30幀/秒、分辨率為1920×1152×60、子采樣格式為4:2:0、位速率達(dá)80 Mb/s的HDTV制電視。

表10-05 MPEG-2配置等級和參數(shù)級

Level＼Profile (等級＼配置)	Simple (簡化型)	Main(基本型)	SRN Scalability (信噪比可變型)	Spatial Scalability(空間分辨率可變型)	High(高檔型)
High(高級)		4:2:0 1920×1152×60 80 Mb/s I, P, B			4:2:0, 4:2:2 1920×1152×60 80 Mb/s I, P, B
High-1440(高級1440)		4:2:0 1440×1152×60 60 Mb/s I, P, B		4:2:0 1440×1152×60 60 Mb/s I, P, B	4:2:0, 4:2:2 1440×1152×60 60 Mb/s I, P, B
Main(基本級)	4:2:0 720×576×30 15 Mb/s I, P	4:2:0 720×576×30 15 Mb/s I, P, B	4:2:0 720×576×30 15 Mb/s I, P, B		4:2:0 720×576×30 20 Mb/s I, P, B
Low(低級)		4:2:0 352×288×30 4 Mb/s I, P, B	4:2:0 352×288×30 4 Mb/s I, P, B

10.4 MPEG-4電視圖像編碼

　　MPEG Video專家組建立了一個(gè)用來開發(fā)圖像和電視圖像編碼技術(shù)的模型，叫做“試驗(yàn)?zāi)Ｐ?Test Model)”或者叫做“驗(yàn)證模型(VM—Verification Model)”。這個(gè)模型描述了一個(gè)核心的編碼算法平臺，包括編碼器、解碼器以及位流(bitstream)的語法和語義。本節(jié)就電視圖像的編碼和解碼的基本方法作一個(gè)簡單介紹，其他內(nèi)容請看本章所附的參考文獻(xiàn)和站點(diǎn)。

10.4.1 電視圖像對象區(qū)的概念

　　MPEG-4 Video編碼算法支持由MPEG-1和MPEG-2提供的所有功能，包括對各種輸入格式下的標(biāo)準(zhǔn)矩形圖像、幀速率、位速率和隔行掃描圖像源的支持。MPEG-4 Video算法的核心是支持內(nèi)容基(content-based)的編碼和解碼功能，也就是對場景中使用分割算法抽取的單獨(dú)的物理對象進(jìn)行編碼和解碼。MPEG-4 Video還提供管理這些電視內(nèi)容的最基本方法。
　　為了實(shí)現(xiàn)預(yù)想的內(nèi)容基交互等功能，MPEG-4 Video驗(yàn)證模型引進(jìn)了一個(gè)叫做“電視圖像對象區(qū)(Video Object Plane，VOP)”的概念。如圖10-11所示，上圖表示支持MPEG-1和MPEG-2的普通的MPEG-4編碼器，下圖表示MPEG-4的甚低速率電視圖像(Very Low Bitrate Video，VLVB)的核心編碼器。MPEG-4 Video驗(yàn)證模型不像MPEG-1/-2 Video那樣把電視圖像都認(rèn)為是一個(gè)矩形區(qū)，而是假設(shè)每幀圖像被分割成許多任意形狀的圖像區(qū)，每個(gè)區(qū)都有可能覆蓋描述場景中感興趣的物理對象或者內(nèi)容，這種區(qū)被定義為圖像對象區(qū)VOP。

圖10-11 普通MPEG-4編碼器和MPEG-4 VLBV核心編碼器[6]

　　編碼器輸入的是任意形狀的圖像區(qū)，圖像區(qū)的形狀和位置也可隨幀的變化而改變。屬于相同物理對象的連續(xù)的電視圖像對象區(qū)(VOP)組成電視圖像對象(Video Objects，VO)。例如，一個(gè)沒有背景圖像的正在演講的人，如圖10-11所示。MPEG-4可單獨(dú)對屬于相同電視圖像對象(VO)的電視圖像區(qū)(VOP)的形狀、移動(motion)和紋理(texture)信息進(jìn)編碼和傳送，或者把它們編碼成一個(gè)單獨(dú)的電視圖像對象層(Video Object Layer，VOL)。此外，需要標(biāo)識每個(gè)電視圖像對象層(VOL)的信息也包含在編碼后的位流(bitstream)中，這些信息包括各種電視圖像對象層(VOL)的電視圖像在接收端應(yīng)該如何進(jìn)行組合，以便重構(gòu)完整的原始圖像序列。這樣就可以對每個(gè)電視圖像對象區(qū)(VOP)進(jìn)行單獨(dú)解碼，提供了管理電視圖像序列的靈活性。

10.4.2 電視圖像編碼方案

　　MPEG-4 Video驗(yàn)證模型對每個(gè)電視圖像對象(VO)的形狀、移動和紋理信息進(jìn)行編碼形成單獨(dú)的VOL層，以便能夠單獨(dú)對電視圖像對象(VO)進(jìn)行解碼。如果輸入圖像序列只包含標(biāo)準(zhǔn)的矩形圖像，就不需要形狀編碼，在這種情況下，MPEG-4 Video使用的編碼算法結(jié)構(gòu)也就與MPEG-1和MPEG-2使用的算法結(jié)構(gòu)相同。
　　MPEG-4 Video驗(yàn)證模型對每個(gè)電視圖像對象區(qū)(VOP)進(jìn)行編碼使用的壓縮算法是在MPEG-1和MPEG-2 Video標(biāo)準(zhǔn)的基礎(chǔ)上開發(fā)的，它也是以圖像塊為基礎(chǔ)的混合DPCM和變換編碼技術(shù)(hybrid DPCM/Transform coding)。MPEG-4編碼算法也定義了幀內(nèi)電視圖像對象區(qū)(Intra-Frame VOP，I-VOP)編碼方式和幀間電視圖像對象區(qū)預(yù)測(Inter-frame VOP prediction，簡寫為P-VOP)編碼方式，它也支持雙向預(yù)測電視圖像對象區(qū)(B-directionally predicted VOP，B-VOP)方式。在對電視圖像對象區(qū)(VOP)的形狀編碼之后，顏色圖像序列分割成宏塊進(jìn)行編碼，如圖10-12所示。圖中的Y1、Y2、Y3和Y4表示亮度宏塊，U、V分別表示紅色差和藍(lán)色差宏塊。

圖10-12 電視圖像序列中的I-VOP和P-VOP編碼方式和宏塊結(jié)構(gòu)

　　圖10-13描繪了MPEG-4 Video的編碼算法，用來對矩形和任意形狀的輸入圖像序列進(jìn)行編碼。這個(gè)基本編碼算法結(jié)構(gòu)圖包含了移動矢量(motion vector)的編碼，以及以離散余弦變換為基礎(chǔ)的紋理編碼。

圖10-13 MPEG-4 Video編碼器的算法方框圖[6]

　　MPEG-4采用內(nèi)容基編碼方法的一個(gè)重要優(yōu)點(diǎn)是，使用合適的和專門的對象基移動預(yù)測工具(object-based motion prediction tools)可以明顯提高場景中某些電視圖像對象的壓縮效率。
　　圖10-14表示MPEG-4對電視圖像序列進(jìn)行編碼的一個(gè)實(shí)際例子。左上角的圖是背景全景圖。右上角的圖是一個(gè)沒有背景的子圖像全景圖，可以把網(wǎng)球運(yùn)動員當(dāng)作是一個(gè)電視圖像對象(VO)，經(jīng)常把這種可以獨(dú)立移動的小圖像稱為子圖像(sprite)。下面的圖是接收端合成的全景圖。在編碼之前這個(gè)子圖像全景圖從背景全背景圖序列中抽出來，然后分別對它們進(jìn)行編碼、傳送和解碼，最后再合成。

圖10-14 MPEG-4電視序列編碼舉例[6]

10.4.3 電視圖像分辨率可變編碼

　　“電視圖像分辨率”是指電視圖像空間分辨率(spatial resolution)和時(shí)間分辨率(temporal resolution)。空間分辨率是指一幀圖像包含的行數(shù)與每行顯示的像素?cái)?shù)之乘積，而時(shí)間分辨率是指每秒種顯示或者傳輸?shù)膱D像幀數(shù)。設(shè)置電視圖像分辨率可變編碼功能的一個(gè)重要目的是為了能夠靈活支持性能不同(例如不同帶寬)的各種電視接收或顯示設(shè)備，或者支持要求瀏覽電視數(shù)據(jù)庫等方面的應(yīng)用。另一個(gè)目的是提供分層次的電視圖像數(shù)據(jù)位流，這樣可按應(yīng)用所要求的先后次序進(jìn)行傳輸。
　　MPEG-2也有電視圖像分辨率可變編碼功能，但它是以圖像的幀為基礎(chǔ)進(jìn)行編碼。而MPEG-4電視圖像分辨率可變編碼是以任意形狀的電視圖像對象區(qū)(VOP)為基礎(chǔ)進(jìn)行編碼。對那些沒有能力或者不愿意接收高分辨率圖像的接收器，它可以接收分辨率比較低的電視圖像，降低空間分辨率或者時(shí)間分辨率意味降低圖像的質(zhì)量。
　　空間分辨率可變性(Spatial Scalability)和時(shí)間分辨率可變性(Temporal Scalability)的實(shí)現(xiàn)方法類似。圖10-15描述了多種分辨率電視圖像編碼(multiscale video coding)方案。該方案提供三個(gè)層次的編碼/解碼，每一層都支持在不同空間分辨率下進(jìn)行編碼/解碼。從圖中可以看到，多種空間分辨率的實(shí)現(xiàn)是通過降低輸入電視信號的采樣率來獲得的。

圖10-15 VOP空間分辨率可變編碼方法[3]

10.5 HDTV格式

　　現(xiàn)在我們使用的電視格式再加上新制定的電視格式歸納在圖10-16中。圖中，K＝1024。px表示像素(pixel)。美國把1280×720格式稱為高級電視ATV(advanced television)，把1920×1035稱為高清晰度電視HDTV(high definition television)。

圖10-16 數(shù)字電視格式

　　1995年11月28日美國高級電視委員會(Advanced Television Systems Committee，ATSC)向FCC咨詢委員會(FCC Advisory Committee)提交了數(shù)字電視標(biāo)準(zhǔn)(Digital Television Standard)，并推薦作為高級電視廣播標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)的電視掃描格式如表10-06所示。

表10-06 電視掃描格式

垂直方向行數(shù)	水平方向像素	長寬比	圖像速率
1035	1920	16:9	60I* 30P* 24P*
720	1280	16:9	60P 30P 24P
480	704	16:9和4:3	60I 60P 30P 24P
480	640	4:3	60I 60P 30P 24P

　　* I表示隔行掃描；P表示非隔行掃描
　　** HDTV的長寬比為16:9； NTSC, PAL和SECAM為4:3
　　*** 支持整數(shù)和非整數(shù)幀速率(60.00, 59.94；30.00, 29.97；24.00, 23.98)
　　電視圖像壓縮以MPEG-2 Video標(biāo)準(zhǔn)為基礎(chǔ)，采樣基本型配置(Main Profile)，等級從基本級（Main Level)到高級(High Level)。聲音壓縮以AC-3系統(tǒng)為基礎(chǔ)，采樣頻率為48 kHz，支持5個(gè)環(huán)繞聲和1個(gè)超低頻聲道。該規(guī)格是1996年介紹的，由于近年來MPEG電視和聲音標(biāo)準(zhǔn)的研究已有新的進(jìn)展，因此該規(guī)格有可能在實(shí)行過程中會作修改。

練習(xí)與思考題

電視圖像數(shù)據(jù)壓縮的依據(jù)是什么？
MPEG-1編碼器輸出的電視圖像的數(shù)據(jù)率大約是多少？
MPEG專家組在制定MPEG-1/-2 Video標(biāo)準(zhǔn)時(shí)定義了哪幾種圖像？哪種圖像的壓縮率最高？哪種圖像的壓縮率最低？
有人認(rèn)為“圖像壓縮比越高越好”。你對這種說法有何看法？
有人說“MPEG-1編碼器的壓縮比大約是200:1”。這種說法對不對？為什么？
說明電視規(guī)格MP@ML和HP@HL各自的含義。
電視圖像的空間分辨率和時(shí)間分辨率是什么意思？

參考文獻(xiàn)和站點(diǎn)

http://ee./～music/tutorials/mmbook/node31.html (瀏覽日期：1998年11月)
http://www./jfm/avi.html (瀏覽日期：1998年11月)
http://wwwam./mpeg-video/standards/ (瀏覽日期：1998年11月)
http://www./technology/mpeg.html (瀏覽日期：1998年11月)
http://fas./cs/undergrad/CourseMaterials/CMPT365/material/notes/contents.html(瀏覽日期1998年3月)
ISO/IEC JTC1/SC29/WG11 N2459. MPEG-4 Overview - (Atlantic City Version). October 1998/Atlantic City
Ming Liou. Overview of the p×64 Kbps Video Coding Standard. Communication of the ACM，Vol.34，No.4，Apr.1991
ISO/IEC. CD 11172，Coding of Moving Pictures and Associated Audio For Digital Storage Media at up to about 1.5 M b/s. 12/6/1991
Didier Le Gall. MPEG: A Video Compression Standard for Multimedia Applications. Communications of the ACM，Vol.34，No.4，Apr.1991
CCITT Recommendation. H.261，Video Codec for Audiovisual Service at p×64 b/s. Aug.1990

本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：百眼通 > 《04多媒體（辦公）技術(shù)-108》

舉報(bào)/認(rèn)領(lǐng)