|
多媒體技術(shù)基礎(chǔ)篇 第一章.什么是多媒體以及多媒體技術(shù)? 要了解多媒體以及多媒體技術(shù),首先要掌握以下兩個(gè)知識: 1. 人肉眼可見的畫面分為:靜止的畫面——圖形圖像(graph/image/picture),動態(tài)的畫面——動畫(cartoon/movie)和視頻影像(video)。 連續(xù)的圖像變化每秒超過24幀(frame)畫面以上時(shí),根椐視覺暫留原理,人眼無法辨別每付單獨(dú)的靜態(tài)畫面(graph/image/picture),看上去是平滑連續(xù)的視覺效果。這樣的連續(xù)畫面叫視頻影像(video)。而當(dāng)連續(xù)圖像變化每秒低于24幀畫面時(shí),人眼有不連續(xù)的感覺,叫動畫(cartoon/movie)。 2. 目前能構(gòu)成媒體(medium)的介質(zhì)主要包括視頻影像(video)、聲音(sound)、圖形圖像(graph/image/picture) 、文本(text)、動畫(cartoon/movie)。而以數(shù)字信號傳輸為途徑的單一媒體的有機(jī)結(jié)合即可視為多媒體(multimedia)。換句話說,多媒體技術(shù)賴以產(chǎn)生發(fā)展的基礎(chǔ)不只是多媒體硬件技術(shù)的革新,還包括通信傳輸方式的改變和發(fā)展。目前,多媒體傳輸已由數(shù)字信號處理(dsp)逐漸取代甚至完全取代以前的模擬信號處理。 掌握了這些基礎(chǔ)知識后,就不難理解多媒體以及多媒體技術(shù)。 多媒體是有別于以前單一媒體的傳輸介質(zhì),多媒體技術(shù)則是對多媒體傳輸方式的一種革新發(fā)展??偟膩碚f,多媒體技術(shù)是利用多媒體存儲硬件和傳輸方式對多媒體介質(zhì)的綜合運(yùn)用。 多媒體技術(shù),即是計(jì)算機(jī)交互式綜合處理多媒體信息——文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)并具有交互性。簡言之,多媒體技術(shù)就是具有集成性、實(shí)時(shí)性和交互性的計(jì)算機(jī)綜合處理聲文圖信息的技術(shù)。 第二章.什么是多媒體文件以及各種多媒體文件格式詳解: 多媒體文件是對承載多媒體通信傳輸?shù)挠?jì)算機(jī)文件的一種統(tǒng)稱,或者可理解為以多媒體形式方式存儲,具有多媒體特征,可對其進(jìn)行數(shù)字信號處理傳輸存儲的一種數(shù)據(jù)。在當(dāng)前技術(shù)下,多媒體文件分為傳統(tǒng)的靜態(tài)(多)媒體文件和流(多)媒體文件兩種。其文件格式按其傳輸對象不同又可分為視頻影像文件和音頻文件。同時(shí),其對應(yīng)的多媒體文件格式不但紛繁復(fù)雜,還包括各種相關(guān)協(xié)議。 了解和掌握必要的多媒體文件相關(guān)知識不但為我們下載/制作多媒體文件帶來極大便利,而且,對于我們在娛樂中學(xué)習(xí)計(jì)算機(jī)多媒體技術(shù)有很大幫助,因此,個(gè)人認(rèn)為,這些基礎(chǔ)知識是每位愛好下載制作多媒體文件,喜歡多媒體技術(shù)朋友所必須掌握的。 所謂“格式”,是指以何種算法對聲音、圖象文件(或稱音頻、視頻文件)進(jìn)行壓縮或解壓縮?!安シ牌鳌笔侵高€原某種或多種特定格式的音頻、視頻文件的軟件。 一.靜態(tài)媒體文件以及靜態(tài)媒體文件技術(shù)概述: 傳統(tǒng)的靜態(tài)媒體文件區(qū)別于現(xiàn)今流行的流式媒體文件最大的特征是,無法提供網(wǎng)絡(luò)在線功能。其原理是必須提供下載,而在今天網(wǎng)絡(luò)發(fā)展飛速的年代,尤其是影音文件的網(wǎng)絡(luò)傳輸,使得這一局限性成為阻礙網(wǎng)絡(luò)多媒體發(fā)展的主要瓶頸。在流式媒體誕生之前,網(wǎng)絡(luò)提供的資源很有限——下載,除此之外,就是vcd等傳統(tǒng)媒體文件的天下。 其缺點(diǎn)不但在于擠占帶寬,而且無法實(shí)現(xiàn)網(wǎng)絡(luò)資源的優(yōu)化利用。對于日益提倡網(wǎng)絡(luò)資源共享和提高網(wǎng)絡(luò)瀏覽速度的今天,傳統(tǒng)媒體文件包括早期的錄象帶,卡帶,vcd甚至dvd都不能滿足人們迫切要求網(wǎng)絡(luò)資源優(yōu)化利用的要求。因此,有賴于傳統(tǒng)多媒體技術(shù)的不斷發(fā)展,世界各大多媒體技術(shù)先進(jìn)的公司開始研發(fā)新技術(shù)產(chǎn)品以取代靜態(tài)媒體文件技術(shù)。 早期的傳統(tǒng)靜態(tài)媒體文件包括: 1. 音頻文件: 音頻文件通常分為兩類:聲音文件和midi文件,聲音文件指的是通過聲音錄入設(shè)備錄制的原始聲音,直接記錄了真實(shí)聲音的二進(jìn)制采樣數(shù)據(jù),通常文件較大;而midi文件則是一種音樂演奏指令序列,相當(dāng)于樂譜,可以利用聲音輸出設(shè)備或與計(jì)算機(jī)相連的電子樂器進(jìn)行演奏,由于不包含聲音數(shù)據(jù),其文件尺寸較小。 a. 聲音文件: wav——是windows操作系統(tǒng)中應(yīng)用最為廣泛的一種音頻格式。wav具有很高的音質(zhì),cd的數(shù)字音頻存儲格式cd-da就極其類似于它。它符合riff(resource interchange file format)文件規(guī)范,用于保存windows平臺的音頻信息資源,被windows平臺及其應(yīng)用程序所廣泛支持。wav格式支持msadpcm、ccitt alaw、ccitt μlaw和其他壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,是pc機(jī)上最為流行的聲音文件格式,但其文件尺寸較大,多用于存儲簡短的聲音片斷。但是,由于未經(jīng)壓縮,wav的存儲容量非常大,大約一分鐘cd音質(zhì)的音頻要占用10mb的存儲空間,不利于用戶存儲歌曲,更不利于音樂的網(wǎng)上傳播。 mp3——針對傳統(tǒng)的wav文件體積過于“龐大”,不便于保存和網(wǎng)絡(luò)傳播的缺點(diǎn),“動態(tài)圖象專家組”(全稱為:moving picture experts group,一個(gè)專為影音數(shù)據(jù)壓縮研發(fā)公開標(biāo)準(zhǔn)的團(tuán)體)經(jīng)過努力,提出了廣受歡迎的標(biāo)準(zhǔn)mpeg。mp3的全稱為:mpeg 1 audio layer 3,是一種高性能的聲音壓縮編碼方案。audio layer 3是mpeg-1的第三層聲音壓縮標(biāo)準(zhǔn)。每一層的壓縮率并不相同,第一層為1:4,第二層為1:6-1:8,第三層則高達(dá)1:10-1:12。創(chuàng)建mp3文件時(shí),mp3編碼器讀取wav文件并同時(shí)剝離了其中不為人感知的部分。例如,大多數(shù)人聽不到16khz以上的聲音,因此mp3編碼器便剝離了頻率高于預(yù)設(shè)頻率的所有音頻,只是我們沒有覺察到罷了。所以雖然我們在聽歌曲(特別是流行樂)時(shí),感不到mp3與cd有什么區(qū)別,但在欣賞古典樂時(shí)就感到了明顯的差距(不過你也得像筆者一樣有一對高保真音箱,否則……)。mp3成功創(chuàng)造了與cd幾乎具有相同音質(zhì)但又小得多的聲音文件。例如,一首50mb的wav格式的歌曲用mp3壓縮后只需4mb左右的存儲空間,一張光盤就可以儲存100多首mp3歌曲,而以前在互聯(lián)網(wǎng)上要幾個(gè)小時(shí)才能完成下載的一首歌曲,現(xiàn)在其mp3格式只需幾分鐘。所以mp3的出現(xiàn)使在網(wǎng)上發(fā)布和傳輸歌曲成為了可能,互聯(lián)網(wǎng)真正成為了最重要的音樂資料庫,是音樂愛好者的一大福音,是數(shù)字音頻界一場劃時(shí)代的革命。盡管眼下由于mp3涉及到版權(quán)等相關(guān)問題,遭到作曲家和音樂制作公司的打擊,但仍然無法熄滅人們對其沸騰的熱情。音樂愛好者們不僅可以在電腦上享受mp3音樂,還可以購買到能播放mp3音樂的電子表、手機(jī)等產(chǎn)品,更可以通過相關(guān)軟件管理、編輯和制作個(gè)性化的mp3,真是其樂無窮。 wma—— 全稱為“windows media audio”的wma是微軟挑戰(zhàn)mp3的產(chǎn)物,使用windows操作系統(tǒng)自帶的media player 6.x(“媒體播放器”)以上版本即可播放,并且隨著集成了media player 8.0(media player 8.0)的微軟下一代操作系統(tǒng)windows xp的廣泛使用,會有更多的人使用這一全新的媒體格式。通過壓縮實(shí)驗(yàn)可以得知,在低比特率時(shí)(如采用48kbps),相同音質(zhì)的wma文件比mp3小了許多,這就是它的優(yōu)勢。微軟推出wma時(shí)曾宣稱它可以保護(hù)版權(quán),例如,版權(quán)限制可以規(guī)定wma文件只能在指定的機(jī)器、指定的播放器,甚至指定的時(shí)間內(nèi)播出(那對我們還有什么用?),但是wma推出不到一周,黑客們就將這些限制破解了(黑客高手們?nèi)f歲!)。不錯的本質(zhì)加上微軟的大力推廣,相信wma的前景一片光明。 vqf ——由ntt(日本電報(bào)電話)和yamaha公司聯(lián)合開發(fā)的這種電腦音樂壓縮格式的壓縮率驚人,一般情況下它的壓縮率能達(dá)到1:18,而mp3也就在1:12左右。vqf的音質(zhì)遠(yuǎn)勝過了mp3,并且它也是免費(fèi)的(好東西!)。但由于mp3的數(shù)字音頻界霸主地位已經(jīng)形成,一時(shí)難以撼動,vqf受關(guān)注的程度并不高,所以支持的播放軟件并不多,yamaha soundvq是比較優(yōu)秀的一款。 aiff——.aif/.aiff:aiff是音頻交換文件格式(audio interchange file format)的英文縮寫,是蘋果計(jì)算機(jī)公司開發(fā)的一種聲音文件格式,被macintosh平臺及其應(yīng)用程序所支持,netscape navigator瀏覽器中的liveaudio也支持aiff格式,sgi及其他專業(yè)音頻軟件包也同樣支持這種格式。aiff支持ace2、ace8、mac3和mac6壓縮,支持16位44.1khz立體聲。 audio——.au:audio文件是sun microsystems公司推出的一種經(jīng)過壓縮的數(shù)字聲音格式,是internet中常用的聲音文件格式,netscape navigator瀏覽器中的liveaudio也支持audio格式的聲音文件。 sound文件——.snd:sound文件是next computer公司推出的數(shù)字聲音文件格式,支持壓縮。 voice文件——.voc:voice文件是creative labs(創(chuàng)新公司)開發(fā)的聲音文件格式,多用于保存creative sound blaster(創(chuàng)新聲霸)系列聲卡所采集的聲音數(shù)據(jù),被windows平臺和dos平臺所支持,支持ccitt alaw和ccitt μlaw等壓縮算法。 mpeg音頻文件——.mp1/.mp2/.mp3 mpeg是運(yùn)動圖象專家組(moving picture experts group)的英文縮寫,代表mpeg運(yùn)動圖象壓縮標(biāo)準(zhǔn),這里的音頻文件格式指的是mpeg標(biāo)準(zhǔn)中的音頻部分,即mpeg音頻層(mpeg audio layer)。mpeg音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層(mpeg audio layer 1/2/3),分別對應(yīng)mp1、mp2和mp3這三種聲音文件。mpeg音頻編碼具有很高的壓縮率,mp1和mp2的壓縮率分別為4∶1和6∶1~8∶1,而mp3的壓縮率則高達(dá)10∶1~12∶1,也就是說一分鐘cd音質(zhì)的音樂,未經(jīng)壓縮需要10mb存儲空間,而經(jīng)過mp3壓縮編碼后只有1mb左右,同時(shí)其音質(zhì)基本保持不失真,因此,目前使用最多的是mp3文件格式。 realaudio文件——.ra/.rm/.ram realaudio文件是realnetworks公司開發(fā)的一種新型流式音頻(streaming audio)文件格式,它包含在realnetworks公司所制定的音頻、視頻壓縮規(guī)范realmedia中,主要用于在低速率的廣域網(wǎng)上實(shí)時(shí)傳輸音頻信息。網(wǎng)絡(luò)連接速率不同,客戶端所獲得的聲音質(zhì)量也不盡相同:對于14.4kbps的網(wǎng)絡(luò)連接,可獲得調(diào)幅(am)質(zhì)量的音質(zhì);對于28.8kbps的連接,可以達(dá)到廣播級的聲音質(zhì)量;如果擁有isdn或更快的線路連接,則可獲得cd音質(zhì)的聲音。 b. midi文件: midi文件——.mid/.rmi midi是樂器數(shù)字接口(musical instrument digital interface)的英文縮寫,是數(shù)字音樂/電子合成樂器的統(tǒng)一國際標(biāo)準(zhǔn),它定義了計(jì)算機(jī)音樂程序、合成器及其他電子設(shè)備交換音樂信號的方式,還規(guī)定了不同廠家的電子樂器與計(jì)算機(jī)連接的電纜和硬件及設(shè)備間數(shù)據(jù)傳輸?shù)膮f(xié)議,可用于為不同樂器創(chuàng)建數(shù)字聲音,可以模擬大提琴、小提琴、鋼琴等常見樂器。在midi文件中,只包含產(chǎn)生某種聲音的指令,這些指令包括使用什么midi設(shè)備的音色、聲音的強(qiáng)弱、聲音持續(xù)多長時(shí)間等,計(jì)算機(jī)將這些指令發(fā)送給聲卡,聲卡按照指令將聲音合成出來,midi聲音在重放時(shí)可以有不同的效果,這取決于音樂合成器的質(zhì)量。相對于保存真實(shí)采樣數(shù)據(jù)的聲音文件,midi文件顯得更加緊湊,其文件尺寸通常比聲音文件小得多。 模塊文件——.mod/.s3m/.xm/.mtm/.far/.kar/.it 模塊(module)格式是一種已經(jīng)存在了很長時(shí)間的聲音記錄方式,它同時(shí)具有midi與數(shù)字音頻的共同特性。模塊文件中既包括如何演奏樂器的指令,又保存了數(shù)字聲音信號的采樣數(shù)據(jù),為此,其聲音回放質(zhì)量對音頻硬件的依賴性較小,也就是說,在不同的機(jī)器上可以獲得基本相似的聲音回放質(zhì)量。模塊文件根據(jù)不同的編碼方法有mod、s3m、xm、mtm、far、kar、it等多種不同格式。 2. 視頻影象文件 廣義的視頻文件細(xì)分起來,又可以分兩類,即動畫文件和影象文件:動畫文件指由相互關(guān)聯(lián)的若干幀靜止圖象所組成的圖象序列,這些靜止圖象連續(xù)播放便形成一組動畫,通常用來完成簡單的動態(tài)過程演示;影象文件,主要指那些包含了實(shí)時(shí)的音頻、視頻信息的多媒體文件,其多媒體信息通常來源于視頻輸入設(shè)備,由于同時(shí)包含了大量的音頻、視頻信息,影象文件往往相當(dāng)龐大,動輒幾mb甚至幾十mb.這里省去介紹動畫文件。 avi格式—— avi是音頻視頻交錯(audio video interleaved)的英文縮寫,它是microsoft公司開發(fā)的一種符合riff文件規(guī)范的數(shù)字音頻與視頻文件格式,原先用于microsoft video for windows (簡稱vfw)環(huán)境,現(xiàn)在已被windows 95/98、os/2等多數(shù)操作系統(tǒng)直接支持。avi格式允許視頻和音頻交錯在一起同步播放,支持256色和rle壓縮,但avi文件并未限定壓縮標(biāo)準(zhǔn),因此,avi文件格式只是作為控制界面上的標(biāo)準(zhǔn),不具有兼容性,用不同壓縮算法生成的avi文件,必須使用相應(yīng)的解壓縮算法才能播放出來。常用的avi播放驅(qū)動程序,主要是microsoft video for windows或windows 95/98中的video 1,以及intel公司的indeo video。avi文件目前主要應(yīng)用在多媒體光盤上,用來保存電影、電視等各種影象信息,有時(shí)也出現(xiàn)在internet上,供用戶下載、欣賞新影片的精彩片斷。 如果你是一名游戲玩家,應(yīng)該會注意到很多游戲的片首動畫都是avi格式的吧。比如很多人喜歡玩的《仙劍奇?zhèn)b傳》,片首那段極富中國傳統(tǒng)色彩(青山、綠水、白鷺)的動畫就是采用的avi格式。avi有一個(gè)專業(yè)的名字,叫做音頻視頻交錯(audio video interleaved)格式。它的背景不可小看,它是由microsoft公司開發(fā)的一種數(shù)字音頻與視頻文件格式,原先僅僅用于微軟的視窗視頻操作環(huán)境(vfw,microsoft video for windows),現(xiàn)在已被大多數(shù)操作系統(tǒng)直接支持。avi格式允許視頻和音頻交錯在一起同步播放,但avi文件沒有限定壓縮標(biāo)準(zhǔn),由此就造就了avi的一個(gè)“永遠(yuǎn)的心痛”,即avi文件格式不具有兼容性。不同壓縮標(biāo)準(zhǔn)生成的avi文件,就必須使用相應(yīng)的解壓縮算法才能將之播放出來。我們常??梢栽诙嗝襟w光盤上發(fā)現(xiàn)它的蹤影,一般用于保存電影、電視等各種影像信息,有時(shí)它也出沒于internet中,主要用于讓用戶欣賞新影片的精彩片段。常用的avi播放驅(qū)動程序,主要有microsoft video for windows或windows 95/98中的video 1,以及intel公司的indeo video等等。 mov格式(quicktime)—— quicktime格式大家可能不怎么熟悉,因?yàn)樗莂pple公司開發(fā)的一種音頻、視頻文件格式。quicktime用于保存音頻和視頻信息,現(xiàn)在它被包括apple mac os、microsoft windows 95/98/nt在內(nèi)的所有主流電腦平臺支持。quicktime文件格式支持25位彩色,支持領(lǐng)先的集成壓縮技術(shù),提供150多種視頻效果,并配有提供了200多種midi兼容音響和設(shè)備的聲音裝置。新版的quicktime進(jìn)一步擴(kuò)展了原有功能,包含了基于internet應(yīng)用的關(guān)鍵特性。綜上,quicktime因具有跨平臺、存儲空間要求小等技術(shù)特點(diǎn),得到業(yè)界的廣泛認(rèn)可,目前已成為數(shù)字媒體軟件技術(shù)領(lǐng)域的事實(shí)上的工業(yè)標(biāo)準(zhǔn)。 quicktime是apple計(jì)算機(jī)公司開發(fā)的一種音頻、視頻文件格式,用于保存音頻和視頻信息,具有先進(jìn)的視頻和音頻功能,被包括apple mac os、microsoft windows 95/98/nt在內(nèi)的所有主流電腦平臺支持。quicktime文件格式支持25位彩色,支持rle、jpeg等領(lǐng)先的集成壓縮技術(shù),提供150多種視頻效果,并配有提供了200多種midi兼容音響和設(shè)備的聲音裝置。新版的quicktime進(jìn)一步擴(kuò)展了原有功能,包含了基于internet應(yīng)用的關(guān)鍵特性,能夠通過internet提供實(shí)時(shí)的數(shù)字化信息流、工作流與文件回放功能,此外,quicktime還采用了一種稱為quicktime vr (簡作qtvr)技術(shù)的虛擬現(xiàn)實(shí)(virtual reality, vr)技術(shù),用戶通過鼠標(biāo)或鍵盤的交互式控制,可以觀察某一地點(diǎn)周圍360度的景象,或者從空間任何角度觀察某一物體。quicktime以其領(lǐng)先的多媒體技術(shù)和跨平臺特性、較小的存儲空間要求、技術(shù)細(xì)節(jié)的獨(dú)立性以及系統(tǒng)的高度開放性,得到業(yè)界的廣泛認(rèn)可,目前已成為數(shù)字媒體軟件技術(shù)領(lǐng)域的事實(shí)上的工業(yè)標(biāo)準(zhǔn)。國際標(biāo)準(zhǔn)化組織(iso)最近選擇quicktime文件格式作為開發(fā)mpeg4規(guī)范的統(tǒng)一數(shù)字媒體存儲格式。 mpeg/mpg/dat格式—— 大家對在電腦上看vcd都習(xí)以為常了吧?但你知道如何將那么多的音頻和視頻信息壓縮到一張cd光盤中的嗎?如果你曾打開過vcd光盤的文件,你會發(fā)現(xiàn)其中有一個(gè)mpeg的文件夾。此時(shí)聰明的你一定會意識到vcd光盤壓縮就是采用mpeg(可參考本報(bào)36期21版的內(nèi)容)這種文件格式。就是moving pictures experts group(動態(tài)圖像專家組)的縮寫,由國際標(biāo)準(zhǔn)化組織iso(international standards organization)與iec(international electronic committee)于1988年聯(lián)合成立,專門致力于運(yùn)動圖像(mpeg視頻)及其伴音編碼(mpeg音頻)標(biāo)準(zhǔn)化工作。mpeg是運(yùn)動圖像壓縮算法的國際標(biāo)準(zhǔn),現(xiàn)已被幾乎所有的計(jì)算機(jī)平臺共同支持。和前面某些視頻格式不同的是,mpeg采用有損壓縮方法減少運(yùn)動圖像中的冗余信息從而達(dá)到高壓縮比的目的,當(dāng)然這些是在保證影像質(zhì)量的基礎(chǔ)上進(jìn)行的。mpeg壓縮標(biāo)準(zhǔn)是針對運(yùn)動圖像而設(shè)計(jì)的,其基本方法是:在單位時(shí)間內(nèi)采集并保存第一幀信息,然后只存儲其余幀相對第一幀發(fā)生變化的部分,從而達(dá)到壓縮的目的。mpeg的平均壓縮比為50∶1,最高可達(dá)200∶1,壓縮效率之高由此可見一斑。同時(shí)圖像和音響的質(zhì)量也非常好,并且在微機(jī)上有統(tǒng)一的標(biāo)準(zhǔn)格式,兼容性相當(dāng)好。mpeg標(biāo)準(zhǔn)包括mpeg視頻、mpeg音頻和mpeg系統(tǒng)(視頻、音頻同步)三個(gè)部分,mp3音頻文件就是mpeg音頻的一個(gè)典型應(yīng)用,而video cd (vcd)、super vcd (svcd)、dvd (digital versatile disk)則是全面采用mpeg技術(shù)所產(chǎn)生出來的新型消費(fèi)類電子產(chǎn)品。 mpeg文件格式是運(yùn)動圖象壓縮算法的國際標(biāo)準(zhǔn),它采用有損壓縮方法減少運(yùn)動圖象中的冗余信息,同時(shí)保證每秒30幀的圖象動態(tài)刷新率,已被幾乎所有的計(jì)算機(jī)平臺共同支持。mpeg標(biāo)準(zhǔn)包括mpeg視頻、mpeg音頻和mpeg系統(tǒng)(視頻、音頻同步)三個(gè)部分,前文介紹的mp3音頻文件就是mpeg音頻的一個(gè)典型應(yīng)用,而video cd (vcd)、super vcd (svcd)、dvd (digital versatile disk)則是全面采用mpeg技術(shù)所產(chǎn)生出來的新型消費(fèi)類電子產(chǎn)品。mpeg壓縮標(biāo)準(zhǔn)是針對運(yùn)動圖象而設(shè)計(jì)的,其基本方法是:在單位時(shí)間內(nèi)采集并保存第一幀信息,然后只存儲其余幀相對第一幀發(fā)生變化的部分,從而達(dá)到壓縮的目的,它主要采用兩個(gè)基本壓縮技術(shù):運(yùn)動補(bǔ)償技術(shù)(預(yù)測編碼和插補(bǔ)碼)實(shí)現(xiàn)時(shí)間上的壓縮,變換域(離散余弦變換dct)壓縮技術(shù)實(shí)現(xiàn)空間上的壓縮。mpeg的平均壓縮比為50∶1,最高可達(dá)200∶1,壓縮效率非常高,同時(shí)圖象和音響的質(zhì)量也非常好,并且在微機(jī)上有統(tǒng)一的標(biāo)準(zhǔn)格式,兼容性相當(dāng)好。 二. 流式媒體文件以及流式媒體文件技術(shù),協(xié)議概述: 流式媒體指在internet/intranet中使用流式傳輸技術(shù)的連續(xù)時(shí)基媒體,如音頻、視頻等多媒體文件。流式媒體在播放前并不下載整個(gè)文件,只將開始部分內(nèi)容存入內(nèi)存,流式媒體的數(shù)據(jù)流隨時(shí)傳送、隨時(shí)播放,只是在開始時(shí)有一些延遲。實(shí)現(xiàn)流媒體的關(guān)鍵技術(shù)是流式傳輸。 流式傳輸定義很廣泛,現(xiàn)在主要指通過網(wǎng)絡(luò)傳送媒體(如視頻、音頻)的技術(shù)總稱。其特定含義為通過互聯(lián)網(wǎng)或局域網(wǎng)將影視節(jié)目傳送到計(jì)算機(jī)。 1. 流式媒體文件格式(streaming video/sound format) 分類: rm ——我們把可以一邊下載一邊播放的影音文件稱為流式文件(與其相對需完全下載才能播放的即為離散文件),rm(全稱為:realmedia)格式就是由realnetwork公司開發(fā)的一種流媒體視頻文件格式,它主要包含realaudio、realvideo、realflash三部分。 rm文件可以在有限的網(wǎng)絡(luò)帶寬下實(shí)現(xiàn)比較流暢的在線視頻和音頻播放,因此是目前網(wǎng)絡(luò)中應(yīng)用最廣泛的流式媒體。rm的突出優(yōu)點(diǎn)就是壓縮比高,例如在犧牲音質(zhì)的情況下,它能將4mb左右的mp3歌曲壓縮到驚人的幾百kb(1024kb=1mb),很適合網(wǎng)上傳播。但是,伴隨高壓縮比而來的就是文件低劣的音質(zhì)和畫質(zhì)。因而,人們主要用rm中的realflash來壓縮色彩和音效都很簡單的動畫片。如目前市場上6張光盤的全套《灌籃高手》就是這種格式。 rm格式是realnetworks公司開發(fā)的一種新型流式視頻文件格式,它麾下共有三員大將:realaudio、realvideo和realflash。realaudio用來傳輸接近c(diǎn)d音質(zhì)的音頻數(shù)據(jù),realvideo用來傳輸連續(xù)視頻數(shù)據(jù),而realflash則是realnetworks公司與macromedia公司新近合作推出的一種高壓縮比的動畫格式。realmedia可以根據(jù)網(wǎng)絡(luò)數(shù)據(jù)傳輸速率的不同制定了不同的壓縮比率,從而實(shí)現(xiàn)在低速率的廣域網(wǎng)上進(jìn)行影像數(shù)據(jù)的實(shí)時(shí)傳送和實(shí)時(shí)播放。這里我們主要介紹realvideo,它除了可以以普通的視頻文件形式播放之外,還可以與realserver服務(wù)器相配合,首先由realencoder負(fù)責(zé)將已有的視頻文件實(shí)時(shí)轉(zhuǎn)換成realmedia格式,realserver則負(fù)責(zé)廣播realmedia視頻文件。在數(shù)據(jù)傳輸過程中可以邊下載邊由realplayer播放視頻影像,而不必像大多數(shù)視頻文件那樣,必須先下載然后才能播放。目前,internet上已有不少網(wǎng)站利用realvideo技術(shù)進(jìn)行重大事件的實(shí)況轉(zhuǎn)播。 asf——微軟為與rm競爭,推出了一種新的網(wǎng)絡(luò)傳播多媒體流信息的解決方案windows media service,該方案的核心就是asf(全稱為advanced streaming format,即高級流格式)。asf是一種數(shù)據(jù)文件格式,音頻、視頻、圖象以及控制命令腳本等多媒體信息都可以通過這種格式,以網(wǎng)絡(luò)數(shù)據(jù)包的形式傳播。由于是微軟的產(chǎn)品,前景十分光明,但目前國內(nèi)電腦影音玩家用得還不多。高壓縮比影音格式的出現(xiàn)和廣泛使用,使在個(gè)人計(jì)算機(jī)硬盤中保存大量的歌曲、電影和電視劇成為了可能,這也正是本文主題的技術(shù)基礎(chǔ)。 asf是一個(gè)獨(dú)立于編碼方式的在internet上實(shí)時(shí)傳播多媒體的技術(shù)標(biāo)準(zhǔn),microsoft公司希望用asf取代quicktime之類的技術(shù)標(biāo)準(zhǔn)以及wav、avi之類的文件擴(kuò)展名,并打算將asf用作將來的windows版本中所有多媒體內(nèi)容的標(biāo)準(zhǔn)文件格式。asf的主要優(yōu)點(diǎn)包括:本地或網(wǎng)絡(luò)回放、可擴(kuò)充的媒體類型、部件下載、可伸縮的媒體類型、流的優(yōu)先級化、多語言支持、環(huán)境獨(dú)立性、豐富的流間關(guān)系以及擴(kuò)展性等。 mov文件格式(quicktime)—— mov也可以作為一種流文件格式。quicktime能夠通過internet提供實(shí)時(shí)的數(shù)字化信息流、工作流與文件回放功能,為了適應(yīng)這一網(wǎng)絡(luò)多媒體應(yīng)用,quicktime為多種流行的瀏覽器軟件提供了相應(yīng)的quicktime viewer插件(plug-in),能夠在瀏覽器中實(shí)現(xiàn)多媒體數(shù)據(jù)的實(shí)時(shí)回放。該插件的“快速啟動(fast start)”功能,可以令用戶幾乎能在發(fā)出請求的同時(shí)便收看到第一幀視頻畫面,而且,該插件可以在視頻數(shù)據(jù)下載的同時(shí)就開始播放視頻圖像,用戶不需要等到全部下載完畢就能進(jìn)行欣賞。此外,quicktime還提供了自動速率選擇功能,當(dāng)用戶通過調(diào)用插件來播放quicktime多媒體文件時(shí),能夠自己選擇不同的連接速率下載并播放影像,當(dāng)然,不同的速率對應(yīng)著不同的圖像質(zhì)量。此外,quicktime還采用了一種稱為quicktime vr的虛擬現(xiàn)實(shí)(vr,virtual reality)技術(shù),用戶只需通過鼠標(biāo)或鍵盤,就可以觀察某一地點(diǎn)周圍360度的景象,或者從空間任何角度觀察某一物體。 2. 流媒體文件協(xié)議。 即時(shí)串流通訊協(xié)議(real time streaming protocol,rtsp)—— 它是realnetworks公司協(xié)助建立的一個(gè)用來傳送串流媒體的開放網(wǎng)頁標(biāo)準(zhǔn)。雖然它必須使用一種稱為realserver的特殊服務(wù)器,然而rtsp能夠提升流式媒體影片的品質(zhì),改善傳送效率以及提供更佳的高流量處理功能。如果你的isp(因特網(wǎng)信息服務(wù)提供商)具備了realserver服務(wù),那么建議你使用realserver而不要使用 web服務(wù)器來傳送串流媒體文件。 實(shí)時(shí)流協(xié)議rtsp(realtimestreamingprotocol)是由realnetworks和netscape共同提出的,該協(xié)議定義了一對多應(yīng)用程序如何有效地通過ip網(wǎng)絡(luò)傳送多媒體數(shù)據(jù)。rtsp在體系結(jié)構(gòu)上位于rtp和rtcp之上,它使用tcp或rtp完成數(shù)據(jù)傳輸。http與rtsp相比,http傳送html,而rtp傳送的是多媒體數(shù)據(jù)。http請求由客戶機(jī)發(fā)出,服務(wù)器作出響應(yīng);使用rtsp時(shí),客戶機(jī)和服務(wù)器都可以發(fā)出請求,即rtsp可以是雙向的。 mms(media server protocol,mms)—— 這是微軟定義的一種流媒體傳輸協(xié)議。用來訪問并流式接收 windows media 服務(wù)器中.asf 文件的一種協(xié)議。mms協(xié)議用于訪問windows media發(fā)布點(diǎn)上的單播內(nèi)容。mms 是連接 windows media 單播服務(wù)的默認(rèn)方法。若觀眾在 windows media player 中鍵入一個(gè)url 以連接內(nèi)容,而不是通過超級鏈接訪問內(nèi)容,則他們必須使用mms 協(xié)議引用該流。當(dāng)使用 mms 協(xié)議連接到發(fā)布點(diǎn)時(shí),使用協(xié)議翻轉(zhuǎn)以獲得最佳連接?!皡f(xié)議翻轉(zhuǎn)”始于試圖通過 mmsu 連接客戶端。mmst 是 mms 協(xié)議結(jié)合udp 數(shù)據(jù)傳送。如果 mmsu 連接不成功,則服務(wù)器試圖使用 mmst。mmst 是 mms 協(xié)議結(jié)合 tcp 數(shù)據(jù)傳送。如果連接到編入索引的 .asf 文件,想要快進(jìn)、后退、暫停、開始和停止流,則必須使用 mms。不能用 unc 路徑快進(jìn)或后退。若您從獨(dú)立的 windows media player 連接到發(fā)布點(diǎn),則必須指定單播內(nèi)容的 url。若內(nèi)容在主發(fā)布點(diǎn)點(diǎn)播發(fā)布,則 url由服務(wù)器名和 .asf 文件名組成。 例如:mms://windows_media_server/sample.asf 其中 windows media server是 windows media 服務(wù)器名,sample.asf 是您想要使之轉(zhuǎn)化為流的.asf 文件名。若您有實(shí)時(shí)內(nèi)容要通過廣播單播發(fā)布,則該 url 由服務(wù)器名和發(fā)布點(diǎn)別名組成。例如:mms://windows_media_server/liveevents這里 windows_media_server 是 windows media 服務(wù)器名,而 liveevents 是發(fā)布點(diǎn)名。 實(shí)時(shí)傳輸協(xié)議(theater server protocol,rtp)—— 是用于internet上針對多媒體數(shù)據(jù)流的一種傳輸協(xié)議。rtp被定義為在一對一或一對多的傳輸情況下工作,其目的是提供時(shí)間信息和實(shí)現(xiàn)流同步。rtp通常使用udp來傳送數(shù)據(jù),但rtp也可以在tcp或atm等其他協(xié)議之上工作。當(dāng)應(yīng)用程序開始一個(gè)rtp會話時(shí)將使用兩個(gè)端口:一個(gè)給rtp,一個(gè)給rtcp。rtp本身并不能為按順序傳送數(shù)據(jù)包提供可靠的傳送機(jī)制,也不提供流量控制或擁塞控制,它依靠rtcp提供這些服務(wù)。通常rtp算法并不作為一個(gè)獨(dú)立的網(wǎng)絡(luò)層來實(shí)現(xiàn),而是作為應(yīng)用程序代碼的一部分。實(shí)時(shí)傳輸控制協(xié)議rtcp。rtcp(real-timetransportcontrolprotocol)和rtp一起提供流量控制和擁塞控制服務(wù)。在rtp會話期間,各參與者周期性地傳送rtcp包。rtcp包中含有已發(fā)送的數(shù)據(jù)包的數(shù)量、丟失的數(shù)據(jù)包的數(shù)量等統(tǒng)計(jì)資料,因此,服務(wù)器可以利用這些信息動態(tài)地改變傳輸速率,甚至改變有效載荷類型。rtp和rtcp配合使用,它們能以有效的反饋和最小的開銷使傳輸效率最佳化,因而特別適合傳送網(wǎng)上的實(shí)時(shí)數(shù)據(jù)。 資源預(yù)訂協(xié)議(resource reserve protocol,rsvp)—— 由于音頻和視頻數(shù)據(jù)流比傳統(tǒng)數(shù)據(jù)對網(wǎng)絡(luò)的延時(shí)更敏感,要在網(wǎng)絡(luò)中傳輸高質(zhì)量的音頻、視頻信息,除帶寬要求之外,還需其他更多的條件。rsvp(resourcereserveprotocol)是正在開發(fā)的internet上的資源預(yù)訂協(xié)議,使用rsvp預(yù)留一部分網(wǎng)絡(luò)資源(即帶寬),能在一定程度上為流媒體的傳輸提供qos。在某些試驗(yàn)性的系統(tǒng)如網(wǎng)絡(luò)視頻會議工具vic中就集成了rsvp。 第三章.多媒體文件制作以及下載教程 一般的多媒體系統(tǒng)主要由如下四個(gè)部分的內(nèi)容組成:多媒體硬件系統(tǒng)、多媒體操作系統(tǒng)、媒體處理系統(tǒng)工具和用戶應(yīng)用軟件。 多媒體操作系統(tǒng): 也稱為多媒體核心系統(tǒng)(multimedia kernel system),具有實(shí)時(shí)任務(wù)調(diào)度、多媒體數(shù)據(jù)轉(zhuǎn)換和同步控制對多媒體設(shè)備的驅(qū)動和控制,以及圖形用戶界面管理等。 多媒體硬件系統(tǒng): 包括計(jì)算機(jī)硬件、聲音/視頻處理器、多種媒體輸入/輸出設(shè)備及信號轉(zhuǎn)換裝置、通信傳輸設(shè)備及接口裝置等。其中,最重要的是根據(jù)多媒體技術(shù)標(biāo)準(zhǔn)而研制生成的多媒體信息處理芯片、光盤驅(qū)動器等。 媒體處理系統(tǒng)工具:或稱為多媒體系統(tǒng)開發(fā)工具軟件,是多媒體系統(tǒng)重要組成部分。 用戶應(yīng)用軟件:根據(jù)多媒體系統(tǒng)終端用戶要求而定制的應(yīng)用軟件或面向某一領(lǐng)域的用戶應(yīng)用軟件系統(tǒng),它是面向大規(guī)模用戶的系統(tǒng)產(chǎn)品。 一.多媒體播放工具以及其他詳解 1.多媒體播放工具 現(xiàn)在市面上流行的播放器我大概數(shù)了一下,包括winmap,realplayer/realone/,windows media player等主流播放器在內(nèi),至少有十幾二十種。如何在這繁多的播放器中選擇合適的工具以及孰優(yōu)孰劣是大家最為關(guān)心的問題。為了有效的解答這些問題,首先要了解各種播放器至少對主流播放工具要有較全面的認(rèn)識。 以前的播放器往往只能播放某種特定的影音文件,而由于計(jì)算機(jī)用戶使用的影音格式種類越來越多,播放器對各種影音文件的兼容性也越來越強(qiáng),表現(xiàn)了明顯的通用化趨勢。 世界最著名的幾大多媒體播放工具生產(chǎn)廠家主要有:mircrosoft(windows media player),realnetworks(realplayer/realone),nullsoft(winmap),apple公司的(quicktime)。而由于winmap不支持流媒體以及對視頻影象技術(shù)的支持很有限,所以實(shí)際上,現(xiàn)在最為大家所接受和廣泛使用的是windows media player,realplayer,quictime. 1. winmap——nullsoft公司的mp3等音頻文件的首席播放器,用戶可以用它提供的編輯功能編輯播放菜單,也可以在它提供的音頻均衡器上進(jìn)行有點(diǎn)專業(yè)味道的音頻調(diào)試。winwap的突出優(yōu)點(diǎn)是支持眾多的功能插件,如有改變外觀的“外殼插件”,制作歌詞的“歌詞插件”以及“卡拉ok插件”等等。過去,winwap主要用于播放mp3,現(xiàn)在新的版本還支持mpg、avi等視頻文件,很有發(fā)展前途。 winmap最初是由美國大學(xué)生賈斯丁·弗蘭克(justin frankel) 和多米特里·鮑德羅夫(dmitry boldyrev)在1997年聯(lián)合開發(fā)的mp3播放器。當(dāng)時(shí)最早的播放器是弗朗霍(frauenhofer) 在1990年開發(fā)的。但這只是一個(gè)非常不知名的小程序,沒有引起大家的重視。1995年mp3格式的確定,許多朋友對它的癡迷是用語言無法表達(dá)的,隨之而來的就是mp3播放器的紅火,大家公認(rèn)的第一個(gè)mp3播放器是在1997年。由一個(gè)叫做tomislav uzelac 的開發(fā)者開發(fā)的。他開發(fā)了amp mp3 播放引擎。 當(dāng)amp引擎進(jìn)入網(wǎng)絡(luò)以后不久,賈斯丁·弗蘭克(justin frankel) 和多米特里·鮑德羅夫(dmitry boldyrev)拿到了amp引擎,并且為他添加了一個(gè)windows界面,最后他們把這個(gè)程序命名為“winamp”。之后他們創(chuàng)建了nullsoft公司,并最終出售給美國在線公司。目前的最新版本是2003年由aol/nullsoft公司推出的winamp 3.0。以前的版本一直是wsz格式的,只能作出方方正正的界面,新版本winamp 3.0采用了全新的wal格式,終于支持自由外觀的界面了。skin采用新的wal格式,使皮膚管理更加方便,完全支持自由形式的外觀。 2. windows media player ——windows操作系統(tǒng)從windows 3.1直到windows 95/98/nt/2000/xp,均內(nèi)置了媒體播放器(media player)軟件,這是一個(gè)windows下的應(yīng)用程序,主要用于控制多媒體設(shè)備并播放多媒體文件,如聲音、音樂、動畫、視頻等。通過媒體播放器,用戶可以直接播放聲音文件(wav文件)、midi音樂(mid文件和rmi文件)以及cd音樂,而更為重要的是,媒體播放器能夠與支持mci(媒體控制接口)的第三方應(yīng)用程序緊密配合,從而擴(kuò)展其功能,例如,如果安裝了video for windows,媒體播放器便可以播放avi文件(該功能從windows 95開始作為系統(tǒng)的內(nèi)置功能),同樣,一旦安裝了mpeg或quicktime的播放程序,媒體播放器便可以播放mpeg文件、vcd影片或是quicktime文件了。 windows media player7.0以后的版本幾乎支持所有的影音文件(目前最新版本9.0安裝解碼器后也支持rm文件)。它已經(jīng)從原來單純的windows組件發(fā)展成為一個(gè)全能的網(wǎng)絡(luò)多媒體播放器,不僅能播放wav、mid、mp3、mpg、avi、asf、wmv等文件,而且支持dvd及最新的mp4格式(所謂的mp4并不是mpeg-4或者mpeg-1 layer 4,而是mpeg-2 aaciso/iec 13818-7,它是針對數(shù)碼電視提出的。音頻部分mpeg-2 bc(iso/iec 13818-3)則是對mpeg-1的向后兼容多聲道擴(kuò)展方案,增加了低采樣頻率(16khz,22.05khz,24khz),增加了一個(gè)“低頻擴(kuò)展”聲道從而提升至5個(gè)聲道編碼)的文件 3. realplayer——realnetwoks公司的rm格式的首席播放器,具備強(qiáng)大的多媒體播放功能,除rm外還支持avi、mpg、mp3等多種影音文件。安裝插件后和解碼器后幾乎支持所有影音格式,是本人最喜歡的播放工具。realone player 是realnetwoks公司推出的一種新型音視頻綜合播放系統(tǒng),以取代該公司現(xiàn)有的三種主打產(chǎn)品,即realplayer、realjukebox和goldpass。目前,realone player的最新版本是2.0。 realnetworks公司總部位于西雅圖,是全球領(lǐng)先的數(shù)字媒體技術(shù)提供商,主要從事軟件產(chǎn)品和服務(wù)的開發(fā)和銷售業(yè)務(wù),旨在使個(gè)人計(jì)算機(jī)及其他電子設(shè)備用戶通過web發(fā)送和接收音頻、視頻及其他多媒體服務(wù)。 4. quicktime——apple公司的quicktime是一個(gè)非常老牌的媒體技術(shù)集成,是數(shù)字媒體領(lǐng)域事實(shí)上的工業(yè)標(biāo)準(zhǔn)。之所以說集成這個(gè)詞是因?yàn)閝uicktime實(shí)際上是一個(gè)開放式的架構(gòu),包含了各種各樣的流式或者非流式的媒體技術(shù)。quicktime是最早的視頻工業(yè)標(biāo)準(zhǔn),1999 年發(fā)布的quicktime 4.0版本開始支持真正的流式播放。由于quicktime本身也存在著平臺的便利(mac os),因此也擁有不少的用戶。quicktime在視頻壓縮上采用的是sorenson video技術(shù),音頻部分則采用qdesign music技術(shù)。quicktime最大的特點(diǎn)是其本身所具有的包容性使得它是一個(gè)完整的多媒體平臺,因此基于quicktime可以使用多種媒體技術(shù)來共同制作媒體內(nèi)容。同時(shí),它在交互性方面是三者之中最好的。例如,在一個(gè) quicktime 文件中可同時(shí)包含midi、動畫gif、flash和smil等等格式的文件,配合quicktime的wired sprites互動格式和,可設(shè)計(jì)出各種互動界面和動畫。 quicktime在視頻壓縮上采用的是sorenson video技術(shù),音頻部分則采用qdesign music技術(shù)。是各大電影公司播放高清晰電影預(yù)告片的首選播放器。 |
|
|