Video Object編碼技術(shù)
Video Object編碼技術(shù)
Video Object編碼技術(shù)
《西部廣播電視》2001.10發(fā)表2001中南地區(qū)廣播電視技術(shù)討論會(huì)技術(shù)論文二等獎(jiǎng)
多媒體信息是未來人類獲取信息最主要的載體,因此它已成為目前世界上技術(shù)開發(fā)和研究的熱點(diǎn)。視頻信息作為多媒體信息中最被關(guān)注、數(shù)據(jù)量最大的一員,現(xiàn)在也正面臨著一場其意義不亞于從模擬到數(shù)字的技術(shù)進(jìn)步革新:從傳統(tǒng)的矩形DCT變換編碼到根據(jù)視頻內(nèi)容、劃分對(duì)象、分別變換編碼的新的編碼方法。
一、傳統(tǒng)的編碼方式
傳統(tǒng)的視頻編碼是以視頻信號(hào)的數(shù)字量為編碼對(duì)象的,與視頻信息的內(nèi)容無關(guān),無論是M-JPEG、MPEG-1還是MPEG-2,都是以DCT矩形變換塊為變換編碼單元,對(duì)DCT塊內(nèi)圖像的亮度和色度進(jìn)行特征取樣,提取像素;采用幀間編碼、運(yùn)動(dòng)估測技術(shù),在參考幀幀內(nèi)DCT編碼的基礎(chǔ)上,對(duì)DCT塊內(nèi)圖像的像素特征進(jìn)行差值預(yù)測編碼。基于矩形DCT編碼的視頻編碼在設(shè)計(jì)思想上只考慮到對(duì)信號(hào)數(shù)據(jù)進(jìn)行處理的需要(比如小的比特率以利于傳輸、高的比特率以保證質(zhì)量),但未考慮視頻信息--圖像內(nèi)容本身的含義和重要性,以及視頻信息應(yīng)用者的主觀需求(比如部分內(nèi)容的提取功能)。另外,這種基?quot;塊"的壓縮算法在低碼率時(shí)容易產(chǎn)生"方塊效應(yīng)"和"抽幀",大大縮小了視頻信息的應(yīng)用領(lǐng)域。
小波變換是一種新的變換編碼方法,它與DCT變換相比,考慮到了視頻信號(hào)對(duì)不同應(yīng)用環(huán)境的自適應(yīng)性(不同的清晰度與比特率),可以將基礎(chǔ)圖像層與增強(qiáng)圖像層分離編碼傳輸,用戶可根據(jù)實(shí)際情況選擇是否打開增強(qiáng)圖像層。但無論用戶選擇是或否,被傳送的視頻信息卻都是一樣的。
二、 基于內(nèi)容對(duì)象的編碼
1、 VO與VOP概念的引入
傳統(tǒng)的視頻編碼方式是將整個(gè)視頻信號(hào)作為一個(gè)內(nèi)容單體來處理,其本身不可再分割,而這與人類對(duì)視覺信息的判別法則,也就是大腦對(duì)視神經(jīng)導(dǎo)入的視覺信號(hào)的處理方法是完全不同的。這就決定了我們不可能將一個(gè)視頻信息完整的從視頻信號(hào)中提取出來,比如:將加有臺(tái)標(biāo)和字幕的視頻恢復(fù)成無臺(tái)標(biāo)、字幕的視頻。解決問題的惟一途徑就是在編碼時(shí)就將不同的視頻信息載體--視頻對(duì)象VO(Video Objects)區(qū)分開,獨(dú)立編碼傳送,將圖像序列中的每一幀,看成是由不同的VO加上活動(dòng)的背景所組成。VO可以是人或物,也可以是計(jì)算機(jī)生成的2D或3D圖形。VO具有音頻屬性,其屬性賦值可能?quot;有"或者是"無"。但音頻的具體內(nèi)容數(shù)據(jù)是獨(dú)立于視頻編碼、傳輸?shù)摹O概念的引入,更加符合人腦對(duì)視覺信息的處理方式,并使視頻信號(hào)的處理方式從數(shù)字化進(jìn)展到智能化。提高了視頻信號(hào)的交互性和靈活性,使得更廣泛的視頻應(yīng)用和更多的內(nèi)容交互功能成為可能。
現(xiàn)代圖像編碼理論指出,人眼捕獲圖像信息的本質(zhì)是"輪廓-紋理",即人眼感興趣的是VO的一些表面特性,如形狀、運(yùn)動(dòng)、紋理等。VO的表面往往是不規(guī)則的、千變?nèi)f化的,但可將其視為一定視角下,n個(gè)形狀規(guī)則的、具有一定紋理的剖面的組合的連續(xù)運(yùn)動(dòng),這些剖面的組合稱為視頻對(duì)象面VOP(Video Object Profile)。VOP描述了VO在一定視角條件下的表面特性。VOP的編碼主要由兩部分組成:一個(gè)是形狀編碼,另一個(gè)是紋理和運(yùn)動(dòng)信息編碼。VOP紋理編碼和運(yùn)動(dòng)的預(yù)測、補(bǔ)償在原理上同MPEG-2基本一致,而形狀編碼技術(shù)則是首次應(yīng)用在圖像編碼領(lǐng)域。
2、新的編碼技術(shù)
合成VO的獨(dú)立編碼 在以前,2D或3D動(dòng)畫被看作是視頻的一部分,并一概以視頻的方法來處理。實(shí)際上,根據(jù)合成VO的合成機(jī)理和特性,大部分合成VO都可以用通用的有關(guān)圖形文本的多種表達(dá)方式來描述。非復(fù)雜性合成VO將被視為一種獨(dú)立于視頻的數(shù)據(jù)類型來編碼,并定義了其描述框架、通用的數(shù)據(jù)流結(jié)構(gòu)和靈活的接口。而復(fù)雜性合成VO和自然VO的.編碼方法,將采用以下的編碼方法。
基于矩形窗口的VOP分割 考慮到與現(xiàn)有標(biāo)準(zhǔn)的兼容,目前已得到應(yīng)用的VO編碼技術(shù),比如MPEG4,仍采用了基于矩形窗口的內(nèi)容分割法。編碼時(shí),首先利用像素特征統(tǒng)計(jì),將每一個(gè)VOP都限定在一個(gè)矩形窗口內(nèi),稱之為VOP窗口(VOP Window),取窗的原則為:長、寬均為16像素的整數(shù)倍(便于對(duì)現(xiàn)有標(biāo)準(zhǔn)的兼容和將來的擴(kuò)展),同時(shí)保證VOP窗口中非VOP的宏塊數(shù)目最少。目前標(biāo)準(zhǔn)中的視頻幀可認(rèn)為是一個(gè)無VOP的特例,在編碼過程中將形狀編碼模塊屏蔽掉就可以了。在一個(gè)VOP窗口內(nèi),VOP剖面的形狀也是采用8×8像素的矩形形狀。針對(duì)不同的VOP,可以根據(jù)不同的應(yīng)用場合和運(yùn)動(dòng)、變化的特點(diǎn),采用固定的或可變的VOP幀頻(即VOP刷新頻率)。
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 yyfangchan@163.com (舉報(bào)時(shí)請(qǐng)帶上具體的網(wǎng)址) 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除