在TM1300上實(shí)現(xiàn)H.26L的4×4點(diǎn)整數(shù)變換
發(fā)布時(shí)間:2008/5/27 0:00:00 訪問次數(shù):513
來源:單片機(jī)及嵌入式系統(tǒng)應(yīng)用 作者:新聞管理員
摘要:h.26l是下一代視頻編碼標(biāo)準(zhǔn)。它的編碼性超越了所有現(xiàn)存標(biāo)準(zhǔn),包括h.263+和mpeg-4(sp)。該文分析h.26l引入的多種新的編碼特性,著重講述4×4點(diǎn)整數(shù)變換,并提出一種在tm1300上實(shí)現(xiàn)的快速變換算法。
關(guān)鍵詞:h.26l uvlc 4×4點(diǎn)整數(shù)變換 tm1300
引言h.26l是下一代視頻編碼標(biāo)準(zhǔn)。最初,h.26l由itu-t的vceg小組開始著手制訂。2001年11月,mpeg和vceg聯(lián)合成立jvt小組共同參與制訂h.26l。也正因?yàn)閙peg的加入,h.26l將被納入mpeg-4的第十部分。由于h.26l標(biāo)準(zhǔn)還在制訂過程中,本文暫時(shí)以jvt提供的測試模型tml8為參考。
h.26l信源編碼的基本編碼框架類似于當(dāng)前流行的視頻編碼標(biāo)準(zhǔn),采用結(jié)合變換編碼和預(yù)測編碼的混合編碼技術(shù)。它出色的性能主要來源于引入的新編碼特性:4×4點(diǎn)整數(shù)變換、使用uvlc進(jìn)行熵編碼、1/4~1/8像素精度的運(yùn)行矢量、有多種塊大小進(jìn)行運(yùn)動估計(jì)等等。這些新的編碼技術(shù)從不同側(cè)面提高了壓縮性能和容錯(cuò)性能。尤其是4×4點(diǎn)整數(shù)變換,是所有視頻壓縮協(xié)議中獨(dú)一無二的。
雖然h.26l標(biāo)準(zhǔn)還在制訂中,但是在初步的測試中,它的編碼性能超越了現(xiàn)存所有標(biāo)準(zhǔn),包括h.263+和mpeg-4(simple profile)。這些試驗(yàn)結(jié)果表明,在取得相同的客觀視頻質(zhì)量下,h.26l比h.263+能夠節(jié)省20%~50%的碼率,比mpeg-4(sp)節(jié)省多達(dá)50%的碼率。作為下一代視頻編碼標(biāo)準(zhǔn),h.26l展示了其巨大的發(fā)展前景。
1 h.26l的4×4點(diǎn)整數(shù)變換1.1 變換簡介
在h.26l編碼技術(shù)中,4×4點(diǎn)整數(shù)變換可以看作是dct變換的整數(shù)版本,主要完成去除圖像的空間相關(guān)性,與4×4點(diǎn)dct變換有著相同的性質(zhì)。先考慮一維的整數(shù)變換:設(shè)a,b,c,d是4個(gè)待變換的點(diǎn),a,b,c,d是對應(yīng)的4個(gè)變換系數(shù),則可以用以下公式表示a,b,c,d點(diǎn)的正變換:
a=13a+13b+13c+13d
b=17a+7b-7c-17d
c=13a-13b-13c+13d
d=7a-17b+17c-7d
反變換公式如下:
a'=13a+17b+13c+7d
b'=13a+7b-13c-17d
c'=13a-7b-13c+17d
d'=13a-17b+13c-7d
其中a和a'的關(guān)系是a'=676a。也就是說,經(jīng)過反變換后,還需要進(jìn)行歸一化操作,使得正變換和變換尺度一致。
同樣二維的4×4整數(shù)變換的變換核是可分離的。分離的變換將計(jì)算復(fù)雜度從o(n4)降到o(n3)。
1.2 與8×8點(diǎn)dct變換的比較
與傳統(tǒng)的dct變換相比,h.26l采用4×4點(diǎn)整數(shù)變換為視頻編碼帶來了以下優(yōu)點(diǎn):
①有助于減少塊斑和環(huán)形斑,提高了圖像質(zhì)量。由于對變換系數(shù)進(jìn)行了量化,造成了高頻系數(shù)丟失,所以恢復(fù)的圖像中會有塊班和環(huán)形班。在h.26l中,采用了更小的4×4點(diǎn)變換,可以有效抑制塊斑和環(huán)形斑。
②整數(shù)變換減小了積累誤差。傳統(tǒng)的積累誤差來自兩個(gè)方面:正變換和反變換不匹配造成的誤與量化造成的誤差。為了達(dá)到壓縮的目的,第二種誤差不可避免。但是,由于h.26l采用了精確的整數(shù)變換,所以正變換和反變換不會產(chǎn)生誤差,這樣有效地減少了積累誤差。
③運(yùn)算速度快。因?yàn)閔.26l采用的變換公式是一個(gè)簡單的整數(shù)方程,也就是說計(jì)算都是基于整數(shù)的,而不是浮點(diǎn)數(shù),所以它減少了單個(gè)變換的計(jì)算量,也有利于采用定點(diǎn)的dsp實(shí)現(xiàn)。
2 在tm1300中的實(shí)現(xiàn)tm1300是一款32位超高性能的多媒體處理器。它的核心處理器采用的是vliw超長指令字結(jié)構(gòu),可以在每一個(gè)時(shí)鐘周期內(nèi)同時(shí)進(jìn)行5個(gè)操作;支持高度并行的定制操作,能大大加快數(shù)字信號處理和多媒體應(yīng)用中常見的特殊運(yùn)行的性能,而定制操作在使用上類似于c語言函數(shù)調(diào)用,方便了程序的設(shè)計(jì)。
本文針對4×4點(diǎn)整數(shù)變換的特點(diǎn)和tm1300的定制運(yùn)算指令的特點(diǎn),對整數(shù)變換作了以下調(diào)整:先做行變換,再做列變換。由于行變換的結(jié)果不會超過16位的表示范圍,故在作列變換之前,重新合并數(shù)據(jù),再作列變換,這樣作是基于以下兩點(diǎn)考慮。
第一,由于視頻輸入數(shù)據(jù)為無符號的字節(jié)型,而tm1300是32位的處理器,以字為單位訪問內(nèi)存,能提高訪問的效率。當(dāng)前4×4數(shù)據(jù)塊(指針為p1)和參考幀4×4數(shù)據(jù)塊(指針為p2)的數(shù)據(jù)組織如下。待變換的點(diǎn)為當(dāng)前數(shù)據(jù)塊的值與參考幀數(shù)據(jù)塊對應(yīng)的值之差。
p1:cal,cb1,cc1,cd1 p2:ra1,rb1,rc1,rd1
ca2,cb2,cc2,cd2 ra2,rb2,rc2,rd2
ca3,cb3,cc3,cd3 ra3,rb3,rc3,rd3
ca4,cb4,cc4,cd4 ra4,rb4,rc4,rd4
第二,可以利用8位乘/累加的定制操作,一個(gè)操作能完成4個(gè)8位乘/累加,一個(gè)機(jī)器周期(clk)最
來源:單片機(jī)及嵌入式系統(tǒng)應(yīng)用 作者:新聞管理員
摘要:h.26l是下一代視頻編碼標(biāo)準(zhǔn)。它的編碼性超越了所有現(xiàn)存標(biāo)準(zhǔn),包括h.263+和mpeg-4(sp)。該文分析h.26l引入的多種新的編碼特性,著重講述4×4點(diǎn)整數(shù)變換,并提出一種在tm1300上實(shí)現(xiàn)的快速變換算法。
關(guān)鍵詞:h.26l uvlc 4×4點(diǎn)整數(shù)變換 tm1300
引言h.26l是下一代視頻編碼標(biāo)準(zhǔn)。最初,h.26l由itu-t的vceg小組開始著手制訂。2001年11月,mpeg和vceg聯(lián)合成立jvt小組共同參與制訂h.26l。也正因?yàn)閙peg的加入,h.26l將被納入mpeg-4的第十部分。由于h.26l標(biāo)準(zhǔn)還在制訂過程中,本文暫時(shí)以jvt提供的測試模型tml8為參考。
h.26l信源編碼的基本編碼框架類似于當(dāng)前流行的視頻編碼標(biāo)準(zhǔn),采用結(jié)合變換編碼和預(yù)測編碼的混合編碼技術(shù)。它出色的性能主要來源于引入的新編碼特性:4×4點(diǎn)整數(shù)變換、使用uvlc進(jìn)行熵編碼、1/4~1/8像素精度的運(yùn)行矢量、有多種塊大小進(jìn)行運(yùn)動估計(jì)等等。這些新的編碼技術(shù)從不同側(cè)面提高了壓縮性能和容錯(cuò)性能。尤其是4×4點(diǎn)整數(shù)變換,是所有視頻壓縮協(xié)議中獨(dú)一無二的。
雖然h.26l標(biāo)準(zhǔn)還在制訂中,但是在初步的測試中,它的編碼性能超越了現(xiàn)存所有標(biāo)準(zhǔn),包括h.263+和mpeg-4(simple profile)。這些試驗(yàn)結(jié)果表明,在取得相同的客觀視頻質(zhì)量下,h.26l比h.263+能夠節(jié)省20%~50%的碼率,比mpeg-4(sp)節(jié)省多達(dá)50%的碼率。作為下一代視頻編碼標(biāo)準(zhǔn),h.26l展示了其巨大的發(fā)展前景。
1 h.26l的4×4點(diǎn)整數(shù)變換1.1 變換簡介
在h.26l編碼技術(shù)中,4×4點(diǎn)整數(shù)變換可以看作是dct變換的整數(shù)版本,主要完成去除圖像的空間相關(guān)性,與4×4點(diǎn)dct變換有著相同的性質(zhì)。先考慮一維的整數(shù)變換:設(shè)a,b,c,d是4個(gè)待變換的點(diǎn),a,b,c,d是對應(yīng)的4個(gè)變換系數(shù),則可以用以下公式表示a,b,c,d點(diǎn)的正變換:
a=13a+13b+13c+13d
b=17a+7b-7c-17d
c=13a-13b-13c+13d
d=7a-17b+17c-7d
反變換公式如下:
a'=13a+17b+13c+7d
b'=13a+7b-13c-17d
c'=13a-7b-13c+17d
d'=13a-17b+13c-7d
其中a和a'的關(guān)系是a'=676a。也就是說,經(jīng)過反變換后,還需要進(jìn)行歸一化操作,使得正變換和變換尺度一致。
同樣二維的4×4整數(shù)變換的變換核是可分離的。分離的變換將計(jì)算復(fù)雜度從o(n4)降到o(n3)。
1.2 與8×8點(diǎn)dct變換的比較
與傳統(tǒng)的dct變換相比,h.26l采用4×4點(diǎn)整數(shù)變換為視頻編碼帶來了以下優(yōu)點(diǎn):
①有助于減少塊斑和環(huán)形斑,提高了圖像質(zhì)量。由于對變換系數(shù)進(jìn)行了量化,造成了高頻系數(shù)丟失,所以恢復(fù)的圖像中會有塊班和環(huán)形班。在h.26l中,采用了更小的4×4點(diǎn)變換,可以有效抑制塊斑和環(huán)形斑。
②整數(shù)變換減小了積累誤差。傳統(tǒng)的積累誤差來自兩個(gè)方面:正變換和反變換不匹配造成的誤與量化造成的誤差。為了達(dá)到壓縮的目的,第二種誤差不可避免。但是,由于h.26l采用了精確的整數(shù)變換,所以正變換和反變換不會產(chǎn)生誤差,這樣有效地減少了積累誤差。
③運(yùn)算速度快。因?yàn)閔.26l采用的變換公式是一個(gè)簡單的整數(shù)方程,也就是說計(jì)算都是基于整數(shù)的,而不是浮點(diǎn)數(shù),所以它減少了單個(gè)變換的計(jì)算量,也有利于采用定點(diǎn)的dsp實(shí)現(xiàn)。
2 在tm1300中的實(shí)現(xiàn)tm1300是一款32位超高性能的多媒體處理器。它的核心處理器采用的是vliw超長指令字結(jié)構(gòu),可以在每一個(gè)時(shí)鐘周期內(nèi)同時(shí)進(jìn)行5個(gè)操作;支持高度并行的定制操作,能大大加快數(shù)字信號處理和多媒體應(yīng)用中常見的特殊運(yùn)行的性能,而定制操作在使用上類似于c語言函數(shù)調(diào)用,方便了程序的設(shè)計(jì)。
本文針對4×4點(diǎn)整數(shù)變換的特點(diǎn)和tm1300的定制運(yùn)算指令的特點(diǎn),對整數(shù)變換作了以下調(diào)整:先做行變換,再做列變換。由于行變換的結(jié)果不會超過16位的表示范圍,故在作列變換之前,重新合并數(shù)據(jù),再作列變換,這樣作是基于以下兩點(diǎn)考慮。
第一,由于視頻輸入數(shù)據(jù)為無符號的字節(jié)型,而tm1300是32位的處理器,以字為單位訪問內(nèi)存,能提高訪問的效率。當(dāng)前4×4數(shù)據(jù)塊(指針為p1)和參考幀4×4數(shù)據(jù)塊(指針為p2)的數(shù)據(jù)組織如下。待變換的點(diǎn)為當(dāng)前數(shù)據(jù)塊的值與參考幀數(shù)據(jù)塊對應(yīng)的值之差。
p1:cal,cb1,cc1,cd1 p2:ra1,rb1,rc1,rd1
ca2,cb2,cc2,cd2 ra2,rb2,rc2,rd2
ca3,cb3,cc3,cd3 ra3,rb3,rc3,rd3
ca4,cb4,cc4,cd4 ra4,rb4,rc4,rd4
第二,可以利用8位乘/累加的定制操作,一個(gè)操作能完成4個(gè)8位乘/累加,一個(gè)機(jī)器周期(clk)最
熱門點(diǎn)擊
- 富士施樂推出世界上最快單頁彩色數(shù)碼印刷機(jī)
- 電子快門含集成電路SF1212原理與應(yīng)用
- 時(shí)尚嬌點(diǎn):MP3數(shù)字音樂播放器
- 一種智能型兆歐表的設(shè)計(jì)
- 新型固體LBCAST JFET圖像傳感器
- 媒體信號處理器MAP-CA及其應(yīng)用實(shí)例
- 在TM1300上實(shí)現(xiàn)H.26L的4×4點(diǎn)整數(shù)
推薦技術(shù)資料
- 業(yè)余條件下PCM2702
- PGM2702采用SSOP28封裝,引腳小而密,EP3... [詳細(xì)]
- CV/CC InnoSwitch3-AQ 開
- URF1DxxM-60WR3系
- 1-6W URA24xxN-x
- 閉環(huán)磁通門信號調(diào)節(jié)芯片NSDRV401
- SK-RiSC-SOM-H27X-V1.1應(yīng)
- RISC技術(shù)8位微控制器參數(shù)設(shè)
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究