幀內預測

幀內預測是一個物理學術語,指的是H.264採用的一種新技術

原理,
在先前的H.26x系列和MPEG-x系列標準中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A+B+C+D+I+J+K+L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有1類模式。

原理

在選擇預測器時,主要是確定預測的階數N,以及各個預測係數。
由圖像的統計特性可知,一幀圖像像素之間的相關係數在一定範圍內可用指數型衰減曲線近似,像素距離小時,相關性較強,當像素距離增大時,相關性急劇減弱。因此,預測器的階數不宜取得過大。實驗表明,對於一般圖像,取N = 4就足夠了。當 N > 5時,預測效果的改善程度已不明顯。
當階數N一定後,通過求解N階線性方程組(式1-2)就可以得到預測係數值{ai}。
例如,對於一幅圖像像,如用X1X2X3X4來預測X0,根據均方誤差極小準則對整幅圖像進行計算,得出4個預測值為:
由於前述的N階線性方程組中Rij是與圖像內容有關的量(協方差矩陣),造成對不同的圖像就有一組不同的預測係數{ai},這在一個實際的編碼器中是不能做到的。解決這一矛盾的方法是對一些標準圖像作統計平均,並在實際套用場合,以恢復圖像的主觀效果作為係數的選擇依據。
以下是幾種常用的幀內預測方案(像素的位置見圖1)。
① 1,0,0,0 (一維前值預測)
② 1/2,1/4,1/8,1/8 (二維預測)
③ 1/2,1/4,0,1/4 (二維預測)
這幾種方案的特點都是實現方便,乘法運算只需用D觸發器的抽頭實現,運算量小,並且結合主觀準則量化器的設計後,可以獲得很好的壓縮效果。
圖1給出了預測方案③的一個具體編解碼器框圖。由於量化誤差的作用,恢復值可能超出圖像的8bit取值範圍[ 0,255 ],因此用圖中的限幅器進行限幅,把恢復值限定在256個電平範圍內。
幀內預測
圖1 (1/2,1/4,0,1/4)DPCM系統框圖

相關詞條

熱門詞條

聯絡我們