運動補償預測編碼

幀間預測原理

根據圖像的統計特性，對於活動圖像，由於相鄰幀的時間間隔很短(1/25 ~ 1/30秒)，因而在景物的運動不是很劇烈的場合，相鄰幀的相似的部分較多，即他們之間的相關性很強。如果編碼時能充分利用序列圖像在時間軸方向的相關性進行預測，就可望獲得更高的壓縮比，這就是幀間預測編碼。有時，根據實際情況還進一步分為幀間預測(利用相鄰幀的相關性)和場間預測(利用相鄰場之間的相關性)。可以說，幀間預測是目前數字視頻壓縮編碼採用的標誌性技術。

圖1 圖像區域分類示意

幀間預測考慮的幾種典型的情況由圖1的可視電話圖像概括，圖像的內容通常是在一個細節不十分複雜的背景前，有一個活動量不大的單個人物的頭——肩像。假定人的位置在第k幀與第k-1幀相比有一定的位移，可以將畫面分為三個各具特點的區域：

① 背景區這裡指攝像機不動而攝取的人物後面的背景，它對人物起陪襯作用，一般它是靜止的，若外界條件不變，則這兩幀背景區的絕大部分數據相同，這意味著兩幀背景區之間的幀間相關性很強。

② 運動物體區若將物體運動近似看作簡單的平移，則第k幀與第k-1幀的運動區的數據也基本相同。假如能採用某種位移估值方法對位移量進行“運動補償”，那么兩幀的運動區之間的相關性也是很強的。

③ 暴露區這是指運動後所暴露出的原來曾被物體遮蓋住的區域。如果有存儲器將這些暴露區的數據暫時存儲，則再次經遮蓋再暴露出來的數據與原先存儲的數據相同。這也是一種幀間的強相關性。

除了上述的攝像機不變的情況外，對一些攝像機運動的場合也有類似的結論。例如，如果活動圖像是在行進中的車輛中攝取的前方景物、或攝像機用“倍焦”工作攝取的前方景物，或者是用飛行器攝像機攝取的地面景物、或攝像機用“掃視”方式攝取的圖像，其相鄰幀之間也存在很強的相關性。

普通電視圖像及HDTV圖像內容則豐富多變，它們可以看成是上述幾類各具特點的序列圖像的複雜組合，因而總有一定成分的幀間相關性，可以用於圖像的幀間編碼。