影像金字塔

定義

以多解析度來解釋圖像的一種有效但概念簡單的結構就是影像金字塔。一幅圖像的金字塔就是一系列以金字塔形狀排列的解析度逐漸降低的圖像集合。金字塔的底部是圖像的高解析度表示，也就是原始圖像，而頂部是低解析度的近似。最底層的解析度最高，並且數據量最大，隨著層數的增加，其解析度逐漸降低，數據量也按比例減少。理論上，金字塔是一種連續解析度模型，但在構建金字塔時很難做到解析度連續變化，並且這樣做也沒有實際意義。

金字塔模型最初套用於機器視覺和圖像壓縮，目前很多商業影像資料庫系統都採用了金字塔結構來管理影像，例如 MrSID,TerraServer[TerraServer online],TerraShare [TerraShare online]等。但套用最廣泛的是圖像金字塔。

深入理解

指在同一的空間參照下，根據用戶需要以不同解析度進行存儲與顯示，形成解析度由粗到細、數據量由小到大的金字塔結構。影像金字塔結構用於圖像編碼和漸進式圖像傳輸，是一種典型的分層數據結構形式，適合於柵格數據和影像數據的多解析度組織，也是一種柵格數據或影像數據的有損壓縮方式。如圖所示：

從圖中可以看出, 從金字塔的底層開始每四個相鄰的像素經過重採樣生成一個新的像素, 依此重複進行, 直到金字塔的頂層。重採樣的方法一般有以下三種: 雙線性插值、最臨近像元法、三次卷積法。其中最臨近像元法速度最快, 如果對圖像的邊緣要求不是很高的話,最適合使用該方法。三次卷積由於考慮的參考點數太多、運算較複雜等原因, 速度最慢, 但是重採樣後圖像的灰度效果較好。

每一層影像金字塔都有其解析度的，比如說放大（無論是拉框放大、還是固定比例放大）、縮小、漫遊（此操作不涉及到影像解析度的改變）計算出進行該操作後所需的影像解析度及在當前視圖範圍內會顯示的地理坐標範圍，然後根據這個解析度去和已經建好的影像金字塔解析度匹配，哪層影像金字塔的解析度最接近就用哪層的圖像來顯示，並且根據操作後當前視圖應該顯示的範圍，來求取在該層影像金字塔上，應該對應取哪幾塊，然後取出來畫上去就可以了。

金字塔是一種能對柵格影像按逐級降低解析度的拷貝方式存儲的方法。通過選擇一個與顯示區域相似的解析度，只需進行少量的查詢和少量的計算，從而減少顯示時間。

構建方法

目前影像金字塔的構建方法有兩種：一種是多解析度的數據源自動構建金字塔；另一種是除了金字塔最底層數據是原始影像數據之外，其他層的影像數據是從底層數據通過採樣抽取出來構建的。

從原始影像數據中抽取數據構建金字塔時，通常採用重採樣方法構建，形成一個多個解析度層次。從金字塔的底層到頂層，解析度越來越低，但是表示的範圍卻是一致的，可以用一個公式來表示各層的解析度。設影像數據的原始解析度為 r0，重採樣率為 m，則第 j 層的解析度 rj= r0×mj，其中重採樣率可以是任何大於 1 的整數。

影像金字塔構建的具體方法是把原始影像作為影像金字塔的最底層，定義為 0層，通過對原始影像採用重採樣方法，建立起一系列反應不同解析度的影像，即生成影像的第 1，2，3……層，直至最終建立的影像數據層解析度滿足要求，其中第 0 層即原始影像層解析度最高，最清晰，經重採樣得到的影像解析度隨著金字塔層數的增加解析度依次降低，數據量也依次減少，但表示的範圍卻是不變的。如果生成的影像金字塔最頂層的影像是由一個像素構成的話，在不考慮壓縮的情況下，建立金字塔後的影像數據將近增加原始目標影像大小的 1/3。

影像金字塔

基本介紹

定義

深入理解

構建方法

套用概況

算法研究概況

意義

相關詞條

熱門詞條