圖像數據處理:簡介,研究現狀,圖像數據基本術語,像素,灰度矩陣,視窗,圖像數據去噪

圖像數據處理是利用圖像數據去噪、圖形分割、圖像數據增強等手段根據需求對圖像數據進行處理的技術。圖像數據處理技術基本可以分成兩大類：模擬圖像處理（Analog Image Processing）和數字圖像處理（Digital Image Processing）。近年來，圖像處理技術日趨成熟，被航空航天、軍事、生物醫學及人工智慧等廣泛套用。

基本介紹

中文名：圖像數據處理
外文名：Image Data Processing
套用領域：航空航天、軍事、生物醫學
分類：模擬圖像處理、數字圖像處理
技術手段：圖像數據去噪、圖像數據增強等
所屬學科：信息科學

簡介,研究現狀,圖像數據基本術語,像素,灰度矩陣,視窗,圖像數據去噪,圖形分割,基於區域的圖像分割,基於邊緣的圖像分割,邊緣與區域相結合的圖像分割方法,圖像數據增強,圖像數據目標檢測與運動檢測,減背景技術,幀差技術,光流技術,

簡介

圖像數據處理技術基本可以分成兩大類：模擬圖像處理（Analog Image Processing）和數字圖像處理（Digital Image Processing）。數字圖像處理是指將圖像信號轉換成數位訊號並利用計算機進行處理的過程。其優點是處理精度高，處理內容豐富，可進行複雜的非線性處理，有靈活的變通能力，一般來說只要改變軟體就可以改變處理內容。困難主要在處理速度上，特別是進行複雜的處理。數字圖像處理技術主要包括如下內容：幾何處理（Ceometrical Processing）、算術處理（Arithmetic Processing）、圖像增強（Image Enhancement）、圖像復原（Image Restoration）、圖像重建（Image Reconstructiong）、圖像識別（Image Recongnition）。圖像處理技術的發展涉及到信息科學、計算機科學、數學、物理學以及生物學等學科，其理論和技術的發展對圖像處理科學的發展有越來越大的影響。近年來，圖像處理技術日趨成熟，被航空航天、軍事、生物醫學及人工智慧等廣泛套用。

研究現狀

數字圖像數據處理技術是 20 世紀 60 年代隨著計算機技術和 VLSI（Very Large Scale Integration）的發展而產生、發展和不斷成熟起來的一個新興技術領域，在理論、技術和實際套用方面都取得了巨大成就。早期圖像處理的目的是改善圖像質量，它以人為對象，以改善人的視覺效果為目的，輸入的是質量低的圖像，輸出的是改善質量後的圖像，目前發展到圖像自動識別的新的階段。

常用的圖像數據處理方法有圖像增強、復原、編碼、壓縮等。首次獲得成功套用的是美國噴氣推進實驗室（JPL），即對航天探器徘徊者 7 號在 1964 年發回的幾千張月球照片進行圖像處理，如幾何校正、灰度變換、去除噪聲等，並考慮了太陽位置和月球環境影響，由計算機成功地繪製出月球表面地圖，獲得了巨大成功。隨後又對探測飛船發回的近十萬張照片進行更為複雜的圖像處理，獲得了月球地形圖、彩色圖及全景鑲嵌圖，為人類登月創舉奠定了堅實的基礎，也推動了數字圖像處理這門學科的誕生。以後的宇航空間技術探測研究中，數字圖像處理技術都發揮了巨大作用。

圖像數據處理的大發展是從 20 世紀 90 年代末開始的。自 1986 年以來，小波理論與變換方法迅速發展，克服了傅立葉分析不能用於局部分析等方面的不足之處，被認為調和分析半個世紀以來工作之結晶。Mallat在 1988 年有效地將小波分析套用於圖像分解和重構。小波分析被認為是信號與圖像分析在數學方法上的重大突破。

進入 21 世紀，隨著計算機及 ARM 技術的迅猛發展和相關理論的不斷完善，圖像處理技術在許多套用領域受到廣泛重視並取得了重大的開拓性成就。但與此同時，圖像處理和計算機視覺的工程套用中還有許多問題尚待解決。特別是傳統的視頻監控系統均以固定的工作站或 PC 機作為查看、控制客戶端，成本高、使用不方便，更無法達到隨時隨地方便監控的效果。根據這種情況，研究設計出成本低、處理速度高、運行穩定的嵌入式可移動圖像處理系統就顯得尤為迫切。

圖像數據基本術語

圖像（Image）就是採用各種觀測系統獲得的，能夠為人類視覺系統所感覺到的實體。研究表明，人類交往用以傳遞信息的主要媒介是語言和圖像。據統計，在人類接收的信息中，聽覺占 20%，視覺占 60%（有人估計占 75%），其他占 20%。由此可見，作為信息傳遞媒介之一的圖像的地位是非常重要的。

圖像就其本質而言可以將分為模擬圖像和數字圖像兩大類。模擬圖像，用連續函式來描述，其特點為光照位置和光照強度均為連續變化。模擬圖像的處理速度快，但精度和靈活性差，不便於用計算機處理，也不便於圖像的儲存、傳輸。數字圖像，將連續的模擬圖像經過幅度和位置的離散化處理後形成的數字圖像。數字圖像的傳輸快速有效，存儲通用性強，精度高，處理方法靈活。本文涉及到的圖像均指數字圖像。圖像處理著重考慮圖像之間的變換，主要包括對圖像進行各種加工以改善圖像的視覺效果並為自動識別打基礎，主要在圖像像素級上進行處理，包括噪聲濾波、圖像增強等，為研究這些理論首先要搞清楚幾個與圖像數據有關的術語。

像素

當把一個監視的圖像輸入到視頻監視系統時，將每個連續的圖像描述成 M×N矩陣的形式，矩陣的每一個元素稱為像素 P（i，j），是一個非負值標量，因為圖像光強沒有負值。從實際的圖形轉變成矩陣時，常把圖像 x,y 的坐標原點設在左下角，而像素的數 i，j 則通常從矩陣的左上角開始。這樣 x 與 i 有著對應的關係，而 y 與 j 則相反。

灰度矩陣

在圖像被採樣和模數轉換後，代表圖像上每個像素的光強用灰度來表示，它取決於模數轉化，也與所用微處理器有關。目前常用的是 256 灰度級，相當於 8位，其數值由 0 到 255。對於灰度值，在轉換時若採用四捨五入法，則灰度定量誤差為1/512=0.2%。一個圖像在存儲或處理時都採用一個以像素為位置、灰度值數組元素的矩陣表示。像素除用灰度表示外，也可用 RGB 色彩成分表示，其包含更加豐富的信息。

視窗

在圖像處理中常常需要在整個圖像的某一部分進行，這個子區域稱為子域，它常用四角對應的像素來表示。

圖像數據去噪

圖像數據去噪又稱作圖像濾波，其最終目的是改善給定的圖像，解決實際圖像由於各種寄生效應產生的圖像質量下降的問題。通過去噪技術可以有效地提高圖像的質量，增大信噪比，更好地體現原來圖像所攜帶的信息，做為一種重要的預處理手段為後續的數字圖像數據處理和目標識別奠定良好基礎。

圖形分割

圖像分割是數字圖像處理中的關鍵技術之一，圖像分割是將圖像中有意義的特徵部分提取出來，其有意義的特徵有圖像中的邊緣、區域等，這是進一步進行圖像識別、分析和理解的基礎。雖然目前已研究出不少邊緣提取、區域分割的方法，但還沒有一種普遍適用於各種圖像的有效方法。因此，對圖像分割的研究還在不斷深入之中，是目前圖像處理中研究的熱點之一。

圖像分割是將圖像中有意義的特徵或區域提取出來的過程。這些特徵可以是圖像的原始特徵，如像素的灰度值、物體輪廓、顏色、反射特徵和紋理等，也可以是空間頻譜等，如直方圖特徵。圖像分割的目的是把圖像劃分成若干互不相交的區域，使各區域具有一致性，而相鄰區域間的屬性特徵有明顯的差別。圖像分割的套用非常廣泛，幾乎出現在有關圖像處理的所有領域，並涉及各種類型。傳統的圖像分割方法包括基於區域的，基於邊緣的和兩者結合的圖像分割方法。

基於區域的圖像分割

基於區域的分割方法是以直接尋找區域為基礎的分割技術，具體算法有區域生長和區域分離與合併算法。基於區域提取方法有兩種基本形式：一種是區域生長，從單個像素出發，逐步合併以形成所需要的分割區域；另一種是從全局出發，逐步切割至所需的分割區域。在實際中使用的通常是這兩種基本形式的結合。該類算法對某些複雜物體定義的複雜場景的分割或者對某些自然景物的分割等類似先驗知識不足的圖像分割，效果較理想。

基於邊緣的圖像分割

基於邊緣檢測的分割方法試圖通過檢測不同區域的邊緣來解決問題，通常不同的區域之間的邊緣上灰度值的變化往往比較大，這是邊緣檢測方法得以實現的主要假設之一。它的基本思想是先檢測圖像中的邊緣點，再按一定策略連線成輪廓，從而構成分割區域。其難點在於邊緣檢測時抗噪性和檢測精度的矛盾，若提高檢測精度則噪聲產生的偽邊緣會導致不合理的輪廓，若提高抗噪性則會產生輪廓漏檢和位置偏差。

邊緣與區域相結合的圖像分割方法

邊緣檢測能夠獲得灰度值的局部變化強度，而區域分割能夠檢測特徵的相似性與均勻性。邊緣與區域相結合分割的主要思想是結合二者的優點，通過邊緣點的限制，避免區域的過分割。同時，通過區域分割補充漏檢的邊緣，使輪廓更加完整。

圖像數據增強

圖像增強是指按特定的需要突出一幅圖像中的某些信息，消弱或去除某些不需要的信息的處理方法。由於受到各種條件的限制和隨機干擾，使得圖像外觀質量嚴重退化，所以採取的基本手段是灰度校正，噪聲濾波等，以使圖像在視覺感知或某種準則下恢復原始圖像，恢復原始圖像其實是解決圖像灰度與原始圖像不匹配的問題。有選擇的加強圖中某些信息而抑制另一些信息，目的是增強圖像的有用性。

圖像增強技術是改善圖像質量的一種重要技術。它可以改善圖像的模糊狀況，有目的的強調和增強圖像的局部性，是圖像更適合人的視覺效果。圖像增強技術主要有直方圖處理、平滑處理、銳化處理等。可以歸納為兩大類：空域處理和頻域處理。空域處理方法是直接對圖像中的像素進行處理，基本上以灰度映射變換為基礎，增強圖像的對比度、改善圖像的內部層次。頻域處理時運用變換技術如傅立葉變換等，用數字濾波方法修改圖像頻譜，在反變得到增強的圖像。

圖像數據目標檢測與運動檢測

圖像的檢測是利用圖像不同區域的邊緣上存在灰度值的不連續性或突變性來實現的，在對圖像進行處理的三維顯示過程中，邊緣檢測占有十分重要的地位。邊緣檢測可以分為並行法和串列法兩種，並行法對邊緣點的判定是基於所檢測的點及其鄰點，主要包括一些局部微分運算元，其優點是速度快，但得到的往往是不連續、不完整的結構信息。串列法中判斷一個被檢測點是否為邊緣點依賴於其周圍的已檢測像素點，即屬於多階段決策過程，可以檢測到感興趣邊緣的單線、連續的結構信息，但這種方法速度較慢。

Montanar 第一個提出在邊緣檢測時可以考慮最最佳化判據，動態規劃（DP）是一種解決多階段決策過程最最佳化的方法。首先檢測出圖像的局部不連續性，再用串列搜尋法將它們連成邊界，從而實現目標的邊緣檢測。Pope 和 Parker 等曾經建立了一個搜尋矩陣，把二維邊緣的跟蹤問題化為對似然矩陣從上到下的一維搜尋，增強了方向性，對垂直於搜尋方向的邊緣線不靈敏，需人為進行錯誤跟蹤及糾正。Morse 和 Mortensen 等嘗試利用活動線(Live-sire)的方法獲得最最佳化二維邊緣搜尋。用於邊緣檢測的 DP 模型以某一起始點到某一終止點的累積代價作為目標函式，起始代價陣元素作為變數，最優值就是使終止點的累積代價值最小。動態規劃用於邊緣檢測時，要同時利用局部梯度信息和全局邊緣累積代價信息，這正是它能獲得全局最優解的原因。通過分析動態規划算法的原理可以得知，算法的核心是一個對全局數據的反覆疊代，直到穩定的過程。該過程保證了 DP 算法在解決圖像邊緣檢測時得到的輪廓線是穩定唯一的，這即是希望的全局最優解。

針對小直徑的圖像測量的邊緣檢測，可以利用最小二乘法確定最佳化目標函式，用 Powell 最佳化方法獲得最佳化結果，最後採用常態分配理論對最佳化結果進行修正的新方法。最佳化目標函式的建立通過圓心坐標（x,y）和半徑 r 可以獲得一個標準圓的圖像。用最小二乘估計值║f-g║來描述標準圓的圖像和原圖像的誤差，將該誤差定為最佳化目標函式。對孔測量採用圓徑向方向目標圖像的邊緣點與標準圓周距離的平方和，作為其誤差的描述。

運動目標檢測的方法主要有減背景技術、幀差技術和光流技術對象分割算法等。

減背景技術

減背景技術是目前最常用的一種方法，利用當前圖像與背景圖像的差分米檢測運動區域的一種技術。它一般能提供最完全的特徵數據，但是對於動態場景的變化，如光照變化等特別敏感。最簡單的背景模型是時間平均圖像，大部分的研究人員都致力於開發不同的背景模型，以期減少動態場景變化對運動分割的影響。

幀差技術

幀差技術是在連續的圖像序列中兩個或三個相鄰幀間採用基於象素的幀間差分並且閾值化來提取出圖像中的運動區域。

光流技術

基於光流技術的對象檢測採用了運動對象隨時間變化的光流特性，如Meyer等通過計算位移向量光流場來扔始化基於輪廓的跟蹤算法，從而有效地提取和跟蹤運動對象。該方法的優點是在攝像機存在運動的前提下也能檢測出獨立的運動對象。然而，大多數的光流計算方法相當複雜，且抗噪性能差，如果沒有特別的硬體裝置則不能被套用於視頻流的實時處理。

圖像數據處理