立體視覺匹配

簡介

立體視覺匹配（Stereo Matching）是計算機視覺中的一個重要而又非常困難的問題，它的目標是從不同視點圖像中找到匹配的對應點。

背景

人類的雙目立體視覺系統是一個非常智慧型的系統。場景中的光線在人眼這個精密的成像系統中被採集，通過神經中樞被送入包含有數以億計的神經元的大腦中被並行的處理，得到了實時的高清晰度的準確的深度感覺信息。憑藉著大腦的智慧型與人類的知識，即使是高度近視的人，在摘掉眼鏡之後仍然能夠得到比較準確的深度感。這樣智慧型的系統，使得人類對環境的適應能力大大提高，很多複雜的動作能夠得以完成：如行走、體育運動、駕駛車輛以及進行科學實驗等。
相比之下，機器的立體視覺系統則要落後得多。相機採集到的圖像數據中可能存在較大的噪聲，相機參數也有可能不對稱；用於處理圖像的計算機大部分還是馮·諾依曼結構的串列計算機，處理能力與人腦相差甚遠。計算機視覺的研究歷史也不長：上世紀七十年代末之前的視覺研究主要集中於生理學和心理學上；在大衛·馬爾提出了視覺計算模型以後，人們才慢慢的開始利用計算機和數學模型進行視覺處理。早期的立體視覺，由於受限於硬體條件，只能對圖像上的特徵點進行匹配，得到離散點的深度信息。然而，計算機硬體的發展非常迅速，正如摩爾定律所指出的，每 18 個月，計算機的硬體價格就下降一半，而性能則提高一倍。當計算機的處理能力不斷提高的時候，人們開始嘗試計算整幅圖的稠密對應關係，同時也開始採用一些更加複雜更加準確的數學工具進行計算。
當前計算機立體視覺的水平與人類的雙目視覺水平還相距甚遠，對它的研究仍然是一個非常活躍的領域。大量的學校、公司以及研究機構的研究人員仍然在進行著對計算機立體視覺的研究，這是因為計算機立體視覺與人眼立體視覺相比，主要有以下不可替代的優點：

1、精度高。人眼的立體感知能力雖然很強，能夠很輕鬆的正確判斷出兩個物體的深度順序，但是卻無法得到其精確的距離信息。然而，使用計算機立體視覺，通過精確的標定，使用合適的計算方法，在匹配正確的情況下可以得到非常精確的深度和位置等數值信息，這使得機器人的精密控制、三維模型重建等工作可以更好的完成。
2、擴展能力強大。由於計算機硬體和軟體不像人類的器官那樣不可改變，計算機立體視覺可以從各個方面對其進行擴展，以滿足不同套用的需求。首先，計算機立體視覺並不限於雙目視覺，很多系統使用了三相機、多相機甚至相機矩陣採集圖像。相機的擺放方式除了類似人眼的水平擺放，還可以採用垂直擺放、環繞擺放以及立體擺放等多種靈活的方式，有一些系統的相機間的關係還可以根據需要進行動態變化。此外，除了可見光，使用特殊的相機，還可以採集到其它各種類型的輸入數據，如紅外線、核磁共振等。所以說，計算機立體視覺技術具有強大的擴展能力，能夠提供比人眼立體視覺系統更豐富的信息。
3、除了以上的兩個特點，計算機還具有連續工作時間長、不易損壞、保密性好、沒有培訓成本、結果易於保存和複製等優點。
由此看來，對於立體視覺匹配的研究，能夠大大的增強計算機或機器人對環境的感知能力，使得機器人能夠更好的適應環境、更加智慧型，從而能夠更好的為人們服務。
如今立體視覺技術主要套用於如下一些領域：三維環境感知與建模、機器人導航、物體跟蹤與檢測以及圖像分割等。隨著立體視覺技術的進一步發展，可能會有更多的領域使用這項技術。

立體視覺匹配

基本介紹

簡介

背景

發展現狀

問題描述

相關詞條

熱門詞條