R-CNN

R-CNN

R-CNN的全稱是Region-CNN,是第一個成功將深度學習套用到目標檢測上的算法。R-CNN基於卷積神經網路(CNN),線性回歸,和支持向量機(SVM)等算法,實現目標檢測技術。

基本介紹

  • 外文名:R-CNN
R-CNN的全稱是Region-CNN,它可以說是是第一個成功將深度學習套用到目標檢測上的算法。傳統的目標檢測方法大多以圖像識別為基礎。 一般可以在圖片上使用窮舉法選出所所有物體可能出現的區域框,對這些區域框提取特徵並使用圖像識別方法分類, 得到所有分類成功的區域後,通過非極大值抑制(Non-maximumsuppression)輸出結果。
R-CNN遵循傳統目標檢測的思路,同樣採用提取框,對每個框提取特徵、圖像分類、 非極大值抑制四個步驟進行目標檢測。只不過在提取特徵這一步,將傳統的特徵(如 SIFT、HOG 特徵等)換成了深度卷積網路提取的特徵。R-CNN 體框架如圖所示。
R-CNN
對於一張圖片,R-CNN基於selective search方法大約生成2000個候選區域,然後每個候選區域被resize成固定大小,並送入一個CNN模型中,最後得到一個特徵向量。然後這個特徵向量被送入一個多類別SVM分類器中,預測出候選區域中所含物體的屬於每個類的機率值。每個類別訓練一個SVM分類器,從特徵向量中推斷其屬於該類別的機率大小。為了提升定位準確性,R-CNN最後又訓練了一個邊界框回歸模型,通過框線回歸模型對框的準確位置進行修正。

相關詞條

熱門詞條

聯絡我們