R-CNN

R-CNN的全稱是Region-CNN，它可以說是是第一個成功將深度學習套用到目標檢測上的算法。傳統的目標檢測方法大多以圖像識別為基礎。一般可以在圖片上使用窮舉法選出所所有物體可能出現的區域框，對這些區域框提取特徵並使用圖像識別方法分類，得到所有分類成功的區域後,通過非極大值抑制(Non-maximumsuppression)輸出結果。

R-CNN遵循傳統目標檢測的思路，同樣採用提取框，對每個框提取特徵、圖像分類、非極大值抑制四個步驟進行目標檢測。只不過在提取特徵這一步，將傳統的特徵(如 SIFT、HOG 特徵等)換成了深度卷積網路提取的特徵。R-CNN 體框架如圖所示。

對於一張圖片，R-CNN基於selective search方法大約生成2000個候選區域，然後每個候選區域被resize成固定大小，並送入一個CNN模型中，最後得到一個特徵向量。然後這個特徵向量被送入一個多類別SVM分類器中，預測出候選區域中所含物體的屬於每個類的機率值。每個類別訓練一個SVM分類器，從特徵向量中推斷其屬於該類別的機率大小。為了提升定位準確性，R-CNN最後又訓練了一個邊界框回歸模型，通過框線回歸模型對框的準確位置進行修正。

R-CNN

基本介紹

相關詞條

熱門詞條