Inception結構

Inception結構簡介

自從2012年Krizhevsky等贏了ImageNet競賽後，他們的AlexNet被成功套用在大量的計算機視覺任務，例如物體檢測，分割，人體姿勢估計，視頻分類，物體追蹤和圖像超分辨。

這些成功激發了對於找到更好執行卷積神經網路的的研究。從2014年起，使用更深、更寬的網路大幅提高了網路結構的質量。VGGNet和GoogleNet在2014ILSVRC分類大賽中取得了相似的突出成績。一個有意思的現象是在分類中表現突出的模型在很多領域都有廣泛套用。這意味著深度視覺結構的提升可以用於提升大部分依賴高質量視覺特徵的其它計算機視覺任務。同樣，網路質量的提高引發了新的卷積網路套用，比如此前AlexNet特徵還無法比擬的手工解析度調整。

雖然VGGNet有吸引人的簡單結構，相應的評估網路需要大量計算。另一方面GoogleNet的Inception結構也是設計用於在嚴格的記憶體和計算條件下執行。GoogleNet只使用500萬個參數，是AlexNet的1/12，它使用了6000萬個參數。VGGNet使用了比AlexNet3倍多的參數。

Inception的計算成本也低於VGGNet，這使它能夠套用於大數據場景，或是在有限的記憶體和計算能力的情況下以相對合理的成本處理較大的數據，如移動端。當然我們可以通過計算技巧來最佳化一些特定的操作來解決該問題。但是這些方法加大了複雜性。另外，這些最佳化的方法也可以套用了Inception結構，擴大了效率差。

Inception結構的複雜性使它依然存在修改困難的問題。如果只是簡單的擴大結構規模，計算的優勢會馬上消失。並且不能清楚的描述GoogLeNet結構不同設計的考慮因素。這使它難以在維持效率的同時依據新情況更新。例如，如果需要提高一些Inception風格模型的能力，簡單的加倍過濾器大小會導致4倍增加計算成本和參數。這在很多實際場景中並不現實。這裡，我們提出一些能夠有效提高卷積網路規模的原則和最佳化建議。雖然我們的原則不僅限於Inception風格網路，他們更適應於Inception風格的靈活可兼容性。這通過大量使用Inception模組的降低維度和平行結構實現，減輕了結構變動對周邊組件的影響。使用此種方式時依然要保持謹慎，不斷觀察以維持模型的高質量。

設計原則

1、避免表征瓶頸，特別是在網路早期。前向傳播網路可以從輸入層到分類器或回歸器的無環圖來體現。這定義了清晰的信息流。從每一個分割輸入和輸出的切入，能夠獲得通過這個切入的信息流量。應該避免使用極端壓縮導致的瓶頸。一般講表征規模應平緩的從輸入向輸出遞減知道最終任務。理論上，信息內容無法僅通過表征的維度來評估，因為它捨棄了一些重要因素相關性結構；維度僅提供了信息內容的粗略估計。

2、更高維度的表征更容易在一個網路內本地化處理。在卷積網路中加大每層的激活能獲得更多的非糾纏特徵，可使網路訓練更快速。

Inception結構

基本介紹

Inception結構簡介

設計原則

Inception V1模型

Inception v2模型

Inception v3模型

Inception v4模型

相關詞條

熱門詞條