深度可分卷積

理論

深度可分卷積的基本假設，是卷積神經網路中特徵圖的空間維和通道（深度）維是可以解耦（decouple）的。標準的卷積計算使用權重矩陣實現了空間維和通道維特徵的聯合映射（joint mapping），但代價是高計算複雜度、高記憶體開銷和大量的權重係數。在觀念上深度可分卷積通過對空間維和通道維分別進行映射並將結果進行組合，在基本保留卷積核的表征學習（representation learning）能力的同時減少了權重係數的個數。考慮輸入和輸出通道數的差異，深度可分卷積的權重數約為標準卷積權重數的10%至25%。一些使用深度可分卷積搭建的卷積神經網路，例如Xception，在ImageNet數據集的圖像識別任務中的表現要由於隱含層權重相同，但使用標準卷積和Inception模組的Inception v3，因此深度可分卷積也被認為提升了卷積核參數的使用效率。

算法

_參見：_{卷積神經網路}

深度可分卷積分為兩部分，首先使用給定的卷積核尺寸對每個通道分別卷積並將結果組合，該部分被稱為depthwise convolution，隨後深度可分卷積使用單位卷積核進行標準卷積並輸出特徵圖，該部分被稱為pointwise convolution。

解釋性的例子

假設卷積核輸入端的特徵圖大小為(4x4)x64，輸出端的大小為(3x3)x128，卷積核尺寸為(2x2)，單位步長和無填充，則深度可分卷積首先使用64個(2x2)x1的卷積核在每個通道分別卷積，並組合得到(3x3)x64的張量，隨後使用128個(1x1)x64的單位卷積核輸出結果，所需的參數總量為8448；若使用標準卷積，則128個(2x2)x64的卷積核所需的參數總量為32768，是前者的4倍左右。

深度可分卷積

基本介紹

理論

算法

相關詞條

熱門詞條