【技術實現步驟摘要】
本專利技術涉及計算機領域,特別涉及一種神經網絡剪枝方法及裝置。
技術介紹
目前,深度神經網絡在計算機視覺領域取得了巨大的成功,如圖像分類、目標檢測、圖像分割等。然而,效果較好的深度神經網絡往往有著數量較大的模型參數,不僅計算量大而且在實際部署中模型占據較大一部分空間,這在一些需要實時運算的應用場景無法正常應用。因此,如何對深度神經網絡進行壓縮與加速則顯得尤為重要,尤其是未來一些需要將深度神經網絡應用到諸如嵌入式設備、集成硬件設備中的應用場景。目前,對深度神經網絡進行壓縮和加速的方式主要是通過網絡剪枝的方式實現,例如,SongHan等人發表的論文“LearningbothWeightsandConnectionsforEfficientNeuralNetwork”中提出了一種基于權重的網絡剪枝技術,以及ZeldaMariet等人發表的論文“DiversityNetworks”中提出了一種基于行列式點過程的神經網絡剪枝技術。然而目前的網絡剪枝技術的效果不理想,仍然存在壓縮、加速和精度不能同時兼顧的技術問題。
技術實現思路
鑒于上述問題,本專利技術提供一種神經網絡剪枝方法及裝置,以解決現有技術存在壓縮、加速和精度不能同時兼顧的技術問題。本專利技術一方面,提供一種神經網絡剪枝方法,方法包括:根據待剪枝網絡層中神經元的激活值,確定神經元的重要度值;根據所述待剪枝網絡層中神經元與下一個網絡層中神經元的連接權重,確定神經元的多樣性值;根據所述待剪枝網絡層中的神經元的重要度值和多樣性值,采用體積最大化神經元選取策略從所述待剪枝網絡層中選取保留的神經元;將所述待剪枝網絡層中的 ...
【技術保護點】
一種神經網絡剪枝方法,其特征在于,所述方法包括:根據待剪枝網絡層中神經元的激活值,確定神經元的重要度值;根據所述待剪枝網絡層中神經元與下一個網絡層中神經元的連接權重,確定神經元的多樣性值;根據所述待剪枝網絡層中的神經元的重要度值和多樣性值,采用體積最大化神經元選取策略從所述待剪枝網絡層中選取保留的神經元;將所述待剪枝網絡層中的其他神經元剪掉,得到剪枝網絡層。
【技術特征摘要】
1.一種神經網絡剪枝方法,其特征在于,所述方法包括:根據待剪枝網絡層中神經元的激活值,確定神經元的重要度值;根據所述待剪枝網絡層中神經元與下一個網絡層中神經元的連接權重,確定神經元的多樣性值;根據所述待剪枝網絡層中的神經元的重要度值和多樣性值,采用體積最大化神經元選取策略從所述待剪枝網絡層中選取保留的神經元;將所述待剪枝網絡層中的其他神經元剪掉,得到剪枝網絡層。2.根據權利要求1所述的方法,其特征在于,所述根據待剪枝網絡層中神經元的激活值,確定神經元的重要度值,包括:通過神經網絡對輸入數據進行一次前向操作,得到該待剪枝網絡層中每個神經元的激活值向量;計算各神經元的激活值向量的方差;根據各神經元的方差得到所述待剪枝網絡層的神經元方差重要性向量;根據所述神經元方差重要性向量,分別對各神經元的方差進行歸一化處理,得到神經元的重要度值。3.根據權利要求2所述的方法,其特征在于,采用以下公式對各神經元的方差進行歸一化處理:其中式中,qi為待剪枝網絡層中第i個神經元的激活值向量的方差,Q為待剪枝網絡層的神經元方差重要性向量。4.根據權利要求1所述的方法,其特征在于,根據所述待剪枝網絡層中神經元與下一個網絡層中神經元的連接權重,確定神經元的多樣性值,包括:針對待剪枝網絡層中的每個神經元,根據所述神經元與下一個網絡層中神經元的連接權重,構建所述神經元的權重向量,并將所述權重向量的方向向量確定為所述神經元的多樣性值。5.根據權利要求1所述的方法,其特征在于,所述根據所述待剪枝網絡層中的神經元的重要度值和多樣性值,采用體積最大化神經元選取策略從所述待剪枝網絡層中選取保留的神經元,包括:針對待剪枝網絡層中的每個神經元,將所述神經元的重要度值與多樣性值的乘積確定為所述神經元的特征向量;從所述待剪枝網絡層中的神經元中選取多組包含k個神經元的組合,所述k為預置的正整數;計算每個組合包含的神經元的特征向量所組成的平行六面體的體積,選取體積最大的組合作為保留的神經元。6.根據權利要求1所述的方法,其特征在于,所述根據所述待剪枝網絡層中的神經元的重要度值和多樣性值,采用體積最大化神經元選取策略從所述待剪枝網絡層中選取保留的神經元,包括:針對待剪枝網絡層中的每個神經元,將所述神經元的重要度值與多樣性值的乘積確定為所述神經元的特征向量;采用貪心求解方法,從所述待剪枝網絡層中的神經元中選取k個神經元作為保留的神經元。7.根據權利要求6所述的方法,其特征在于,采用貪心求解方法,從所述待剪枝網絡層中的神經元中選取k個神經元作為保留的神經元,包括:初始化神經元集合為空集合;根據所述待剪枝網絡層中的神經元的特征向量構建特征矩陣;采用多輪以下選取方式選取k個神經元:從本輪選取的特征矩陣中選取模長最大的特征向量,并將所述模長最大的特征向量對應的神經元添加至所述神經元集合中;判斷所述神經元集合中的神經元數量是否達到k,若是則結束;若否,則:從本輪選取的特征矩陣中去掉所述模長最大的特征向量在其他特...
【專利技術屬性】
技術研發人員:王乃巖,
申請(專利權)人:北京圖森互聯科技有限責任公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。