【技術實現步驟摘要】
在卷積神經網絡中的1x1卷積的加速
[0001]本公開一般涉及卷積加速器,諸如在學習/推理機(例如,人工神經網絡(ANN),諸如卷積神經網絡(CNN))中使用的卷積加速器。
技術介紹
[0002]各種計算機視覺,語音識別和信號處理應用可以受益于學習/推理機的使用,學習/推理機可以快速地執行數百,數千乃至數百萬的并發操作。如本公開中所討論的,學習/推理機可以屬于機器學習,人工智能,神經網絡,概率推理引擎,加速器等的技術名稱。傳統的學習/推理機可以提供數百teraflops(例如,每秒一百萬(10
12
)個浮點運算)的計算能力。
[0003]這種學習/推理機可以包括或利用CNN,例如深度卷積神經網絡(DCNN)。DCNN是一種基于計算機的工具,其處理大量的數據,并且通過將數據中的相關特征向近端整合,對數據進行廣泛的預測,以及基于可靠的結論和新的整合來改進預測,從而自適應地“學習”。DCNN被安排在多個“層”中,并且在每一層進行不同類型的預測。通常采用包括卷積加速器的硬件加速器來加速DCNN對大量數據的處理。
技術實現思路
[0004]在一個實施例中,卷積加速器包括特征行緩沖器,與特征行緩沖器分離的內核緩沖器,乘累加(MAC)集群,以及耦合到特征行緩沖器、內核緩沖器和MAC集群的模式控制電路裝置。在卷積加速器的第一操作模式中,模式控制電路裝置將特征數據存儲在特征行緩沖器中,將內核數據存儲在內核緩沖器中,將特征數據從特征行緩沖器傳輸到MAC集群,并且將內核數據從內核緩沖器傳輸到MAC ...
【技術保護點】
【技術特征摘要】
1.一種卷積加速器,包括:特征行緩沖器;內核緩沖器,與特征行緩沖器分離;乘法累加MAC集群;以及模式控制電路裝置,耦合到所述特征行緩沖器,所述內核緩沖器和所述MAC集群,其中所述模式控制電路裝置:在所述卷積加速器的第一操作模式中:將特征數據存儲在所述特征行緩沖器中;將內核數據存儲在所述內核緩沖器中;從所述特征行緩沖器向所述MAC集群傳輸特征數據;以及從所述內核緩沖器向所述MAC集群傳輸內核數據;以及在所述卷積加速器的第二操作模式中:在將特征數據存儲在所述內核緩沖器中;將內核數據存儲在所述特征行緩沖器中;從所述內核緩沖器向所述MAC集群傳輸特征數據;以及從所述特征行緩沖器向所述MAC集群傳輸內核數據。2.根據權利要求1所述的卷積加速器,其中所述模式控制電路裝置在所述第一操作模式中:在所述特征行緩沖器中存儲深度達1024個元素的三行特征行數據;以及在所述內核緩沖器中存儲3
×
3內核。3.根據權利要求2所述的卷積加速器,其中所述模式控制電路裝置在所述第二操作模式中:在所述內核緩沖器中存儲深度達128個元素的六行特征行數據;以及在所述特征行緩沖器中存儲1
×
1內核。4.根據權利要求3所述的卷積加速器,其中所述模式控制電路裝置在所述第二操作模式中:在周期中將三行特征行數據從所述內核緩沖器傳輸到所述MAC集群;以及在所述周期中將24個內核數據值傳輸到MAC集群。5.根據權利要求4所述的卷積加速器,其中所述MAC集群在操作中在所述周期中生成72個輸出值。6.根據權利要求1所述的卷積加速器,其中:所述特征行緩沖器是單端口存儲器;以及所述內核緩沖器包括多個雙端口緩沖器。7.根據權利要求6所述的卷積加速器,其中所述模式控制電路裝置在所述第二操作模式中:將特征行數據存儲在所述多個雙端口緩沖器的第一子集中;以及在所述多個雙端口緩沖器的第二子集中緩沖內核數據。8.根據權利要求7所述的卷積加速器,其中在所述多個雙端口緩沖器的所述第二子集中緩沖內核數據包括:
將內核數據存儲在所述第二子集的第一雙端口緩沖器中;將內核數據從所述第二子集的所述第一雙端口緩沖器傳輸到所述特征行緩沖器;將內核數據從所述特征行緩沖器傳輸到所述第二子集的第二雙端口緩沖器;以及將內核數據從所述第二子集的所述第二雙端口緩沖器傳輸到所述MAC集群。9.根據權利要求7所述的卷積加速器,其中在所述多個雙端口緩沖器的所述第二子集中緩沖內核數據包括:將內核數據從所述特征行緩沖器傳輸到所述雙端口緩沖器的所述第二子集的雙端口緩沖器;以及將內核數據從所述雙端口緩沖器的所述第二子集的所述雙端口緩沖器傳輸到所述MAC集群。10.根據權利要求1所述的卷積加速器,其中在所述第二操作模式中,所述模式控制電路裝置串行化由所述MAC集群生成的輸出值。11.根據權利要求1所述的卷積加速器,包括配置寄存器,其中所述模式控制電路裝置在操作中基于存儲在所述配置寄存器中的配置參數來確定是在所述第一操作模式中操作還是在所述第二操作模式中操作。12.根據權利要求1所述的卷積加速器,其中在所述第二操作模式中,所述內核數據具有1
×
N的尺寸,其中N是大于或等于1的整數。13.一種系統,包括:流引擎,其在操作中流式傳輸特征和內核數據;以及卷積加速器,耦合到所述流引擎,其中所述卷積加速器在操作中從所述流引擎接收特征的流和內核數據的流,所述卷積加速器包括:特征行緩沖器;內核緩沖器;乘法累加集群,耦合到所述特征行緩沖器和所述內核緩沖器;以及模式控制電路裝置,耦合到所述特征行緩沖器、所述內核緩沖器和所述MAC集群,其中所述模式控制電路裝置:在所述卷積加速器的第一操作模式中:將特征數據存儲在所述特征行緩沖器中;將內核數據存儲在所述內核緩沖器中;從所述特征行緩沖器向所述MAC集群傳輸特征數據;以及從所述內核緩沖器向所述MAC集群傳輸內核數據;以及在所述卷積加速器的第二操作模式中:將特征數據存儲在所述內核緩沖器中;將內核數據存儲在所述特征行緩沖器中;從所述內核緩沖器向所述MAC集群傳輸特征數據;以及從所述特征行緩沖器向所述MAC集群傳輸內核數據。14.根據權利要求13所述...
【專利技術屬性】
技術研發人員:M,
申請(專利權)人:意法半導體國際有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。