"/>
【技術實現步驟摘要】
硬件加速器和用于在硬件加速器中計算的方法
[0001]本申請要求于2021年8月23日在韓國知識產權局提交的第10
?
2021
?
0111118號韓國專利申請的權益,所述韓國專利申請的全部公開出于所有目的通過引用包含于此。
[0002]下面的描述涉及一種硬件加速器和用于在硬件加速器中計算的方法。
技術介紹
[0003]人工神經網絡可通過參考計算架構而被實現。各種類型的電子系統可使用人工神經網絡分析輸入數據并提取有效信息。用于處理人工神經網絡的設備可能需要針對復雜的輸入數據進行大量的計算。這樣的技術可能無法有效地處理與用于通過使用人工神經網絡分析大量的輸入數據來提取期望的信息的與人工神經網絡相關的運算。
技術實現思路
[0004]提供
技術實現思路
以簡化的形式介紹在下面的具體實施方式中進一步描述的構思的選擇。本
技術實現思路
不意在確定要求保護的主題的關鍵特征或必要特征,也不意在用于幫助確定要求保護的主題的范圍。
[0005]在一個總體方面,一種用于在硬件加速器中計算的方法包括:通過動態浮點轉換器接收被表示為浮點的多個輸入數據;通過動態浮點轉換器通過基于每個輸入數據的指數的大小對每個輸入數據的尾數執行掩蔽來調整尾數的位寬;以及通過混合精度計算單元執行具有已調整的位寬的輸入數據之間的運算。
[0006]針對每個輸入數據,通過動態浮點轉換器調整尾數的位寬的步驟可包括:與輸入數據的大小成比例地調整尾數的位寬。
[0007]針對每個輸入數據,通過動態
【技術保護點】
【技術特征摘要】
1.一種用于在硬件加速器中計算的方法,包括:通過動態浮點轉換器接收被表示為浮點的多個輸入數據;通過動態浮點轉換器通過基于每個輸入數據的指數的大小對每個輸入數據的尾數執行掩蔽來調整尾數的位寬;以及通過混合精度計算單元執行具有已調整的位寬的輸入數據之間的運算。2.根據權利要求1所述的方法,其中,針對每個輸入數據,通過動態浮點轉換器調整尾數的位寬的步驟包括:與輸入數據的大小成比例地調整尾數的位寬。3.根據權利要求1所述的方法,其中,針對每個輸入數據,通過動態浮點轉換器調整尾數的位寬的步驟包括:通過比較器將輸入數據與閾值進行比較;通過控制器基于比較的結果來調整尾數的位寬;以及通過寄存器存儲具有已調整的位寬的輸入數據和關于位寬的信息。4.根據權利要求3所述的方法,其中,閾值基于輸入數據的分布和容許誤差范圍被確定。5.根據權利要求1所述的方法,還包括:接收所述多個輸入數據的分布;以及通過控制器基于所述多個輸入數據的分布確定對應于所述多個輸入數據中的每個輸入數據的閾值。6.根據權利要求1所述的方法,其中,執行所述運算的步驟包括:控制具有已調整的位寬的輸入數據被輸入到的運算器的分組和時序。7.根據權利要求1至權利要求6中的任意一項所述的方法,其中,執行所述運算的步驟包括:基于每個輸入數據的已調整的位寬,確定由預設數量的運算器執行的運算的周期的數量;以及基于確定的周期的數量將具有已調整的位寬的輸入數據輸入到預設數量的運算器。8.根據權利要求7所述的方法,其中,確定運算的周期的數量的步驟包括:基于每個輸入數據的尾數的已調整的位寬以及預設數量的運算器在單個周期中能處理的位的數量來確定運算的周期的數量。9.根據權利要求7所述的方法,其中,每個運算器包括:乘法器,被配置為:執行輸入數據的尾數的整數乘法;移位器,被配置為:對乘法器的結果進行移位;以及累加器,被配置為:將移位結果累加。10.根據權利要求1至權利要求6中的任意一項所述的方法,其中,執行所述運算的步驟包括:基于每個輸入數據的尾數的已調整的位寬,確定用于在預設數量的運算周期內執行運算的運算器的數量;以及基于確定的運算器的數量,將具有已調整的位寬的輸入數據輸入到運算器。11.根據權利要求10所述的方法,其中,確定運算器的數量的步驟包括:基于每個輸入數據的尾數的已調整的位寬以及運算器在單個周期中能處理的位的數量來確定運算器的
數量。12.根據權利要求3所述的方法,其中,調整尾數的位寬的步驟包括:與響應于指數大于或等于閾值相比,響應于指數小于閾值而向尾數分配較小的位寬。13.根據權利要求1所述的方法,其中,執行所述運算的步驟包括:使用運算器,并且尾數的已調整的位寬小于或等于運算器在單個周期中能處理的位的數量。14.根據權利要求3所述的方法,其中,調整尾數的位寬的步驟包括:響應于指數大于或等于閾值而保持尾數的位寬。15.根據權利要求3所述的方法,其中,閾值包括多個閾值范圍,每個閾值范圍對應于相應的位寬,并且調整尾數的位寬的步驟包括:響應于輸入數據對應于所述多個閾值范圍中的一個閾值范圍,將尾數的位寬調整為與所述多個閾值范圍中的所述一個閾值范圍對應的位寬。16.根據權利要求1所述的方法,其中,執行所述運算的步驟包括:使用運算器執行乘法運算和累加運算。17.一種硬件加速器,包括:動態浮點轉換器,被配置為:接收被表示為浮點的多個輸入數據,通過基于每個輸入數據的指數的大小對每個輸入數據的尾數執行掩蔽來調整尾數的位寬;混合精度計算單元,包括一個或者多個運算器,所述一個或多個運算器被配置為:執行具有已調整的位寬的輸入數據之間的運算;以及控制單元。18.根據權利...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。