【技術實現步驟摘要】
本申請涉及人工智能,尤其涉及一種基于ai模型的數據處理方法、芯片架構和智能終端。
技術介紹
1、隨著人工智能(artificial?intelligence,ai)技術的發展,ai模型的應用場景日益廣泛。比如,基于語音模型,用戶可以使用siri或者yoyo等ai助手與手機、平板電腦等智能終端進行交互。傳統的芯片架構包括:計算芯片、閃存(flash?memory)和運行內存(dynamic?random?access?memory,dram)。其中,ai模型存儲在閃存中。在進行數據處理時,先將閃存中存儲的ai模型加載到dram中,然后計算芯片從dram加載ai模型,基于ai模型對待處理的數據進行處理,并將產生的中間數據暫存到dram中。以具有40億參數的大型語言模型為例,傳統的芯片架構需要配備4gb閃存和6gb?dram。由于dram的成本較高,以及閃存與dram之間數據傳輸存在時延,現有的數據處理方法制約了芯片架構制性能的提升與成本控制。
2、因此,如何提供一種高性能低成本的基于ai模型的數據處理方法,是目前亟待解決的技術問題。
技術實現思路
1、本申請提供了一種基于ai模型的數據處理方法、芯片架構和智能終端,能夠高效低成本地基于ai模型進行數據處理。
2、第一方面,本申請實施例提供了一種基于ai模型的數據處理方法,用于芯片架構,芯片架構包括:計算芯片、閃存和運行內存;閃存中存儲有ai模型,處理方法包括:在目標觸發事件發生時,計算芯片直接從閃存加載ai模型;
3、采用該方案,在目標觸發事件發生時,計算芯片直接從閃存加載ai模型,由于不經過運行內存中轉,所以減少了數據傳輸的延遲,提高了數據處理的效率。同時,由于減少了數據在運行內存中的存儲需求,所以該方案還降低了運行內存的用量和成本。
4、結合第一方面,在第一方面的一種可能的實現方式中,在待處理的數據需要進行多次處理時,數據處理方法還包括:在待處理的數據處理完后,計算芯片將處理結果暫存到運行內存中。
5、結合第一方面,在第一方面的一種可能的實現方式中,在將處理結果暫存到運行內存中之前,數據處理方法還包括:計算芯片刪除運行內存中的過程數據。
6、采用該方案,在將處理結果暫存之前刪除運行內存中的過程數據,有利于有效管理運行內存的存儲空間,避免了內存占用過多導致的性能下降,有利于芯片架構穩定運行。
7、結合第一方面,在第一方面的一種可能的實現方式中,閃存的載體包括一個或者多個閃存芯片,運行內存的載體包括一個或者多個運行內存芯片;芯片架構還包括:印刷電路板;計算芯片與印刷電路板電連接;全部閃存芯片和全部運行內存芯片都直接與計算芯片電連接;全部閃存芯片、全部運行內存芯片、以及計算芯片通過封裝技術集成在一起。
8、采用該方案,通過將所有閃存芯片和運行內存芯片直接與計算芯片電連接,并集成在一起,減少了信號傳輸的路徑和延遲,提高了數據傳輸速度和整體性能。同時,這種集成設計簡化了芯片架構的結構,降低了制造成本。
9、結合第一方面,在第一方面的一種可能的實現方式中,閃存的載體包括一個或者多個閃存芯片,運行內存的載體包括一個或者多個運行內存芯片;芯片架構還包括:印刷電路板;計算芯片與印刷電路板電連接;在閃存的載體包括多個閃存芯片時,至少一部分多個閃存芯片通過垂直堆疊方式集成在一起,通過垂直堆疊方式集成在一起的至少一部分閃存芯片作為一個整體直接與計算芯片電連接;多個閃存芯片中未通過垂直堆疊方式集成在一起的存儲芯片都直接與計算芯片電連接;在運行內存的載體包括多個運行內存芯片時,至少一部分運行內存芯片通過垂直堆疊方式集成在一起,通過垂直堆疊方式集成在一起的運行內存芯片作為一個整體直接與計算芯片電連接;多個運行內存芯片中未通過垂直堆疊方式集成在一起的運行內存芯片都直接與計算芯片電連接;在閃存的載體只包括一個閃存芯片時,該閃存芯片直接與計算芯片電連接;在運行內存的載體只包括一個運行內存芯片時,該運行內存芯片與所述計算芯片電連接。
10、采用該方案,在通過垂直堆疊方式集成了閃存芯片或者運行內存芯片時,節省了芯片架構的物理空間,同時垂直堆疊的集成方式還提高了存儲和計算密度,有利于高效地傳輸數據。
11、結合第一方面,在第一方面的一種可能的實現方式中,ai模型包括如下模組中的一個或者多個:語音模型、圖像處理模型、文本處理模型、深度學校模型、機器學習模型、遺傳算法模型。
12、該實施例支持多種類型的ai模型(如語音模型、圖像處理模型等),使得芯片架構能夠應對多樣化的應用場景,提高了芯片架構的通用性和靈活性,有利于滿足用戶多樣化的需求。
13、第二方面,本申請實施例提供了一種芯片架構,芯片架構包括:計算芯片、閃存和運行內存;閃存,用于存儲ai模型:計算芯片,用于在目標觸發事件發生時,直接從閃存加載所述ai模型;以及基于待處理的數據和ai模型,生成過程數據,并將過程數據暫存到運行內存中。
14、采用該方案的芯片架構集成了計算芯片、閃存和運行內存,計算芯片直接從閃存加載ai模型,減少了數據處理流程中的中間環節,提高了處理效率。同時,該方案減少了數據在運行內存中的存儲需求,從而降低了運行內存的用量和成本。
15、結合第二方面,在第二方面的一種可能的實現方式中,閃存的載體包括一個或者多個閃存芯片,運行內存的載體包括一個或者多個運行內存芯片;芯片架構還包括:印刷電路板;計算芯片與印刷電路板電連接;全部閃存芯片和全部所述運行內存芯片都直接與所述計算芯片電連接;全部所述閃存芯片、全部所述運行內存芯片、以及所述計算芯片通過封裝技術集成在一起。
16、該實現方式,通過將所有閃存芯片和運行內存芯片直接與計算芯片電連接并集成,優化了數據傳輸路徑,提高了處理速度和性能,同時降低了制造成本。
17、結合第二方面,在第二方面的一種可能的實現方式中,閃存的載體包括一個或者多個閃存芯片,運行內存的載體包括一個或者多個運行內存芯片;芯片架構還包括:印刷電路板;計算芯片與印刷電路板電連接;在閃存的載體包括多個閃存芯片時,至少一部分多個閃存芯片通過垂直堆疊方式集成在一起,通過垂直堆疊方式集成在一起的至少一部分閃存芯片作為一個整體直接與計算芯片電連接;多個閃存芯片中未通過垂直堆疊方式集成在一起的存儲芯片都直接與計算芯片電連接;在運行內存的載體包括多個運行內存芯片時,至少一部分運行內存芯片通過垂直堆疊方式集成在一起,通過垂直堆疊方式集成在一起的至少一部分運行內存芯片作為一個整體直接與計算芯片電連接;多個運行內存芯片中未通過垂直堆疊方式集成在一起的運行內存芯片都直接與計算芯片電連接;在閃存的載體只包括一個閃存芯片時,該閃存芯片直接與計算芯片電連接;在運行內存的載體只包括一個運行內存芯片時,該運行內存芯片與所述計算芯片電連接。
18、該方案,通過垂直堆疊方式本文檔來自技高網...
【技術保護點】
1.一種基于AI模型的數據處理方法,其特征在于,用于芯片架構,所述芯片架構包括:計算芯片、閃存和運行內存;所述閃存中存儲有AI模型,所述數據處理方法包括:
2.根據權利要求1所述的數據處理方法,其特征在于,在所述待處理的數據需要進行多次處理時,所述數據處理方法還包括:
3.根據權利要求2所述的數據處理方法,其特征在于,在所述計算芯片將處理結果暫存到所述運行內存中之前,所述數據處理方法還包括:
4.根據權利要求1所述的數據處理方法,其特征在于,所述閃存的載體包括一個或者多個閃存芯片,所述運行內存的載體包括一個或者多個運行內存芯片;所述芯片架構還包括:印刷電路板;
5.根據權利要求1所述的數據處理方法,其特征在于,所述閃存的載體包括一個或者多個閃存芯片,所述運行內存的載體包括一個或者多個運行內存芯片;所述芯片架構還包括:印刷電路板;
6.根據權利要求1至5任一項所述的數據處理方法,其特征在于,所述AI模型包括如下模組中的一個或者多個:語音模型、圖像處理模型、文本處理模型、深度學校模型、機器學習模型、遺傳算法模型。
8.根據權利要求7所述的芯片架構,其特征在于,所述閃存的載體包括一個或者多個閃存芯片,所述運行內存的載體包括一個或者多個運行內存芯片;所述芯片架構還包括:印刷電路板;
9.根據權利要求8所述的芯片架構,其特征在于,所述閃存的載體包括一個或者多個閃存芯片,所述運行內存的載體包括一個或者多個運行內存芯片;所述芯片架構還包括:印刷電路板;
10.一種智能終端,其特征在于,包括權利要求7至9任一項所述的芯片架構。
...【技術特征摘要】
1.一種基于ai模型的數據處理方法,其特征在于,用于芯片架構,所述芯片架構包括:計算芯片、閃存和運行內存;所述閃存中存儲有ai模型,所述數據處理方法包括:
2.根據權利要求1所述的數據處理方法,其特征在于,在所述待處理的數據需要進行多次處理時,所述數據處理方法還包括:
3.根據權利要求2所述的數據處理方法,其特征在于,在所述計算芯片將處理結果暫存到所述運行內存中之前,所述數據處理方法還包括:
4.根據權利要求1所述的數據處理方法,其特征在于,所述閃存的載體包括一個或者多個閃存芯片,所述運行內存的載體包括一個或者多個運行內存芯片;所述芯片架構還包括:印刷電路板;
5.根據權利要求1所述的數據處理方法,其特征在于,所述閃存的載體包括一個或者多個閃存芯片,所述運行內存的載體包括一個或者多個運行內存芯片;所述...
【專利技術屬性】
技術研發人員:王者偉,高偉,
申請(專利權)人:聯和存儲科技江蘇有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。