【技術實現步驟摘要】
本申請涉及ai智能算法,尤其涉及一種大模型算法冷啟動提示詞優化方法、裝置及設備。
技術介紹
1、多模態大模型(本文中簡稱大模型)是指能夠同時處理和理解多種類型數據(如文本、圖像、音頻等)的大型深度學習模型。
2、為了使大模型在視覺領域能夠準確理解業務場景和實際需求,在大模型的應用上提出了提示詞(prompt)。基于合適的提示詞,可以提高大模型處理視覺領域任務的性能。
3、如何得到合適的提示詞成為大模型視覺領域任務處理中亟待解決的技術問題。
技術實現思路
1、有鑒于此,本申請提供一種分析區域確定以及智能分析的方法、裝置及設備。
2、根據本申請實施例的第一方面,提供一種大模型算法冷啟動提示詞優化方法,包括:
3、獲取目標業務場景的初始提示詞;
4、依據所述初始提示詞,利用未針對所述目標業務場景進行預訓練的多模態大模型,執行所述目標業務場景的視覺領域任務,得到輸出事件;
5、在確定滿足提示詞優化條件的情況下,依據所述初始提示詞、所述輸出事件對應的、帶有標注信息的事件圖片,以及,所述目標業務場景對應的算法能力描述信息,利用所述多模態大模型,進行提示詞優化,得到優化后的提示詞;其中,所述標注信息包括正報或誤報。
6、根據本申請實施例的第二方面,提供一種大模型算法冷啟動提示詞優化裝置,包括:
7、獲取單元,被配置為獲取目標業務場景的初始提示詞;
8、執行單元,被配置為依據所述初始提示詞,
9、優化單元,被配置為在確定滿足提示詞優化條件的情況下,依據所述初始提示詞、所述輸出事件對應的、帶有標注信息的事件圖片,以及,所述目標業務場景對應的算法能力描述信息,利用所述多模態大模型,進行提示詞優化,得到優化后的提示詞。
10、根據本申請實施例的第三方面,提供一種電子設備,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
11、存儲器,用于存放計算機程序;
12、處理器,用于執行存儲器上所存放的程序時,實現第一方面提供的方法。
13、根據本申請實施例的第四方面,提供一種非臨時性計算機可讀存儲介質,非臨時性計算機可讀存儲介質內存儲有計算機程序,計算機程序被處理器執行時實現第一方面提供的方法。
14、本申請實施例的大模型算法冷啟動提示詞優化方法,通過獲取目標業務場景的初始提示詞,并依據獲取到的初始提示詞,利用多模態大模型,執行目標業務場景的視覺領域任務,得到輸出事件,基于初始提示詞,為多模態大模型提供了一個正向的學習和優化初始方向,無需針對目標業務場景對多模態大模型進行預訓練,在多模態大模型算法冷啟動的情況下,實現大模型對提示詞的自學習,進而,在確定滿足提示詞優化條件的情況下,依據初始提示詞、輸出事件對應的、帶有標注信息的事件圖片,以及,目標業務場景對應的算法能力描述信息,利用多模態大模型,進行提示詞優化,得到優化后的提示詞,利用多模態大模型的自學習能力對初始提示詞進行優化,由于多模態大模型可以學習文本以及圖片等多種模態的信息,因而,通過多模態大模型進行提示詞的優化,可以得到更貼合目標業務場景的提示詞,實現了提示詞的自動優化,為提升利用多模態大模型執行目標業務場景的視覺領域任務的性能提供的技術支持。
本文檔來自技高網...【技術保護點】
1.一種大模型算法冷啟動提示詞優化方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述初始提示詞的初始置信度小于預設置信度閾值;其中,提示詞的置信度與利用所述多模態大模型從圖片中檢出與該提示詞對應的目標的準確性正相關。
3.根據權利要求1所述的方法,其特征在于,所述滿足提示詞優化條件,包括:輸出事件的數量達到預設數量,和/或,利用所述多模態大模型執行所述目標業務場景的視覺領域任務的持續時長達到預設時長。
4.根據權利要求1所述的方法,其特征在于,所述依據所述初始提示詞、所述輸出事件對應的、帶有標注信息的事件圖片,以及,所述目標業務場景對應的算法能力描述信息,利用所述多模態大模型進行提示詞優化,得到優化后的提示詞,包括:
5.根據權利要求4所述的方法,其特征在于,所述優化后的提示詞包括優化后的初始提示詞;
6.根據權利要求1所述的方法,其特征在于,所述方法還包括:
7.根據權利要求1所述的方法,其特征在于,所述得到優化后的提示詞之后,還包括:
8.根據權利要求1至7任一項所述的方
9.一種大模型算法冷啟動提示詞優化裝置,其特征在于,包括:
10.一種電子設備,其特征在于,包括:處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
...【技術特征摘要】
1.一種大模型算法冷啟動提示詞優化方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述初始提示詞的初始置信度小于預設置信度閾值;其中,提示詞的置信度與利用所述多模態大模型從圖片中檢出與該提示詞對應的目標的準確性正相關。
3.根據權利要求1所述的方法,其特征在于,所述滿足提示詞優化條件,包括:輸出事件的數量達到預設數量,和/或,利用所述多模態大模型執行所述目標業務場景的視覺領域任務的持續時長達到預設時長。
4.根據權利要求1所述的方法,其特征在于,所述依據所述初始提示詞、所述輸出事件對應的、帶有標注信息的事件圖片,以及,所述目標業務場景對應的算法能力描述信息,利用所述多模態...
【專利技術屬性】
技術研發人員:李青,
申請(專利權)人:杭州海康威視系統技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。