【技術實現步驟摘要】
本專利技術是有關于一種計算機系統及其運作方法,且特別是有關于一種多重流形嵌入學習方法及系統。
技術介紹
1、機器學習是實現人工智能的一個途徑之一,即以機器學習為手段,解決人工智能中的部分問題。
2、在數據驅動的機器學習中,分布外(out-of-distribution,ood)樣本是指未見過的實例,它們不屬于機器學習模型在訓練時使用的分布。人工智能模型的部署經常會面臨ood挑戰,這是因為與原始訓練數據相比,測試數據存在域偏移(domain?shift)。這種偏移可能會使訓練好的模型對錯誤決策過于自信,從而導致可信度和可靠性問題。然而,由于ood樣本空間比id數據更廣闊的特性,從id數據中檢測ood樣本一直是一項困難的任務。
技術實現思路
1、本專利技術提出一種多重流形嵌入學習方法及系統,改善先前技術的問題。
2、在本專利技術的一實施例中,本專利技術所提出的多重流形嵌入學習方法包含以下步驟:將使用識別(id)訓練數據以訓練多重流形嵌入學習模型,進而凍結多重流形嵌入學習模型的參數以得出已訓練的多重流形嵌入學習模型;將測試數據輸入到已訓練的多重流形嵌入學習模型中,進而使用閾值將分布外(ood)樣本與id樣本區分開來。
3、在本專利技術的一實施例中,多重流形嵌入學習方法還包含:初始化多重流形嵌入學習模型的復數個分支,以編碼不同的復數個流形。
4、在本專利技術的一實施例中,復數個分支包含一超球分支與一雙曲分支,不同的復數個流形包含一超球流形與一
5、在本專利技術的一實施例中,將使用id訓練數據以訓練多重流形嵌入學習模型,進而凍結多重流形嵌入學習模型的參數以得出已訓練的多重流形嵌入學習模型的步驟包含:于每個訓練迭代,提取不同的復數個流形中每一個的嵌入并計算相應的損失,進而依據損失,更新多重流形嵌入學習模型;在多重流形嵌入學習模型訓練完成以后,凍結多重流形嵌入學習模型的參數以得出已訓練的多重流形嵌入學習模型;將id訓練數據饋送到已訓練的多重流形嵌入學習模型中,以提取id參考嵌入。
6、在本專利技術的一實施例中,損失包含不同的復數個流形的損失以及交叉熵分類損失。
7、在本專利技術的一實施例中,將測試數據輸入到已訓練的多重流形嵌入學習模型中,進而使用閾值將ood樣本與id樣本區分開來的步驟包含:將測試數據輸入到已訓練的多重流形嵌入學習模型中以提取潛在嵌入;基于潛在嵌入與id參考嵌入之間的距離,計算ood分數;比較ood分數與閾值以進行ood偵測,ood偵測將測試數據中的ood樣本與id樣本區分開來。
8、在本專利技術的一實施例中,本專利技術所提出的多重流形嵌入學習系統包含儲存裝置以及處理器,處理器電性連接儲存裝置。儲存裝置儲存至少一指令,處理器用以存取并執行至少一指令以:初始化多重流形嵌入學習模型的復數個分支,以編碼不同的復數個流形;將使用id訓練數據以訓練多重流形嵌入學習模型,進而凍結多重流形嵌入學習模型的參數以得出已訓練的多重流形嵌入學習模型;將測試數據輸入到已訓練的多重流形嵌入學習模型中,進而使用閾值將ood樣本與id樣本區分開來。
9、在本專利技術的一實施例中,處理器用以存取并執行至少一指令以:于每個訓練迭代,提取不同的復數個流形中每一個的嵌入并計算相應的損失,進而依據損失,更新多重流形嵌入學習模型;在多重流形嵌入學習模型訓練完成以后,凍結多重流形嵌入學習模型的參數以得出已訓練的多重流形嵌入學習模型;將id訓練數據饋送到已訓練的多重流形嵌入學習模型中,以提取id參考嵌入。
10、在本專利技術的一實施例中,處理器用以存取并執行至少一指令以:將測試數據輸入到已訓練的多重流形嵌入學習模型中以提取潛在嵌入;基于潛在嵌入與id參考嵌入之間的距離,計算ood分數;比較ood分數與閾值以進行ood偵測,ood偵測將測試數據中的ood樣本與id樣本區分開來。
11、在本專利技術的一實施例中,復數個分支包含超球分支與雙曲分支,不同的復數個流形包含超球流形與雙曲流形,損失包含超球損失、雙曲損失以及交叉熵分類損失。
12、綜上所述,本專利技術的技術方案與現有技術相比具有明顯的優點和有益效果。本專利技術的多重流形嵌入學習方法及多重流形嵌入學習系統的目的是檢測ood樣本,以避免模型的不可靠預測結果,因此本專利技術引入了一種新穎的多重流形嵌入學習模型,將具有正曲率和負曲率的兩種流形納入其中,以增強ood樣本的潛在表示。通過使用多種損失聯合學習多個流形,本專利技術的架構旨在增加嵌入空間的異質性,從而在處理未知的ood樣本時避免扭曲的表示關系。
13、以下將以實施方式對上述的說明作詳細的描述,并對本專利技術的技術方案提供更進一步的解釋。
本文檔來自技高網...【技術保護點】
1.一種多重流形嵌入學習方法,其特征在于,包含以下步驟:
2.根據權利要求1所述的多重流形嵌入學習方法,其特征在于,還包含:
3.根據權利要求2所述的多重流形嵌入學習方法,其特征在于,所述復數個分支包含一超球分支與一雙曲分支,所述不同的復數個流形包含一超球流形與一雙曲流形。
4.根據權利要求2所述的多重流形嵌入學習方法,其特征在于,使用一識別訓練數據以訓練一多重流形嵌入學習模型,進而凍結所述多重流形嵌入學習模型的參數以得出一已訓練的多重流形嵌入學習模型的步驟包含:
5.根據權利要求4所述的多重流形嵌入學習方法,其特征在于,所述損失包含所述不同的復數個流形的損失以及交叉熵分類損失。
6.根據權利要求4所述的多重流形嵌入學習方法,其特征在于,將一測試數據輸入到所述已訓練的多重流形嵌入學習模型中,進而使用一閾值將分布外樣本與ID樣本區分開來的步驟包含:
7.一種多重流形嵌入學習系統,其特征在于,包含:
8.根據權利要求7所述的多重流形嵌入學習系統,其特征在于,所述處理器用以存取并執行所述至少一指令以:<
...【技術特征摘要】
1.一種多重流形嵌入學習方法,其特征在于,包含以下步驟:
2.根據權利要求1所述的多重流形嵌入學習方法,其特征在于,還包含:
3.根據權利要求2所述的多重流形嵌入學習方法,其特征在于,所述復數個分支包含一超球分支與一雙曲分支,所述不同的復數個流形包含一超球流形與一雙曲流形。
4.根據權利要求2所述的多重流形嵌入學習方法,其特征在于,使用一識別訓練數據以訓練一多重流形嵌入學習模型,進而凍結所述多重流形嵌入學習模型的參數以得出一已訓練的多重流形嵌入學習模型的步驟包含:
5.根據權利要求4所述的多重流形嵌入學習方法,其特征在于,所述損失包含所述不同的復數個流形的損失以及交叉熵分類損失。
6.根據權利要求...
【專利技術屬性】
技術研發人員:李政霖,陳維超,張明清,
申請(專利權)人:英業達科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。