【技術實現步驟摘要】
本申請涉及數據處理,尤其涉及一種信貸風險識別模型訓練方法、信貸風險識別方法及裝置。
技術介紹
1、隨著金融科技的快速發展,信貸風險預測已成為銀行和金融機構評估借款用戶借款信用的重要工具。深度學習技術在這一領域展示了巨大的潛力,能夠通過分析大量歷史數據來準確預測借款人的違約風險。
2、然而,這些模型通常依賴于訓練數據和測試數據之間的分布一致性,即獨立同分布假設。當訓練數據和測試數據的分布相同時,模型能夠取得良好的效果。然而,在實際應用中,訓練數據和測試數據之間往往存在顯著的分布偏移,例如經濟環境變化、政策調整、市場波動等會導致訓練數據和測試數據之間產生數據分布偏移。
3、示例性的,若模型訓練過程中,是以經濟較好的大環境下的數據進行訓練,此時訓練得到的信貸風險識別模型應對經濟較差的大環境下無法輸出精準的信貸風險預測,也即因為該模型應對數據分布偏移無法做到自適應調整自己的分類結果。
技術實現思路
1、有鑒于此,本申請實施例提供了一種信貸風險識別模型訓練方法、裝置及電子設備,以提高信貸風險識別模型應對數據分布偏移時的分類能力。
2、第一方面,本申請實施例提供了一種信貸風險識別模型訓練方法,所述方法包括:
3、獲取訓練樣本數據,其中,所述訓練樣本數據包括:用戶的歷史信貸記錄數據、社會經濟狀態數據、互聯網金融平臺的交易行為數據;
4、將所述訓練樣本數據輸入至初始的信貸風險識別模型中,對所述信貸風險識別模型進行訓練,由所述信貸風險識別模
5、根據所述經典網絡子模型針對各所述訓練樣本數據輸出的所述風險預測結果,與各所述訓練樣本數據的真實風險逾期結果之間的目標數據差異,對所述信貸風險識別模型的模型參數進行調整,直至所述目標數據差異小于預設數據差異閾值;
6、將所述目標數據差異閾值小于預設數據差異閾值對應的信貸風險識別模型,確定為目標信貸風險識別模型;
7、其中,所述對信貸風險識別模型進行訓練包括:對所述經典網絡子模型在第一階段中單獨進行訓練,在第二階段將所述因果網絡子模型接入所述經典網絡子模型,由所述因果網絡子模型針對所述第二階段輸入至所述經典網絡子模型的訓練樣本數據進行時頻域轉換以及權重調整,得到調整后的訓練樣本數據,并利用所述調整后的訓練樣本數據對所述經典網絡子模型進行所述第二階段的模型訓練。
8、結合第一方面,在第二種可能的實施例中,所述經典網絡子模型包括:嵌入層、編碼層、輸出層,所述對所述經典網絡子模型在第一階段中單獨進行訓練,包括:
9、利用所述訓練樣本數據對所述經典網絡子模型進行第一階段的網絡訓練,直至所述輸出層輸出的風險預測結果與所述真實風險逾期結果之間的目標數據差異小于所述預設數據差異閾值。
10、結合第一方面的第二種可能的實施例,在第三種可能的實施例中,所述在第二階段將所述因果網絡子模型接入所述經典網絡子模型,由所述因果網絡子模型針對所述第二階段輸入至所述經典網絡子模型的訓練樣本數據進行時頻域轉換以及權重調整,得到調整后的訓練樣本數據,并利用所述調整后的訓練樣本數據對所述經典網絡子模型進行所述第二階段的模型訓練,包括:
11、在所述第二階段,將所述嵌入層基于所述訓練樣本數據提取得到的各條第一特征向量,輸出至所述因果網絡子模型中,由所述因果網絡子模型將各所述第一特征向量的時域特征轉換為頻域特征,得到各所述第一特征向量對應的第二特征向量,并由所述因果網絡子模型基于預設協方差損失函數,對各所述第二特征向量的權重進行調整,直至所述預設協方差損失函數值最小,得到各所述第二特征向量對應的目標權重。
12、結合第一方面的第三種可能的實施例,在第四種可能的實施例中,所述方法還包括:
13、利用所述編碼層從所述因果網絡子模型讀取各所述第二特征向量對應的目標權重,并基于所述目標權重以及各所述第二特征向量,進行特征提取得到目標信貸數據特征并輸出所述目標信貸數據特征至所述輸出層;
14、利用所述輸出層基于所述目標信貸數據特征,輸出所述風險預測結果,并結合預設交叉熵損失函數,對所述經典網絡子模型的模型參數進行調整,直至所述預設交叉熵損失函數收斂,其中,所述預設交叉熵損失函數是基于所述風險預測結果與所述真實風險逾期結果構建得到的損失函數。
15、結合第一方面,在第五種可能的實施例中,在所述獲取訓練樣本數據步驟之后,所述方法還包括:
16、針對各所述訓練樣本數據進行預處理,將各所述訓練樣本數據轉換為標準化的特征向量;
17、將各所述訓練樣本數據對應的特征向量輸入至所述經典網絡子模型中。
18、第二方面,本申請實施例提供了一種信貸風險識別方法,所述方法包括:
19、獲取待識別用戶的用戶特征;
20、將所述用戶特征輸入至目標信貸風險識別模型中,由所述目標信貸風險識別模型基于所述用戶特征確定所述待識別用戶的各信貸周期下的逾期概率;
21、輸出所述待識別用戶的各信貸周期下的逾期概率;
22、其中,所述目標信貸風險識別模型是采用如第一方面任一所述的信貸風險識別模型訓練方法預先訓練得到的網絡模型。
23、第三方面,本申請實施例提供了一種信貸風險識別模型訓練裝置,所述裝置包括:
24、輸入模塊,用于獲取訓練樣本數據,其中,所述訓練樣本數據包括:用戶的歷史信貸記錄數據、社會經濟狀態數據、互聯網金融平臺的交易行為數據;
25、模型訓練模塊,用于將所述訓練樣本數據輸入至初始的信貸風險識別模型中,對所述信貸風險識別模型進行訓練,由所述信貸風險識別模型基于輸入的訓練樣本數據,計算各條所述訓練樣本數據對應的風險預測結果;其中,所述信貸風險識別模型包括:經典網絡子模型、因果網絡子模型;
26、調參模塊,用于根據所述經典網絡子模型針對各所述訓練樣本數據輸出的所述風險預測結果,與各所述訓練樣本數據的真實風險逾期結果之間的目標數據差異,對所述信貸風險識別模型的模型參數進行調整,直至所述目標數據差異小于預設數據差異閾值;
27、模型確定模塊,用于將所述目標數據差異閾值小于預設數據差異閾值對應的信貸風險識別模型,確定為目標信貸風險識別模型;
28、其中,所述模型訓練模塊還用于:對所述經典網絡子模型在第一階段中單獨進行訓練,在第二階段將所述因果網絡子模型接入所述經典網絡子模型,由所述因果網絡子模型針對所述第二階段輸入至所述經典網絡子模型的訓練樣本數據進行時頻域轉換以及權重調整,得到調整后的訓練樣本數據,并利用所述調整后的訓練樣本數據對所述經典網絡子模型進行所述第二階段的模型訓練。
29、第四方面,本申請實施例提供了一種信貸風險識別裝置,所述裝置包括:
30、獲取模塊,用于獲取待識別本文檔來自技高網...
【技術保護點】
1.一種信貸風險識別模型訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述經典網絡子模型包括:嵌入層、編碼層、輸出層,所述對所述經典網絡子模型在第一階段中單獨進行訓練,包括:
3.根據權利要求2所述的方法,其特征在于,所述在第二階段將所述因果網絡子模型接入所述經典網絡子模型,由所述因果網絡子模型針對所述第二階段輸入至所述經典網絡子模型的訓練樣本數據進行時頻域轉換以及權重調整,得到調整后的訓練樣本數據,并利用所述調整后的訓練樣本數據對所述經典網絡子模型進行所述第二階段的模型訓練,包括:
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
5.根據權利要求1所述的方法,其特征在于,在所述獲取訓練樣本數據步驟之后,所述方法還包括:
6.一種信貸風險識別方法,其特征在于,所述方法包括:
7.一種信貸風險識別模型訓練裝置,其特征在于,所述裝置包括:
8.一種信貸風險識別裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,所述電子設備包括:
...【技術特征摘要】
1.一種信貸風險識別模型訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述經典網絡子模型包括:嵌入層、編碼層、輸出層,所述對所述經典網絡子模型在第一階段中單獨進行訓練,包括:
3.根據權利要求2所述的方法,其特征在于,所述在第二階段將所述因果網絡子模型接入所述經典網絡子模型,由所述因果網絡子模型針對所述第二階段輸入至所述經典網絡子模型的訓練樣本數據進行時頻域轉換以及權重調整,得到調整后的訓練樣本數據,并利用所述調整后的訓練樣本數據對所述經典網絡子模型進行所述第二階段的模型訓練,包括:
4.根據權利...
【專利技術屬性】
技術研發人員:萬世想,楊青,
申請(專利權)人:度小滿科技北京有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。