本發明專利技術實施例公開了一種推薦模型訓練、推薦方法、裝置、電子設備及存儲介質,推薦模型訓練方法,包括:獲取包括待推薦對象多屬性維度信息的待推薦對象樣本數據和當前對象的當前對象數據;對待推薦對象樣本數據和所述當前對象數據進行語義嵌入處理,得到綜合語義嵌入特征;其中,綜合語義嵌入特征由多個單屬性的基礎屬性語義嵌入特征和屬性交叉語義嵌入特征組成;根據綜合語義嵌入特征生成樣本數據的語義嵌入特征矩陣,其中,樣本數據由待推薦對象樣本數據和當前對象樣本數據拼接組成;將語義嵌入特征作為訓練數據輸入至推薦模型進行訓練。本發明專利技術實施例技術方案提高了推薦模型的精準性,保證了推薦結果的全面性,同時也提高了推薦結果的整體效果。推薦結果的整體效果。推薦結果的整體效果。
【技術實現步驟摘要】
推薦模型訓練、推薦方法、裝置、電子設備及存儲介質
[0001]本專利技術實施例涉及推薦
,尤其涉及一種推薦模型訓練、推薦方法、裝置、電子設備及存儲介質。
技術介紹
[0002]隨著信息技術的快速發展以及移動互聯網的興起,人們已經進入海量數據時代。當每天面對琳瑯滿目并且種類繁雜的商品、電影、歌曲、視頻以及快訊等各種服務時,會出現無法快速找到感興趣的信息的情況。智能推薦技術能夠通過算法模型的形式,基于用戶當前正在瀏覽的對象,來推薦一些與其內容比較相似或者相關的推薦對象。
[0003]目前,技術人員在進行智能推薦時,通常采用基于文本內容匹配的推薦方法、基于文本向量計算相似度的方法以及基于文本特征計算相關性的匹配方法。
[0004]專利技術人在實現本專利技術的過程中,發現現有技術存在如下問題:基于文本內容匹配的推薦方法雖然能保證推薦內容的高相關性,但是由于內容高度匹配,導致推薦結果的驚喜度較差,而且對新用戶不能提供可靠的推薦結果,同時,對稀疏數據、復雜屬性的處理等問題的推薦結果不夠理想。基于文本向量計算相似度的方法,通常是基于主題模型等方法進行文本向量生成,而且多是基于單一向量生成模型統一實現,但是推薦對象的屬性字段中的文本長度是有差異的,一般是正文長度大于標題長度大于標簽長度,這就需要差異化的生成方式以帶來更好的推薦結果。基于文本特征計算相關性的匹配方法,僅考慮了推薦對象的文本特征,忽略了與之相關聯的其他特征。
技術實現思路
[0005]本專利技術實施例提供一種推薦模型訓練、推薦方法、裝置、電子設備及存儲介質,提高了推薦模型的精準性,保證了相關推薦結果的全面性,同時也提高了推薦結果的整體效果。
[0006]根據本專利技術的一方面,提供了一種推薦模型訓練的方法,包括:
[0007]獲取包括待推薦對象多屬性維度信息的待推薦對象樣本數據和當前對象的當前對象數據;
[0008]對所述待推薦對象樣本數據和所述當前對象數據進行語義嵌入處理,得到綜合語義嵌入特征;其中,所述綜合語義嵌入特征由多個單屬性的基礎屬性語義嵌入特征和屬性交叉語義嵌入特征組成;
[0009]根據所述綜合語義嵌入特征生成樣本數據的語義嵌入特征矩陣,其中,所述樣本數據由所述待推薦對象樣本數據和所述當前對象樣本數據拼接組成;
[0010]將所述語義嵌入特征作為訓練數據輸入至推薦模型進行訓練。
[0011]根據本專利技術的另一方面,提供了一種推薦方法,包括:
[0012]獲取當前對象的當前對象關聯數據和備選推薦對象的備選對象關聯數據;
[0013]將所述當前對象的當前對象關聯數據和所述備選推薦對象的備選對象關聯數據
輸入至推薦模型,得到各所述備選推薦對象與所述當前對象的相似度;
[0014]根據各所述備選推薦對象與所述當前對象的相似度確定與所述當前對象匹配的目標推薦對象;
[0015]其中,所述推薦模型通過本專利技術任一實施例所述的推薦模型訓練方法訓練得到。
[0016]根據本專利技術的另一方面,提供了一種推薦模型訓練裝置,包括:
[0017]待推薦對象樣本數據獲取模塊,用于獲取包括待推薦對象多屬性維度信息的待推薦對象樣本數據和當前對象的當前對象數據;
[0018]語義嵌入處理模塊,用于對所述待推薦對象樣本數據和所述當前對象數據進行語義嵌入處理,得到綜合語義嵌入特征;其中,所述綜合語義嵌入特征由多個單屬性的基礎屬性語義嵌入特征和屬性交叉語義嵌入特征組成;
[0019]語義嵌入特征矩陣生成模塊,根據所述綜合語義嵌入特征生成樣本數據的語義嵌入特征矩陣,其中,所述樣本數據由所述待推薦對象樣本數據和所述當前對象樣本數據拼接組成;
[0020]推薦模型訓練模塊,用于將所述語義嵌入特征作為訓練數據輸入至推薦模型進行訓練。
[0021]根據本專利技術的另一方面,提供了一種推薦裝置,包括:
[0022]對象關聯數據獲取模塊,用于獲取當前對象的當前對象關聯數據和備選推薦對象的備選對象關聯數據;
[0023]相似度獲取模塊,用于將所述當前對象的當前對象關聯數據和所述備選推薦對象的備選對象關聯數據輸入至推薦模型,得到各所述備選推薦對象與所述當前對象的相似度;
[0024]目標推薦對象確定模塊,用于根據各所述備選推薦對象與所述當前對象的相似度確定與所述當前對象匹配的目標推薦對象;
[0025]其中,所述推薦模型通過本專利技術任一實施例所述的推薦模型訓練方法訓練得到。
[0026]根據本專利技術的另一方面,提供了一種電子設備,所述電子設備包括:
[0027]至少一個處理器;以及
[0028]與所述至少一個處理器通信連接的存儲器;其中,
[0029]所述存儲器存儲有可被所述至少一個處理器執行的計算機程序,所述計算機程序被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本專利技術任實施例中所述的推薦模型訓練方法或推薦方法。
[0030]根據本專利技術的另一方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機指令,所述計算機指令用于使處理器執行時實現本專利技術實施例中所述的推薦模型訓練方法或推薦方法。
[0031]本專利技術實施例的技術方案,首先獲取包括待推薦對象多屬性維度信息的待推薦對象樣本數據和當前對象的當前對象數據,再對待推薦對象樣本數據和所述當前對象數據進行語義嵌入處理,得到綜合語義嵌入特征,根據綜合語義嵌入特征生成樣本數據的語義嵌入特征矩陣,將語義嵌入特征作為訓練數據輸入至推薦模型進行訓練。相應的,在推薦模型訓練完成后,獲取當前對象的當前對象關聯數據和備選推薦對象的備選對象關聯數據,將當前對象的當前對象關聯數據和備選推薦對象的備選對象關聯數據輸入至推薦模型,得到
各備選推薦對象與當前對象的相似度,最后根據各備選推薦對象與當前對象的相似度確定與當前對象匹配的目標推薦對象。本專利技術實施例的技術方案通過對待推薦對象樣本數據和當前對象的當前對象數據進行綜合語義嵌入學習表示,極大地擴展了特征的表達能力,解決了現有技術中文本特征單一以及未考慮文本長度差異的問題,提高了推薦模型的精準性,保證了相關推薦結果的全面性,同時也提高了推薦結果的整體效果。
[0032]應當理解,本部分所描述的內容并非旨在標識本專利技術的實施例的關鍵或重要特征,也不用于限制本專利技術的范圍。本專利技術的其它特征將通過以下的說明書而變得容易理解。
附圖說明
[0033]為了更清楚地說明本專利技術實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0034]圖1是本專利技術實施例一提供的一種推薦模型訓練方法的流程圖;
[0035]圖2是本專利技術實施例二提供的另一種推薦模型訓練方法的流程圖;
[0036]圖3是本專利技術實施例三提供的一種推薦方法的流程圖;
[本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種推薦模型訓練方法,其特征在于,包括:獲取包括待推薦對象多屬性維度信息的待推薦對象樣本數據和當前對象的當前對象數據;對所述待推薦對象樣本數據和所述當前對象數據進行語義嵌入處理,得到綜合語義嵌入特征;其中,所述綜合語義嵌入特征由多個單屬性的基礎屬性語義嵌入特征和屬性交叉語義嵌入特征組成;根據所述綜合語義嵌入特征生成樣本數據的語義嵌入特征矩陣,其中,所述樣本數據由所述待推薦對象樣本數據和所述當前對象樣本數據拼接組成;將所述語義嵌入特征作為訓練數據輸入至推薦模型進行訓練。2.根據權利要求1所述的方法,其特征在于,所述獲取包括待推薦對象多屬性維度信息的待推薦對象樣本數據,包括:將待推薦對象的推薦日志數據、用戶點擊行為數據和待推薦對象基礎屬性數據作為原始樣本數據;對所述原始樣本數據進行數據預處理,得到預處理原始樣本數據;根據所述預處理原始樣本數據提取關鍵樣本數據,得到所述待推薦對象樣本數據。3.根據權利要求1所述的方法,其特征在于,所述對所述待推薦對象樣本數據和所述當前對象數據進行語義嵌入處理,得到綜合語義嵌入特征,包括:對所述待推薦對象樣本數據的各個屬性維度的單屬性對象樣本數據進行語義嵌入處理,得到所述待推薦對象的多個單屬性的基礎屬性語義嵌入特征;對所述當前對象數據的各個屬性維度的單屬性對象數據進行語義嵌入處理,得到所述當前對象的多個單屬性的基礎屬性語義嵌入特征;根據所述待推薦對象的各所述基礎屬性語義嵌入特征和所述當前對象的各基礎屬性語義嵌入特征計算屬性交叉語義嵌入特征;將所述屬性交叉語義嵌入特征和所述當前對象的基礎屬性語義嵌入特征,輸入至自注意力網絡進行權重學習,得到所述當前對象的綜合語義嵌入特征;將所述屬性交叉語義嵌入特征和所述待推薦對象的基礎屬性語義嵌入特征,輸入至自注意力網絡進行權重學習,得到所述待推薦對象的綜合語義嵌入特征;其中,所述基礎屬性語義嵌入特征包括標題屬性語義嵌入特征、標簽屬性語義嵌入特征、正文屬性語義嵌入特征、圖片屬性語義嵌入特征、視頻屬性語義嵌入特征以及關聯屬性語義嵌入特征中的至少一項。4.根據權利要求1
?
3任一所述的方法,其特征在于,所述待推薦對象包括待推薦物品。5.一種推薦方法,其特征在于,包括:獲取當前對象的當前對象關聯數據和備選推薦對象的備選對象關聯數據;將所述當前對象的當前對象關聯數據和所述備選推薦對象的備選對象關聯數據輸入至推薦模型,得到各所述備選推薦對象與所述當前對象的相似度;根據各所述備選推薦對象與所述當前對象的相似度...
【專利技術屬性】
技術研發人員:于敬,陳運文,劉文海,石京京,李文聰,熊凡,紀達麒,
申請(專利權)人:達觀數據蘇州有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。