本發明專利技術公開了一種基于深度神經網絡的用戶畫像表示學習系統,其中包括:意圖識別模塊,用于根據接收的語句識別用戶的使用功能;特征向量提取模塊,通過深度學習對文本的上下文關系或實體之間的關系進行建模,再通過用戶輸入文本信息提取到用戶的特征信息;以及用戶畫像學習模塊,用于通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。通過深度學習的方式來學習用戶畫像,可以對用戶畫像特征進行抽象提煉,特征表示更簡潔更精準,也能提取到更深層次的隱含信息。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及大數據、人工智能、機器學習,特別涉及一種基于深度神經網絡的用戶畫像表示學習系統及方法。
技術介紹
近年來,社交網絡迅速發展,用戶人數呈爆炸式增長。通過社交網絡服務,人們除了進行社交行為,則更多的是將社交網絡當成公共的媒體平臺,滿足社交需求和特定興趣獲取需求。對于用戶的專業信息及特定興趣獲取需求,而當前社交網絡產品則不能很好的滿足該需求,各類用戶發表的信息混雜在一起,用戶需要自己去甄別其中自己感興趣的信息。如果對社交網絡特定領域中信息走向及分布特點進行深度學習提取特征,則更有利于獲取用戶的信息特征。目前用戶畫像主要通過統計的方式來實現,這種方式往往忽略了用戶的一些隱含的一些信息。通過深度學習的方式來學習用戶畫像,可以對特征進行抽象提煉,特征表示更簡潔更精準,也能提取到更深層次的隱含信息。
技術實現思路
本專利技術公開一種基于深度神經網絡的用戶畫像表示學習系統,其中包括:意圖識別模塊,用于根據接收的語句識別用戶的使用功能;特征向量提取模塊,用于通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息;以及用戶畫像學習模塊,用于通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。優選的,還包括語句接收模塊,用于接收用戶輸入的語句。優選的,用戶輸入的語句包含有做非結構化數據處理的語句以及可轉為結構化數據的語句。優選的,所述非結構化數據是指用戶輸入的語句文本。優選的,所述結構化數據是指把輸入語句轉化為實體和關系后的數據。優選的,所述識別用戶的使用功能中包含有多個功能。本專利技術還公開了一種基于深度神經網絡的用戶畫像表示學習方法,其中包。括:識別用戶的使用功能;提取使用功能的特征信息;以及通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。優選的,還包括接收用戶輸入的語句。優選的,用戶輸入的語句包含做非結構化數據處理的語句以及可轉為結構化數據的語句。優選的,所述非結構化數據是指用戶輸入的語句文本。優選的,所述結構化數據是指把輸入語句轉化為實體和關系后的數據。優選的,更新用戶畫像時要結合監督信息。附圖說明為了更清楚地說明本專利技術實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本專利技術的實施例基于深度神經網絡的用戶畫像表示學習系統的模塊圖;圖2是本專利技術的實施例基于深度神經網絡的用戶畫像表示學習的方法流程圖。具體實施例下面結合附圖和具體實施例對本專利技術的技術方案作進一步更詳細的描述。顯然,所描述的實施例僅僅是本專利技術的一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有作出創造性勞動的前提下所獲得的所有其他實施例,都應屬于本專利技術保護的范圍。如圖1所示為根據本專利技術的實施例基于深度神經網絡的用戶畫像表示學習系統的模塊圖100。如圖1所示,用戶畫像表示學習系統100中包括有語句接收模塊101、意圖識別模塊102、特征向量提取模塊103以及用戶畫像學習模塊104。其中語句接收模塊用于接收用戶輸入的語句,接收到用戶的語句后發送至意圖識別模塊102,意圖識別模塊102用于根據用戶的語句識別用戶想要使用的功能,比如用戶希望閑聊、點播或是調教等等功能,可以是眾多功能中的一個或者多個。針對每一種不同的功能需求,可以按結構化數據和非結構化數據進行區分。具體地,結構化數據是指把輸入語句轉化為實體和關系后的數據。而比如閑聊輸入的語句,調教的語句可以作為非結構化數據,點播輸入的語句數據可以提取出對應的點播實體。其中用戶輸入的語句包含有做非結構化數據處理的語句以及可轉為結構化數據的語句。在一個實施例中,用戶輸入的語句文本設定為非結構化數據。當意圖識別模塊102獲取到用戶想要使用的功能后,特征向量提取模塊103根據非結構化數據,通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息值。在獲取到特征信息值后,用戶畫像學習模塊104通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。而對于結構化數據,使用深度學習對實體之間的關系進行建模,再通過少量監督信息更新用戶畫像,最終獲取高質量的用戶畫像。具體地,結構化數據是指把輸入語句轉化為實體和關系后的數據。圖2是本專利技術的實施例基于深度神經網絡的用戶畫像表示學習的方法流程圖。圖2將結合圖1進行描述。如圖2所示,步驟S201,用戶輸入語句文本;根據用于輸入的語句文本判斷用戶的意圖。步驟S202,獲取到用戶的意圖信息,比如用戶輸入的是閑聊語句、點播語句或者調教語句等。對獲取到的用戶意圖信息進行特征提取,主要是通過深度學習提取特征向量。步驟S203,提取到用戶意圖信息的特征向量,比如閑聊向量、點播向量或者調教向量等等。步驟S204,用戶畫像更新,通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。圖2中所示以三種意圖判斷為實施例來描述本專利技術,但應該理解的是本專利技術并不局限于這三種意圖的輸入(即閑聊意圖、點播意圖或調教意圖),也可以是其他類型的意圖輸入。在一個實施例中,用戶輸入的語句文本設定為非結構化數據。獲取到用戶想要使用的功能后,根據非結構化數據,通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息。在獲取到特征信息值后,結合少量的監督信息,更新用戶畫像。而對于結構化數據,使用深度學習對實體之間的關系進行建模,再通過少量監督信息更新用戶畫像,最終獲取高質量的用戶畫像。具體地,結構化數據是指把輸入語句轉化為實體和關系后的數據。綜上所述,本專利技術提出了一種深度神經網絡的用戶畫像表示學習系統及方法,通過分析用戶的特征,更新用戶畫像,從而獲取高質量的用戶畫像。顯然,本領域的技術人員應該理解,上述的本專利技術的各模塊或各步驟可以用通用的計算系統來實現,它們可以集中在單個的計算系統上,或者分布在多個計算系統所組成的網絡上,可選地,它們可以用計算系統可執行的程序代碼來實現,從而,可以將它們存儲在存儲系統中由計算系統來執行。這樣,本專利技術不限制于任何特定的硬件和軟件結合。以上所揭露的僅為本專利技術實施例中的較佳實施例而已,當然不能以此來限定本專利技術之權利范圍,因此依本專利技術權利要求所作的等同變化,仍屬本專利技術所涵蓋的范圍。本文檔來自技高網...

【技術保護點】
一種基于深度神經網絡的用戶畫像表示學習系統,其中包括:意圖識別模塊,用于根據接收語句識別用戶的使用功能;特征向量提取模塊,用于通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息;以及用戶畫像學習模塊,用于通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。
【技術特征摘要】
【國外來華專利技術】1.一種基于深度神經網絡的用戶畫像表示學習系統,其中包括:意圖識別模塊,用于根據接收語句識別用戶的使用功能;特征向量提取模塊,用于通過深度學習對輸入語句文本的上下文關系進行建模,提取到用戶使用功能的特征信息;以及用戶畫像學習模塊,用于通過特征信息和監督信息迭代訓練,來不斷更新用戶畫像。2.根據權利要求1所述的基于深度神經網絡的用戶畫像表示學習系統,其特征在于,還包括:語句接收模塊,用于接收用戶輸入的語句。3.根據權利要求2所述的基于深度神經網絡的用戶畫像表示學習系統,其特征在于,其中用戶輸入的語句包含做非結構化數據處理的語句以及可轉為結構化數據的語句。4.根據權利要求3所述的基于深度神經網絡的用戶畫像表示學習系統,其特征在于,所述非結構化數據是指用戶輸入的語句文本。5.根據權利要求3所述的基于深度神經網絡的用戶畫像表示學習系統,其特征在于,所述結構化數據是指把輸入語句轉化為實體和關系后的數據。6.根據權利要求1所述的基于深度神經網絡...
【專利技術屬性】
技術研發人員:邱楠,楊新宇,王昊奮,
申請(專利權)人:深圳狗尾草智能科技有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。