• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種篩選用戶特征的方法及裝置制造方法及圖紙

    技術編號:15690879 閱讀:82 留言:0更新日期:2017-06-24 03:37
    本申請公開了一種篩選用戶特征的方法及裝置。該方法包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。從而解決了,現有技術在盡可能多的提取的用戶特征之后,只能通過人工干預的方式來完成對用戶特征的篩選,導致用戶特征的篩選效率低的問題。

    Method and device for screening user characteristics

    The present invention discloses a method and a device for screening user characteristics. The method includes: extracting user feature sets the user feature set contains at least two user characteristics; for each user characteristics of the set of user characteristics in the dependent variable the user features, the user characteristics set the user characteristics of its user characteristics as independent variables, determine related factors for the user characteristics; the correlation factor of each user user features in the feature set and a preset threshold comparison, select the user characteristics according to the results of. The utility model solves the problem that the prior art can complete the screening of user characteristics only through manual intervention after the user's characteristics are extracted as much as possible, resulting in low screening efficiency of the user characteristics.

    【技術實現步驟摘要】
    一種篩選用戶特征的方法及裝置
    本申請涉及機器學習
    ,尤其涉及一種篩選用戶特征的方法及裝置。
    技術介紹
    隨著互聯網的蓬勃發展,機器學習(MachineLearning,ML)技術作為一種新的技術,越來越受到人們的重視。機器學習技術通常用來分析和預測用戶的行為,在實際應用中可以通過建立各種數學模型來實現。在數學模型的建立過程中,通常需要在網絡中收集大量的用戶數據,然后對這些用戶數據進行分析和處理,從而提取用戶數據中能夠解釋用戶行為的用戶特征,并將這些用戶特征作為解釋變量來建立數學模型。然而,在對網絡中收集大量的用戶數據進行分析和處理,進而提取用戶特征時,由于事先很難知道所要分析的用戶行為會和哪些用戶特征有關,因此實際應用中通常會盡可能多的提取與所要分析的用戶行相關的用戶特征,由于用于獎勵模型的用戶特征增多,從而導致建立數學模型的時間較長,并且所建立的數學模型復雜。例如用于分析用戶信用的數學模型中,通常會采集用戶的收入信息和學歷信息,但是通常收入信息和學歷信息會用較強的依賴關系,如果將它們都作為解釋變量,將會使該數學模型參數的數量增多,模型的建立時間加長,并且還會對模型的性能有所影響。現有技術在盡可能多的提取與所要分析的用戶行相關的用戶特征之后,只能通過人工干預的方式來完成對用戶特征的篩選,從而導致用戶特征的篩選效率較低。
    技術實現思路
    本申請實施例提供一種篩選用戶特征的方法及裝置,用于解決現有技術篩選用戶特征效率低的問題。本專利技術實施例提供一種篩選用戶特征的方法,所述方法包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。優選的,所述將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選具體包括:將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,篩選出所述用戶特征集合中關聯因子大于預設閾值的用戶特征子集合。優選的,當篩選出的用戶特征子集合中至少包含兩個用戶特征時,所述方法還包括:通過用戶特征子集合中每一個用戶特征的標準差以及用戶特征子集合中用戶特征兩兩之間的協方差,確定用戶特征子集合中用戶特征兩兩之間的相關系數;將所確定的每一個相關系數取絕對值并分別與預設變量對比,當所述相關系數的絕對值大于所述預設變量時,將所述相關系數以及所述相關系數對應的兩個用戶特征構建為關聯組;通過所構建的各個關聯組,確定構建各個關聯組的用戶特征的特征相關分;根據所述特征相關分,篩選出至少一個用戶特征。優選的,當特征相關分越高表示相關關系越強時,所述根據所述特征相關分,篩選出至少一個用戶特征具體包括:提取最高特征相關分所對應的用戶特征,并將所述用戶特征構建篩選集合;根據特征相關分從高到低的順序,針對構建各個關聯組的每一個用戶特征依次執行如下操作:獲取所述用戶特征和所述篩選集合中的每一個用戶特征之間的相關系數;判斷所獲取的各相關系數的絕對值是否均小于第二閾值,若是,則將所述用戶特征放入所述篩選集合;篩選出篩選集合中的用戶特征。優選的,當所確定的每一個相關系數的絕對值均小于預設變量時,減小所述預設變量并將所確定的每一個相關系數的絕對值分別與減小后的預設變量對比。優選的,當用戶特征集合中每一個用戶特征的方差膨脹因子均小于預設閾值時,所述用戶特征子集合具體為空集。優選的,所述以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的方差膨脹因子具體包括:以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,通過邏輯回歸確定所述用戶特征的方差膨脹因子。優選的,所述用戶特征用于建立分析用戶行為的數學模型。優選的,所述關聯因子具體包括方差膨脹因子。本專利技術實施例還提供一種篩選用戶特征的裝置,所述裝置包括:提取單元、確定單元和篩選單元,其中:提取單元,用于提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;確定單元,用于針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的方差膨脹因子;篩選單元,用于將用戶特征集合中每一個用戶特征的方差膨脹因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。優選的,所述篩選單元包括篩選子單元,用于將用戶特征集合中每一個用戶特征的方差膨脹因子分別和預設閾值對比,篩選出所述用戶特征集合中方差膨脹因子大于預設閾值的用戶特征子集合,所述用戶特征子集合包括空集。本申請實施例采用的上述至少一個技術方案能夠達到以下有益效果:根據所確定的每一個用戶特征的關聯因子,將各關聯因子分別和預設閾值進行對比,從而對用戶特征集合中的用戶特征進行篩選,提高了用戶特征的篩選效率。從而解決了,現有技術在盡可能多的提取的用戶特征之后,只能通過人工干預的方式來完成對用戶特征的篩選,導致用戶特征的篩選效率低的問題。附圖說明此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:圖1為本申請實施例1提供的一種篩選用戶特征的方法的具體實現流程示意圖;圖2為本申請實施例2提供的一種篩選用戶特征的方法的具體實現流程示意圖;圖3為本申請實施例3提供的一種篩選用戶特征的方法的具體實現流程示意圖;圖4為本申請實施例4提供的一種篩選用戶特征的裝置的具體結構示意圖。具體實施方式為使本申請的目的、技術方案和優點更加清楚,下面將結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。以下結合附圖,詳細說明本申請各實施例提供的技術方案。實施例1實施例1提供了一種篩選用戶特征的方法,用于解決現有技術只能通過人工干預的方式來完成對用戶特征的篩選,導致用戶特征的篩選效率低的問題。該方法的具體流程示意圖如圖1所示,包括下述步驟:步驟11:提取用戶特征集合。所述用戶特征集合至少包含兩個用戶特征,用戶特征是用戶各屬性抽象的結果,這些屬性可以包括年齡、性別、收入等。由于用戶特征提取之后用于建立數學模型,所以提取的用戶特征集合包含的用戶特征可以根據所要建立的模型來確定,例如當建立評估用戶信用的模型時,該用戶特征集合包含的用戶特征至少有用戶年齡、用戶收入等一般來說,在提取用戶特征集合前先建立用戶數據庫,然后從用戶數據庫中提取用戶特征集合,不過本申請并不限于這種方式提取用戶特征集合,也可以是問卷調查等形式提取用戶特征集合,甚至也可以任意的方式選取用戶特征集合,提取用戶特征集合的方式并不會影響本申請的技術效果。但是,在實際應用中,如果提取用戶特征集合的目的最終是用于建立數學模型,用以評估用戶行為,用戶特征集合中包含的用戶特征可以從用戶數據庫中本文檔來自技高網...
    一種篩選用戶特征的方法及裝置

    【技術保護點】
    一種篩選用戶特征的方法,其特征在于,包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。

    【技術特征摘要】
    1.一種篩選用戶特征的方法,其特征在于,包括:提取用戶特征集合,所述用戶特征集合至少包含兩個用戶特征;針對所述用戶特征集合中的每一個用戶特征,以所述用戶特征為因變量,所述用戶特征集合中所述用戶特征之外的其它用戶特征為自變量,確定所述用戶特征的關聯因子;將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選。2.如權利要求1所述的方法,其特征在于,所述將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,根據對比的結果對用戶特征進行篩選具體包括:將用戶特征集合中每一個用戶特征的關聯因子分別和預設閾值對比,篩選出所述用戶特征集合中關聯因子大于預設閾值的用戶特征子集合。3.如權利要求2所述的方法,其特征在于,當篩選出的用戶特征子集合中至少包含兩個用戶特征時,所述方法還包括:通過用戶特征子集合中每一個用戶特征的標準差以及用戶特征子集合中用戶特征兩兩之間的協方差,確定用戶特征子集合中用戶特征兩兩之間的相關系數;將所確定的每一個相關系數取絕對值并分別與預設變量對比,當所述相關系數的絕對值大于所述預設變量時,將所述相關系數以及所述相關系數對應的兩個用戶特征構建為關聯組;通過所構建的各個關聯組,確定構建各個關聯組的用戶特征的特征相關分;根據所述特征相關分,篩選出至少一個用戶特征。4.如權利要求3所述的方法,其特征在于,當特征相關分越高表示相關關系越強時,所述根據所述特征相關分,篩選出至少一個用戶特征具體包括:提取最高特征相關分所對應的用戶特征,并將所述用戶特征構建篩選集合;根據特征相關分從高到低的順序,針對構建各個關聯組的每一個用戶特征依次執行如下操作:獲取所述用戶特征和所述篩選集合中的每一個用戶特征之間的相關系數;判斷所獲取的各相關系數的絕對值是否均小于第二閾值,若是,則...

    【專利技術屬性】
    技術研發人員:杜瑋張柯,李文鵬,李屾,姜曉燕王曉光謝樹坤,俞吳杰,朱訓,
    申請(專利權)人:阿里巴巴集團控股有限公司
    類型:發明
    國別省市:開曼群島,KY

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 伊人久久大香线蕉无码| 亚洲欧洲免费无码| 免费看无码特级毛片| 国产精品毛片无码| 久久亚洲精品成人av无码网站| 国产精品无码一区二区三区毛片| 激情无码人妻又粗又大| 无码h黄动漫在线播放网站| 国产色无码精品视频国产| 无码人妻AV一二区二区三区| 无码免费午夜福利片在线| 久久老子午夜精品无码怎么打| 亚洲AV无码成人精品区日韩 | 无码尹人久久相蕉无码| 国产乱子伦精品无码码专区| 亚洲AV无码精品国产成人| 亚洲AV成人无码久久精品老人| 日韩精品无码久久一区二区三 | 无码专区6080yy国产电影| 97性无码区免费| 亚洲AV无码一区二区乱子伦| av无码人妻一区二区三区牛牛| 无码国产69精品久久久久孕妇| 亚洲一区二区三区无码国产| 久久久久久无码Av成人影院| 亚洲AV日韩AV永久无码久久| 久久无码无码久久综合综合| 国产丝袜无码一区二区三区视频 | AV无码精品一区二区三区宅噜噜| 亚洲AV无码成人网站在线观看 | 人妻丰满熟妇aⅴ无码| 亚洲人成无码网WWW| 无码不卡亚洲成?人片| 免费无遮挡无码视频在线观看| 麻豆精品无码国产在线果冻| 亚洲精品久久无码av片俺去也| 中文字幕无码免费久久99| 久久无码高潮喷水| 亚洲成a∧人片在线观看无码| 亚洲精品无码专区| 麻豆亚洲AV成人无码久久精品|