• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種確定用戶身份類別的方法及裝置制造方法及圖紙

    技術編號:15695425 閱讀:63 留言:0更新日期:2017-06-24 10:53
    本申請公開了確定用戶身份類別的方法,包括:接收用戶的數據信息,數據信息包括多個含有用戶身份信息的標記文本;將多個標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配;其中,關鍵詞詞庫中包括至少一個屬性關鍵詞及與屬性關鍵詞對應的類別;統計標記文本與類別相對應的對應次數;其中,類別對應與標記文本相匹配的屬性關鍵詞;依據用戶的標記文本與類別的對應次數,確定用戶身份類別。本申請還公開了確定用戶身份類別的裝置,包括:接收模塊、匹配模塊、統計模塊、身份類別確定模塊。數據信息中還可包括認證信息、注冊信息和/或業務信息。這就實現了對用戶相關的數據信息進行主動收集和分析處理,從而確定用戶身份類別。

    【技術實現步驟摘要】
    一種確定用戶身份類別的方法及裝置
    本申請涉及計算機信息
    ,尤其涉及一種確定用戶身份類別的方法及裝置。
    技術介紹
    許多服務提供商的業務的開展依賴于對客戶資料的收集。服務提供商收集到上述客戶的資料后,會依據客戶提供的信息為客戶提供服務。現有技術中對客戶資料的收集和處理,往往由客戶直接向服務提供商提供所需資料,提出服務需求,服務提供商依據客戶提供的資料為客戶提供服務。但這種方式的缺陷在于:資料的收集完全依賴于客戶主動,服務提供商只能被動接收,因此,服務提供商無法主動及時尋找到潛在客戶,并且由于客戶提供資料的局限性,也難以對客戶提供的資料進行統計分析。而與此同時,隨著互聯網的廣泛應用,用戶在使用互聯網的過程中,在互聯網上存儲了大量帶有用戶信息的數據。如何利用用戶留存在互聯網上的數據對用戶進行分析處理,確定用戶的類別,例如用戶的社會身份類別,從而尋找到潛在用戶,成為了亟待解決的問題。
    技術實現思路
    本申請實施例提供了一種確定用戶身份類別的方法和裝置,旨在對用戶相關的數據信息進行主動收集和分析處理,從而確定用戶身份類別。為實現上述目的,本申請實施例提供了一種確定用戶身份類別的方法,其特征在于,所述方法包括:接收用戶的數據信息,所述數據信息包括多個含有用戶身份信息的標記文本;將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配;其中,所述關鍵詞詞庫中包括至少一個屬性關鍵詞及與屬性關鍵詞對應的類別;統計所述標記文本與類別相對應的對應次數;其中,所述類別對應與所述標記文本相匹配的屬性關鍵詞;依據用戶的所述標記文本與所述類別的對應次數,確定用戶身份類別。作為優選,本申請實施例中,在接收用戶的數據信息之后,在將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配之前,還包括:對所述標記文本進行分詞,將所述標記文本切分成至少一個切分詞;將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配,包括:將所述標記文本中的所述切分詞分別與所述屬性關鍵詞進行匹配。作為優選,本申請實施例中,統計所述標記文本與類別相對應的對應次數,包括:若所述切分詞與所述屬性關鍵詞匹配,則將所述屬性關鍵詞所對應的類別與包含所述切分詞的標記文本相對應的對應次數增加一個步長單位或者計為一個步長單位;將相同的類別與用戶的各標記文本相對應的對應次數進行累加,確定用戶的標記文本與各類別相對應的對應次數。作為優選,本申請實施例中,所述數據信息還包括用戶的認證信息;依據用戶的所述標記文本與所述類別的對應次數,確定用戶身份類別,包括:對于有認證信息的已認證用戶,將與該用戶的認證信息一致的類別作為已認證類別;將所述已認證類別對應的類別,確定為有認證信息的已認證用戶的身份類別;依據所述已認證用戶的標記文本與所述已認證類別相對應的對應次數,計算無認證信息的未認證用戶的標記文本與各類別相對應的各對應次數的分布概率,記為第一概率;依據所述第一概率,確定所述未認證用戶的身份類別。作為優選,本申請實施例中,依據所述已認證用戶的標記文本與所述已認證類別相對應的對應次數,計算無認證信息的未認證用戶的標記文本與各類別相對應的各對應次數的分布概率,包括:對所述已認證類別,計算已認證用戶的標記文本與所述已認證類別相對應的條件下,各對應次數出現的條件概率,記為第二概率;對已認證用戶的標記文本與已認證類別相對應的對應次數,將不大于對應次數本數的各對應次數對應的所述第二概率進行累加,記為第三概率;依據所述第三概率,確定所述第一概率;所述第一概率與所述第三概率在所述類別和所述對應次數上一一對應。作為優選,本申請實施例中,對所述已認證類別,計算已認證用戶的標記文本與所述已認證類別相對應的條件下,各對應次數出現的條件概率,包括:對所述已認證類別,統計與所述已認證類別相對應的已認證用戶的總數,記為第一統計量;對已認證類別與已認證用戶的標記文本相對應的對應次數,統計各相同的對應次數出現的數量,記為第二統計量;對已認證類別與已認證用戶的標記文本相對應的各對應次數,分別以所述第二統計量為被除數、以所述第一統計量為除數,計算得到已認證用戶的標記文本與所述已認證類別相對應的條件下、各對應次數出現的條件概率,記為所述第二概率。作為優選,本申請實施例中,依據所述第一概率,確定所述未認證用戶的身份類別,包括:將所述未認證用戶的標記文本相對應的類別中所述第一概率最高的預設個類別對應的類別確定為所述未認證用戶的身份類別。作為優選,本申請實施例中,所述數據信息還包括用戶的注冊信息和業務信息;在依據所述已認證用戶的標記文本與所述已認證類別相對應的對應次數,計算無認證信息的未認證用戶的標記文本與各類別相對應的各對應次數的分布概率之后,還包括:將所述注冊信息和所述業務信息分別進行分類;將包含同類注冊信息和同類業務信息的未認證用戶分入同一群組中;依據未認證用戶的標記文本與各類別相對應的對應次數,將與所述對應次數相應的所述第一概率作為未認證用戶的標記文本與各類別相對應的概率;依據分入同一群組的各未認證用戶的標記文本與相同類別相對應的概率,按照預設計算規則計算得到該組用戶與各類別相對應的概率,記為第四概率;依據所述第一概率和所述第四概率,確定所述未認證用戶的身份類別。作為優選,本申請實施例中,所述預設計算規則包括:將分入同一群組的各未認證用戶的標記文本與相同類別相對應的概率進行數學平均計算或者加權平均計算。作為優選,本申請實施例中,依據所述第一概率和所述第四概率,確定所述未認證用戶的身份類別,包括:將與所述未認證用戶的標記文本相對應的各類別所對應的所述第一概率和所述第四概率相比較,將概率最高的預設個類別對應的類別作為所述未認證用戶的身份類別。作為優選,本申請實施例中,所述標記文本包括用戶的通訊錄信息和/或用戶被其他用戶標注的備注信息。作為優選,本申請實施例中,在接收用戶的數據信息之后,在將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配之前,還包括:對所述標記文本進行預處理。作為優選,本申請實施例中,所述預處理包括以下處理方式中的一種或多種的組合:將大寫字母轉化為小寫字母、將繁體字轉化為簡體字、將半角符號的字符轉化為全角符號的字符、將無效字符轉化為空格、刪除中文字符之間的空格。作為優選,本申請實施例中,所述處理方式還包括:對所述標記文本中的同義詞進行同義詞替換。本申請實施例還提供了一種確定用戶身份類別的裝置,所述裝置包括:接收模塊,接收用戶的數據信息,所述數據信息包括多個含有用戶身份信息的標記文本;匹配模塊,將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配;其中,所述關鍵詞詞庫中包括至少一個屬性關鍵詞及與屬性關鍵詞對應的類別;統計模塊,統計所述標記文本與類別相對應的對應次數;其中,所述類別對應與所述標記文本相匹配的屬性關鍵詞;身份類別確定模塊,依據用戶的所述標記文本與所述類別的對應次數,確定用戶身份類別。作為優選,本申請實施例中,所述裝置還包括:分詞模塊,對所述標記文本進行分詞,將所述標記文本切分成至少一個切分詞;所述匹配模塊包括:匹配組件,將所述標記文本中的所述切分詞分別與所述屬性關鍵詞進行匹配。作為優選,本申請實施例中,所述統計模塊包括:判斷組件,判斷所述切分詞與所述屬性關鍵詞是否匹配;計數組件本文檔來自技高網...
    一種確定用戶身份類別的方法及裝置

    【技術保護點】
    一種確定用戶身份類別的方法,其特征在于,所述方法包括:接收用戶的數據信息,所述數據信息包括多個含有用戶身份信息的標記文本;將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配;其中,所述關鍵詞詞庫中包括至少一個屬性關鍵詞及與屬性關鍵詞對應的類別;統計所述標記文本與類別相對應的對應次數;其中,所述類別對應與所述標記文本相匹配的屬性關鍵詞;依據用戶的所述標記文本與所述類別的對應次數,確定用戶身份類別。

    【技術特征摘要】
    1.一種確定用戶身份類別的方法,其特征在于,所述方法包括:接收用戶的數據信息,所述數據信息包括多個含有用戶身份信息的標記文本;將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配;其中,所述關鍵詞詞庫中包括至少一個屬性關鍵詞及與屬性關鍵詞對應的類別;統計所述標記文本與類別相對應的對應次數;其中,所述類別對應與所述標記文本相匹配的屬性關鍵詞;依據用戶的所述標記文本與所述類別的對應次數,確定用戶身份類別。2.按照權利要求1所述方法,其特征在于,在接收用戶的數據信息之后,在將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配之前,還包括:對所述標記文本進行分詞,將所述標記文本切分成至少一個切分詞;將多個所述標記文本與關鍵詞詞庫中的屬性關鍵詞進行匹配,包括:將所述標記文本中的所述切分詞分別與所述屬性關鍵詞進行匹配。3.按照權利要求2所述方法,其特征在于,統計所述標記文本與類別相對應的對應次數,包括:若所述切分詞與所述屬性關鍵詞匹配,則將所述屬性關鍵詞所對應的類別與包含所述切分詞的標記文本相對應的對應次數增加一個步長單位或者計為一個步長單位;將相同的類別與用戶的各標記文本相對應的對應次數進行累加,確定用戶的標記文本與各類別相對應的對應次數。4.按照權利要求1所述方法,其特征在于,所述數據信息還包括用戶的認證信息;依據用戶的所述標記文本與所述類別的對應次數,確定用戶身份類別,包括:對于有認證信息的已認證用戶,將與該用戶的認證信息一致的類別作為已認證類別;將所述已認證類別對應的類別,確定為有認證信息的已認證用戶的身份類別;依據所述已認證用戶的標記文本與所述已認證類別相對應的對應次數,計算無認證信息的未認證用戶的標記文本與各類別相對應的各對應次數的分布概率,記為第一概率;依據所述第一概率,確定所述未認證用戶的身份類別。5.按照權利要求4所述方法,其特征在于,依據所述已認證用戶的標記文本與所述已認證類別相對應的對應次數,計算無認證信息的未認證用戶的標記文本與各類別相對應的各對應次數的分布概率,包括:對所述已認證類別,計算已認證用戶的標記文本與所述已認證類別相對應的條件下,各對應次數出現的條件概率,記為第二概率;對已認證用戶的標記文本與已認證類別相對應的對應次數,將不大于對應次數本數的各對應次數對應的所述第二概率進行累加,記為第三概率;依據所述第三概率,確定所述第一概率;所述第一概率與所述第三概率在所述類別和所述對應次數上一一對應。6.按照權利要求5所述方法,其特征在于,對所述已認證類別,計算已認證用戶的標記文本與所述已認證類別相對應的條件下,各對應次數出現的條件概率,包括:對所述已認證類別,統計與所述已認證類別相對應的已認證用戶的總數,記為第一統計量;對已認證類別與已認證用戶的標記文本相對應的對應次數,統計各相同的對應次數出現的數量,記為第二統計量;對已認證類別與已認證用戶的標記文本相對應的各對應次數,分別以所述第二統計量為被除數、以所述第一統計量為除數,計算得到已認證用戶的標記文本與所述已認證類別相對應的條件下、各對應次數出現的條件概率,記為所述第二概率。7.按照權利要求4所述方法,其特征在于,依據所述第一概率,確定所述未認證用戶的身份類別,包括:將所述未認證用戶的標記文本相對應的類別中所述第一概率最高的預設個類別對應的類別確定為所述未認證用戶的身份類別。8.按照權利要求4所述方法,其特征在于,所述數據信息還包括用戶的注冊信息和業務信息;在依據所述已認證用戶的標記文本與所述已認證類別相對應的對應次數,計算無認證信息的未認證用戶的標記文本與各類別相對應的各對應次數的分布概率之后,還包括:將所述注冊信息和所述業務信息分別進行分類;將包含同類注冊信息和同類業務信息的未認證用戶分入同一群組中;依據未認證用戶的標記文本與各類別相對應的對應次數,將與所述對應次數相應的所述第一概率作為未認證用戶的標記文本與各類別相對應的概率;依據分入同一群組的各未認證用戶的標記文本與相同類別相對應的概率,按照預設計算規則計算得到該組用戶與各類別相對應的概率,記為第四概率;依據所述第一概率和所述第四概率,確定所述未認證用戶的身份類別。9.按照權利要求8所述方法,其特征在于,所述預設計算規則包括:將分入同一群組的各未認證用戶的標記文本與相同類別相對應的概率進行數學平均計算或者加權平均計算。10.按照權利要求8所述方法,其特征在于,依據所述第一概率和所述第四概率,確定所述未認證用戶的身份類別,包括:將與所述未認證用戶的標記文本相對應的各類別所對應的所述第一概率和所述第四概率相比較,將概率最高的預設個類別對應的類別...

    【專利技術屬性】
    技術研發人員:李輝梅煒操穎平林嘉南
    申請(專利權)人:阿里巴巴集團控股有限公司
    類型:發明
    國別省市:開曼群島,KY

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 夜夜精品无码一区二区三区 | 惠民福利中文字幕人妻无码乱精品| 亚洲Av无码精品色午夜 | 18精品久久久无码午夜福利| 蜜桃无码一区二区三区| 狼人无码精华AV午夜精品| 中文字幕无码毛片免费看| 人妻少妇看A偷人无码精品| 亚洲国产精品无码久久一线| 国产精品va无码二区| 日日摸日日碰夜夜爽无码| 一本大道无码人妻精品专区| 无码中文在线二区免费| 无套内射在线无码播放| 久久无码一区二区三区少妇| 色欲AV永久无码精品无码| 亚洲AV无码成人专区片在线观看| 无码人妻av一区二区三区蜜臀 | 无码欧精品亚洲日韩一区夜夜嗨| 日韩免费人妻AV无码专区蜜桃| 成人免费无码H在线观看不卡| 麻豆亚洲AV成人无码久久精品 | 办公室丝袜激情无码播放| 亚洲AV无码一区二区三区网址 | 亚洲AV无码一区二区三区牛牛| 国产aⅴ无码专区亚洲av麻豆| 日韩毛片无码永久免费看| 国产成年无码久久久久下载| 亚洲中文无码卡通动漫野外| 亚洲AV无码一区二区三区人| 日韩精品人妻系列无码专区| 波多野结衣AV无码久久一区| 国产精品无码DVD在线观看| 国产乱子伦精品免费无码专区| 精品少妇人妻AV无码专区不卡| 精品久久久久久无码不卡| 亚洲AV无码无限在线观看不卡 | 无码日韩精品一区二区人妻| 精品无码国产AV一区二区三区| 亚洲av永久无码精品秋霞电影秋| 亚洲大尺度无码无码专线一区 |