The invention discloses a subject detection method and device, the method comprises: acquiring the target medium detection; the target medium is the subject used medium; access to every target medium pre training medium score; medium according to the score of each of the target medium, whether the subject is detected the main target; the medium fraction of each target medium according to the following training methods: obtaining pre generated training data carry labels; the labels used to identify the use of the target medium target subject and non subject; for each target medium, calculate the training data using the target medium target the main non target number and the number of main types; medium to obtain the target medium; according to the target number, the main body of non target number And the media type, calculates the dielectric fraction of the target medium obtained. The embodiment of the present invention improves the accuracy of the subject detection.
【技術(shù)實(shí)現(xiàn)步驟摘要】
主體檢測方法及裝置
本申請屬于信息處理
,具體地說,涉及一種主體檢測方法及裝置。
技術(shù)介紹
主體是指自然人、自然人形成的群體或者自然人在網(wǎng)絡(luò)中對應(yīng)的一個帳號。在很多業(yè)務(wù)場景中,存在從一群主體中發(fā)現(xiàn)特殊主體的需求,也即,需要對主體進(jìn)行檢測,以檢測出滿足一定條件的目標(biāo)主體。例如在一群用戶中尋找哪些用戶更有可能購買本公司生產(chǎn)的產(chǎn)品或服務(wù)。再比如,在數(shù)億人中尋找有實(shí)施恐怖襲擊風(fēng)險的人;又如,從大量支付賬號中尋找存在風(fēng)險的支付賬號等。對主體的檢測是依據(jù)主體使用的介質(zhì)進(jìn)行的,主體使用的介質(zhì)可以包括不同的介質(zhì)類型,如主體的屬性,也即年齡、職業(yè)、收入、所在地等,主體的行為如從搜索引擎跳轉(zhuǎn)到商品頁面的瀏覽行為、在非安全環(huán)境修改密碼的行為等特征。現(xiàn)有技術(shù)中,對主體的檢測,通常是判斷主體是否使用了滿足目標(biāo)條件的介質(zhì),如果是,則可以確定主體為目標(biāo)主體。但是,由于一個主體通常具有多個介質(zhì),且不同介質(zhì)類型的介質(zhì)對主體的影響也是不同的,因此現(xiàn)有技術(shù)中的主體檢測并準(zhǔn)確。
技術(shù)實(shí)現(xiàn)思路
有鑒于此,本申請所要解決的技術(shù)問題是提供了主體檢測方法及裝置,提高了主體檢測的準(zhǔn)確性。為了解決上述技術(shù)問題,本申請公開了一種主體檢測方法,獲取檢測主體使用的目標(biāo)介質(zhì);所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì);獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù);根據(jù)各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測主體是否為目標(biāo)主體;其中,所述每一目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)按照如下訓(xùn)練方式預(yù)先生成:獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù);所述標(biāo)簽用于標(biāo)識使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體;針對每一個目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非 ...
【技術(shù)保護(hù)點(diǎn)】
一種主體檢測方法,其特征在于,包括:獲取檢測主體使用的目標(biāo)介質(zhì);所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì);獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù);根據(jù)各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測主體是否為目標(biāo)主體;其中,所述每一目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)按照如下訓(xùn)練方式預(yù)先生成:獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù);所述標(biāo)簽用于標(biāo)識使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體;針對每一個目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù);獲取所述目標(biāo)介質(zhì)的介質(zhì)類型;根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。
【技術(shù)特征摘要】
1.一種主體檢測方法,其特征在于,包括:獲取檢測主體使用的目標(biāo)介質(zhì);所述目標(biāo)介質(zhì)為目標(biāo)主體使用過的介質(zhì);獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù);根據(jù)各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測主體是否為目標(biāo)主體;其中,所述每一目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)按照如下訓(xùn)練方式預(yù)先生成:獲取攜帶標(biāo)簽的訓(xùn)練數(shù)據(jù);所述標(biāo)簽用于標(biāo)識使用目標(biāo)介質(zhì)的目標(biāo)主體以及非目標(biāo)主體;針對每一個目標(biāo)介質(zhì),計(jì)算所述訓(xùn)練數(shù)據(jù)中使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù)以及非目標(biāo)主體數(shù);獲取所述目標(biāo)介質(zhì)的介質(zhì)類型;根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù),判斷所述檢測主體是否為目標(biāo)主體包括:將各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測主體的主體分?jǐn)?shù);根據(jù)所述主體分?jǐn)?shù),判斷所述檢測主體是否為目標(biāo)主體。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述獲取每一目標(biāo)介質(zhì)預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù)包括:根據(jù)每一目標(biāo)介質(zhì)使用的子介質(zhì)以及每一子介質(zhì)使用的下一級子介質(zhì),建立介質(zhì)層級樹形結(jié)構(gòu);所述目標(biāo)介質(zhì)作為分支節(jié)點(diǎn)或者葉子節(jié)點(diǎn);對于任一個分支節(jié)點(diǎn),獲取其子節(jié)點(diǎn)對應(yīng)的介質(zhì)分?jǐn)?shù),將各個子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)匯總獲得的分?jǐn)?shù)作為所述分支節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù);對于任一個葉子節(jié)點(diǎn),獲取預(yù)先訓(xùn)練獲得的介質(zhì)分?jǐn)?shù),所述葉子節(jié)點(diǎn)的介質(zhì)分?jǐn)?shù)為將所述葉子節(jié)點(diǎn)的父節(jié)點(diǎn)作為目標(biāo)主體,所述葉子節(jié)點(diǎn)作為所述目標(biāo)主體使用過的目標(biāo)介質(zhì),按照所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)的訓(xùn)練方式預(yù)先生成的。4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)為使用所述目標(biāo)介質(zhì)的主體為非目標(biāo)主體的概率;所述根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)包括:根據(jù)所述目標(biāo)主體數(shù)、所述非目標(biāo)主體數(shù)以及所述介質(zhì)類型,按照如下第一計(jì)算公式,計(jì)算獲得所述目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù);其中,A表示目標(biāo)主體,表示非目標(biāo)主體,xi表示非目標(biāo)主體使用的第i個目標(biāo)介質(zhì);m表示使用所述目標(biāo)介質(zhì)的非目標(biāo)主體數(shù);n表示使用所述目標(biāo)介質(zhì)的目標(biāo)主體數(shù);F(m,n)表示被m個非目標(biāo)主體以及n個目標(biāo)主體使用,且屬于所述介質(zhì)類型的介質(zhì)的介質(zhì)數(shù)量。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)小于第二閾值時,F(xiàn)(m,n)從所述訓(xùn)練數(shù)據(jù)中統(tǒng)計(jì)獲得;在所述非目標(biāo)主體數(shù)小于第一閾值且所述目標(biāo)主體數(shù)大于第二閾值;或者在所述非目標(biāo)主體數(shù)大于第一閾值且所述目標(biāo)主體小于第二閾值時:其中,αn以及βn分別為將F(m,n)進(jìn)行擬合獲得的斜率以及截距;所述第一計(jì)算公式具體為:在所述非目標(biāo)主體數(shù)大于第一閾值且所屬目標(biāo)主體數(shù)大于第二閾值時:F(m,n)≈1;所述第一計(jì)算公式具體為:6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,獲得所述檢測主體的主體分?jǐn)?shù)包括:將各個目標(biāo)介質(zhì)的介質(zhì)分?jǐn)?shù)進(jìn)行匯總,按照如下第二計(jì)算公式,計(jì)算獲得所述檢測主體的主體分?jǐn)?shù);其中,k表示所述檢測主體使用的目標(biāo)介質(zhì)總個數(shù);X表示所述訓(xùn)練數(shù)據(jù)中的非目標(biāo)主體數(shù),Y所述訓(xùn)練數(shù)據(jù)中的目標(biāo)主體數(shù),表示目標(biāo)介質(zhì)xi的介質(zhì)分?jǐn)?shù)。...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王萌,
申請(專利權(quán))人:阿里巴巴集團(tuán)控股有限公司,
類型:發(fā)明
國別省市:開曼群島,KY
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。