本發(fā)明專利技術(shù)提供了一種用戶行為預(yù)測(cè)方法及裝置,涉及數(shù)據(jù)分析技術(shù)領(lǐng)域。方法包括:對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,其中,第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合分別對(duì)應(yīng)不同的用戶行為,優(yōu)化數(shù)據(jù)集合包括顯性數(shù)據(jù)以及隱性數(shù)據(jù);根據(jù)擬合閾值剔除優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,其中,擬合閾值是根據(jù)顯性數(shù)據(jù)以及隱性數(shù)據(jù)確定的;通過預(yù)先訓(xùn)練完成的行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,其中,目標(biāo)用戶為第二數(shù)據(jù)集合對(duì)應(yīng)的至少一個(gè)用戶。因此,本發(fā)明專利技術(shù)能夠解決現(xiàn)有技術(shù)中的現(xiàn)有聚類分析以及分析算法,用戶行為的分析結(jié)果準(zhǔn)確率低,無法準(zhǔn)確預(yù)測(cè)用戶行為轉(zhuǎn)化率的問題。率的問題。率的問題。
【技術(shù)實(shí)現(xiàn)步驟摘要】
用戶行為預(yù)測(cè)方法及裝置
[0001]本專利技術(shù)涉及數(shù)據(jù)分析
,尤其涉及一種用戶行為預(yù)測(cè)方法及裝置。
技術(shù)介紹
[0002]近年來,隨著大數(shù)據(jù)的興起,消費(fèi)者行為分析的研究方興未艾,數(shù)據(jù)庫與數(shù)據(jù)挖掘、信息系統(tǒng)與信息管理、圖像處理與計(jì)算機(jī)視覺、社會(huì)網(wǎng)絡(luò)分析、電子商務(wù)等很多領(lǐng)域的學(xué)者加人消費(fèi)者行為研究的隊(duì)伍。同時(shí),消費(fèi)者行為分析這一研究領(lǐng)域也受到了電子商務(wù)、社交網(wǎng)絡(luò)等數(shù)字經(jīng)濟(jì)形態(tài)下的企業(yè)的高度關(guān)注,消費(fèi)者行為分析被視為數(shù)字經(jīng)濟(jì)形態(tài)下企業(yè)了解其消費(fèi)者并開展?fàn)I銷活動(dòng)的有效手段之。
[0003]在聚類分析的實(shí)際應(yīng)用中,針對(duì)分類結(jié)果的評(píng)估也有很多的維度和指標(biāo)。但是,從數(shù)據(jù)化運(yùn)營(yíng)的實(shí)踐經(jīng)驗(yàn)來看,任何模型的數(shù)據(jù)評(píng)估,包括聚類分析的數(shù)據(jù)評(píng)估既要考慮統(tǒng)計(jì)學(xué)意義上的指標(biāo)、維度,同時(shí)更要關(guān)注其實(shí)踐效果上的價(jià)值及業(yè)務(wù)背景下的價(jià)值。尤具聚類項(xiàng)目來說,跟分類(預(yù)測(cè))項(xiàng)目的一個(gè)顯著不同之處在于,分類(預(yù)測(cè))項(xiàng)目的評(píng)判有訓(xùn)練集、驗(yàn)證集、測(cè)試集的客觀參照,而對(duì)于聚類結(jié)果的評(píng)判來說,一個(gè)對(duì)象分配到A類與分配到B類,中間并沒有太明確、太客觀的參照依據(jù)。
[0004]鑒于此,聚類結(jié)果的評(píng)判常常更加復(fù)雜和困難。
技術(shù)實(shí)現(xiàn)思路
[0005]本專利技術(shù)實(shí)施例提供一種用戶行為預(yù)測(cè)方法及裝置,以解決現(xiàn)有技術(shù)中的現(xiàn)有聚類分析以及分析算法,用戶行為的分析結(jié)果準(zhǔn)確率低,無法準(zhǔn)確預(yù)測(cè)用戶行為轉(zhuǎn)化率的問題。
[0006]為了解決上述技術(shù)問題,本專利技術(shù)是這樣實(shí)現(xiàn)的:
[0007]第一方面,本專利技術(shù)實(shí)施例提供了一種用戶行為預(yù)測(cè)方法,所述方法包括:對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,其中,所述第一數(shù)據(jù)集合以及所述第二數(shù)據(jù)集合分別對(duì)應(yīng)不同的用戶行為,所述優(yōu)化數(shù)據(jù)集合包括顯性數(shù)據(jù)以及隱性數(shù)據(jù);根據(jù)擬合閾值剔除所述優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,其中,所述擬合閾值是根據(jù)所述顯性數(shù)據(jù)以及所述隱性數(shù)據(jù)確定的;通過預(yù)先訓(xùn)練完成的行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)所述第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,其中,所述目標(biāo)用戶為所述第二數(shù)據(jù)集合對(duì)應(yīng)的至少一個(gè)用戶。
[0008]進(jìn)一步地,所述對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,包括:根據(jù)行為數(shù)據(jù)對(duì)所述第一數(shù)據(jù)集合以及所述第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到所述優(yōu)化數(shù)據(jù)集合,所述行為數(shù)據(jù)包括至少一種網(wǎng)絡(luò)行為特征。
[0009]進(jìn)一步地,所述顯性數(shù)據(jù)對(duì)應(yīng)的網(wǎng)絡(luò)行為包括以下之一:用戶評(píng)論、用戶評(píng)分;所述隱性數(shù)據(jù)對(duì)應(yīng)的網(wǎng)絡(luò)行為包括以下之一:點(diǎn)擊行為、購買行為以及搜索行為。
[0010]進(jìn)一步地,所述根據(jù)擬合閾值剔除所述優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,包括:通過預(yù)先訓(xùn)練完成的擬合值計(jì)算模型,根據(jù)所述顯性數(shù)據(jù)以及所述隱性數(shù)據(jù)確定所述擬合閾值;根據(jù)所述擬合閾值確定所述過擬合數(shù)據(jù);剔除所述優(yōu)化數(shù)據(jù)集合
中的所述過擬合數(shù)據(jù),以得到所述第三數(shù)據(jù)集合。
[0011]進(jìn)一步地,所述通過預(yù)先訓(xùn)練完成的行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)所述第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,包括:將所述第三數(shù)據(jù)集合輸入至所述行為轉(zhuǎn)化預(yù)測(cè)模型,其中,所述行為轉(zhuǎn)化預(yù)測(cè)模型是根據(jù)貝葉斯算法構(gòu)建的;根據(jù)所述第三數(shù)據(jù)集合中目標(biāo)用戶的行為數(shù)據(jù),確定所述用戶行為轉(zhuǎn)化率。
[0012]進(jìn)一步地,所述方法還包括:向用戶行為轉(zhuǎn)化率大于預(yù)設(shè)轉(zhuǎn)化率閾值的意向用戶的終端設(shè)備,發(fā)送預(yù)設(shè)推送信息。
[0013]第二方面,本專利技術(shù)實(shí)施例還提供了一種用戶行為預(yù)測(cè)裝置,所述裝置包括:分析模塊,用于對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,其中,所述第一數(shù)據(jù)集合以及所述第二數(shù)據(jù)集合分別對(duì)應(yīng)不同的用戶行為,所述優(yōu)化數(shù)據(jù)集合包括顯性數(shù)據(jù)以及隱性數(shù)據(jù);處理模塊,用于根據(jù)擬合閾值剔除所述優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,其中,所述擬合閾值是根據(jù)所述顯性數(shù)據(jù)以及所述隱性數(shù)據(jù)確定的;確定模塊,用于通過預(yù)先訓(xùn)練完成的行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)所述第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,其中,所述目標(biāo)用戶為所述第二數(shù)據(jù)集合對(duì)應(yīng)的至少一個(gè)用戶。
[0014]進(jìn)一步地,所述分析模塊包括:分析子模塊,用于根據(jù)行為數(shù)據(jù)對(duì)所述第一數(shù)據(jù)集合以及所述第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到所述優(yōu)化數(shù)據(jù)集合,所述行為數(shù)據(jù)包括至少一種網(wǎng)絡(luò)行為特征。
[0015]進(jìn)一步地,所述顯性數(shù)據(jù)對(duì)應(yīng)的網(wǎng)絡(luò)行為包括以下之一:用戶評(píng)論、用戶評(píng)分;所述隱性數(shù)據(jù)對(duì)應(yīng)的網(wǎng)絡(luò)行為包括以下之一:點(diǎn)擊行為、購買行為以及搜索行為。
[0016]進(jìn)一步地,所述處理模塊包括:第一確定子模塊,用于通過預(yù)先訓(xùn)練完成的擬合值計(jì)算模型,根據(jù)所述顯性數(shù)據(jù)以及所述隱性數(shù)據(jù)確定所述擬合閾值;第二確定子模塊,用于根據(jù)所述擬合閾值確定所述過擬合數(shù)據(jù);處理子模塊,用于剔除所述優(yōu)化數(shù)據(jù)集合中的所述過擬合數(shù)據(jù),以得到所述第三數(shù)據(jù)集合。
[0017]進(jìn)一步地,所述確定模塊包括:輸入子模塊,用于將所述第三數(shù)據(jù)集合輸入至所述行為轉(zhuǎn)化預(yù)測(cè)模型,其中,所述行為轉(zhuǎn)化預(yù)測(cè)模型是根據(jù)貝葉斯算法構(gòu)建的;第三確定子模塊,用于根據(jù)所述第三數(shù)據(jù)集合中目標(biāo)用戶的行為數(shù)據(jù),確定所述用戶行為轉(zhuǎn)化率。
[0018]進(jìn)一步地,所述裝置還包括:發(fā)送模塊,向用戶行為轉(zhuǎn)化率大于預(yù)設(shè)概率閾值的意向用戶的終端設(shè)備,發(fā)送預(yù)設(shè)推送信息。
[0019]第三方面,本專利技術(shù)實(shí)施例另外提供了一種電子設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如前第一方面所述的用戶行為預(yù)測(cè)方法的步驟。
[0020]第四方面,本專利技術(shù)實(shí)施例另外提供了一種可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如前第一方面所述的用戶行為預(yù)測(cè)方法的步驟。
[0021]在本專利技術(shù)實(shí)施例中,對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,其中,第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合分別對(duì)應(yīng)不同的用戶行為,優(yōu)化數(shù)據(jù)集合包括顯性數(shù)據(jù)以及隱性數(shù)據(jù);根據(jù)擬合閾值剔除優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,其中,擬合閾值是根據(jù)顯性數(shù)據(jù)以及隱性數(shù)據(jù)確定的;通過預(yù)先訓(xùn)練完成的
行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,其中,目標(biāo)用戶為第二數(shù)據(jù)集合對(duì)應(yīng)的至少一個(gè)用戶。本實(shí)施例中對(duì)分別對(duì)應(yīng)不同用戶行為的第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到共同網(wǎng)絡(luò)行為的優(yōu)化數(shù)據(jù)集合,然后根據(jù)擬合閾值剔除優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以降低顯性數(shù)據(jù)與隱性數(shù)據(jù)的差異化,最后通過行為轉(zhuǎn)化模型對(duì)第三數(shù)據(jù)集合進(jìn)行預(yù)測(cè),保證了預(yù)測(cè)得到用戶行為轉(zhuǎn)化率的準(zhǔn)確性。本專利技術(shù)解決了現(xiàn)有技術(shù)中的現(xiàn)有聚類分析以及分析算法,用戶行為的分析結(jié)果準(zhǔn)確率低,無法準(zhǔn)確預(yù)測(cè)用戶行為轉(zhuǎn)化率的問題。
[0022]上述說明僅是本專利技術(shù)技術(shù)方案的概述,為了能夠更清楚了解本專利技術(shù)的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本專利技術(shù)的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本專利技術(shù)的具體實(shí)施方式。
附圖說本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種用戶行為預(yù)測(cè)確定方法,其特征在于,所述方法包括:對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,其中,所述第一數(shù)據(jù)集合以及所述第二數(shù)據(jù)集合分別對(duì)應(yīng)不同的用戶行為,所述優(yōu)化數(shù)據(jù)集合包括顯性數(shù)據(jù)以及隱性數(shù)據(jù);根據(jù)擬合閾值剔除所述優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,其中,所述擬合閾值是根據(jù)所述顯性數(shù)據(jù)以及所述隱性數(shù)據(jù)確定的;通過預(yù)先訓(xùn)練完成的行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)所述第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,其中,所述目標(biāo)用戶為所述第二數(shù)據(jù)集合對(duì)應(yīng)的至少一個(gè)用戶。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)第一數(shù)據(jù)集合以及第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到優(yōu)化數(shù)據(jù)集合,包括:根據(jù)行為數(shù)據(jù)對(duì)所述第一數(shù)據(jù)集合以及所述第二數(shù)據(jù)集合進(jìn)行聚類分析,以得到所述優(yōu)化數(shù)據(jù)集合,所述行為數(shù)據(jù)包括至少一種網(wǎng)絡(luò)行為特征。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述顯性數(shù)據(jù)對(duì)應(yīng)的網(wǎng)絡(luò)行為包括以下之一:用戶評(píng)論、用戶評(píng)分;所述隱性數(shù)據(jù)對(duì)應(yīng)的網(wǎng)絡(luò)行為包括以下之一:點(diǎn)擊行為、購買行為以及搜索行為。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)擬合閾值剔除所述優(yōu)化數(shù)據(jù)集合中的過擬合數(shù)據(jù),以得到第三數(shù)據(jù)集合,包括:通過預(yù)先訓(xùn)練完成的擬合值計(jì)算模型,根據(jù)所述顯性數(shù)據(jù)以及所述隱性數(shù)據(jù)確定所述擬合閾值;根據(jù)所述擬合閾值確定所述過擬合數(shù)據(jù);剔除所述優(yōu)化數(shù)據(jù)集合中的所述過擬合數(shù)據(jù),以得到所述第三數(shù)據(jù)集合。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過預(yù)先訓(xùn)練完成的行為轉(zhuǎn)化預(yù)測(cè)模型,根據(jù)所述第三數(shù)據(jù)集合確定目標(biāo)用戶的用戶行為轉(zhuǎn)化率,包括:將所述第三數(shù)據(jù)集合輸入至所述行為轉(zhuǎn)化預(yù)測(cè)模型,其中,所述行為轉(zhuǎn)化預(yù)測(cè)模型是根據(jù)貝葉斯算法構(gòu)建的;根據(jù)所述第三數(shù)據(jù)集合中目標(biāo)用戶的行為數(shù)據(jù),確定所述用戶行為轉(zhuǎn)化率。6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:向用戶行為轉(zhuǎn)化率大于預(yù)設(shè)轉(zhuǎn)化率閾...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:槐正,徐冬冬,姜承祥,付迎鑫,崔明,徐銳,王健,魏丫丫,徐蕾,
申請(qǐng)(專利權(quán))人:中國電信股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。