• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    微博用戶興趣推理方法及裝置制造方法及圖紙

    技術(shù)編號:13306765 閱讀:59 留言:0更新日期:2016-07-10 02:03
    本發(fā)明專利技術(shù)提出了一種建立微博用戶興趣推理模型的方法,包括興趣標(biāo)簽的模型計(jì)算、微博文本內(nèi)容提取興趣模型和博主社交關(guān)系提取博主興趣點(diǎn)模型,通過模型融合策略將三個(gè)模型融合在一起,即成為最終的微博用戶興趣推理模型。本發(fā)明專利技術(shù)的方法將個(gè)人信息、微博內(nèi)容和社交關(guān)系相結(jié)合,針對微博內(nèi)容稀疏性問題,采用將同一個(gè)博主的所有微博進(jìn)行混合的USER策略,利用LDA發(fā)掘微博隱主題,基于博主關(guān)注形成的網(wǎng)絡(luò)提出了社會化標(biāo)簽傳播算法,計(jì)算各種興趣標(biāo)簽對博主的影響力。本發(fā)明專利技術(shù)的方法具備很好的識別能力和信息過濾能力,在推薦之前過濾掉虛假的消息,識別出虛假博主,這樣即可提高了推薦系統(tǒng)推薦的質(zhì)量和準(zhǔn)確率,也給博主帶來更好的體驗(yàn)。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)屬于互聯(lián)網(wǎng)通信
    ,具體涉及一種建立微博用戶興趣推理模型的方法及裝置。
    技術(shù)介紹
    在微博普及的同時(shí),基于微博的各種應(yīng)用也應(yīng)允而生,其中,針對博主的個(gè)性化推薦技術(shù)獲得了很多的關(guān)注,其中關(guān)于微博的個(gè)性化推薦的學(xué)術(shù)研究也開始出現(xiàn),例如基于地理位置信息的好友推薦、基于相同Tag信息的好友推薦、基于共同關(guān)注的好友推薦、基于話題熱度的微博話題推薦等,然而這些個(gè)性化推薦技術(shù)通常只考慮了博主的某部分相對片面的信息,卻忽略了一個(gè)重要的目的,推薦的賬號或話題是否能被博主接受,是其想要的、真正感興趣的。傳統(tǒng)的基于協(xié)同過濾的個(gè)性化推薦算法,根據(jù)博主之間的近似程度來選擇推薦物品,這種方式雖然能夠較好地完成各種推薦,然而這種忽略個(gè)體間差異性尋求共性的推薦方法,只能覆蓋部分博主或博主的部分興趣,不能完整的刻畫博主的興趣,如一些商業(yè)化的應(yīng)用案例中,推薦系統(tǒng)只能向同類的賬戶推送相同的產(chǎn)品。這種只需考慮博主對商品的潛在購買欲或?qū)σ徊侩娪捌谕^看指數(shù)的推薦算法,并不適合所有的系統(tǒng),在微博中尤為如此。微博中信息繁雜,博主的興趣愛好廣泛,博主的相似性計(jì)算起來很復(fù)雜,且相似性如何衡量也是一個(gè)待探究問題。如能將博主興趣點(diǎn)概括成一個(gè)興趣模型,通過衡量模型間的相似程度來尋找有相同愛好的博主,并用于微博的個(gè)性化服務(wù)中,預(yù)計(jì)將是一個(gè)有效的思路。而其中的一個(gè)核心問題是如何對博主的興趣進(jìn)行建模,建模后的模型精確度對今后的推薦有很大影響。如何提高模型的精確性,全面詳盡的展示博主興趣點(diǎn)所在,是具有直接研究價(jià)值的。另外,微博中的個(gè)性化服務(wù)面臨著微博高速發(fā)展所帶來的其它挑戰(zhàn)。博主增長迅速,總體擁有海量的數(shù)據(jù),各式各樣的信息參差不齊,許多虛假信息、虛假賬號混雜其中,若推薦系統(tǒng)不加區(qū)分的進(jìn)行信息推薦,勢必會影響正常博主的使用,帶來不好的博主體驗(yàn)。顯然,推薦系統(tǒng)必須要具備很好的識別能力和信息過濾能力,在推薦之前過濾掉虛假的消息,識別出虛假博主,這樣即可提高了推薦系統(tǒng)推薦的質(zhì)量和準(zhǔn)確率,也給博主帶來更好的體驗(yàn),因此,如何能準(zhǔn)確地識別出虛假博主,也具有實(shí)際的研究意義。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)具體通過如下技術(shù)方案實(shí)現(xiàn):一種建立微博用戶興趣推理模型的方法,包括:(1)用戶個(gè)人標(biāo)簽的獲取與計(jì)算,(2)用戶微博內(nèi)容的興趣關(guān)鍵詞提取,(3)提取基于社會化網(wǎng)絡(luò)的興趣標(biāo)簽,最后對上述三個(gè)方面的興趣特征進(jìn)行融合,建立用戶的興趣模型:M=αMtags+βMcontent+γMrelation其中0≤α,β,γ≤1,且α+β+γ=1,Mtags是博主的標(biāo)簽通過計(jì)算得到的博主興趣點(diǎn)模型,Mcontent是博主微博的內(nèi)容提取出來的興趣關(guān)鍵詞,Mrelation是基于博主的關(guān)注列表提取的博主興趣點(diǎn)模型;Mtags的模型計(jì)算主要是提取當(dāng)前博主的Tags標(biāo)簽,并利用標(biāo)簽自帶的權(quán)重值進(jìn)行歸一化處理;Mcontent的提取關(guān)鍵詞的計(jì)算包括:微博文本的預(yù)處理,分詞、同義詞計(jì)算進(jìn)行話題分類,微博內(nèi)容聚類擴(kuò)展,關(guān)鍵詞提取以及權(quán)重計(jì)算;Mrelation采用標(biāo)簽傳播算法計(jì)算,所述標(biāo)簽傳播算法是利用已標(biāo)注好的節(jié)點(diǎn)標(biāo)簽信息去評測尚未標(biāo)記節(jié)點(diǎn)的標(biāo)簽信息。附圖說明圖1是本專利技術(shù)的微博用戶興趣模型構(gòu)建框架圖;圖2是微博文本預(yù)處理流程圖;圖3是博主興趣點(diǎn)標(biāo)簽傳播示意圖;圖4是Ebbinghaus遺忘曲線圖。具體實(shí)施方式下面結(jié)合附圖說明及具體實(shí)施方式對本專利技術(shù)進(jìn)一步說明。在微博中,博主發(fā)布或者評論的微博可以體現(xiàn)個(gè)人興趣愛好,博主發(fā)表一些原創(chuàng)新的微博用于記錄個(gè)人的喜好,博主處于獲取某種信息的目的去關(guān)注一個(gè)賬號,博主貼標(biāo)簽也是根據(jù)個(gè)人的喜好給自己標(biāo)注,所有這些博主的行為都能體現(xiàn)博主的興趣所在。因此,博主的標(biāo)簽信息,博主關(guān)注以及博主發(fā)表、轉(zhuǎn)發(fā)、評論的微博都能體現(xiàn)博主興趣點(diǎn)。但微博文本字?jǐn)?shù)很短,每條微博文本字?jǐn)?shù)都少于140個(gè)字,另外有的博主發(fā)表或者轉(zhuǎn)發(fā)的微博并不多,微博中的內(nèi)容涉及的信息太多太雜,有很多日常口語;博主標(biāo)簽雖然能夠反映博主興趣點(diǎn),但博主可以自己貼一些可能自己隨意貼一些和自己興趣無關(guān)的標(biāo)簽,或者根本沒有貼標(biāo)簽;博主關(guān)注博主要么是這兩個(gè)博主在現(xiàn)實(shí)社會中存在著某種關(guān)系而將社會關(guān)系網(wǎng)絡(luò)化,要么是想從被關(guān)注者那里獲得有用的信息,但也不能排除一些博主可能為了刷粉絲數(shù)量去隨機(jī)關(guān)注一些博主希望得到回粉。上述這三種情況可能會對博主興趣點(diǎn)建模造成一定的影響,為了消除或降低這三種情況出現(xiàn)時(shí)對模型精度的影響,需要采用一種加權(quán)融合的信息整合建模策略。因此,本專利技術(shù)的微博用戶興趣推理模型建模總體上分為三個(gè)部分,如附圖1所示,即興趣標(biāo)簽的模型計(jì)算、微博文本內(nèi)容提取興趣模型和博主社交關(guān)系提取博主興趣點(diǎn)模型,先分別計(jì)算每個(gè)模型,然后通過模型融合策略將三個(gè)模型融合在一起,即成為最終的微博用戶興趣推理模型。Keywords和WeightedKeywords表示法是用一組詞語來描述博主興趣點(diǎn),具體形式為:M={體育,游戲,音樂,電影本文檔來自技高網(wǎng)
    ...

    【技術(shù)保護(hù)點(diǎn)】
    一種建立微博用戶興趣推理模型的方法,其特征在于:所述方法包括(1)用戶個(gè)人標(biāo)簽的獲取與計(jì)算,(2)用戶微博內(nèi)容的興趣關(guān)鍵詞提取,(3)提取基于社會化網(wǎng)絡(luò)的興趣標(biāo)簽,最后對上述三個(gè)方面的興趣特征進(jìn)行融合,建立用戶的興趣模型:M=αMtags+βMcontent+γMrelation其中0≤α,β,γ≤1,且α+β+γ=1,Mtags是博主的標(biāo)簽通過計(jì)算得到的博主興趣點(diǎn)模型,Mcontent是博主微博的內(nèi)容提取出來的興趣關(guān)鍵詞,Mrelation是基于博主的關(guān)注列表提取的博主興趣點(diǎn)模型;Mtags的模型計(jì)算主要是提取當(dāng)前博主的Tags標(biāo)簽,并利用標(biāo)簽自帶的權(quán)重值進(jìn)行歸一化處理;Mcontent的提取關(guān)鍵詞的計(jì)算包括:微博文本的預(yù)處理,分詞、同義詞計(jì)算進(jìn)行話題分類,微博內(nèi)容擴(kuò)充,關(guān)鍵詞提取以及權(quán)重計(jì)算;Mrelation采用標(biāo)簽傳播算法計(jì)算,所述標(biāo)簽傳播算法是利用已標(biāo)注好的節(jié)點(diǎn)標(biāo)簽信息去評測尚未標(biāo)記節(jié)點(diǎn)的標(biāo)簽信息。

    【技術(shù)特征摘要】
    1.一種建立微博用戶興趣推理模型的方法,其特征在于:所述方法包括(1)
    用戶個(gè)人標(biāo)簽的獲取與計(jì)算,(2)用戶微博內(nèi)容的興趣關(guān)鍵詞提取,(3)
    提取基于社會化網(wǎng)絡(luò)的興趣標(biāo)簽,最后對上述三個(gè)方面的興趣特征進(jìn)行
    融合,建立用戶的興趣模型:
    M=αMtags+βMcontent+γMrelation其中0≤α,β,γ≤1,且α+β+γ=1,Mtags是博主的標(biāo)簽通過計(jì)算得到的
    博主興趣點(diǎn)模型,Mcontent是博主微博的內(nèi)容提取出來的興趣關(guān)鍵詞,
    Mrelation是基于博主的關(guān)注列表提取的博主興趣點(diǎn)模型;Mtags的模型計(jì)
    算主要是提取當(dāng)前博主的Tags標(biāo)簽,并利用標(biāo)簽自帶的權(quán)重值進(jìn)行歸
    一化處理;Mcontent的提取關(guān)鍵詞的計(jì)算包括:微博文本的預(yù)處理,分
    詞、同義詞計(jì)算進(jìn)行話題分類,微博內(nèi)容擴(kuò)充,關(guān)鍵詞提取以及權(quán)重計(jì)
    算;Mrelation采用標(biāo)簽傳播算法計(jì)算,所述標(biāo)簽傳播算法是利用已標(biāo)注
    好的節(jié)點(diǎn)標(biāo)簽信息去評測尚未標(biāo)記節(jié)點(diǎn)的標(biāo)簽信息。
    2.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述微博內(nèi)容擴(kuò)充分為兩種
    方式:一是對該用戶的微博進(jìn)行分類聚類處理,從微博平臺收集具有相
    同話題或相似話題的微博歸為博主的微博數(shù)據(jù)文本數(shù)據(jù)集中;二是利用
    WBUserRank算法尋找與當(dāng)前博主關(guān)系最為密切的那些博主的部分微博
    混合集作為當(dāng)前博主的微博文本集。
    3.根據(jù)權(quán)利要求1所述的方法,其特征在于:對融合后的主題模型的關(guān)鍵
    詞提取,采用計(jì)算主題內(nèi)關(guān)鍵詞的相似性的方法,選取權(quán)重較大的有代
    表性的詞作為關(guān)鍵詞。
    4.根據(jù)權(quán)利要求1所述的方法,其特征在于:博主A經(jīng)過標(biāo)簽傳播算法
    可以表示成:
    M A = Σ i = 1 n M A i × W B U R ( ...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:王岢徐曉飛葉允明李小宜劉廣建
    申請(專利權(quán))人:哈爾濱工業(yè)大學(xué)深圳研究生院
    類型:發(fā)明
    國別省市:廣東;44

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文字幕无码爆乳AV| 无码国模国产在线观看免费| 少妇爆乳无码专区| 国产精品午夜无码体验区| 亚洲大尺度无码无码专线一区 | 亚洲中文字幕无码爆乳| 亚洲精品久久无码av片俺去也| 麻豆人妻少妇精品无码专区| 久久久久无码精品| 亚洲AV无码成人网站在线观看| 亚洲AV无码精品色午夜在线观看| 亚洲的天堂av无码| 国产aⅴ激情无码久久| 国产在线精品无码二区二区| 无码日韩人妻精品久久蜜桃| 无码一区二区三区在线| 中文无码制服丝袜人妻av| 欧洲精品无码成人久久久| 无码av免费一区二区三区| 亚洲啪啪AV无码片| 国产精品无码素人福利免费 | 无码AV天堂一区二区三区| 免费无码作爱视频| 国产AV无码专区亚洲AV琪琪| 亚洲成无码人在线观看| 国产日韩精品中文字无码| 精品人妻系列无码人妻免费视频 | 国产怡春院无码一区二区 | 无码av免费毛片一区二区| 亚洲AV无码专区电影在线观看 | 亚洲精品无码乱码成人| 一本色道无码道在线| 一本天堂ⅴ无码亚洲道久久| 久久精品亚洲中文字幕无码网站| 久久久久亚洲AV无码专区桃色 | 午夜福利无码不卡在线观看| 亚洲色无码专区在线观看| 亚洲综合无码精品一区二区三区| 国产日产欧洲无码视频无遮挡 | 成人免费午夜无码视频| 麻豆亚洲AV永久无码精品久久|