• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>山東大學專利>正文

    一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法技術(shù)

    技術(shù)編號:15551337 閱讀:1021 留言:0更新日期:2017-06-07 23:53
    本發(fā)明專利技術(shù)涉及一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,包括步驟如下:(1)利用異構(gòu)信息網(wǎng)絡(luò)中的語義信息和邊屬性信息,計算得到用戶之間基于不同元路徑的相似度;(2)將基于不同元路徑求得的相似度分別應(yīng)用到基于用戶的協(xié)同過濾推薦算法中,得到基于每個相似度的用戶評分值;(3)采用監(jiān)督學習算法為每個用戶評分值分配不同的權(quán)重,融合為全面考慮多種元路徑信息的用戶最終評分值。在擴展MovieLens經(jīng)典數(shù)據(jù)集上的實驗結(jié)果表明,本發(fā)明專利技術(shù)所提算法在精確度上較傳統(tǒng)算法有顯著提高。

    A movie recommendation method based on weighted heterogeneous information network

    The invention relates to a method of weighted recommendation of heterogeneous information network based on the films, including the following steps: (1) the use of heterogeneous information network of semantic information and edge attribute information, calculate the similarity between users of different element based on path; (2) the similarity of different size were obtained based on the element applied to the collaborative filtering recommendation the algorithm based on the user, each user based on the similarity score; (3) using supervised learning algorithm to assign different weights for each user score, score fusion final value to fully consider the various meta path information users. Experimental results on extended MovieLens data sets show that the proposed algorithm significantly improves the accuracy of the proposed algorithm over traditional algorithms.

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,尤其涉及一種加權(quán)異構(gòu)信息網(wǎng)絡(luò)中基于元路徑計算用戶間相似度的新的協(xié)同過濾推薦方法,屬于數(shù)據(jù)挖掘和機器學習的

    技術(shù)介紹
    協(xié)同過濾(CollaborativeFiltering)是推薦系統(tǒng)發(fā)展史上發(fā)展最快、應(yīng)用最廣的一類算法,其基本思想是相似的用戶對商品的選取也是相似的,根據(jù)與目標用戶最相似的K個鄰居對目標項目的評分來進行推薦。其中,鄰居用戶是基于用戶間的相似度得出的,最常用的相似度度量方式有Pearson相關(guān)系數(shù)和Cosine相似度。但是傳統(tǒng)的相似度度量方式只考慮了用戶評分這一個因素,評分矩陣是極其稀疏的,兩個用戶共同評價的項目非常少,在這種情況下得到的用戶相似性是不準確的,最終推薦精度自然不高。近年來,隨著數(shù)據(jù)庫技術(shù)、機器學習技術(shù)以及網(wǎng)絡(luò)科學的不斷進步,社交網(wǎng)絡(luò)朝異質(zhì)性方向發(fā)展:網(wǎng)絡(luò)中包含多種實體(Entity)、實體間存在多種關(guān)系(Relation),這種網(wǎng)絡(luò)被稱為異構(gòu)信息網(wǎng)絡(luò)(HeterogeneousInformationNetwork,HIN)。大數(shù)據(jù)時代的HIN包含豐富的語義信息,對其進行深度挖掘分析能夠得到非常有意義的知識,而HIN中包含的更多的有效信息會帶來更好地推薦效果,所以近年來在HIN上做推薦問題的研究開始興起。以圖1為例,HIN中不僅包含多種類型的實體(如:用戶、電影和導演類型等),還包含著多種多樣的邊信息(如:用戶對電影的評分、電影的各種屬性和邊的屬性信息等)。為了更好地利用異構(gòu)網(wǎng)絡(luò)中所蘊含的多樣性內(nèi)容,可以用元路徑(MetaPath)表示不同的關(guān)系,表示兩個實體之間語義信息的路徑為一條元路徑,兩節(jié)點間不同的元路徑代表不同的語義聯(lián)系。利用元路徑的概念,我們可以靈活地運用HIN中豐富的信息來做推薦,表1為幾個典型的元路徑和其分別對應(yīng)的經(jīng)典推薦模型。表1目前,基于HIN的推薦工作還處于起步階段,一方面,目前的大多數(shù)方法都是旨在融合異構(gòu)網(wǎng)絡(luò)中的多元信息并且只考慮了HIN中的部分信息;另一方面,這些方法并沒有考慮網(wǎng)絡(luò)中邊屬性問題,沒有關(guān)注由用戶兩極化評分造成的本質(zhì)差別,描述的異構(gòu)網(wǎng)絡(luò)信息并不準確。以電影推薦網(wǎng)絡(luò)為例,用戶給一部電影評5分代表用戶喜歡這部電影,反之如果用戶評分為1分則表示用戶不喜歡這部電影;同樣,一部電影被貼上某種標簽的次數(shù)越多代表該電影越偏向于此類型。如果在推薦過程中不考慮此種邊屬性問題,很可能會使推薦結(jié)果有所偏差。石川等人第一次提出了加權(quán)HIN的概念,通過區(qū)分網(wǎng)絡(luò)中邊上的不同屬性值來探索更全面的元路徑語義信息以實現(xiàn)更準確的推薦,但是該方法并沒有提出新的相似度度量方法,而是將有權(quán)元路徑分解為有確定屬性值限定的原子元路徑,利用的還是原來的PathSim、HeteSim等相似度度量方法。中國專利文獻CN105373597A公開了基于k-Medoids項目聚類和局部興趣融合的用戶協(xié)同過濾推薦方法,該專利通過減緩數(shù)據(jù)極端稀疏性對協(xié)同過濾推薦的影響來提高推薦質(zhì)量,宏觀上看都是對基于用戶的協(xié)調(diào)過濾方法的改進。但是,該專利與本專利方法不同,該專利提出一種基于k-Medoids項目聚類和局部興趣融合的用戶協(xié)同過濾推薦方法。首先針對用戶-項目矩陣計算任意用戶間的相似度,得到全局近鄰用戶;然后針對用戶-項目矩陣對項目進行聚類,計算用戶的局部相似度得到局部最近鄰用戶;最后將全局最近鄰和局部最近鄰進行融合,預測用戶評分。該專利存在以下缺陷:(1)本質(zhì)上,該專利技術(shù)利用的信息還是只有用戶-項目矩陣數(shù)據(jù),還是只利用了用戶對項目非常稀疏的評分信息,并沒有引入其他屬性信息或社交關(guān)系信息等;(2)在計算用戶間相似度或計算項目間相似度對項目聚類時,該專利技術(shù)利用的還是協(xié)同過濾技術(shù)中的經(jīng)典的相似度度量方式:余弦相似度、pearson相關(guān)系數(shù)、修正的余弦相似度等,并沒有提出新的相似度度量方式;(3)該專利技術(shù)并沒有細粒度地考慮用戶對不同項目評分的兩極化影響。中國專利文獻CN102231166A公開了基于社會上下文的協(xié)同推薦方法,該專利并不是對基于用戶的協(xié)同過濾推薦技術(shù)的改進,而是提出了一種新的基于模型的協(xié)同過濾推薦算法,并針對用戶對項目的評分數(shù)據(jù)的稀疏性問題,引入了用戶的社會關(guān)系數(shù)據(jù)。首先根據(jù)得到用戶與項目間的互動矩陣(例如用戶對項目的評分數(shù)據(jù)),然后得到用戶的社會關(guān)系矩陣;最后采用帶約束的低秩矩陣分解方法來預測用戶評分。該專利存在以下缺陷:(1)該專利引入了用戶的社會信息即用戶間的朋友關(guān)系等,但是所考慮的信息并不全面,并沒有考慮用戶與項目間除評分外的其他信息也沒有考慮項目的豐富的屬性信息。(2)該專利采用的是矩陣分解方法,與本申請所采用的方法有著本質(zhì)的區(qū)別。(3)該專利并沒有細粒度地考慮用戶對不同項目評分的兩極化影響。中國專利文獻CN106202502A公開了音樂信息網(wǎng)絡(luò)中用戶興趣發(fā)現(xiàn)方法,先從音樂信息網(wǎng)絡(luò)中通過N步長隨機游走得到與用戶相關(guān)的信息子網(wǎng)以及信息子網(wǎng)的網(wǎng)絡(luò)模式;然后對信息子網(wǎng)進行剪枝,并在剪枝后的信息子網(wǎng)中利用HeteSim算法計算不同類型節(jié)點間相關(guān)性,進而得到不同類型邊的權(quán)重;接著,根據(jù)單源最短路徑算法得到所有歌曲對之間的最短路徑集和最短路徑權(quán)重,并計算出元路徑集和元路徑權(quán)重;最后,利用PathSelClus算法基于元路徑將歌曲聚成三類,根據(jù)聚類結(jié)果分析出用戶對歌曲的興趣愛好。該專利存在以下缺陷:(1)該專利目的與本申請不同,該專利技術(shù)力圖探索用戶興趣,分析用戶對歌曲的興趣愛好,而本申請旨在預測用戶對項目的評分,根據(jù)評分信息為用戶推薦其可能喜歡的具體的項目。(2)該專利利用隨機游走建立信息子圖,并對剪枝后的網(wǎng)絡(luò)應(yīng)用異構(gòu)信息網(wǎng)絡(luò)中的經(jīng)典的計算相關(guān)性的算法Hetesim來計算任意兩節(jié)點間的相似度,將此相關(guān)度作為兩節(jié)點間的權(quán)重。該算法是針對無權(quán)異構(gòu)信息網(wǎng)絡(luò)的相關(guān)性度量方法并沒有考慮權(quán)重信息,無法直接應(yīng)用到加權(quán)異構(gòu)信息網(wǎng)絡(luò)中,本申請中提出了一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的新的相似度度量方式,在實驗結(jié)果分析部分本專利技術(shù)所提算法也與基于HeteSim的協(xié)同過濾算法做過比較,本專利技術(shù)所提算法優(yōu)于HeteSim。(3)該專利也是基于元路徑進行,但是其目的和方法與本申請都不同。
    技術(shù)實現(xiàn)思路
    針對現(xiàn)有技術(shù)的不足,本專利技術(shù)提供了一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法;本專利技術(shù)包括步驟如下:(1)利用異構(gòu)信息網(wǎng)絡(luò)中的語義信息和邊屬性信息,計算得到用戶之間基于不同元路徑的相似度;(2)將基于不同元路徑求得的相似度分別應(yīng)用到基于用戶的協(xié)同過濾推薦算法中,得到基于每個相似度的用戶評分值;(3)采用監(jiān)督學習算法為每個用戶評分值分配不同的權(quán)重,融合為全面考慮多種元路徑信息的用戶最終評分值。在擴展MovieLens經(jīng)典數(shù)據(jù)集上的實驗結(jié)果表明,本專利技術(shù)所提算法在精確度上較傳統(tǒng)算法有顯著提高。本申請引入加權(quán)HIN的概念,充分考慮HIN中的節(jié)點類型信息和多種邊屬性信息,并且對用戶評分進行了兩極化映射處理,提出了一種引入加權(quán)異構(gòu)信息的改進協(xié)同過濾算法。術(shù)語解釋1、協(xié)同過濾推薦算法,基本思想是相似的用戶對商品的選取也是相似的,根據(jù)與目標用戶最相似的K個鄰居對目標項目的評分來進行推薦。2、異構(gòu)信息網(wǎng)絡(luò)(WeightedHeterogeneousInformationNetwork,WHIN),可以簡稱本文檔來自技高網(wǎng)
    ...
    一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法

    【技術(shù)保護點】
    一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,其特征在于,包括以下步驟:(1)對數(shù)據(jù)集構(gòu)建加權(quán)異構(gòu)信息網(wǎng)絡(luò),并提取出兩用戶間多種不同的元路徑;(2)分別計算用戶在對電影M、演員A、導演D、國家C、電影體裁G、電影標簽T方面的偏好度;(3)分別針對用戶在每一方面的偏好度,計算兩用戶間的相似度,若兩用戶在所有方面的偏好都相似,則兩用戶相似;否則,兩用戶偏好相差越大則兩用戶越不相似;(4)分別將受偏好度影響的6個相似度應(yīng)用到協(xié)同過濾推薦算法中,預測用戶對電影的評分;(5)應(yīng)用經(jīng)典的線性回歸算法為每一個用戶對電影的評分分配合適的權(quán)重,融合為最終的評分值;(6)將最終的評分值最高的幾部電影推薦給該用戶。

    【技術(shù)特征摘要】
    1.一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,其特征在于,包括以下步驟:(1)對數(shù)據(jù)集構(gòu)建加權(quán)異構(gòu)信息網(wǎng)絡(luò),并提取出兩用戶間多種不同的元路徑;(2)分別計算用戶在對電影M、演員A、導演D、國家C、電影體裁G、電影標簽T方面的偏好度;(3)分別針對用戶在每一方面的偏好度,計算兩用戶間的相似度,若兩用戶在所有方面的偏好都相似,則兩用戶相似;否則,兩用戶偏好相差越大則兩用戶越不相似;(4)分別將受偏好度影響的6個相似度應(yīng)用到協(xié)同過濾推薦算法中,預測用戶對電影的評分;(5)應(yīng)用經(jīng)典的線性回歸算法為每一個用戶對電影的評分分配合適的權(quán)重,融合為最終的評分值;(6)將最終的評分值最高的幾部電影推薦給該用戶。2.根據(jù)權(quán)利要求1所述的一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,其特征在于,所述數(shù)據(jù)集是指grouplens研究組發(fā)布的MovieLens10M擴展數(shù)據(jù)集,所述數(shù)據(jù)集包括實體類型、表示及數(shù)目,實體類型包括用戶、電影、演員、導演、國家、體裁、標簽;表示是指對每種實體類型的表示字符,字符U表示用戶類型,字符M表示電影類型,字符A表示演員類型,字符D表示導演類型,字符C表示國家類型,字符G表示體裁類型,字符T表示標簽類型;數(shù)目是指每種實體類型的個數(shù);所述元路徑包括P1、P2、P3、P4、P5、P6,P1=UMU,P2=UMAMU,P3=UMCMU,P4=UMDMU,P5=UMGMU,P6=UMTMU;P1的語義信息是指:與目標用戶看過同一部電影的用戶;P2的語義信息是指:與目標用戶看過同一個演員演過的電影的用戶;P3的語義信息是指:與目標用戶看過在同一個國家上映的電影的用戶;P4的語義信息是指:與目標用戶看過由同一個導演執(zhí)導的電影的用戶;P5的語義信息是指:與目標用戶看過屬于同一個體裁的電影的用戶;P6的語義信息是指:與目標用戶看過被貼上同一個類型標簽T的電影的用戶。3.根據(jù)權(quán)利要求2所述的一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,其特征在于,所述步驟(2),用戶ui對影響因素y的偏好度的求取公式如式(Ⅰ)所示:式(Ⅰ)中,ui表示用戶,ui屬于用戶類型U;P為用戶ui到影響因素y的元路徑;為從ui到y(tǒng)的一個加權(quán)路徑實例,w為該加權(quán)路徑上的權(quán)重值;為ui到y(tǒng)的一個加權(quán)路徑實例上的權(quán)重值;t(ui,y)為ui到y(tǒng)的所有加權(quán)路徑實例上的權(quán)重值之和,即要求取的用戶ui對影響因素y的偏好度;影響因素y包括電影、演員、導演、國家、體裁、標簽;y屬于影響因素y。4.根據(jù)權(quán)利要求3所述的一種基于加權(quán)異構(gòu)信息網(wǎng)絡(luò)的電影推薦方法,其特征在于,通過擴展交換矩陣快速計算用戶在每一方面的偏好度,包括步驟如下:A、設(shè)定...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:張海霞呂振
    申請(專利權(quán))人:山東大學
    類型:發(fā)明
    國別省市:山東;37

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码之日韩精品| 无码av不卡一区二区三区| 无码人妻一区二区三区在线水卜樱 | 国产亚洲美日韩AV中文字幕无码成人 | 亚洲成A人片在线观看无码不卡| 国产在线精品无码二区| 无码中文字幕乱码一区 | (无码视频)在线观看| 人妻av无码专区| 亚洲国产成人无码AV在线影院 | 精品无码一区在线观看| 夜夜精品无码一区二区三区| 精品无码AV无码免费专区| 中文字幕丰满乱子无码视频| 久久亚洲精品无码av| 久久久久精品国产亚洲AV无码| 国产精品无码素人福利| 无码无套少妇毛多69XXX| 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 一区二区无码免费视频网站| 午夜无码伦费影视在线观看| 国产福利电影一区二区三区久久老子无码午夜伦不 | 亚洲国产综合无码一区| 无码国产亚洲日韩国精品视频一区二区三区 | 一本无码人妻在中文字幕免费| 国产成人午夜无码电影在线观看| YY111111少妇无码理论片| 成人免费a级毛片无码网站入口 | 免费无码国产V片在线观看| 亚洲AV永久无码精品放毛片| 无码国产精品一区二区免费| 亚洲精品偷拍无码不卡av| 日韩精品真人荷官无码| 免费无码毛片一区二区APP| 亚洲av无码不卡久久| 精品亚洲成A人无码成A在线观看| 久久久久亚洲AV无码永不| 无码爆乳护士让我爽| 亚洲av中文无码字幕色不卡| 极品无码国模国产在线观看| 国产精品无码DVD在线观看|