【技術實現步驟摘要】
一種視頻推薦方法、裝置、電子設備及可讀存儲介質
本說明書涉及機器學習
,特別涉及一種視頻推薦方法、裝置、電子設備及可讀存儲介質。
技術介紹
視頻推薦技術本質上是一種信息過濾技術。它從海量的數據中找到用戶感興趣的部分,并將其推薦給用戶,這在用戶沒有明確需求或者數據量過多的情況下,能夠更好的為用戶服務,解決信息過載的問題。例如,用戶并不確定的想看哪一部電影,只是想看一部讓自己感興趣的電影,推薦系統能夠主動的使用機器學習的技術去挖掘出用戶的興趣、偏好,從而在海量的數據當中過濾出用戶感興趣的內容,并將其推薦給用戶。隨著直播和短視頻的興起,視頻內容呈爆炸式的增長,如何給用戶提供個性化和高效的視頻推薦服務受到越來越多的關注。按照數學原理的不同,可將視頻推薦算法分為矩陣分解算法和協同過濾算法。矩陣分解算法策略是將大的原始數據集組成的特征矩陣等價成兩個或者三個較小的矩陣相乘的形式,以降低時間復雜度和空間復雜度;協同過濾算法策略是,分析系統里已經存在了的用戶群之前的行為,根據相似用戶或者相似視頻之間的聯系,對目前用戶最喜歡或者最感興趣的視頻做預測。矩陣分解推薦算法從隱性反饋數據集中學習到用戶的隱向量和節目的隱向量,即通過隱性特征將用戶和節目聯系起來了,但是沒有顯式的考慮用戶的歷史行為對用戶評分預測的影響;協同過濾推薦算法采用歷史評分數據來構建用戶對節目的喜好度,但是不能深入挖掘背后的隱性因素,通常推薦精確度不高。
技術實現思路
為了在降低視頻推薦的復雜度的基礎上還提高視頻推薦的準確率, ...
【技術保護點】
1.一種視頻推薦方法,其特征在于,包括:/n獲取用戶的歷史點播數據;/n從所述歷史點播數據中提取對應用戶的興趣特征;其中,所述興趣特征包括:視頻節目、用戶觀看某個視頻節目的觀看時長比;/n根據所述視頻節目的觀看時長比獲取所述興趣特征中視頻節目與每個聚類中心之間的相似度;其中,所述聚類中心利用樣本視頻節目數據進行聚類獲得;/n根據所述相似度確定視頻節目的隱因子向量;/n確定視頻節目喜愛度偏離值、用戶喜愛度偏離值、用戶的隱因子向量、用戶和所觀看的視頻節目之間的隱因子向量;/n根據所述視頻節目的隱因子向量、用戶觀看過的所有視頻節目的總數、所述視頻節目喜愛度偏離值、所述用戶喜愛度偏離值、所述用戶的隱性因子向量、所述用戶和所觀看的視頻節目之間的隱因子向量獲得用戶對每個節目的喜愛度預測值;/n根據所述喜愛度預測值確定向對應用戶終端推薦的視頻節目。/n
【技術特征摘要】
1.一種視頻推薦方法,其特征在于,包括:
獲取用戶的歷史點播數據;
從所述歷史點播數據中提取對應用戶的興趣特征;其中,所述興趣特征包括:視頻節目、用戶觀看某個視頻節目的觀看時長比;
根據所述視頻節目的觀看時長比獲取所述興趣特征中視頻節目與每個聚類中心之間的相似度;其中,所述聚類中心利用樣本視頻節目數據進行聚類獲得;
根據所述相似度確定視頻節目的隱因子向量;
確定視頻節目喜愛度偏離值、用戶喜愛度偏離值、用戶的隱因子向量、用戶和所觀看的視頻節目之間的隱因子向量;
根據所述視頻節目的隱因子向量、用戶觀看過的所有視頻節目的總數、所述視頻節目喜愛度偏離值、所述用戶喜愛度偏離值、所述用戶的隱性因子向量、所述用戶和所觀看的視頻節目之間的隱因子向量獲得用戶對每個節目的喜愛度預測值;
根據所述喜愛度預測值確定向對應用戶終端推薦的視頻節目。
2.如權利要求1所述的方法,其特征在于,所述用戶觀看過的所有視頻節目的總數通過用戶的歷史行為統計獲取。
3.如權利要求1所述的方法,其特征在于,根據所述喜愛度預測值確定向對應用戶終端推薦的視頻節目的步驟包括:
將所述用戶觀看過的視頻節目剔除掉;
按所述喜愛度預測值的大小對剩余的視頻節目降序排列,根據排列結果生成推薦列表;
將所述推薦列表中排在前面的視頻節目的數據發送至用戶終端。
4.如權利要求1所述的方法,其特征在于,確定視頻節目喜愛度偏離值、用戶喜愛度偏離值、用戶的隱因子向量、用戶和所觀看的視頻節目之間的隱因子向量的步驟包括:
對損失函數利用隨機梯度下降法求解,確定當所述損失函數取最小值時對應的視頻節目喜愛度偏離值、用戶喜愛度偏離值、用戶的隱因子向量、用戶和所觀看的視頻節目之間的隱因子向量。
5.如權利要求1所述的方法,其特征在于,所述用戶觀看某個視頻節目的觀看時長比等于用于觀看某個視頻節目的時長除以對應視頻節目的總時長。
6.如權利要求1所述的方法,其特征在于,所述相似度通過曼哈頓街區距離公式、歐式距離公式或皮爾遜公式獲取。
7.如權利要求1所述的方法,其特征在于,根據所述相似度確定視頻節目的隱因子向量的步驟包括:
從所述視頻節目與每個聚類中心之間的相似度中獲取最大相似度、最小相似度;
將所述視頻節目與每個聚類中心之間的相似度均除以所述最大相似度或所述最小相似度,獲得歸一化結果值;
將歸一化結果值與閾值比較,將小于閾值的歸一化結果值置于零,將大于等于的閾值的歸一化結果值保持不變,得到的結果值構成的向量為所述視頻節目的隱因子向量。
8.一種視頻推薦裝置,其特征在于,包括:
歷史點播數據獲取單元,用于獲取用戶的歷史點播數據;
興趣特征提取單元,用于從所述歷史點播數據中提取對應用戶的興趣特征;其中,所述興趣特征包括:視頻節目、用戶觀看某個視頻節目的觀看時長比;
相似度獲取...
【專利技術屬性】
技術研發人員:王興軍,馬力,
申請(專利權)人:清華大學深圳研究生院,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。