【技術實現步驟摘要】
本專利技術涉及多媒體搜索領域,特別涉及。
技術介紹
社會媒體(Social Media)已經極大地改變了用戶分享和獲取信息的方式和習慣。在社會媒體服務中,用戶不可避免地與其他用戶交互構成社區,即所謂的社會網絡。社會網絡中包括雙向的社會關系,如LinkedIn中的“關聯(Connect) ”和Facebook中的“加為好友(Add Friend) ”,以及單向的社會關系,如Twitter中的“跟隨(Follow) ”和Youtube中的“訂閱(Subscribe) ”。這些社會關系被認為影響著用戶的行為以及社會網絡的動態發展。如,LinkedIn上的同事可以影響一個人工作上的選擇,Facebook上的好友則會影響一個人生活中的行為和需求。通過分析和挖掘這些社會關系可以促生很多重要的應用,如病毒式營銷、協同推薦和協同信息搜索等等。以基于單向社會關系的多媒體協同搜索為例,其基本假設和出發點是通過分析對搜索用戶有影響關系的其他用戶的行為,可以預測搜索用戶的真實需求并調整搜索結果。目前針對社會關系挖掘的方法,主要集中于研究是否存在社會關系以及社會關系的強度預測。在很多問題中,二值化或者連續的社會關系并不能滿足應用的需求。如在多媒體搜索問題中,對于不同的搜索詞,用戶之間的社會關系是不同的。假設用戶要為自己的蜜月旅行搜索“夏威夷”的照片,有旅游特長的好友會對他的幫助最大,我們希望他們之間的社會關系變強;而當同一個用戶搜索“時裝秀”的照片時,則會希望對流行時尚有研究的好友能更多地影響搜索結果,即他們之間的社會關系變強。我們稱這種與問題相關的社會關系為自適應的社會關系強度 ...
【技術保護點】
一種基于多模態自適應社會關系強度挖掘的社會搜索方法,該方法包括步驟如下:步驟1:收集用戶上傳的圖片信息以及與其有單向社會關系的用戶,每個用戶對應一個由上傳圖像集合、圖像標注集合和與其有單向社會關系的關系用戶集合組成的三元組;步驟2:根據輸入的三元組,建立多模態概率生成式模型,將所述圖像集合中的圖片內容和圖像標注集合中的圖像標注信息的生成過程進行推斷;步驟3:根據推斷結果計算用戶主題空間和用戶主題分布,計算用戶與用戶之間的主題敏感的社會關系強度;步驟4:根據所得到的用戶主題空間、用戶主題分布以及社會關系強度對搜索結果進行排序。
【技術特征摘要】
1.一種基于多模態自適應社會關系強度挖掘的社會搜索方法,該方法包括步驟如下 步驟1:收集用戶上傳的圖片信息以及與其有單向社會關系的用戶,每個用戶對應一個由上傳圖像集合、圖像標注集合和與其有單向社會關系的關系用戶集合組成的三元組; 步驟2:根據輸入的三元組,建立多模態概率生成式模型,將所述圖像集合中的圖片內容和圖像標注集合中的圖像標注信息的生成過程進行推斷; 步驟3 :根據推斷結果計算用戶主題空間和用戶主題分布,計算用戶與用戶之間的主題敏感的社會關系強度; 步驟4:根據所得到的用戶主題空間、用戶主題分布以及社會關系強度對搜索結果進行排序。2.如權利要求1所述的方法,其特征在于,所述步驟I包括 步驟11 :對每個用戶U,根據其社會關系網絡采集與其有單向社會關系的用戶,組成集合Cu ; 步驟12 :對每個用戶U,采集其上傳的圖片,組成集合Du; 步驟13 :對每個用戶U,采集其對所上傳的圖片添加的標注,組成集合Tu。3.如權利要求1所述的方法,其特征在于,所述步驟2包括 步驟21 :建立主題敏感的多模態概率生成式模型,來模擬圖片和標注的生成過程;其中通過設置隱變量來描述建立多模態概率生成式模型的過程;其中,所述隱變量包括開關隱變量S、主題記錄隱變量z和采樣用戶隱變量C,所述開關隱變量s表示標注詞和圖像是用戶自發產生還是受關系用戶影響而產生的;所述主題記錄隱變量z表示采樣得到的主題;所述用戶隱變量c表示采樣得到的關系用戶; 步驟22 :求解所述多模態概率生成式模型,其中通過吉布斯采樣推斷得到所述隱變量的取值。4....
【專利技術屬性】
技術研發人員:徐常勝,桑基韜,
申請(專利權)人:中國科學院自動化研究所,
類型:發明
國別省市: