【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及一種移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,具體的說(shuō)是一種基于社交圖片SIFT特征的上下文信息預(yù)測(cè)方法。
技術(shù)介紹
在飛速發(fā)展的移動(dòng)互聯(lián)網(wǎng)時(shí)代,圖像簡(jiǎn)明形象的時(shí)代特性,使其成為人們表達(dá)情感的重要載體。用戶的上下文信息在移動(dòng)互聯(lián)網(wǎng)應(yīng)用中扮演著重要角色,它反映了用戶的各種基本信息。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,圖像與用戶上下文信息關(guān)系密切,能夠在一定程度上反映發(fā)圖用戶的基本特征。用戶上下文信息預(yù)測(cè)就是通過(guò)分析用戶上傳到移動(dòng)互聯(lián)網(wǎng)上的圖片來(lái)預(yù)測(cè)用戶的性別、發(fā)圖習(xí)慣、影響力、活躍度以及使用終端等上下文信息。目前根據(jù)圖像特征進(jìn)行預(yù)測(cè)的技術(shù)多是從全局特征出發(fā),通過(guò)灰度矩陣、顏色矩陣等得到數(shù)字特征來(lái)進(jìn)行預(yù)測(cè)。如果是對(duì)圖像的整體進(jìn)行研究,而不太關(guān)注圖片隱含的背景信息,使用全局特征比較合適。但是如果要預(yù)測(cè)用戶的上下文信息,需要辨識(shí)圖片的前景和背景,使用全局特征得到的預(yù)測(cè)準(zhǔn)確率不高,因此提取圖片的局部特征更為合適。而且之前的技術(shù)研究的圖像多是人工分類過(guò)或標(biāo)記過(guò)的,但是大數(shù)據(jù)背景下社交網(wǎng)絡(luò)上的圖片更多是沒有被標(biāo)記的。因此本專利技術(shù)主要通過(guò)對(duì)用戶上傳到移動(dòng)互聯(lián)網(wǎng)的未處理的社交圖片的局部特征進(jìn)行研究,提取圖片的SIFT特征,對(duì)提取的特征進(jìn)行聚類,采用的聚類算法是K-Means++算法;然后對(duì)用戶的上下文信息進(jìn)行分類預(yù)測(cè),采取的分類方法是GBDT(GradientBoostingDecisionTree)算法和SVM(SupportVectorMachine)算法。
技術(shù)實(shí)現(xiàn)思路
本專利技術(shù)的目的在于克服上述不足,提供一種基于社交圖片SIFT特征的上下文信息預(yù)測(cè)方法,通過(guò)分析用戶上傳到移動(dòng)互聯(lián)網(wǎng)上的圖片,預(yù) ...
【技術(shù)保護(hù)點(diǎn)】
基于社交圖片SIFT特征的上下文信息預(yù)測(cè)方法,其特征在于,包括以下步驟:步驟1、獲取用戶上下文信息和圖片特征數(shù)據(jù)集;步驟2、采用十字交叉驗(yàn)證法將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集;步驟3、將訓(xùn)練集訓(xùn)練SVM和GBDT分類模型,以供預(yù)測(cè)時(shí)使用;步驟4、用訓(xùn)練好的SVM模型和GBDT模型分別預(yù)測(cè)測(cè)試集的數(shù)據(jù),對(duì)于用SVM訓(xùn)練出的分類模型,使用SVM預(yù)測(cè)算法測(cè)試測(cè)試集,對(duì)于用GBDT訓(xùn)練出的分類模型,使用GBDT預(yù)測(cè)算法測(cè)試測(cè)試集;步驟5、對(duì)測(cè)試樣本的預(yù)測(cè)測(cè)試結(jié)果進(jìn)行輸出,并比較得出最終預(yù)測(cè)結(jié)果。
【技術(shù)特征摘要】
1.基于社交圖片SIFT特征的上下文信息預(yù)測(cè)方法,其特征在于,包括以下步驟:步驟1、獲取用戶上下文信息和圖片特征數(shù)據(jù)集;步驟2、采用十字交叉驗(yàn)證法將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集;步驟3、將訓(xùn)練集訓(xùn)練SVM和GBDT分類模型,以供預(yù)測(cè)時(shí)使用;步驟4、用訓(xùn)練好的SVM模型和GBDT模型分別預(yù)測(cè)測(cè)試集的數(shù)據(jù),對(duì)于用SVM訓(xùn)練出的分類模型,使用SVM預(yù)測(cè)算法測(cè)試測(cè)試集,對(duì)于用GBDT訓(xùn)練出的分類模型,使用GBDT預(yù)測(cè)算法測(cè)試測(cè)試集;步驟5、對(duì)測(cè)試樣本的預(yù)測(cè)測(cè)試結(jié)果進(jìn)行輸出,并比較得出最終預(yù)測(cè)結(jié)果。2.根據(jù)權(quán)利要求1所述的基于社交圖片SIFT特征的上下文信息預(yù)測(cè)方法,其特征在于,所述獲取用戶上下文信息和圖片特征數(shù)據(jù)集的方法包括以下步驟:步驟101、獲取用戶上傳到移動(dòng)互聯(lián)網(wǎng)上的圖片,獲取發(fā)圖用戶的基本信息;步驟102、收集并記錄所述圖片的相關(guān)信息和圖片對(duì)應(yīng)的用戶上下文信息;步驟103、圖片預(yù)處理,提取圖片的SIFT特征:將下載到的圖片進(jìn)行預(yù)處理操作,構(gòu)建尺度空間,使用高斯核和高斯微分建立高斯金字塔,檢測(cè)尺度空間的極值點(diǎn),精確定位極值點(diǎn),確定關(guān)鍵點(diǎn)的位置、尺度和主方向,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王永,
申請(qǐng)(專利權(quán))人:鄭州埃文計(jì)算機(jī)科技有限公司,
類型:發(fā)明
國(guó)別省市:河南;41
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。