溫馨提示:您尚未登錄,請點 登陸 后下載,如果您還沒有賬戶請點 注冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。
本發(fā)明實施例公開了一種網(wǎng)頁數(shù)據(jù)獲取方法、裝置、設(shè)備及介質(zhì)。該方法通過爬取預設(shè)網(wǎng)址的網(wǎng)頁數(shù)據(jù);利用預設(shè)的機器學習算法集合對網(wǎng)頁數(shù)據(jù)進行分詞處理,得到網(wǎng)頁數(shù)據(jù)的詞向量關(guān)系、關(guān)鍵字;根據(jù)詞向量關(guān)系、關(guān)鍵字分析網(wǎng)頁數(shù)據(jù)的主題,得到網(wǎng)頁數(shù)據(jù)的主題分類...該專利屬于中國移動通信集團河北有限公司;中國移動通信集團有限公司所有,僅供學習研究參考,未經(jīng)過中國移動通信集團河北有限公司;中國移動通信集團有限公司授權(quán)不得商用。