The invention discloses a OTA bed and Breakfast Inn mining method, which comprises the following steps: S1, a mining model, hotel text information based on S2, the establishment of coarse-grained; fine-grained mining model Hostel Inn Hotel Based on image information; S3, a combination of the coarse grained mining model and the fine-grained mining model explore the OTA hotel in the hostel inn. GuestHouse Inn Hotel fine-grained mining model based on image information established by the invention, according to the difference of Tradition Hotel and guesthouse inn in the appearance of image content, the depth of excavation of the inn in the B & B on the level of image, improve the accuracy of mining. The invention can effectively take advantage of the hotel's text information and image information to conduct a comprehensive analysis and judgment, quickly and accurately to dig out a lot of Home Inn, greatly reduce the labor cost of investment.
【技術實現(xiàn)步驟摘要】
OTA的民宿客棧挖掘方法
本專利技術涉及一種信息挖掘領域,特別是涉及一種OTA的民宿客棧挖掘方法。
技術介紹
當前,在旅游出行中選擇入住民宿和客棧的游客數(shù)量不斷增長。為了滿足用戶的需求,在線旅游公司(OTA)需要從現(xiàn)有售賣酒店中挖掘出盡可能多的民宿和客棧供用戶選擇。然而OTA售賣的酒店數(shù)量往往數(shù)以十萬計,數(shù)量已遠遠超過人工挖掘的限度。因此,利用計算機對酒店的相關信息進行分析和判斷,挖掘出其中的民宿和客棧成為了迫切的需求。民宿客棧挖掘的關鍵是判斷酒店是屬于傳統(tǒng)酒店類型還是屬于民宿客棧類型。當前,關于OTA的民宿客棧挖掘的相關研究尚未深入展開,鮮有利用計算機自動從OTA售賣的海量酒店中挖掘出民宿和客棧的方法,實現(xiàn)民宿客棧的快速而準確的挖掘成為了一項具有挑戰(zhàn)性的任務。
技術實現(xiàn)思路
本專利技術要解決的技術問題是為了克服現(xiàn)有技術中無法對OTA售賣酒店中的民宿客棧進行快速而準確挖掘的缺陷,提供一種實用性強、準確率高、速度快的OTA的民宿客棧挖掘方法。本專利技術是通過下述技術方案來解決上述技術問題的:本專利技術提供了一種OTA的民宿客棧挖掘方法,其特點在于,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。較佳地,步驟S1包括:S11、建立一系列關鍵字集合,包括:包含集團酒店關鍵字的第一集合;包含傳統(tǒng)酒店的酒店名稱關鍵字的第二集合;包含傳統(tǒng)酒店的房型名稱關鍵字的第三集合;包含民宿客棧的酒店名稱關鍵字的第四集合;包含古鎮(zhèn)、景區(qū) ...
【技術保護點】
一種OTA的民宿客棧挖掘方法,其特征在于,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。
【技術特征摘要】
1.一種OTA的民宿客棧挖掘方法,其特征在于,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。2.如權利要求1所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S1包括:S11、建立一系列關鍵字集合,包括:包含集團酒店關鍵字的第一集合;包含傳統(tǒng)酒店的酒店名稱關鍵字的第二集合;包含傳統(tǒng)酒店的房型名稱關鍵字的第三集合;包含民宿客棧的酒店名稱關鍵字的第四集合;包含古鎮(zhèn)、景區(qū)和商業(yè)區(qū)關鍵字的第五集合;包含民宿客棧的用戶點評關鍵字的第六集合;S12、對于待挖掘的OTA酒店,若屬于步驟S11建立的第一集合中的集團酒店關鍵字對應的集團酒店,或酒店名稱中出現(xiàn)步驟S11建立的第二集合中的關鍵字,或房型名稱中出現(xiàn)步驟S11建立的第三集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于傳統(tǒng)酒店;若酒店名稱中出現(xiàn)步驟S11建立的第四集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于民宿客棧;若不滿足上述兩種情況,則執(zhí)行S13;S13、利用步驟S11建立的第五集合,結合所述待挖掘的OTA酒店的位置信息進行進一步挖掘,若酒店位于所述第五集合中的古鎮(zhèn)和商業(yè)區(qū)關鍵字對應的古鎮(zhèn)和商業(yè)區(qū),或位于所述第五集合中的景區(qū)關鍵字對應的景區(qū)附近第一距離閾值范圍內,則所述待挖掘的OTA酒店被判為待定酒店,若不滿足,則執(zhí)行S14;S14、將步驟S11建立的第六集合中的關鍵字在所述待挖掘的OTA酒店的用戶點評中進行搜索,若包括所述關鍵字的用戶點評數(shù)量大于等于第一閾值并且所述用戶點評數(shù)量占所有用戶點評的比例大于等于第二閾值,則所述酒店被判為待定酒店,否則被判為傳統(tǒng)酒店。3.如權利要求1所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S2包括:S21、收集多個圖像,并生成第一圖像訓練集;S22、利用所述第一圖像訓練集訓練基于深度神經網絡的圖像特征提取模型;S23、收集傳統(tǒng)酒店和民宿客棧兩個類別的外觀圖像,生成第二圖像訓練集;S24、利用所述第二圖像訓練集訓練基于外觀圖像的傳統(tǒng)酒店...
【專利技術屬性】
技術研發(fā)人員:李翔,嚴捷冰,李發(fā)科,鞠濤偉,
申請(專利權)人:攜程計算機技術上海有限公司,
類型:發(fā)明
國別省市:上海,31
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。