• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    OTA的民宿客棧挖掘方法技術

    技術編號:15691727 閱讀:71 留言:0更新日期:2017-06-24 05:10
    本發(fā)明專利技術公開了一種OTA的民宿客棧挖掘方法,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。本發(fā)明專利技術建立的基于酒店圖像信息的民宿客棧細粒度挖掘模型,根據傳統(tǒng)酒店和民宿客棧在外觀圖像內容上的差異性,在圖像層面上進行民宿客棧的深度挖掘,提高了挖掘的準確性。本發(fā)明專利技術有效地利用酒店的文本信息和圖像信息進行綜合分析和判斷,快速而準確地挖掘出了大量民宿客棧,極大地減少了人力成本的投入。

    OTA Hostel Inn Mining Method

    The invention discloses a OTA bed and Breakfast Inn mining method, which comprises the following steps: S1, a mining model, hotel text information based on S2, the establishment of coarse-grained; fine-grained mining model Hostel Inn Hotel Based on image information; S3, a combination of the coarse grained mining model and the fine-grained mining model explore the OTA hotel in the hostel inn. GuestHouse Inn Hotel fine-grained mining model based on image information established by the invention, according to the difference of Tradition Hotel and guesthouse inn in the appearance of image content, the depth of excavation of the inn in the B & B on the level of image, improve the accuracy of mining. The invention can effectively take advantage of the hotel's text information and image information to conduct a comprehensive analysis and judgment, quickly and accurately to dig out a lot of Home Inn, greatly reduce the labor cost of investment.

    【技術實現(xiàn)步驟摘要】
    OTA的民宿客棧挖掘方法
    本專利技術涉及一種信息挖掘領域,特別是涉及一種OTA的民宿客棧挖掘方法。
    技術介紹
    當前,在旅游出行中選擇入住民宿和客棧的游客數(shù)量不斷增長。為了滿足用戶的需求,在線旅游公司(OTA)需要從現(xiàn)有售賣酒店中挖掘出盡可能多的民宿和客棧供用戶選擇。然而OTA售賣的酒店數(shù)量往往數(shù)以十萬計,數(shù)量已遠遠超過人工挖掘的限度。因此,利用計算機對酒店的相關信息進行分析和判斷,挖掘出其中的民宿和客棧成為了迫切的需求。民宿客棧挖掘的關鍵是判斷酒店是屬于傳統(tǒng)酒店類型還是屬于民宿客棧類型。當前,關于OTA的民宿客棧挖掘的相關研究尚未深入展開,鮮有利用計算機自動從OTA售賣的海量酒店中挖掘出民宿和客棧的方法,實現(xiàn)民宿客棧的快速而準確的挖掘成為了一項具有挑戰(zhàn)性的任務。
    技術實現(xiàn)思路
    本專利技術要解決的技術問題是為了克服現(xiàn)有技術中無法對OTA售賣酒店中的民宿客棧進行快速而準確挖掘的缺陷,提供一種實用性強、準確率高、速度快的OTA的民宿客棧挖掘方法。本專利技術是通過下述技術方案來解決上述技術問題的:本專利技術提供了一種OTA的民宿客棧挖掘方法,其特點在于,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。較佳地,步驟S1包括:S11、建立一系列關鍵字集合,包括:包含集團酒店關鍵字的第一集合;包含傳統(tǒng)酒店的酒店名稱關鍵字的第二集合;包含傳統(tǒng)酒店的房型名稱關鍵字的第三集合;包含民宿客棧的酒店名稱關鍵字的第四集合;包含古鎮(zhèn)、景區(qū)和商業(yè)區(qū)關鍵字的第五集合;包含民宿客棧的用戶點評關鍵字的第六集合;S12、對于待挖掘的OTA酒店,若屬于步驟S11建立的第一集合中的集團酒店關鍵字對應的集團酒店,或酒店名稱中出現(xiàn)步驟S11建立的第二集合中的關鍵字,或房型名稱中出現(xiàn)步驟S11建立的第三集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于傳統(tǒng)酒店;若酒店名稱中出現(xiàn)步驟S11建立的第四集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于民宿客棧;若不滿足上述兩種情況,則執(zhí)行S13;S13、利用步驟S11建立的第五集合,結合所述待挖掘的OTA酒店的位置信息進行進一步挖掘,若酒店位于所述第五集合中的古鎮(zhèn)和商業(yè)區(qū)關鍵字對應的古鎮(zhèn)和商業(yè)區(qū),或位于所述第五集合中的景區(qū)關鍵字對應的景區(qū)附近第一距離閾值范圍內,則所述待挖掘的OTA酒店被判為待定酒店,若不滿足,則執(zhí)行S14;S14、將步驟S11建立的第六集合中的關鍵字在所述待挖掘的OTA酒店的用戶點評中進行搜索,若包括所述關鍵字的用戶點評數(shù)量大于等于第一閾值并且所述用戶點評數(shù)量占所有用戶點評的比例大于等于第二閾值,則所述酒店被判為待定酒店,否則被判為傳統(tǒng)酒店。較佳地,步驟S2包括:S21、收集多個圖像,并生成第一圖像訓練集;S22、利用所述第一圖像訓練集訓練基于深度神經網絡的圖像特征提取模型;S23、收集傳統(tǒng)酒店和民宿客棧兩個類別的外觀圖像,生成第二圖像訓練集;S24、利用所述第二圖像訓練集訓練基于外觀圖像的傳統(tǒng)酒店和民宿客棧的二分類模型,通過判斷酒店外觀圖像是否屬于民宿客棧,實現(xiàn)民宿客棧的細粒度挖掘。較佳地,步驟S22中所訓練的圖像特征提取模型使用的深度神經網絡為8層的卷積神經網絡。較佳地,步驟S22中所述的圖像特征提取模型,將待提取特征的圖像作為所述網絡的輸入,將所述待提取特征的圖像在所述網絡的特定層的輸出值作為特征表達。較佳地,步驟S24包括:S241、將通過步驟S23生成的所述第二圖像訓練集中的所有圖像,利用步驟S22訓練得到的所述圖像特征提取模型進行特征提取,獲取相應的圖像特征表達;S242、利用通過步驟S241提取到的所述第二圖像訓練集中的圖像對應的圖像特征表達,訓練一個集成學習分類器,輸入一張酒店的外觀圖像到所述集成學習分類器,則輸出圖像所屬類別,類別包括傳統(tǒng)酒店、民宿客棧。較佳地,步驟S3包括:S31、對于一家OTA酒店,利用步驟S1建立的民宿客棧粗粒度挖掘模型進行第一次挖掘;S32、對于一家OTA酒店,利用步驟S2建立的民宿客棧細粒度挖掘模型進行第二次挖掘;S33、重復執(zhí)行步驟S31和S32,對OTA的所有酒店完成民宿客棧的挖掘。較佳地,在步驟S31中,對于一家OTA酒店,若所述民宿客棧粗粒度挖掘模型將所述OTA酒店判為民宿客棧,則所述OTA酒店被認為是民宿客棧,若所述民宿客棧粗粒度挖掘模型將所述OTA酒店判為傳統(tǒng)酒店,則所述OTA酒店被認為是傳統(tǒng)酒店,若所述民宿客棧粗粒度挖掘模型將所述OTA酒店判為待定酒店,則執(zhí)行步驟S32。較佳地,在步驟S32中,對于一家OTA酒店,將所述OTA酒店的所有外觀圖像依次輸入步驟S24訓練的基于外觀圖像的傳統(tǒng)酒店和民宿客棧的二分類模型中,綜合所述二分類模型對所有外觀圖像判定的類別進行最終挖掘,確定所述OTA酒店是否是民宿客棧。本專利技術的積極進步效果在于:本專利技術建立的基于酒店文本信息的民宿客棧粗粒度挖掘模型,充分利用酒店名稱、房型名稱、位置信息和用戶點評等多方面的信息,在快速挖掘出明顯屬于民宿客棧的酒店的同時,也快速過濾大量不屬于民宿客棧的酒店,為后續(xù)細粒度挖掘做好了準備。本專利技術建立的基于酒店圖像信息的民宿客棧細粒度挖掘模型,根據傳統(tǒng)酒店和民宿客棧在外觀圖像內容上的差異性,在圖像層面上進行民宿客棧的深度挖掘,提高了挖掘的準確性。本專利技術有效地利用酒店的文本信息和圖像信息進行綜合分析和判斷,快速而準確地挖掘出了大量民宿客棧,極大地減少了人力成本的投入。附圖說明圖1為本專利技術的較佳實施例的OTA的民宿客棧挖掘方法的流程圖。具體實施方式下面通過實施例的方式進一步說明本專利技術,但并不因此將本專利技術限制在所述的實施例范圍之中。如圖1所示,本專利技術的OTA的民宿客棧挖掘方法包括以下步驟:步驟101、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;步驟102、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;步驟103、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA售賣的海量酒店中的民宿客棧進行挖掘。其中,步驟101具體包括以下步驟:步驟1011、建立一系列關鍵字集合:包含集團酒店關鍵字的第一集合A;包含傳統(tǒng)酒店的酒店名稱關鍵字的第二集合B;包含傳統(tǒng)酒店的房型名稱關鍵字的第三集合C;包含民宿客棧的酒店名稱關鍵字的第四集合D;包含古鎮(zhèn)、景區(qū)和商業(yè)區(qū)關鍵字的第五集合E;包含民宿客棧的用戶點評關鍵字的第六集合F;其中1)第一集合A包含“七天”、“如家”、“漢庭”、“萬豪”、“希爾頓”等,2)第二集合B包含“快捷”、“便捷”、“商務”、“商旅”等,3)第三集合C包含“商務”、“商旅”、“標準”、“標間”、“雙標”、“行政”、“普通”等,4)第四集合D包含“客棧”、“民宿”、“公寓”、“農家樂”、“小筑”、“小舍”、“驛站”等,5)第五集合E包含古鎮(zhèn)關鍵字:“麗江”、“鳳凰”、“周莊”等,包含商業(yè)區(qū)關鍵字:“西溪濕地”、“龍門古鎮(zhèn)景區(qū)”等,包含特定4A和5A景區(qū)的關鍵字:“杭州西湖風景區(qū)”、“舟山普陀山風景區(qū)”等,6)第六集合F包含“院落”、“掌柜”、“古鎮(zhèn)”、“田園”、“別院”、“老街”、“洱海”等。步驟1012、對于待挖掘的OTA售賣酒店,若其本文檔來自技高網...
    OTA的民宿客棧挖掘方法

    【技術保護點】
    一種OTA的民宿客棧挖掘方法,其特征在于,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。

    【技術特征摘要】
    1.一種OTA的民宿客棧挖掘方法,其特征在于,包括以下步驟:S1、建立基于酒店文本信息的民宿客棧粗粒度挖掘模型;S2、建立基于酒店圖像信息的民宿客棧細粒度挖掘模型;S3、結合所述粗粒度挖掘模型和所述細粒度挖掘模型對OTA酒店中的民宿客棧進行挖掘。2.如權利要求1所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S1包括:S11、建立一系列關鍵字集合,包括:包含集團酒店關鍵字的第一集合;包含傳統(tǒng)酒店的酒店名稱關鍵字的第二集合;包含傳統(tǒng)酒店的房型名稱關鍵字的第三集合;包含民宿客棧的酒店名稱關鍵字的第四集合;包含古鎮(zhèn)、景區(qū)和商業(yè)區(qū)關鍵字的第五集合;包含民宿客棧的用戶點評關鍵字的第六集合;S12、對于待挖掘的OTA酒店,若屬于步驟S11建立的第一集合中的集團酒店關鍵字對應的集團酒店,或酒店名稱中出現(xiàn)步驟S11建立的第二集合中的關鍵字,或房型名稱中出現(xiàn)步驟S11建立的第三集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于傳統(tǒng)酒店;若酒店名稱中出現(xiàn)步驟S11建立的第四集合中的關鍵字,則所述待挖掘的OTA酒店被判為屬于民宿客棧;若不滿足上述兩種情況,則執(zhí)行S13;S13、利用步驟S11建立的第五集合,結合所述待挖掘的OTA酒店的位置信息進行進一步挖掘,若酒店位于所述第五集合中的古鎮(zhèn)和商業(yè)區(qū)關鍵字對應的古鎮(zhèn)和商業(yè)區(qū),或位于所述第五集合中的景區(qū)關鍵字對應的景區(qū)附近第一距離閾值范圍內,則所述待挖掘的OTA酒店被判為待定酒店,若不滿足,則執(zhí)行S14;S14、將步驟S11建立的第六集合中的關鍵字在所述待挖掘的OTA酒店的用戶點評中進行搜索,若包括所述關鍵字的用戶點評數(shù)量大于等于第一閾值并且所述用戶點評數(shù)量占所有用戶點評的比例大于等于第二閾值,則所述酒店被判為待定酒店,否則被判為傳統(tǒng)酒店。3.如權利要求1所述的OTA的民宿客棧挖掘方法,其特征在于,步驟S2包括:S21、收集多個圖像,并生成第一圖像訓練集;S22、利用所述第一圖像訓練集訓練基于深度神經網絡的圖像特征提取模型;S23、收集傳統(tǒng)酒店和民宿客棧兩個類別的外觀圖像,生成第二圖像訓練集;S24、利用所述第二圖像訓練集訓練基于外觀圖像的傳統(tǒng)酒店...

    【專利技術屬性】
    技術研發(fā)人員:李翔嚴捷冰李發(fā)科鞠濤偉
    申請(專利權)人:攜程計算機技術上海有限公司
    類型:發(fā)明
    國別省市:上海,31

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 免费无码又爽又刺激高潮的视频| 人妻AV中出无码内射| 99久久人妻无码精品系列| 亚洲爆乳无码一区二区三区| 久久无码人妻一区二区三区午夜| 好了av第四综合无码久久| 国产在线无码不卡影视影院 | 中文字幕AV无码一区二区三区| 亚洲人成人伊人成综合网无码| YY111111少妇无码理论片| 久久午夜福利无码1000合集| 午夜无码视频一区二区三区| 无码av免费毛片一区二区| 精品无码国产污污污免费网站国产| 亚洲av无码不卡久久| 高h纯肉无码视频在线观看| 免费无码一区二区三区蜜桃大| 久久精品亚洲中文字幕无码网站| 国产成年无码v片在线| 亚洲最大av资源站无码av网址| 国产v亚洲v天堂无码网站| 亚洲国产综合无码一区二区二三区| 亚洲精品无码久久久久秋霞| 精品日韩亚洲AV无码一区二区三区| 亚洲国产精品无码久久久久久曰| 无码人妻aⅴ一区二区三区有奶水 亚洲AV无码专区在线厂 | 国产午夜无码片在线观看| 久久精品国产亚洲AV无码偷窥| 亚洲热妇无码AV在线播放| av无码一区二区三区| 国产午夜无码片在线观看 | 无码夜色一区二区三区| 777爽死你无码免费看一二区| 无码乱人伦一区二区亚洲一| 亚洲av永久无码精品古装片| 中文无码制服丝袜人妻av| 日韩精品无码免费专区午夜不卡| 中文无码vs无码人妻| 精品久久久久久无码国产| 精品人妻无码专区中文字幕| 国产亚洲精品a在线无码|