【技術實現步驟摘要】
一種智慧招標業績關鍵字提取及相似度匹配方法
本專利技術涉及招標業績計算
,具體為一種智慧招標業績關鍵字提取及相似度匹配方法。
技術介紹
招標(invitationtotender)是指招標人(買方)事先發出招標通告或招標單,品種、數量和有關的交易條件提出在規定的時間、地點,準備買進的商品名稱、件,邀請投標人(賣方)參加投標的行為。現有的在對招標業績進行匯總時,需要查詢很多的相關文件,效率極慢,無法便利的幫助客戶快速挑選符合要求的相關文件,大大降低了工作效率。基于此,本專利技術設計了一種智慧招標業績關鍵字提取及相似度匹配方法,以解決上述問題。
技術實現思路
本專利技術的目的在于提供一種智慧招標業績關鍵字提取及相似度匹配方法,以解決上述
技術介紹
中提出的現有的在對招標業績進行匯總時,需要查詢很多的相關文件,效率極慢,無法便利的幫助客戶快速挑選符合要求的相關文件,大大降低了工作效率的問題。為實現上述目的,本專利技術提供如下技術方案:一種智慧招標業績關鍵字提取及相似度匹配方法,包括以下步驟:步驟一、使用TextRank算法提取對應文檔業績要求值中的關鍵字,使用一些規則提取添增到關鍵字中;步驟二、前端頁面獲取客戶上傳文檔,將上傳的文檔及業績要求值作為語料,結巴分詞之后一同喂進word2vec模型訓練得到詞向量;步驟三、用訓練出來的模型查找出與關鍵字最相似的詞語;步驟四、遍歷上傳文件,以便找出關鍵段落或句子與關鍵字、相似詞相匹配,并提取關鍵句子;r>步驟五、將業績要求值切分成句子,然后與找出的關鍵句子建立語料庫,使用doc2bow把句子變為一個稀疏向量;步驟六、業績要求句子和關鍵句子所生成的稀疏向量進行兩兩計算相似度,取與業績要求句子相似度最高的句子,得到句子與句子之間的相似度,并輸出相似結果;步驟七、同理可計算出業績要求值文本與提取的關鍵句子文本之間的相似度。優選的,所述步驟二中的詞向量需保留專業詞匯及基于規則提取的關鍵字不被切分。優選的,所述步驟一中的所需業績要求值存儲于建立的語料庫中。優選的,所述步驟一中使用TextRank提取關鍵字,存儲到數據庫關鍵字表中,且前端客戶上傳文檔,后端運行算法提取文檔關鍵內容存入數據庫表中,自動創建項目。優選的,所述自動創建項目包括以下步驟:A、點擊跳轉到項目條件頁面,讀取數據庫表中內容,關鍵字呈現在頁面;B、在項目結果詳情頁面,讀取數據庫表中內容,業績要求句子與文檔中的句子相似度最高的結果會一一呈現在前端頁面;C、給出文本之間的相似度,自動判斷是否符合業績要求。與現有技術相比,本專利技術的有益效果是:本專利技術可以實現對比業績要求,通過客戶上傳的文檔,自動提取上傳文檔中與業績相關的內容,并進行業績相似度的比對。也可以幫助客戶快速自動甄選符合要求的文檔,提高工作效率;省去人工添加項目所需要填寫內容的繁瑣過程,簡化了流程。自動判別文檔是否滿足要求,客觀公正,有效避免人工判別因情緒所左右的結果,同時節省人工查閱文檔的大量時間。當客戶感覺關鍵字或效果不滿意時,客戶可自助添加關鍵字,算法會提升關鍵字權重以達到預期效果。附圖說明為了更清楚地說明本專利技術實施例的技術方案,下面將對實施例描述所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本專利技術算法整體流程圖;圖2為本專利技術Word2vec訓練流程圖;圖3為本專利技術自動創建項目流程圖。具體實施方式下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其它實施例,都屬于本專利技術保護的范圍。請參閱圖1-3,本專利技術提供一種技術方案:一種智慧招標業績關鍵字提取及相似度匹配方法,包括以下步驟:步驟一、使用TextRank算法提取對應文檔業績要求值中的關鍵字,使用一些規則提取添增到關鍵字中;步驟二、前端頁面獲取客戶上傳文檔,將上傳的文檔及業績要求值作為語料,結巴分詞之后一同喂進word2vec模型訓練得到詞向量;步驟三、用訓練出來的模型查找出與關鍵字最相似的詞語;步驟四、遍歷上傳文件,以便找出關鍵段落或句子與關鍵字、相似詞相匹配,并提取關鍵句子;步驟五、將業績要求值切分成句子,然后與找出的關鍵句子建立語料庫,使用doc2bow把句子變為一個稀疏向量;步驟六、業績要求句子和關鍵句子所生成的稀疏向量進行兩兩計算相似度,取與業績要求句子相似度最高的句子,得到句子與句子之間的相似度,并輸出相似結果;步驟七、同理可計算出業績要求值文本與提取的關鍵句子文本之間的相似度。更進一步的實施方式為,所述步驟二中的詞向量需保留專業詞匯及基于規則提取的關鍵字不被切分。更進一步的實施方式為,所述步驟一中的所需業績要求值存儲于建立的語料庫中。更進一步的實施方式為,所述步驟一中使用TextRank提取關鍵字,存儲到數據庫關鍵字表中,且前端客戶上傳文檔,后端運行算法提取文檔關鍵內容存入數據庫表中,自動創建項目。更進一步的所述自動創建項目實施方式為如圖3所示,包括以下步驟:A、點擊跳轉到項目條件頁面,讀取數據庫表中內容,關鍵字呈現在頁面;B、在項目結果詳情頁面,讀取數據庫表中內容,業績要求句子與文檔中的句子相似度最高的結果會一一呈現在前端頁面;C、給出文本之間的相似度,自動判斷是否符合業績要求。需要說明的是,通過利用對比業績要求的關鍵字,通過客戶上傳的文檔,自動提取上傳文檔中與業績相關的內容,并進行業績相似度的比對,并且可以幫助客戶快速自動甄選符合要求的文檔,提高工作效率;省去人工添加項目所需要填寫內容的繁瑣過程,簡化了流程,通過自動判別文檔是否滿足要求,客觀公正,有效避免人工判別因情緒所左右的結果,同時節省人工查閱文檔的大量時間,而且當客戶感覺關鍵字或效果不滿意時,客戶可自助添加關鍵字,算法會提升關鍵字權重以達到預期效果。在本說明書的描述中,參考術語“一個實施例”、“示例”、“具體示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本專利技術的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。以上公開的本專利技術優選實施例只是用于幫助闡述本專利技術。優選實施例并沒有詳盡敘述所有的細節,也不限制該專利技術僅為所述的具體實施方式。顯然,根據本說明書的內容,可作很多的修改和變化。本說明書選取并具體描述這些實施例,是為了更好地解釋本專利技術的原理和實際應用,從而使本文檔來自技高網...
【技術保護點】
1.一種智慧招標業績關鍵字提取及相似度匹配方法,其特征在于:包括以下步驟:/n步驟一、使用TextRank算法提取對應文檔業績要求值中的關鍵字,使用一些規則提取添增到關鍵字中;/n步驟二、前端頁面獲取客戶上傳文檔,將上傳的文檔及業績要求值作為語料,結巴分詞之后一同喂進word2vec模型訓練得到詞向量;/n步驟三、用訓練出來的模型查找出與關鍵字最相似的詞語;/n步驟四、遍歷上傳文件,以便找出關鍵段落或句子與關鍵字、相似詞相匹配,并提取關鍵句子;/n步驟五、將業績要求值切分成句子,然后與找出的關鍵句子建立語料庫,使用doc2bow把句子變為一個稀疏向量;/n步驟六、業績要求句子和關鍵句子所生成的稀疏向量進行兩兩計算相似度,取與業績要求句子相似度最高的句子,得到句子與句子之間的相似度,并輸出相似結果;/n步驟七、同理可計算出業績要求值文本與提取的關鍵句子文本之間的相似度。/n
【技術特征摘要】
1.一種智慧招標業績關鍵字提取及相似度匹配方法,其特征在于:包括以下步驟:
步驟一、使用TextRank算法提取對應文檔業績要求值中的關鍵字,使用一些規則提取添增到關鍵字中;
步驟二、前端頁面獲取客戶上傳文檔,將上傳的文檔及業績要求值作為語料,結巴分詞之后一同喂進word2vec模型訓練得到詞向量;
步驟三、用訓練出來的模型查找出與關鍵字最相似的詞語;
步驟四、遍歷上傳文件,以便找出關鍵段落或句子與關鍵字、相似詞相匹配,并提取關鍵句子;
步驟五、將業績要求值切分成句子,然后與找出的關鍵句子建立語料庫,使用doc2bow把句子變為一個稀疏向量;
步驟六、業績要求句子和關鍵句子所生成的稀疏向量進行兩兩計算相似度,取與業績要求句子相似度最高的句子,得到句子與句子之間的相似度,并輸出相似結果;
步驟七、同理可計算出業績要求值文本與提取的關鍵句子文本之間的相似度。
2.根據權利要求1所述的一種智慧招標業績關鍵字提取及...
【專利技術屬性】
技術研發人員:黃璇,陸韜,姜建波,
申請(專利權)人:上海傳時軟件技術開發有限公司,
類型:發明
國別省市:上海;31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。