【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及人工智能,尤其涉及一種信息提取方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、在各行各業(yè),幾乎都會(huì)存在業(yè)務(wù)人員與客戶溝通的對(duì)話場景,比如在產(chǎn)品銷售、服務(wù)咨詢等活動(dòng)中,存在業(yè)務(wù)人員與客戶進(jìn)行對(duì)話交流的場景。在這些對(duì)話場景中,客戶與業(yè)務(wù)人員之間會(huì)產(chǎn)生大量的、多輪次的對(duì)話交流。
2、而對(duì)于錄制的對(duì)話數(shù)據(jù)的應(yīng)用,目前還是停留在對(duì)話數(shù)據(jù)的存檔、證據(jù)溯源等傳統(tǒng)應(yīng)用上,無法實(shí)現(xiàn)更加高效的關(guān)鍵信息抽取和作業(yè)輔助。當(dāng)用戶需要從對(duì)話數(shù)據(jù)中提取需要的信息時(shí),常規(guī)的做法是直接從對(duì)話數(shù)據(jù)中檢索與問題相關(guān)的信息,該信息提取方式效率較低,并且提取的信息準(zhǔn)確度較低。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)本申請實(shí)施例的第一方面,提供了一種信息提取方法,包括:
2、獲取特定業(yè)務(wù)場景下的對(duì)話數(shù)據(jù)以及待答復(fù)的問題信息;
3、從所述問題信息中提取關(guān)鍵詞,并至少基于提取的關(guān)鍵詞,從所述對(duì)話數(shù)據(jù)中篩選與所述關(guān)鍵詞相關(guān)的對(duì)話數(shù)據(jù),作為備用對(duì)話數(shù)據(jù);
4、從所述備用對(duì)話數(shù)據(jù)中提取得到與所述問題信息對(duì)應(yīng)的答案信息;
5、從預(yù)先構(gòu)建的知識(shí)庫中,提取得到與所述問題信息相對(duì)應(yīng)的知識(shí)數(shù)據(jù),并利用所述知識(shí)數(shù)據(jù),對(duì)所述答案信息進(jìn)行優(yōu)化調(diào)整;所述知識(shí)庫由所述特定業(yè)務(wù)場景所屬行業(yè)的知識(shí)數(shù)據(jù)和/或業(yè)務(wù)數(shù)據(jù)構(gòu)建得到。
6、根據(jù)本申請實(shí)施例的第二方面,提供了一種信息提取裝置,包括:
7、數(shù)據(jù)獲取單元,用于獲取特定業(yè)務(wù)場景下的對(duì)話數(shù)據(jù)以及待答復(fù)的問題信息;
8、數(shù)據(jù)
9、標(biāo)簽提取單元,用于從所述備用對(duì)話數(shù)據(jù)中提取得到與所述問題信息對(duì)應(yīng)的答案信息;從預(yù)先構(gòu)建的知識(shí)庫中,提取得到與所述問題信息相對(duì)應(yīng)的知識(shí)數(shù)據(jù),并利用所述知識(shí)數(shù)據(jù),對(duì)所述答案信息進(jìn)行優(yōu)化調(diào)整;所述知識(shí)庫由所述特定業(yè)務(wù)場景所屬行業(yè)的知識(shí)數(shù)據(jù)和/或業(yè)務(wù)數(shù)據(jù)構(gòu)建得到。
10、根據(jù)本申請實(shí)施例的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器和處理器;
11、所述存儲(chǔ)器與所述處理器連接,用于存儲(chǔ)程序;
12、所述處理器用于通過運(yùn)行所述存儲(chǔ)器中的程序,實(shí)現(xiàn)以上任意一項(xiàng)所述的信息提取方法。
13、根據(jù)本申請實(shí)施例的第四方面,提供了一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器運(yùn)行時(shí),實(shí)現(xiàn)以上任意一項(xiàng)所述的信息提取方法。
14、根據(jù)本申請實(shí)施例的第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,所述計(jì)算機(jī)程序產(chǎn)品或所述計(jì)算機(jī)程序包括計(jì)算機(jī)指令,所述計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中;計(jì)算機(jī)設(shè)備的處理器從所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取所述計(jì)算機(jī)指令,處理器執(zhí)行所述計(jì)算機(jī)指令,使得所述計(jì)算機(jī)設(shè)備執(zhí)行上述的方法。
15、本申請?zhí)岢龅男畔⑻崛》椒ǎ軌蚪柚P(guān)鍵詞從特定業(yè)務(wù)場景的對(duì)話數(shù)據(jù)中篩選出與問題信息相關(guān)的備用對(duì)話數(shù)據(jù),然后從備用對(duì)話數(shù)據(jù)中提取與問題信息對(duì)應(yīng)的答案信息。在此基礎(chǔ)上,還借助由上述特定業(yè)務(wù)場景所屬行業(yè)的知識(shí)數(shù)據(jù)和/或業(yè)務(wù)數(shù)據(jù)構(gòu)建的知識(shí)庫,從中提取與問題信息對(duì)應(yīng)的知識(shí)數(shù)據(jù),用于對(duì)提取的答案信息進(jìn)行優(yōu)化調(diào)整,從而使得答案信息符合行業(yè)知識(shí),提高了答案信息提取的準(zhǔn)確度和效率。
16、在一些實(shí)現(xiàn)方式中,本申請?zhí)岢龅男畔⑻崛》椒ɡ锰囟I(yè)務(wù)場景所屬行業(yè)的知識(shí)數(shù)據(jù)和/或業(yè)務(wù)數(shù)據(jù),對(duì)預(yù)訓(xùn)練的生成式語言模型進(jìn)行微調(diào),得到答案信息提取模型。基于上述的答案信息提取模型,在獲取到上述特定業(yè)務(wù)場景下的對(duì)話數(shù)據(jù)以及待答復(fù)的問題信息時(shí),能夠基于待答復(fù)的問題信息中的關(guān)鍵詞,從對(duì)話數(shù)據(jù)中篩選出與這些關(guān)鍵詞相關(guān)的對(duì)話數(shù)據(jù),作為備用對(duì)話數(shù)據(jù),然后,借助預(yù)先訓(xùn)練的答案信息提取模型,從該備用對(duì)話數(shù)據(jù)中提取得到與該問題信息對(duì)應(yīng)的答案信息。該方案實(shí)現(xiàn)了自動(dòng)從對(duì)話數(shù)據(jù)中提取出與問題信息相對(duì)應(yīng)的答案信息,即能夠?qū)崿F(xiàn)自動(dòng)從對(duì)話數(shù)據(jù)中提煉解答問題的答案,從而實(shí)現(xiàn)了更加高效的關(guān)鍵信息抽取和作業(yè)輔助。
17、基于預(yù)訓(xùn)練的生成式語言模型強(qiáng)大的自然語言處理能力,該方案的答案信息提取準(zhǔn)確度更高,實(shí)現(xiàn)了信息抽取的質(zhì)量和效率雙雙提升。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種信息提取方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,從所述備用對(duì)話數(shù)據(jù)中提取得到與所述問題信息對(duì)應(yīng)的答案信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用預(yù)先訓(xùn)練的信息提取模型,從所述備用對(duì)話數(shù)據(jù)中提取得到與所述問題信息對(duì)應(yīng)的答案信息,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述信息提取任務(wù)還用于從所述備用對(duì)話數(shù)據(jù)中,提取出與提取的答案信息對(duì)應(yīng)的對(duì)話上下文;
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述知識(shí)數(shù)據(jù),對(duì)所述答案信息進(jìn)行優(yōu)化調(diào)整,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述知識(shí)庫包括行業(yè)知識(shí)圖譜和實(shí)體知識(shí)圖譜,所述行業(yè)知識(shí)圖譜由所述特定業(yè)務(wù)場景所屬行業(yè)的知識(shí)數(shù)據(jù)構(gòu)建得到,所述實(shí)體知識(shí)圖譜由所述特定業(yè)務(wù)場景所屬行業(yè)的特定實(shí)體的知識(shí)數(shù)據(jù)構(gòu)建得到;
7.根據(jù)權(quán)利要求1至4中任意一項(xiàng)所述的方法,其特征在于,從所述問題信息中提取關(guān)鍵詞,并至少基于提取的關(guān)鍵詞,從所述對(duì)話數(shù)據(jù)中篩選與所述關(guān)鍵詞相關(guān)的對(duì)話數(shù)據(jù),作為備用對(duì)話數(shù)據(jù),包括:
...【技術(shù)特征摘要】
1.一種信息提取方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,從所述備用對(duì)話數(shù)據(jù)中提取得到與所述問題信息對(duì)應(yīng)的答案信息,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用預(yù)先訓(xùn)練的信息提取模型,從所述備用對(duì)話數(shù)據(jù)中提取得到與所述問題信息對(duì)應(yīng)的答案信息,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述信息提取任務(wù)還用于從所述備用對(duì)話數(shù)據(jù)中,提取出與提取的答案信息對(duì)應(yīng)的對(duì)話上下文;
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述知識(shí)數(shù)據(jù),對(duì)所述答案信息進(jìn)行優(yōu)化調(diào)整,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述知識(shí)庫包括行業(yè)知識(shí)圖譜和實(shí)體知識(shí)圖譜,所述行業(yè)知識(shí)圖譜由所述特定業(yè)務(wù)場景所屬行業(yè)的知識(shí)數(shù)據(jù)構(gòu)建得到,所述實(shí)體知識(shí)圖譜由所述特定業(yè)務(wù)場景所屬行業(yè)的特定實(shí)體的知識(shí)數(shù)據(jù)構(gòu)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:姚繼軍,馮庭好,張東旭,
申請(專利權(quán))人:科大訊飛股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。