【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及查詢目標分析方法,特別是。
技術(shù)介紹
在使用中文自然語言查詢的系統(tǒng)中,其基本的處理流程是由用戶采用自然語言 給出包括查詢條件和查詢目標的中文查詢句,系統(tǒng)對該查詢句進行句法、詞法、語義的分析 和理解,從中識別出相關(guān)的查詢條件和查詢目標,并以此構(gòu)成對知識庫的檢索語句,得到正 確答案,生成中文回答句反饋給用戶,以結(jié)束一次查詢的過程。在整個流程中,對于查詢句 的分析,或者說對于查詢目標的識別是整個系統(tǒng)正確工作的第一步。若對于查詢目標分析 錯誤,將直接導致知識檢索和答句生成的錯誤,也就會直接影響到系統(tǒng)的工作效率和正確 性。 —般來說,常用的查詢目標分析方法有模板匹配和相似度計算等方法。模板匹配 方法在應用時,是將由統(tǒng)計得到的大量常用問句以形式化的方式表示,作為模板,要求用戶 在進行信息查詢時嚴格按照模板的組織結(jié)構(gòu)來表述查詢意圖。這種方法的封閉測試正確率 很高,但對于用戶的使用限制較多,很難達到自然語言查詢所希望的無障礙交流, 一旦用戶 查詢句的表述形式超出了系統(tǒng)模板的范圍,系統(tǒng)則會顯得無能為力。因此,在現(xiàn)代的查詢工 作中,該方法大多作為一種輔助手段來識別查詢目標。相似度計算方法,主要是通過對詞法 分析后的查詢句中詞語共現(xiàn)概率、特征詞使用頻度等內(nèi)容的計算和統(tǒng)計,得到查詢句中各 部分內(nèi)容作為查詢目標的概率值——即相似度,以此相似度的大小來確定查詢目標。這種 方法對于用戶的輸入限制相對較少,但由于中文的靈活多樣性,使得根據(jù)統(tǒng)計結(jié)果計算出 的相似度命中查詢目標的概率降低,自然語言問答時有時會出現(xiàn)答非所問的情況。 由于技術(shù)限制,目前中文自然語言查詢的系統(tǒng)大 ...
【技術(shù)保護點】
一種面向中文查詢句的三級查詢目標分析方法,其特征在于:包括以下步驟: ?。ǎ保└鶕?jù)系統(tǒng)語言的受限情況,通過大規(guī)模語料分析和統(tǒng)計,建立復合概念和推演規(guī)則的知識庫; ?。ǎ玻┰诰浞ê驮~法分析的基礎(chǔ)上,對查詢句進行語義理解,識別出其中的查詢目標,并將該查詢目標歸類為直接查詢目標、邏輯推理目標、比較判斷目標; ?。ǎ常┤糇R別出比較判斷目標,則根據(jù)查詢句類型、比較元素關(guān)系、比較元素值來源以及比較結(jié)果類型內(nèi)容的不同,提取到對應的邏輯推理目標或直接查詢目標;若無比較判斷目標,則直接進入步驟(4); ?。ǎ矗┤糇R別出邏輯推理目標,則系統(tǒng)需要經(jīng)過概念分解或規(guī)則推演,轉(zhuǎn)化為相對應的直接查詢目標;若無邏輯推理目標,則直接進入步驟(5); (5)若識別出直接查詢目標,系統(tǒng)可以直接進行查詢轉(zhuǎn)換,將其轉(zhuǎn)換為數(shù)據(jù)提取目標,用于檢索專業(yè)基本知識庫獲取答案; ?。ǎ叮└鶕?jù)查詢和分析結(jié)果,以及查詢句中初始查詢目標的類型,通過概念合成和推理,產(chǎn)生回答用戶目標的值,并以此形成反饋給用戶的答句。
【技術(shù)特征摘要】
一種面向中文查詢句的三級查詢目標分析方法,其特征在于包括以下步驟(1)根據(jù)系統(tǒng)語言的受限情況,通過大規(guī)模語料分析和統(tǒng)計,建立復合概念和推演規(guī)則的知識庫;(2)在句法和詞法分析的基礎(chǔ)上,對查詢句進行語義理解,識別出其中的查詢目標,并將該查詢目標歸類為直接查詢目標、邏輯推理目標、比較判斷目標;(3)若識別出比較判斷目標,則根據(jù)查詢句類型、比較元素關(guān)系、比較元素值來源以及比較結(jié)果類型內(nèi)容的不同,提取到對應的邏輯推理目標或直接查詢目標;若無比較判斷目標,則直接進入步驟(4);(4)若識別出邏輯推理目標,則系統(tǒng)需要經(jīng)過概念分解或規(guī)則推演,轉(zhuǎn)化為相對應的直接查詢目標;若無邏輯推理目標,則直接進入步驟(5);(5)若識別出直接查詢目標,系統(tǒng)可以直接進行查詢轉(zhuǎn)換,將其轉(zhuǎn)換為數(shù)據(jù)提取目標,用于檢索專業(yè)基本知識庫獲取答案;(6)根據(jù)查詢和分析結(jié)果,以及查詢句中初始查詢目標的類型,通過概念合成和推理,產(chǎn)生回答用戶目標的值,并以此形成反饋給用戶的答句。2. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于所 述的步驟(1)中,復合概念和推演規(guī)則的知識庫指系統(tǒng)所屬應用領(lǐng)域的復合概念知識庫和 邏輯概念推理知識庫;所述的復合概念就是指可以分解為多個標準概念,或一個標準概念 與常量的算術(shù)運算式的概念;將復合概念與標準概念之間的關(guān)系表達式建立成復合概念知 識庫,只在基本知識庫中保持標準概念,在分析查詢句時將復合概念分解為標準概念,從而 理解查詢意圖;所述的邏輯概念就是指可以用多個標準概念派生的概念;邏輯概念推理知 識庫則是用于保存邏輯概念與標準概念之間的推演規(guī)則,形式為邏輯產(chǎn)生式。3. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于所 述的步驟(2)中,查詢句包含直接查詢目標、邏輯推理目標、比較判斷目標中的一級或多 級,對不同形式和復雜度的查詢句,采用不同層次和級別的推演變換過程,此概念變換過程 可逐級或越級進行。4. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于所 述的步驟(3)中,比較判斷目標對應于各種結(jié)構(gòu)形式的查詢句,從比較判斷目標中分析出 需要進行比較和判斷的邏輯推理目標或直接查詢目標,然后由邏輯推理目標或直接查詢目 標進行知識庫查詢,然后再反向推演出結(jié)果,再合成回答用戶目標的值。5. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于所 述的步驟(4)中,邏輯推理目標分為直接邏輯推理目標和間接邏輯推理目標;直接邏輯推 理目標是指邏輯概念推理知識庫的產(chǎn)生式結(jié)論中出現(xiàn)的知識目標;間接邏輯推理目標是指 經(jīng)過概念分解等價變換最終變換為邏輯概念推理知識庫的產(chǎn)生式結(jié)論中出現(xiàn)的知識目標; 邏輯推理目標化解推演變換的變換過程為直接邏輯推理目標經(jīng)過邏輯概念推理知識庫的 產(chǎn)生式逆向推理,可轉(zhuǎn)換為直接查詢目標;邏輯推理目標求值推演變換的變換過程為對于 直接查詢目標查詢到的知識結(jié)果,再經(jīng)過邏輯概念推理知識庫的產(chǎn)生式推理轉(zhuǎn)換為直接邏 輯推理目標的值,用于生成答句。6. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于所 述的步驟(5)中,直接查詢目標是一種對應于標準概念的查詢目標;根據(jù)查詢句中的直接查詢目標,可以直接對知識庫進行檢索操作得到數(shù)據(jù),或這些數(shù)據(jù)經(jīng)過簡單的概念合成等 價變換得到結(jié)果;直接查詢目標分簡單直接查詢目標和復合直接查詢目標,簡單直接查詢目標是指只包 含域名和聚集函數(shù)的目標;復合直接查詢目標是指由簡單直接查詢目標經(jīng)過概念合成等價 變換的目標;對于可以出現(xiàn)聚集函數(shù)的簡單直接查詢目標又可以分為顯性目標、疑問目標和聚集目 標三類;顯性目標是指用域名直接給出的目標;疑問目標是指用疑問詞給出的目標;聚集 目標是指用聚集函數(shù)給出的目標。7. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于所 述的步驟(6)中,回答用戶目標是指自然語言查詢句要求系統(tǒng)回答的內(nèi)容,所述內(nèi)容是比 較判斷目標、邏輯推理目標或者是直接查詢目標。8. 根據(jù)權(quán)利要求1所述的面向中文查詢句的三級查詢目標分析方法,其特征在于回 答用戶目標和查詢目標直接存在以下幾種對應關(guān)系 當回答用戶目標=直接查詢目標時,直接查詢目標的內(nèi)容就是回答用戶目標的值;② ...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:鄭逢斌,毋琳,賴積保,喬保軍,葛強,
申請(專利權(quán))人:河南大學,
類型:發(fā)明
國別省市:41[中國|河南]
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。