"/>
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于檢索和知識圖譜的軍事法規問答方法技術

    技術編號:36691893 閱讀:29 留言:0更新日期:2023-02-27 20:00
    本發明專利技術的目的是提供一種基于檢索和知識圖譜的軍事法規問答方法,通過運用以上兩種技術構建軍事法規問答系統,先將問題定位到最相關的法規條款,再通過匹配語義關系得出短答案,以條款完整內容和層次脈絡作為補充,融合兩種技術的優勢,并通過測試驗證問答效果。并通過測試驗證問答效果。并通過測試驗證問答效果。

    【技術實現步驟摘要】
    一種基于檢索和知識圖譜的軍事法規問答方法


    [0001]本專利技術涉及軍事法規問答
    ,特別涉及一種基于檢索和知識圖譜的軍事法規問答方法。

    技術介紹

    [0002]隨著人類社會邁入信息化、智能化時代,戰爭和軍事行動面貌隨之發生深刻演變,尤其是輿論戰、心理戰和法律戰等認知領域作戰樣式的興起,對指揮信息系統的綜合信息服務能力提出了更高要求。軍事法規作為指導戰場行動的法理依據,重要性不可忽視,特別是在認知作戰領域,其作用早已從幕后走向前臺。指揮員做出決策需要詳細的法規支持,每一步都應做到有據可查。然而,在信息化條件下,人工查閱文本的傳統方式顯然已經跟不上戰爭節奏,難以滿足戰場決策需要。因此,構建準確、高效、靈活、智能的軍事法規問答系統,具有廣闊的應用前景。
    [0003]目前,法規問答可歸納為七類,分別是判斷類、多選項類、檢索類、大數據類、本體類、神經網絡類與其他方法?;谛畔z索(information retrieval,IR)的法規問答首先定位包含相關信息的段落,再確定具體答案,但目前尚未見可用于問答的軍事法規開源圖譜。
    [0004]信息檢索技術可根據關鍵詞迅速找到相關法規和條款,但難以直接給出問題答案,需要人工閱讀條款。知識圖譜問答的效果依賴圖譜的規模和質量,工作量較大,且答案缺乏來源信息和可解釋性,因此,單獨采用檢索或知識圖譜技術構建的問答系統均不能契合軍事輔助決策的需求。

    技術實現思路

    [0005]本專利技術的目的是提供一種基于檢索和知識圖譜的軍事法規問答方法,用來
    技術介紹
    中提出的問題。
    [0006]為了達到上述專利技術目的,本專利技術采用的技術方案為:
    [0007]一種基于檢索和知識圖譜的軍事法規問答方法,包括軍事法規文本預處理、軍事法規問答和實驗與分析三個步驟:
    [0008]所述軍事法規文本預處理包括以下步驟:
    [0009]步驟一:法規標題識別:軍事法規篇章結構嚴謹、層次鮮明,各級標題對所屬內容的概括凝練而準確,將法規文本以條款為單位進行分割,對于信息檢索十分重要,軍事法規的標題結構具有很強的規律性,通常一級標題為“第X章”、二級標題為“第X節”、三級標題為“第X條”;
    [0010]步驟二:生成條款檢索樹:在標題識別的基礎上,為快速定位與問題最相關的條款,根據軍事法規特點對經典的TF
    ?
    IDF算法進行調整;
    [0011]步驟三:語義關系標注:為了向簡單問題提供簡明扼要的短答案,需利用知識圖譜技術對法規條款進行語義關系標注,生成大量知識“三元組”,知識的規模和質量將直接影
    響問題理解能力與解答質量,主要有三種標注方式:一是人工標注,較為詳細準確,但費時費力;二是自動標注,可批量處理句式固定的條款,但需逐一編寫程序;三是從題庫提取簡潔的題目進行轉換,但受限于題庫規模。
    [0012]進一步的,其特征在于,所述軍事法規問答包括以下步驟:
    [0013]步驟一:問句處理:回答問題的前提是將自然語言形式的問句處理成可被計算機理解的數據,所述問句處理包含疑問詞替換、指定搜索范圍和分詞三個步驟;
    [0014]a、疑問詞替換:自然語言中的疑問詞對于檢索是無用的,應在準確理解提問者意圖后將其去除。本系統通過枚舉常見的提問方式來理解意圖,對部分字詞進行近義替換可減少枚舉數量,例如,“X包含哪些條目”、“X含有什么條款”、“X包括哪些章節”都會替換成“X有什么內容”,只要識別后者,就能理解類似的一系列提法;
    [0015]b、指定搜索范圍:對于“X法規對Y有何規定”、“X法規附則有哪幾條”的提問,在提問者指定的范圍內搜索后,將范圍限定詞代表的層級作為初始搜索節點,未指定范圍,則從包含所有法規的根節點開始搜索;
    [0016]c、問句分詞:除去開頭的范圍限定詞和末尾的疑問詞后,對問句其余部分進行分詞,由實詞構成問句詞組,《軍語》詞匯、人工標注的軍事用語可增強通用分詞工具在軍事法規領域的分詞效果;
    [0017]步驟二:答案組織:問句處理明確了搜索范圍和問句詞組,在此基礎上通過檢索相關條款、匹配語義關系和輸出答案三個步驟,完成一次問答;
    [0018]a、檢索相關條款:以問句詞組和代表搜索范圍的初始搜索節點為輸入,運行條款檢索算法,輸出的答案列表即為相關度最高的條款集合,若答案列表為空,則表示找不到相關條款;
    [0019]b、匹配語義關系:預處理過程中的語義關系標注為各條款添加了若干知識三元組,問句匹配了答案條款所包含的三元組,則給出短答案;
    [0020]c、輸出答案:雖然短答案提供了關鍵信息,但詢問者可能還想了解更詳細的信息,此外,仍有大量知識難以用三元組表述,很多問題也不能用短答案解答,因此,還需要答案來源和條款全文作為補充,以增強說服力和準確性,此外,知識圖譜除了難以解決找不到語義關系的問題,也不適合回答詢問章節條款的問題,而本系統建立了完善的目錄層級,便于回答此類問題;
    [0021]步驟三:輔助答題:利用條款檢索和語義匹配能力實現答題模塊,能嘗試解答判斷題、單選題、多選題和填空題,該功能可用于輔助軍事法規學習和測試,也可用于從題庫添加語義關系,將題干視為問題,檢索到最相關的法規條款,對于單選題、多選題和填空題,嘗試通過匹配語義關系得出答案,對于判斷題或無法匹配語義關系的情況,采用字符串匹配確定答案,對于仍不能確定答案的單選題和多選。
    [0022]進一步的,所述實驗與分析包括問答測試和對比分析兩個步驟。
    [0023]進一步的,所述步驟一中的生成條款檢索樹包括以下步驟進行生成:
    [0024]步驟一:構建分詞計數器:分詞計數器是一種數據結構,用于保存一段文字中各分詞的詞頻(term frequency,TF),問答系統的各級目錄層級均具備上級標題計數器C
    up
    、本級標題計數器C
    now
    和正文計數器C
    text
    ,將本級標題與上級標題分別計數,是因為本級標題與本級內容相關性最強,權重更高,在正文或上級標題中,分詞出現頻率越高并不代表它與該條
    款的相關性越強,本文的TF值已不單指分詞頻率,C
    up
    和C
    text
    只統計分詞出現與否(值為0或1),C
    now
    中的值表示各分詞占總詞數的比率,求分詞a在某層級的TF值,即按下式計算三個分詞計數器相應值的加權和:
    [0025]TF[a]=C
    up
    [a]×
    W
    up
    +C
    now
    [a]×
    W
    now
    +C
    text
    [a]×
    W
    text
    ????
    (1)
    [0026]式(1)中,W
    up
    、W
    now
    和W
    text
    表示各分詞計數器的權重;
    [0027]步驟二:分詞計數器更新:為使各層級的分詞計數器準確反映分詞與所屬內容的最強相關性,每本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種基于檢索和知識圖譜的軍事法規問答方法,其特征在于,包括軍事法規文本預處理、軍事法規問答和實驗與分析三個步驟:所述軍事法規文本預處理包括以下步驟:步驟一:法規標題識別:軍事法規篇章結構嚴謹、層次鮮明,各級標題對所屬內容的概括凝練而準確,將法規文本以條款為單位進行分割,對于信息檢索十分重要,軍事法規的標題結構具有很強的規律性,通常一級標題為“第X章”、二級標題為“第X節”、三級標題為“第X條”;步驟二:生成條款檢索樹:在標題識別的基礎上,為快速定位與問題最相關的條款,根據軍事法規特點對經典的TF
    ?
    IDF算法進行調整;步驟三:語義關系標注:為了向簡單問題提供簡明扼要的短答案,需利用知識圖譜技術對法規條款進行語義關系標注,生成大量知識“三元組”,知識的規模和質量將直接影響問題理解能力與解答質量,主要有三種標注方式:一是人工標注,較為詳細準確,但費時費力;二是自動標注,可批量處理句式固定的條款,但需逐一編寫程序;三是從題庫提取簡潔的題目進行轉換,但受限于題庫規模。2.根據權利要求1所述的一種基于檢索和知識圖譜的軍事法規問答方法,其特征在于,所述軍事法規問答包括以下步驟:步驟一:問句處理:回答問題的前提是將自然語言形式的問句處理成可被計算機理解的數據,所述問句處理包含疑問詞替換、指定搜索范圍和分詞三個步驟;a、疑問詞替換:自然語言中的疑問詞對于檢索是無用的,應在準確理解提問者意圖后將其去除,本系統通過枚舉常見的提問方式來理解意圖,對部分字詞進行近義替換可減少枚舉數量;b、指定搜索范圍:對于“X法規對Y有何規定”、“X法規附則有哪幾條”的提問,在提問者指定的范圍內搜索后,將范圍限定詞代表的層級作為初始搜索節點,未指定范圍,則從包含所有法規的根節點開始搜索;c、問句分詞:除去開頭的范圍限定詞和末尾的疑問詞后,對問句其余部分進行分詞,由實詞構成問句詞組,《軍語》詞匯、人工標注的軍事用語可增強通用分詞工具在軍事法規領域的分詞效果;步驟二:答案組織:問句處理明確了搜索范圍和問句詞組,在此基礎上通過檢索相關條款、匹配語義關系和輸出答案三個步驟,完成一次問答;a、檢索相關條款:以問句詞組和代表搜索范圍的初始搜索節點為輸入,運行條款檢索算法,輸出的答案列表即為相關度最高的條款集合,若答案列表為空,則表示找不到相關條款;b、匹配語義關系:預處理過程中的語義關系標注為各條款添加了若干知識三元組,問句匹配了答案條款所包含的三元組,則給出短答案;c、輸出答案:雖然短答案提供了關鍵信息,但詢問者可能還想了解更詳細的信息,此外,仍有大量知識難以用三元組表述,很多問題也不能用短答案解答,因此,還需要答案來源和條款全文作為補充,以增強說服力和準確性,此外,知識圖譜除了難以解決找不到語義關系的問題,也不適合回答詢問章節條款的問題,而本系統建立了完善的目錄層級,便于回答此類問題;
    步驟三:輔助答題:利用條款檢索和語義匹配能力實現答題模塊,能嘗試解答判斷題、單選題、多選題和填空題,該功能可用于輔助軍事法規學習和測試,也可用于從題庫添加語義關系,將題干視為問題,檢索到最相關的法規條款,對于單選題、多選題和填空題,嘗試通過匹配語義關系得出答案,對于判斷題或無法匹配語義關系的情況,采用字符串匹配確定答案,對于仍不能確定答案的單選題和多選。3.根據權利要求1所述的一種基于檢索和知識圖譜的軍事法規問答方法,其特征在于,所述實驗與分析包括問答測試和對比分析兩個步驟。4.根據權利...

    【專利技術屬性】
    技術研發人員:劉奕明,謝振杰,徐瑞麟付偉,魏國珩秦艷琳,張志紅,周九星
    申請(專利權)人:中國人民解放軍海軍工程大學,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产av永久无码天堂影院| 国产精品成人一区无码| 亚洲AV无码久久精品色欲| 日韩乱码人妻无码中文字幕| 亚洲中文字幕无码久久2020| 日韩人妻系列无码专区| 久久久无码精品亚洲日韩蜜桃| 日韩精品无码一区二区三区 | 国产成人无码AV在线播放无广告| 久久无码av亚洲精品色午夜 | 亚洲av无码乱码国产精品fc2| 亚洲综合无码一区二区三区| r级无码视频在线观看| 永久免费av无码网站韩国毛片 | 色综合久久无码中文字幕| 亚洲精品无码专区在线播放| 国产精品va在线观看无码| 亚洲AV无码一区二区三区网址 | 无码精品国产dvd在线观看9久 | 免费无码一区二区三区| 综合国产在线观看无码| 国产精品第一区揄拍无码| 亚洲av无码av在线播放| 亚洲一本到无码av中文字幕| 亚洲精品无码久久久久去q | 免费人妻无码不卡中文字幕系| 亚洲中文字幕伊人久久无码| 国产精品无码制服丝袜| 国产精品无码久久av| 免费无码又爽又黄又刺激网站| 亚洲aⅴ无码专区在线观看 | 亚洲Av无码国产情品久久| 好了av第四综合无码久久 | 麻豆亚洲AV永久无码精品久久| 亚洲中文字幕久久精品无码APP| 亚洲无码日韩精品第一页| AV无码小缝喷白浆在线观看| 综合无码一区二区三区| 亚洲av无码国产精品色午夜字幕| 无码人妻AⅤ一区二区三区| 小13箩利洗澡无码视频网站|