• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    知識庫三元組檢驗的方法與裝置制造方法及圖紙

    技術編號:15690973 閱讀:273 留言:0更新日期:2017-06-24 03:48
    本發明專利技術提供一種知識庫三元組檢驗的方法與裝置,通過獲取擴展三元組對應的規則,根據初始因子函數和EM算法確定該規則對應的因子函數,并根據該因子函數確定擴展三元組是否可信,進而可以確定是否將該擴展三元組放入知識庫中,對知識庫進行擴充,提高了知識庫擴充的準確性。

    Method and device for checking three tuples of knowledge base

    The present invention provides a method and a device for the knowledge base of three tuple inspection, by obtaining the extended three tuple rules, according to the initial factor function and EM algorithm to determine the factor function of the corresponding rules, and according to the factor function to determine the extended three tuple is credible, and to determine whether the extended three tuple into the knowledge base in the knowledge base to expand and improve the accuracy of knowledge base expansion.

    【技術實現步驟摘要】
    知識庫三元組檢驗的方法與裝置
    本專利技術涉及知識庫擴充技術,尤其涉及一種知識庫三元組檢驗的方法與裝置。
    技術介紹
    知識庫是一種以三元組的形式結構化地存儲知識的數據庫,用于對某一領域或者某一行業中海量知識進行結構化地存儲。例如,一個歷史知識庫可以存儲歷史領域中的海量知識,包括各個歷史人物、歷史事件等。知識庫以實例為主要描述對象,采用面向對象的方法表示知識,一個實例是對現實中一個具體或抽象事務的指代。例如,實例可以表示一個人物,也可以表示一座城市、一件事情等。一個知識庫通常包括多個實例,實例的多個屬性以及各個實例之間的關系均采用三元組的結構存儲。三元組是知識庫中用于表示知識的基礎結構。它的結構可以表示為<第一語句,關系語句,第二語句>,關系語句用于表示所述第一語句和所述第二語句之間的關系。知識庫擴充是指在原知識庫不完備的情況下,通過數據挖掘的方法,利用已知的表示知識的三元組預測未知的三元組,以在原知識庫中擴展新的三元組,使得知識庫更加完備。因此,檢驗新的三元組是否可信成為亟需解決的技術問題。
    技術實現思路
    本專利技術提供一種知識庫三元組檢驗的方法與裝置,以解決現有技術中擴展的三元組不可信等缺陷。本專利技術第一個方面提供一種知識庫三元組檢驗的方法,包括:獲取擴展三元組對應的規則,所述擴展三元組是基于現有知識庫中的原三元組和所述規則進行擴展操作得到的三元組,所述擴展三元組包括至少由第一語句、關系語句、第二語句組成的有序集合,所述關系語句用于表示所述第一語句和所述第二語句之間的關系;確定所述規則對應的因子函數,所述因子函數用于表示所述規則是否正確的概率,所述因子函數是根據初始因子函數和EM算法獲得的;根據所述因子函數確定所述擴展三元組是否可信。根據如上所述的方法,可選地,所述根據所述因子函數確定所述擴展三元組是否可信包括:根據置信傳播和所述因子函數確定所述擴展三元組對應的第一概率分布和第二概率分布,所述第一概率分布用于表示所述擴展三元組應該可信的概率,所述第二概率分布用于表示所述擴展三元組不可信的概率,且所述第二概率分布=1-所述第一概率分布;根據目標概率分布和預設閾值確定所述擴展三元組是否可信,所述目標概率分布為所述第一概率分布或所述第二概率分布。根據如上所述的方法,可選地,所述根據目標概率分布和所述預設閾值確定所述擴展三元組是否可信包括:若所述預設閾值為可信的閾值,則所述目標概率分布為第一概率分布,若所述目標概率分布大于或等于所述預設閾值,則確定所述擴展三元組可信;若所述目標概率分布小于所述預設閾值,則確定所述擴展三元組不可信;若所述預設閾值為不可信的閾值,則所述目標概率分布為第二概率分布,若所述目標概率分布大于或等于所述預設閾值,則確定所述擴展三元組不可信;若所述目標概率分布小于所述預設閾值,則確定所述擴展三元組可信。根據如上所述的方法,可選地,所述確定所述規則對應的因子函數包括:根據如下公式確定通過所述EM算法進行迭代操作之后的所述因子函數f(t+1):f(t+1)=f(t)*[f’(t)/p(t)];其中,f(t)表示所述因子函數在第t輪的取值,t為大于或等于0的正整數且t的初始值為0,f(0)為初始化的因子函數的值,f’(t)表示所述因子函數在t輪的經驗分布,p(t)表示所述因子函數在第t輪的采樣分布,所述經驗分布和所述采樣分布是在EM算法進行迭代操作過程中得到的。根據如上所述的方法,可選地,所述迭代操作在f(t)的值不再發生變化時停止。本專利技術另一個方面提供一種知識庫三元組檢驗的裝置,包括:獲取模塊,用于獲取擴展三元組對應的規則,所述擴展三元組是基于現有知識庫中的原三元組和所述規則進行擴展操作得到的三元組,所述擴展三元組包括至少由第一語句、關系語句、第二語句組成的有序集合,所述關系語句用于表示所述第一語句和所述第二語句之間的關系;確定模塊,用于確定所述規則對應的因子函數,所述因子函數用于表示所述規則是否正確的概率,所述因子函數是根據初始因子函數和EM算法獲得的;處理模塊,用于根據所述因子函數確定所述擴展三元組是否可信。根據如上所述的裝置,可選地,所述處理模塊包括:第一子模塊,用于根據置信傳播和所述因子函數確定所述擴展三元組對應的第一概率分布和第二概率分布,所述第一概率分布用于表示所述擴展三元組應該可信的概率,所述第二概率分布用于表示所述擴展三元組不可信的概率,且所述第二概率分布=1-所述第一概率分布;第二子模塊,用于根據目標概率分布和預設閾值確定所述擴展三元組是否可信,所述目標概率分布為所述第一概率分布或所述第二概率分布。根據如上所述的裝置,可選地所述第二子模塊具體用于:若所述預設閾值為可信的閾值,則所述目標概率分布為第一概率分布,若所述目標概率分布大于或等于所述預設閾值,則確定所述擴展三元組可信;若所述目標概率分布小于所述預設閾值,則確定所述擴展三元組不可信;若所述預設閾值為不可信的閾值,則所述目標概率分布為第二概率分布,若所述目標概率分布大于或等于所述預設閾值,則確定所述擴展三元組不可信;若所述目標概率分布小于所述預設閾值,則確定所述擴展三元組可信。根據如上所述的裝置,可選地,所述確定模塊具體用于:根據如下公式確定通過所述EM算法進行迭代操作之后的所述因子函數f(t+1):f(t+1)=f(t)*[f’(t)/p(t)];其中,f(t)表示所述因子函數在第t輪的取值,t為大于或等于0的正整數且t的初始值為0,f(0)為初始化的因子函數的值,f’(t)表示所述因子函數在t輪的經驗分布,p(t)表示所述因子函數在第t輪的采樣分布,所述經驗分布和所述采樣分布是在EM算法進行迭代操作過程中得到的。根據如上所述的裝置,可選地,所述確定模塊還用于:所述迭代操作在f(t)的值不再發生變化時停止。根據本專利技術的知識庫三元組檢驗的方法與裝置,通過獲取擴展三元組對應的規則,根據初始因子函數和EM算法確定該規則對應的因子函數,并根據該因子函數確定擴展三元組是否可信,進而可以確定是否將該擴展三元組放入知識庫中,對知識庫進行擴充,提高了知識庫擴充的準確性。附圖說明為了更清楚地說明本專利技術實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本專利技術的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本專利技術一實施例提供的知識庫三元組檢驗的方法的流程示意圖;圖2為本專利技術另一實施例提供的知識庫三元組檢驗的方法的流程示意圖;圖3為本專利技術一實施例提供的知識庫三元組檢驗的裝置的結構示意圖;圖4為本專利技術另一實施例提供的知識庫三元組檢驗的裝置的結構示意圖;圖5為本專利技術實施例中構建的因子圖。具體實施方式為使本專利技術實施例的目的、技術方案和優點更加清楚,下面將結合本專利技術實施例中的附圖,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。實施例一本實施例提供一種知識庫三元組檢驗的方法,用于檢驗知識庫的擴展三元組是否可信。本實施例的執行主體是知識庫本文檔來自技高網...
    知識庫三元組檢驗的方法與裝置

    【技術保護點】
    一種知識庫三元組檢驗的方法,其特征在于,包括:獲取擴展三元組對應的規則,所述擴展三元組是基于現有知識庫中的原三元組和所述規則進行擴展操作得到的三元組,所述擴展三元組包括至少由第一語句、關系語句、第二語句組成的有序集合,所述關系語句用于表示所述第一語句和所述第二語句之間的關系;確定所述規則對應的因子函數,所述因子函數用于表示所述規則是否正確的概率,所述因子函數是根據初始因子函數和EM算法獲得的;根據所述因子函數確定所述擴展三元組是否可信。

    【技術特征摘要】
    1.一種知識庫三元組檢驗的方法,其特征在于,包括:獲取擴展三元組對應的規則,所述擴展三元組是基于現有知識庫中的原三元組和所述規則進行擴展操作得到的三元組,所述擴展三元組包括至少由第一語句、關系語句、第二語句組成的有序集合,所述關系語句用于表示所述第一語句和所述第二語句之間的關系;確定所述規則對應的因子函數,所述因子函數用于表示所述規則是否正確的概率,所述因子函數是根據初始因子函數和EM算法獲得的;根據所述因子函數確定所述擴展三元組是否可信。2.根據權利要求1所述的方法,其特征在于,所述根據所述因子函數確定所述擴展三元組是否可信包括:根據置信傳播和所述因子函數確定所述擴展三元組對應的第一概率分布和第二概率分布,所述第一概率分布用于表示所述擴展三元組應該可信的概率,所述第二概率分布用于表示所述擴展三元組不可信的概率,且所述第二概率分布=1-所述第一概率分布;根據目標概率分布和預設閾值確定所述擴展三元組是否可信,所述目標概率分布為所述第一概率分布或所述第二概率分布。3.根據權利要求2所述的方法,其特征在于,所述根據目標概率分布和所述預設閾值確定所述擴展三元組是否可信包括:若所述預設閾值為可信的閾值,則所述目標概率分布為第一概率分布,若所述目標概率分布大于或等于所述預設閾值,則確定所述擴展三元組可信;若所述目標概率分布小于所述預設閾值,則確定所述擴展三元組不可信;若所述預設閾值為不可信的閾值,則所述目標概率分布為第二概率分布,若所述目標概率分布大于或等于所述預設閾值,則確定所述擴展三元組不可信;若所述目標概率分布小于所述預設閾值,則確定所述擴展三元組可信。4.根據權利要求1-3中任一項所述的方法,其特征在于,所述確定所述規則對應的因子函數包括:根據如下公式確定通過所述EM算法進行迭代操作之后的所述因子函數f(t+1):f(t+1)=f(t)*[f’(t)/p(t)];其中,f(t)表示所述因子函數在第t輪的取值,t為大于或等于0的正整數且t的初始值為0,f(0)為初始化的因子函數的值,f’(t)表示所述因子函數在t輪的經驗分布,p(t)表示所述因子函數在第t輪的采樣分布,所述經驗分布和所述采樣分布是在EM算法進行迭代操作過程中得到的。5.根據權利要求4所述的方法,其特征在于,所述迭代操作在f(t)的值不再發生變化時停止。6...

    【專利技術屬性】
    技術研發人員:趙偉華張日崇
    申請(專利權)人:北京航空航天大學
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 伊人久久一区二区三区无码| 久久亚洲精品无码VA大香大香| 性无码专区无码片| 国产精品无码AV一区二区三区| 性无码专区无码片| 无码一区二区三区爆白浆| 国产AV无码专区亚洲AV漫画| 99无码精品二区在线视频| 免费无码又爽又刺激高潮| 亚洲国产精品无码久久SM| 亚洲av成本人无码网站| 亚洲一区二区三区AV无码| 国产综合无码一区二区色蜜蜜| 久久久无码精品亚洲日韩蜜臀浪潮| 内射人妻无套中出无码| 中文字幕无码中文字幕有码| 在线观看片免费人成视频无码 | 亚洲AV无码久久精品狠狠爱浪潮| 无码精品国产dvd在线观看9久| 精品人体无码一区二区三区 | 在线观看无码AV网址| 国产在线无码一区二区三区视频| 国产成人无码网站| 本道天堂成在人线av无码免费| 久久久久久久亚洲Av无码| 亚洲日韩精品一区二区三区无码| 色欲aⅴ亚洲情无码AV| 久久久无码精品人妻一区| 亚洲av无码一区二区三区天堂古代| 亚洲AV无码久久精品蜜桃| 久久精品中文字幕无码| 国产在线无码一区二区三区视频| 成在线人免费无码高潮喷水| 丰满爆乳无码一区二区三区| 国产精品无码2021在线观看| 久久久久亚洲av无码专区蜜芽 | 久久无码av三级| 国产AV无码专区亚洲AV漫画 | 人妻夜夜添夜夜无码AV| 亚洲日韩欧洲无码av夜夜摸| 亚洲综合无码一区二区|