【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及知識圖譜推理,具體涉及一種融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法。
技術(shù)介紹
1、知識圖譜是一種結(jié)構(gòu)化的知識表示方法,目的是將人類豐富、多樣的知識組織成結(jié)構(gòu)化形式,使計算機能夠更好地理解和處理這些知識。它通過將實體、屬性和關(guān)系組織成一個大規(guī)模的知識圖譜網(wǎng)絡(luò),來呈現(xiàn)真實世界中的各種概念及其之間的聯(lián)系。在大規(guī)模通用知識圖譜和特定的領(lǐng)域知識圖譜不斷發(fā)布,以及信息服務(wù)智能應(yīng)用的不斷發(fā)展的背景下,知識圖譜在智能問答、語義搜索、個性化推薦、推理決策等領(lǐng)域得到了廣泛的應(yīng)用。根據(jù)知識領(lǐng)域和范圍的不同,知識圖譜可以分為通用知識圖譜和領(lǐng)域知識圖譜。通用知識圖譜涉及的知識范圍廣,通常包含大量現(xiàn)實世界中的常識性知識;而領(lǐng)域知識圖譜面向某一特定領(lǐng)域,對知識的深度和準確度具有更高的要求。
2、隨著工業(yè)生產(chǎn)逐步邁向信息化和智能化,工業(yè)生產(chǎn)關(guān)鍵設(shè)備作為生產(chǎn)的驅(qū)動力,其自動化程度日益提高。然而,隨著這些生產(chǎn)設(shè)備在運行過程中新生成的運維記錄和檢修數(shù)據(jù)呈現(xiàn)爆炸式增長,知識維護面臨的挑戰(zhàn)也愈發(fā)嚴峻。因為這些運維工單往往分散在不同的數(shù)據(jù)庫、電子文件和紙質(zhì)文檔中,且結(jié)構(gòu)化程度較低,導(dǎo)致信息檢索和利用效率低下。此外,傳統(tǒng)的專家系統(tǒng)依賴人工獲取和維護知識,不僅成本高昂,而且難以應(yīng)對頻繁更新的故障診斷信息,無法滿足大規(guī)模、快速演變的工業(yè)場景需求。面對這些挑戰(zhàn),工業(yè)知識圖譜作為一種新興的技術(shù)手段展現(xiàn)出了巨大的潛力。與傳統(tǒng)的專家系統(tǒng)相比,工業(yè)知識圖譜能夠?qū)<抑R和其他非結(jié)構(gòu)化數(shù)據(jù)進行規(guī)范化存儲,具備更靈活的表現(xiàn)形式和更好的可擴展性。通過構(gòu)建基于知識
3、以鋼鐵產(chǎn)業(yè)中的情況為例,鋼鐵產(chǎn)線具有生產(chǎn)工藝復(fù)雜、環(huán)境工況惡劣等特點,部分設(shè)備長期處于高負荷狀態(tài)和惡劣工況下運行,導(dǎo)致鋼鐵生產(chǎn)進程經(jīng)常受到設(shè)備故障的影響。設(shè)備故障輕則導(dǎo)致生產(chǎn)線臨時停工,影響生產(chǎn)效率及產(chǎn)品質(zhì)量,重則可能引發(fā)安全事故,甚至威脅工人的生命安全,造成重大經(jīng)濟損失。為了減少設(shè)備故障導(dǎo)致的損失,提升鋼鐵產(chǎn)線的穩(wěn)定性和可靠性,需要提升設(shè)備故障診斷的準確率和效率,確保產(chǎn)線能夠快速從已發(fā)生的故障狀態(tài)中恢復(fù)正常運行。傳統(tǒng)的鋼鐵產(chǎn)線故障診斷方法主要依賴于領(lǐng)域?qū)<业闹R和經(jīng)驗,對技術(shù)人員的專業(yè)素養(yǎng)和經(jīng)驗積累提出了較高的要求,且人工進行詳細分析診斷的過程往往耗時較長,導(dǎo)致產(chǎn)線長時間故障停機,難以適應(yīng)現(xiàn)代鋼鐵生產(chǎn)線對于快速響應(yīng)的迫切需求。而鋼鐵產(chǎn)線在長期的運行和維護過程中產(chǎn)生了大量故障報告、維護日志等文檔,這些文檔中蘊含豐富的設(shè)備運維知識,對于提升故障診斷和預(yù)測的效果具有重要價值?;谶@部分知識來構(gòu)建鋼鐵故障診斷知識圖譜對于解決工業(yè)場景面臨的知識管理和重用困難等問題,提升產(chǎn)線的智能化水平具有重要意義。
4、然而,目前知識圖譜通常通過人工或半自動化的方式進行構(gòu)建,所以不可避免地存在完整性不足和數(shù)據(jù)稀疏的問題。在工業(yè)等垂直領(lǐng)域中,一方面由于這些領(lǐng)域的應(yīng)用場景往往復(fù)雜多變,且可用的語料資源相對匱乏,另一方面領(lǐng)域知識圖譜專門化的特點要求在構(gòu)建圖譜時對領(lǐng)域內(nèi)的知識有深刻的理解,還需要能夠準確提取并描述實體之間的復(fù)雜關(guān)系,因此使得領(lǐng)域知識圖譜的不完整性和稀疏性更加嚴重。即存在實體之間隱含的關(guān)系沒有被充分地挖掘出來的情況,這些隱性關(guān)系包含了豐富和深入的語義信息,對于提高知識驅(qū)動型任務(wù)的效果具有重要意義,而知識圖譜不完備的問題始制約著其應(yīng)用效果。
5、目前,知識圖譜的補全都是依賴于知識圖譜推理方法來實現(xiàn),但由于工業(yè)知識圖譜的上述特性,已有的知識圖譜推理模型和方法對于工業(yè)知識圖譜的自動補全效果還不理想,有待提高。
6、知識圖譜補全任務(wù)可以抽象為三元組預(yù)測任務(wù),即對三元組中缺失的部分進行預(yù)測,具體分為頭實體預(yù)測、尾實體預(yù)測和關(guān)系預(yù)測。本專利技術(shù)僅考慮數(shù)據(jù)層實例三元組的頭、尾實體預(yù)測問題,即對于?部分未知的實例三元組(h,r,?)或(?,r,t),預(yù)測出?所對應(yīng)的實例。在知識圖譜推理模型中,通常使用基于嵌入表示的評分函數(shù)f(h,r,t)來評估三元組(h,r,t)的合理性,通過模型的訓(xùn)練使得真實三元組的得分高于非真實三元組,從而完成三元組預(yù)測任務(wù)。
7、知識圖譜補全技術(shù)的核心在于獲取更準確的實體和關(guān)系嵌入表示,這不僅有助于填補知識圖譜中的數(shù)據(jù)空白,還為推理決策等下游任務(wù)提供了更加堅實的基礎(chǔ)。工業(yè)知識圖譜相比于通用知識圖譜具有更加完整和嚴格的本體設(shè)計,本體作為領(lǐng)域知識圖譜的頂層設(shè)計,挖掘領(lǐng)域知識模式并對其建模,其中包含實體對應(yīng)概念及概念間的層級關(guān)系,對實例圖譜中的實體發(fā)揮著指導(dǎo)作用,因此對于存在稀疏性問題的工業(yè)知識圖譜來說,通過本體中概念和實例實體之間的跨視圖連接能夠為稀疏節(jié)點確定其在嵌入空間的大致位置,這實際上是一種信息補充。此外,工業(yè)知識圖譜的場景復(fù)雜多變導(dǎo)致其實體關(guān)聯(lián)復(fù)雜,部分實體具有豐富的鄰域結(jié)構(gòu),而這些實體鄰域內(nèi)存在包含了豐富的語義信息的屬性三元組,能夠幫助獲得更加準確的實體嵌入表示。鑒于此,本專利技術(shù)提出了一種融合本體和鄰域語義信息的知識圖譜推理方法以獲得封裝更加豐富信息的實體關(guān)系嵌入表示,從而提高工業(yè)知識圖譜推理及補全的準確性。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)是為解決上述問題而進行的,目的在于提供一種能夠更為準確地對工業(yè)知識圖譜進行推理的方法,從而可實現(xiàn)更好的補全效果,本專利技術(shù)采用了如下技術(shù)方案:
2、本專利技術(shù)提供了一種融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,該方法具有這樣的技術(shù)特征,其包括以下步驟:步驟s1,獲取來源于實際生產(chǎn)的工業(yè)知識圖譜,并對所述工業(yè)知識圖譜進行數(shù)據(jù)預(yù)處理操作,以得到數(shù)據(jù)集;步驟s2,將所述數(shù)據(jù)集劃分為訓(xùn)練集和測試集;步驟s3,將所述訓(xùn)練集的數(shù)據(jù)輸入知識圖譜嵌入模型進行預(yù)訓(xùn)練,得到預(yù)訓(xùn)練后的實體嵌入表示和關(guān)系嵌入表示;步驟s4,基于跨視圖聚合模型和鄰域信息增強模型構(gòu)建工業(yè)知識圖譜推理模型,并利用所述訓(xùn)練集的數(shù)據(jù)對所述跨視圖聚合模型和所述鄰域信息增強模型進行聯(lián)合訓(xùn)練,其中,所述工業(yè)知識圖譜推理模型以步驟s3得到的所述實體嵌入表示和所述關(guān)系嵌入表示作為初始向量;步驟s5,利用訓(xùn)練好的所述工業(yè)圖譜推理模型輸出推理的結(jié)果。
3、本專利技術(shù)提供的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,還可以具有這樣的技術(shù)特征,其中,所述工業(yè)知識圖譜數(shù)據(jù)集包括本體視圖知識圖譜和實例視圖知識圖譜,所述本體視圖知識圖譜由本體三元組構(gòu)成,所述本體三元組包含本體概念及其關(guān)系,所述實例視圖知識圖譜由實例三元組構(gòu)成,所述實例三元組包含實例實體及其關(guān)系,所述實例實體與所述本體概念具有對應(yīng)關(guān)系,步驟s1中,對于所述工業(yè)知識圖譜數(shù)據(jù)集,為其中缺失所述本體概念的所述實例實體用預(yù)定的占位概念來進行占位補全,然后分別從所述本體視圖知識圖譜和所述實例視圖知識圖譜抽取所述本體概念的集合、所述實例實體的集合以及對應(yīng)的關(guān)系的集合,構(gòu)成所述數(shù)據(jù)集。
4、本專利技術(shù)提供的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,還可以具有這樣的技術(shù)特征,其中,步驟s3中,所述知識圖譜嵌入模型為tr本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
3.根據(jù)權(quán)利要求2所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
4.根據(jù)權(quán)利要求3所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
5.根據(jù)權(quán)利要求4所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
6.根據(jù)權(quán)利要求4所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
7.根據(jù)權(quán)利要求6所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
8.根據(jù)權(quán)利要求7所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
9.根據(jù)權(quán)利要求8所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
10.根據(jù)權(quán)利要求1所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
【技術(shù)特征摘要】
1.一種融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
3.根據(jù)權(quán)利要求2所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
4.根據(jù)權(quán)利要求3所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
5.根據(jù)權(quán)利要求4所述的融合本體和鄰域語義信息的工業(yè)知識圖譜推理方法,其特征在于:
<...【專利技術(shù)屬性】
技術(shù)研發(fā)人員:戴毅茹,陳子昊,
申請(專利權(quán))人:同濟大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。