【技術實現步驟摘要】
本專利技術設計領域,尤其涉及一種沖突檢驗方法以及計算機系統。
技術介紹
標簽是互聯網環境中用于描述特定資源的一個或多個詞語的集合,標簽的準確度直接影響到資源的個性化推薦、營銷等互聯網應用的效率。因此,提升標簽的準確度具有重要的商業價值。然而在為資源打上標簽的過程中,由于用戶身份發生改變、人工標注不規范、機器標注不完善等各種原因,標簽的準確度并不高,甚至標簽中的詞語會出現語義沖突。為了提升標簽的準確度,現有技術中一般會對標簽中的詞語進行沖突檢驗,進而判定標簽中是否存在語義沖突的詞語。但是,現有技術中并沒有提供足夠高效的沖突檢驗方法。例如在判斷“資深美女”與“購物狂人”之間是否存在沖突的時候,現有技術需要依次判斷“資深美女”的每個同義詞與“購物狂人”的每個同義詞之間是否存在沖突。若“資深美女”有M個同義詞,“購物狂人”有N個同義詞,則判斷的總次數為M×N。在M、N較大的時候,該沖突檢驗操作會花費較長的時間和較多的計算資源,檢驗效率非常低下。
技術實現思路
本專利技術提供了一種沖突檢驗方法,用于提高計算機系統的沖突檢驗效率。本專利技術還提供了相關的計算機系統以及沖突檢驗裝置。本專利技術的第一方面提供了一種沖突檢驗方法,其中,計算機系統獲取待檢驗的第一詞語和第二詞語,并獲取概念標識對應表。其中,概念標識對應表中記錄了多個概念標識,以及每個概念標識對應的一個或多個詞語,且一個概念標識對應的多個詞 ...
【技術保護點】
一種沖突檢驗方法,適用于計算機系統,其特征在于,包括:獲取待檢驗的第一詞語與第二詞語;獲取概念標識對應表,所述概念標識對應表中記錄了多個概念標識和每個概念標識對應的一個或多個詞語;根據所述概念標識對應表,確定所述第一詞語對應的第一概念標識,并確定所述第二詞語對應的第二概念標識;判斷所述第一概念標識與所述第二概念標識是否互為反義;若判斷結果為是,則確定所述第一詞語與所述第二詞語沖突。
【技術特征摘要】
1.一種沖突檢驗方法,適用于計算機系統,其特征在于,包括:
獲取待檢驗的第一詞語與第二詞語;
獲取概念標識對應表,所述概念標識對應表中記錄了多個概念標識和每
個概念標識對應的一個或多個詞語;
根據所述概念標識對應表,確定所述第一詞語對應的第一概念標識,并
確定所述第二詞語對應的第二概念標識;
判斷所述第一概念標識與所述第二概念標識是否互為反義;
若判斷結果為是,則確定所述第一詞語與所述第二詞語沖突。
2.根據權利要求1所述的沖突檢驗方法,其特征在于,所述獲取概念標
識對應表包括:
從同義詞詞庫中獲取多個同義詞組,每個同義詞組包括至少兩個互為同
義的詞語;
為所述每個同義詞組設置對應的概念標識,并根據所述每個同義詞組包
括的詞語和所述每個同義詞組對應的概念標識生成所述概念標識對應表。
3.根據權利要求1或2所述的沖突檢驗方法,其特征在于,所述判斷所
述第一概念標識與所述第二概念標識是否互為反義包括:
獲取所述概念標識對應表中的概念標識之間的邏輯拓撲關系圖,所述邏
輯拓撲關系圖中,相鄰的兩個概念標識之間的邏輯拓撲關系包括:反義拓撲
關系或非反義拓撲關系;
在所述邏輯拓撲關系圖中,判斷所述第一概念標識與所述第二概念標識
之間的反義拓撲關系的個數;
若所述第一概念標識與所述第二概念標識之間的反義拓撲關系的個數為
奇數,則確定所述第一概念標識與所述第二概念標識互為反義。
4.根據權利要求3所述的沖突檢驗方法,其特征在于,所述獲取所述概
念標識對應表中的概念標識之間的邏輯拓撲關系圖包括:
從反義詞詞庫中獲取反義詞組,所述反義詞組中包括互為反義的第三詞
語和第四詞語;
根據所述概念標識對應表,確定所述第三詞語對應的第三概念標識,以
及所述第四詞語對應的第四概念標識;
在所述第三概念標識與所述第四概念標識之間建立反義拓撲關系并存入
所述邏輯拓撲關系圖。
5.根據權利要求3或4所述的沖突檢驗方法,其特征在于,所述獲取所
述概念標識對應表中的概念標識之間的邏輯拓撲關系圖包括:
從上下位詞庫中獲取上下位詞組,上下位詞組中包括互為上下位的第五
詞語和第六詞語;
根據所述概念標識對應表,確定所述第五詞語對應的第五概念標識,以
及所述第六詞語對應的第六概念標識;
在所述第五概念標識和所述第六概念標識之間建立...
【專利技術屬性】
技術研發人員:沈志宏,鐘偉才,季振峰,
申請(專利權)人:華為技術有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。