【技術實現步驟摘要】
本專利技術涉及信息分析領域,更具體地,涉及一種基于共同序列模式的分析系統和方法。
技術介紹
隨著計算機技術的不斷發展,經常存在需要在多個系統中部署產品組件的情形。一旦出現錯誤(error),針對復雜產品組件的分析是耗時以及復雜的工作(即使對于簡單的產品部署來說也是如此)。相關信息(例如應用日志、系統日志/事件)被放置在若干主機/組件、實例中。如何分析信息并找到錯誤的根源是極富挑戰性的工作。現有的方法一般通過查看單個案例的單個日志文件來查找問題,這不能檢測事件序列并獲得有用信息。在復雜的多生產環境中,找到問題根源非常困難,尤其是在存在多個噪聲信息時尤其如此。歷史性日志不能用于未來的診斷和對嚴重問題的預防。之前的信息在分析之后不能以適當形式保存。可以看到,要從復雜的事件中獲得問題的根源而不比較不同的日志信息是非常困難的。
技術實現思路
為了解決現有技術中存在的上述問題,本專利技術提出如下方案。根據本專利技術的第一方面,提供一種信息分析方法,包括:基于源信息集合生成元數據集合,所述元數據包括錯誤日志信息,所述錯誤日志信息在所述元數據集合中構成錯誤序列;以及為多個所述元數據集合生成共同錯誤序列集合。根據本專利技術的第二方面,提供一種信息分析系統,包括:預處理裝置,用于基于源信息集合生成元數據集合,所述元數據包括錯誤日志信息,所述錯誤日志信息在所述元數據集合中構成錯誤序列;以及< ...
【技術保護點】
一種信息分析方法,包括:基于源信息集合生成元數據集合,所述元數據包括錯誤日志信息,所述錯誤日志信息在所述元數據集合中構成錯誤序列;以及為多個所述元數據集合生成共同錯誤序列集合。
【技術特征摘要】
1.一種信息分析方法,包括:
基于源信息集合生成元數據集合,所述元數據包括錯誤日志信
息,所述錯誤日志信息在所述元數據集合中構成錯誤序列;以及
為多個所述元數據集合生成共同錯誤序列集合。
2.根據權利要求1所述的方法,其中所述元數據還包括時間信
息,并且所述方法進一步包括:
在所述第一集合中歸一化所述時間信息。
3.根據權利要求1所述的方法,進一步包括:
在所述元數據集合中去除重復的錯誤日志信息。
4.根據權利要求3所述的方法,其中所述去除重復的錯誤日志
信息進一步包括去除以下中的一個或多個類型的消息:
完全相同的錯誤日志、僅非關鍵部分不同而其它部分完全相同的
錯誤日志、關鍵部分相同的錯誤日志、用戶認定為重復的錯誤日志。
5.根據權利要求3所述的方法,其中所述去除重復的錯誤日志
信息進一步包括通過機器學習進行和/或由用戶進行。
6.根據權利要求1-5之任一所述的方法,其中所提取的元數據
為設定時間段內的元數據和/或來自設定的源。
7.根據權利要求1-5之任一所述的方法,其中為多個所述元數
據集合生成共同錯誤序列集合進一步包括:
為多個所述元數據集合中的每兩個所述元數據集合生成共同錯
誤序列集合;以及
將所生成的每兩個所述元數據集合的共同錯誤序列集合合并為
所述多個元數據集合的共同錯誤序列集合。
8.根據權利要求7所述的方法,其中為多個所述元數據集合中
的每兩個所述元數據集合生成共同錯誤序列集合為并行進行。
9.根據權利要求7所述的方法,其中將所生成的每兩個所述元
數據集合的共同錯誤序列集合合并為所述多個元數據集合的共同錯
誤序列集合進一步包括:
統計每個共同錯誤序列出現的次數。
10.根據權利要求1-5之任一所述的方法,其中所述錯誤序列標
識所述錯誤日志信息之間的聯系。
11.根據權利要求1-5之任一所述的方法,其中所述源信息包括
與以下中的一個或多個相關的信息:應用程序日志、系統事件、系統
日志、流程堆棧、線程堆棧、用戶記錄、應用程序記錄;和/或
所述錯誤日志信息包括與以下中的一個或多個相關的信息:運行
時錯誤、警告、調試。
12.根據權利要求1-5之任一所述的方法,其中所述元數據進一
步包括日志等級和/或所述錯誤日志信息的出處。
13.根據權利要求1-5之任一所述的方法,其中所述共同錯誤序
列集合包括多個所述元數據集合中相同的錯誤日志信息構成的錯誤
序列的集合。
14.根據權利要求13所述的方法,其中相同的錯誤日志信息構
成的錯誤序列的長度大于設定閾值。
15.根據權利要求13所述的方法,其中所述相同的判斷標準由
用戶設定。
16.一種信息分析系統,包括:
預處理...
【專利技術屬性】
技術研發人員:陳超,付宇,鐘錢杰,劉晶晶,陳齊彥,
申請(專利權)人:伊姆西公司,
類型:發明
國別省市:美國;US
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。