本發明專利技術提供一種Linux集群故障自動恢復方法,包括執行數據信息采集并判斷是否出現故障;當判斷出現故障時,重新啟動節點;當重新啟動該節點后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的維護集成;在執行該故障節點的維護集成后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的安裝集成;以及在執行該故障節點的安裝集成后,再次執行該數據信息采集并判斷出現故障時,進行人工處理。該Linux集群故障自動恢復方法在很大程度上減少了人工的消耗,能夠自動、快速、高效地完成集群節點系統的故障自動恢復,能夠滿足異構集群不同需求,支持多個版本操作系統,提高了集群資源利用效率。
【技術實現步驟摘要】
本專利技術涉及大規模集群資源管理系統的優化與應用,特別是涉及到Linux集群故障自動恢復方法。
技術介紹
隨著計算需求的發展,微機集群的規模也在不斷地擴大,如何高效地完成對大規模集群的管理,成為亟待解決的一個難題。國內外的計算機廠家均投入了大量研發力量開發集群相關產品,從免費軟件到收費軟件,功能各有不同,主要功能集中于系統管理和監視,但缺少智能的、自動化的工具,所以集群的可管理性和可用性均收到極大的影響。在現有的模式下,管理人員需要通過自身的經驗進行故障點的查找和判斷,往往耗時較長,且不容易迅速處理問題,將故障節點重新投入使用。為此我們專利技術了一種新的Linux集群故障自動恢復方法,解決了以上技術問題。
技術實現思路
本專利技術的目的是提供一種能夠自動、快速、高效地完成集群節點系統的故障自動恢復的Linux集群故障自動恢復方法。????本專利技術的目的可通過如下技術措施來實現:Linux集群故障自動恢復方法,該Linux集群故障自動恢復方法包執行數據信息采集并判斷是否出現故障;當判斷出現故障時,重新啟動節點;當重新啟動該節點后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的維護集成;在執行該故障節點的維護集成后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的安裝集成;以及在執行該故障節點的安裝集成后,再次執行該數據信息采集并判斷出現故障時,進行人工處理。本專利技術的目的還可通過如下技術措施來實現:該數據信息采集包括動態數據采集、靜態信息采集、系統服務狀態數據采集和應用信息數據采集。該動態數據采集和靜態信息采集通過讀取系統的/proc文件系統獲取系統信息。該系統服務狀態數據采集是檢測整個集群的DNS、NIS、NTP等主從服務器的服務狀態,并把其狀態寫到數據庫中。該應用信息數據采集是根據生產應用的實際情況,先羅列出實際應用中的各種需要,然后根據需要手工錄入各個應用服務器及應用服務的節點名,并保存到數據庫中,然后根據各個應用服務器的節點名檢測該服務器的應用服務狀態,并把其狀態寫到該數據庫中。該Linux集群故障自動恢復方法根據該數據信息采集的更新時間,設定該更新間隔的最大時間間隔,當該數據信息采集的刷新時間超過了該最大時間間隔時,判斷出現故障。該Linux集群故障自動恢復方法還包括在重新啟動節點的步驟后,標志節點已進行重新啟動的標志位,并在再次執行該數據信息采集并判斷未出現故障時,清除節點已進行重新啟動的標志位。該Linux集群故障自動恢復方法還包括在執行故障節點的維護集成的步驟后,標志節點維護集成的標志位,并在再次執行該數據信息采集并判斷未出現故障時,清除節點維護集成的標志位。該Linux集群故障自動恢復方法還包括在執行故障節點的安裝集成的步驟后,標志節點安裝集成的標志位,并在再次執行該數據信息采集并判斷未出現故障時,清除節點安裝集成的標志位。該執行故障節點的維護集成的步驟包括將該節點在服務器端設置成維護狀態,重新啟動該節點,該節點在啟動過程中,從網絡讀取啟動映像,進入該節點的維護狀態,將該節點系統的配置還原到最初配置狀態。該執行故障節點的安裝集成的步驟包括將該節點在服務器端設置成安裝集成狀態,重新啟動該節點,該節點在啟動過程中,從網絡讀取啟動映像,進入節點的網絡安裝集成,從網絡讀取安裝包,進行系統的安裝配置,將該節點系統重新進行安裝。本專利技術的目的也可通過如下技術措施來實現:Linux集群故障自動恢復系統,其特征在于,該Linux集群故障自動恢復系統包括數據信息采集及判斷模塊、重新啟動節點模塊、維護集成模塊和安裝集成模塊,該數據信息采集及判斷模塊用于執行數據信息采集并判斷是否出現故障,該重新啟動節點模塊用于重新啟動節點,該維護集成模塊用于執行故障節點的維護集成,該安裝集成模塊用于執行故障節點的安裝集成。本專利技術的目的還可通過如下技術措施來實現:該數據信息采集及判斷模塊執行數據信息采集并判斷是否出現故障,當該數據信息采集及判斷模塊判斷出現故障時,該重新啟動節點模塊重新啟動節點,在該重新啟動節點模塊重新啟動該節點后,該數據信息采集及判斷模塊再次執行該數據信息采集并判斷出現故障時,該維護集成模塊執行故障節點的維護集成,當該維護集成模塊執行該故障節點的維護集成后,該數據信息采集及判斷模塊再次執行該數據信息采集并判斷出現故障時,該安裝集成模塊執行故障節點的安裝集成,在該安裝集成模塊執行該故障節點的安裝集成后,該數據信息采集及判斷模塊再次執行該數據信息采集并判斷出現故障時,該數據信息采集及判斷模塊發送消息以進行人工處理。該數據信息采集包括動態數據采集、靜態信息采集、系統服務狀態數據采集和應用信息數據采集。該數據信息采集及判斷模塊通過讀取系統的/proc文件系統獲取系統信息以獲得該動態數據采集和該靜態信息采集。該數據信息采集及判斷模塊檢測整個集群的DNS、NIS、NTP等主從服務器的服務狀態以獲得該系統服務狀態數據采集,并把其狀態寫到數據庫中。該數據信息采集及判斷模塊根據生產應用的實際情況,先羅列出實際應用中的各種需要,然后根據需要手工錄入各個應用服務器及應用服務的節點名,并保存到數據庫中,然后根據各個應用服務器的節點名檢測該服務器的應用服務狀態,并把其狀態寫到該數據庫中,以進行該應用信息數據采集。該數據信息采集及判斷模塊根據該數據信息采集的更新時間,設定該更新間隔的最大時間間隔,當該數據信息采集的刷新時間超過了該最大時間間隔時,該數據信息采集及判斷模塊判斷出現故障。該維護集成模塊在執行故障節點的維護集成時,將該節點在服務器端設置成維護狀態,重新啟動該節點,該節點在啟動過程中,從網絡讀取啟動映像,進入該節點的維護狀態,將該節點系統的配置還原到最初配置狀態。該安裝集成模塊在執行故障節點的安裝集成時,將該節點在服務器端設置成安裝集成狀態,重新啟動該節點,該節點在啟動過程中,從網絡讀取啟動映像,進入節點的網絡安裝集成,從網絡讀取安裝包,進行系統的安裝配置,將該節點系統重新進行安裝。本專利技術中的Linux集群故障自動恢復方法,能夠采集集群系統運行的各種關鍵信息并集中存儲,建立預警機制,從多個級別自動處理集群的故障,并能夠提供詳細的參考數據供管理人員決策,在很大程度上減少了人工的消耗,將故障節點以最快地速度恢復并投入生產使用。本專利技術中的Linux集群故障自動恢復方法,能夠自動、快速、高效地完成集群節點系統的故障自動恢復,能夠滿足異構集群不同需求,支持多個版本操作系統,加快了集群節點的再次投產,方便了用戶的使用,提高了集群資源利用效率。附圖說明圖1為本專利技術的Linux集群故障自動恢復方法的流程圖;圖2為圖1中的應用信息數據采集步驟的流程圖;圖3為本專利技術的Linux集群故障自動恢復系統的模塊圖。具體實施方式為使本專利技術的上述和其他目的、特征和優點能更明顯易懂,下文特舉出較佳實施例,并配合所附圖式,作詳細說明如下。如圖1所示,圖1為本專利技術的Linux集本文檔來自技高網...
【技術保護點】
Linux集群故障自動恢復方法,其特征在于,該Linux集群故障自動恢復方法包括:執行數據信息采集并判斷是否出現故障;當判斷出現故障時,重新啟動節點;當重新啟動該節點后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的維護集成;在執行該故障節點的維護集成后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的安裝集成;以及在執行該故障節點的安裝集成后,再次執行該數據信息采集并判斷出現故障時,進行人工處理。
【技術特征摘要】
2011.08.16 CN 201110234547.4;2011.10.27 CN 2011101.Linux集群故障自動恢復方法,其特征在于,該Linux集群故障自動恢復方法包括:
執行數據信息采集并判斷是否出現故障;
當判斷出現故障時,重新啟動節點;
當重新啟動該節點后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的維護集成;
在執行該故障節點的維護集成后,再次執行該數據信息采集并判斷出現故障時,執行故障節點的安裝集成;以及
在執行該故障節點的安裝集成后,再次執行該數據信息采集并判斷出現故障時,進行人工處理。
2.根據權利要求1所述的Linux集群故障自動恢復方法,其特征在于,該數據信息采集包括動態數據采集、靜態信息采集、系統服務狀態數據采集和應用信息數據采集。
3.根據權利要求2所述的Linux集群故障自動恢復方法,其特征在于,該動態數據采集和靜態信息采集通過讀取系統的/proc文件系統獲取系統信息。
4.根據權利要求2所述的Linux集群故障自動恢復方法,其特征在于,該系統服務狀態數據采集是檢測整個集群的DNS、NIS、NTP等主從服務器的服務狀態,并把其狀態寫到數據庫中。
5.Linux集群故障自動恢復系統,其特征在于,該Linux集群故障自動恢復系統包括數據信息采集及判斷模塊、重新啟動節點模塊、維護集成模塊和安裝集成模塊,該數據信息采集及判斷模塊用于執行數據信息采集并判斷是否出現故障,該重新啟動節點模塊用于重新啟動節點,該維護集成模塊用于執行故障節點的維護集成,該安裝集成模塊用于執行故障...
【專利技術屬性】
技術研發人員:單聯瑜,叢龍水,董濤,李戰強,孫世為,邢占軍,孫友凱,段淼,劉玉梅,徐香明,趙軍民,付巧娟,吳敏,車曉萍,劉芳,盧晉平,董倩,尚新民,侯樹杰,郭見樂,
申請(專利權)人:中國石油化工股份有限公司,中國石油化工股份有限公司勝利油田分公司物探研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。