【技術實現步驟摘要】
本專利技術涉及微處理器體系結構領域眾核容錯技術,具體涉及一種。
技術介紹
故障率的增加使得容錯成為所有處理器必需面對的問題。甚至桌面應用也開始考慮可靠性。目前廣泛應用容錯系統的都是金融、能源、航空航天等關鍵領域,這主要是因為這些關鍵應用對容錯開銷的承受能力強。而桌面應用,高性能計算等應用對容錯代價是很敏感的。同時處理器的發展也日益從多核向眾核發展。所以一種面向開銷敏感型應用的眾核容錯技術是極為有意義的。 目前主流的容錯技術分軟件實現和硬件實現兩種,軟件實現多基于多次執行相同程序比較結果,而硬件容錯多基于多模冗余,實現多套硬件資源來同時執行程序的多個副本。將軟硬件結合起來進行全系統的容錯是目前一個趨勢,如硬件負責錯誤檢測而軟件負責錯誤恢復,這可以極大降低容錯開銷。 公認的,目前眾核處理器存在利用率較低的問題,通常存在空閑資源。Pollack定律表明如果程序的并行性足夠,眾核能夠維持性能繼續按照摩爾定律增長。所以眾核對并行性的需求也是遵循摩爾定律的,但是程序的并行性及其開發受多種因素限制很難滿足需求,這就導致了眾核性能的下降和空閑核的存在。實際的眾核處理器如MIC的利用效率通常很低,利用空閑的核進行冗余執行容錯就成了一個具有吸引力的選擇。 設備視圖是一種為物理設備提供編程調用的驅動接口技術,針對物理設備一般提供配置、啟用、停用等方法,來實現對物理設備的編程調用。
技術實現思路
本專利技術要解決的技術問題是:針對現有技術的上述技術問題,提供一種可靠性高、軟件調用方便、容錯靈活、容錯成本低、錯誤發現實時、容錯執行效率高,能夠 ...
【技術保護點】
一種基于設備視圖冗余的眾核處理器容錯方法,其特征在于步驟包括:1)預先在眾核處理器指定的主核和冗余核中加入用于容錯檢測的可靠設備單元,且針對可靠設備單元提供可供編程調用的設備視圖,所述設備視圖可供編程調用的指令包括設備視圖的配置、啟用和停用;在主核執行應用程序時,如果執行到設備視圖的配置指令,則初始化配置可靠設備單元并向控制核發送中斷請求,控制核根據中斷請求為主核分配一個可用的冗余核,跳轉執行步驟2);2)主核繼續執行應用程序;當主核執行到設備視圖的啟用指令時掛起應用程序,啟用可靠設備單元并將上下文復制給冗余核,冗余核保存上下文并啟用可靠設備單元,控制核分別給主核和冗余核發送冗余執行命令,跳轉執行步驟3);3)主核、冗余核同時執行設備視圖的啟用指令后的關鍵代碼段,同時控制核根據指定的間隔時間更新主核執行的檢查點,在執行關鍵代碼段的過程中如果主核的可靠設備單元檢測到和冗余核的可靠設備單元執行的結果不一致則向控制核發出中斷請求,則控制核控制主核和冗余核退回上一個檢查點;當主核執行到設備視圖的停用指令時,跳轉執行步驟4);4)主核、冗余核分別停用可靠設備單元,主核繼續執行應用程序。
【技術特征摘要】
1.一種基于設備視圖冗余的眾核處理器容錯方法,其特征在于步驟包括: 1)預先在眾核處理器指定的主核和冗余核中加入用于容錯檢測的可靠設備單元,且針對可靠設備單元提供可供編程調用的設備視圖,所述設備視圖可供編程調用的指令包括設備視圖的配置、啟用和停用;在主核執行應用程序時,如果執行到設備視圖的配置指令,則初始化配置可靠設備單元并向控制核發送中斷請求,控制核根據中斷請求為主核分配一個可用的冗余核,跳轉執行步驟2); 2)主核繼續執行應用程序;當主核執行到設備視圖的啟用指令時掛起應用程序,啟用可靠設備單元并將上下文復制給冗余核,冗余核保存上下文并啟用可靠設備單元,控制核分別給主核和冗余核發送冗余執行命令,跳轉執行步驟3); 3)主核、冗余核同時執行設備視圖的啟用指令后的關鍵代碼段,同時控制核根據指定的間隔時間更新主核執行的檢查點,在執行關鍵代碼段的過程中如果主核的可靠設備單元檢測到和冗余核的可靠設備單元執行的結果不一致則向控制核發出中斷請求,則控制核控制主核和冗余核退回上一個檢查點;當主核執行到設備視圖的停用指令時,跳轉執行步驟4); 4)主核、冗余核分別停用可靠設備單元,主核繼續執行應用程序。2.根據權利要求1所述的基于設備視圖冗余的眾核處理器容錯方法,其特征在于:所述步驟I)中初始化配置可靠設備單元時包括配置控制核用于更新主核執行的間隔時間。3.根據權利要求2所述的基于設備視圖冗余的眾核處理器容錯方法,其特征在于:所述步驟I)中控制核根據中斷請求為主核分配一個可用的冗余核的步驟包括:控制核收到中斷請求后向各個冗余核發送空閑度查詢指令,各個冗余核基于自帶的性能計數器或者可靠設備單元內置的性能計數器統計指定的時間內該冗余核執行的NULL指令數和總指令數,并將NULL指令數除以總指令數得到該冗余核的空閑度并發送給控制核,控制核根據各個冗余核返回的空閑度為主核分配一個可用的冗余核。4.根據權利要求3所述的基于設備視圖冗余的眾核處理器容錯方法,其特征在于:所述步驟I)中初始化配置可靠設備單元時還包括配置主核的冗余優先級;所述控制核根據各個冗余核返回的空閑度為主核分配一個可用的冗余核時,如果同時只有一個主核向控制核發送中斷請求,則查找一個空閑度最高的有效的冗余核分配給該主核,如果同時存在兩個以上主核同時向控制核發送中斷請求,則控制核根據各個主核的冗余優先級來分配冗余核,冗余優先級最高的主核獲得空閑度最高的有效的冗余核,冗余優先級最低的主核獲得空閑度最低的有效的冗余核,如果沒有足夠的冗余核,則將冗余核優先分配冗余優先級較高的主核,如果控制核沒有足夠的冗余核分配給主核,則向主核返回分...
【專利技術屬性】
技術研發人員:喬寓然,文梅,任巨,荀長慶,范方園,蘇華友,張春元,黃達飛,
申請(專利權)人:中國人民解放軍國防科學技術大學,
類型:發明
國別省市:湖南;43
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。