• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于設備視圖冗余的眾核處理器容錯方法技術

    技術編號:11103675 閱讀:76 留言:0更新日期:2015-03-04 15:54
    本發明專利技術公開了一種基于設備視圖冗余的眾核處理器容錯方法,步驟包括:預先在眾核處理器的主核和冗余核中加入可靠設備單元并提供可供編程調用的設備視圖;主核執行到配置指令時配置可靠設備單元,控制核為主核分配冗余核;在主核執行到啟用指令后,主核將現場復制給冗余核,主核和冗余核分別啟用可靠設備單元;控制核分別發送冗余執行命令,主核和冗余核開始容錯執行,控制核定時執行更新檢查點,在容錯執行出錯時退回上一個檢查點;在主核執行到停用指令后,分別停用可靠設備單元,主核繼續執行應用程序。本發明專利技術可靠性高、軟件調用方便、容錯靈活、容錯成本低、錯誤發現實時、容錯執行效率高,能夠充分利用空閑的核資源、對系統性能影響小。

    【技術實現步驟摘要】

    本專利技術涉及微處理器體系結構領域眾核容錯技術,具體涉及一種。
    技術介紹
    故障率的增加使得容錯成為所有處理器必需面對的問題。甚至桌面應用也開始考慮可靠性。目前廣泛應用容錯系統的都是金融、能源、航空航天等關鍵領域,這主要是因為這些關鍵應用對容錯開銷的承受能力強。而桌面應用,高性能計算等應用對容錯代價是很敏感的。同時處理器的發展也日益從多核向眾核發展。所以一種面向開銷敏感型應用的眾核容錯技術是極為有意義的。 目前主流的容錯技術分軟件實現和硬件實現兩種,軟件實現多基于多次執行相同程序比較結果,而硬件容錯多基于多模冗余,實現多套硬件資源來同時執行程序的多個副本。將軟硬件結合起來進行全系統的容錯是目前一個趨勢,如硬件負責錯誤檢測而軟件負責錯誤恢復,這可以極大降低容錯開銷。 公認的,目前眾核處理器存在利用率較低的問題,通常存在空閑資源。Pollack定律表明如果程序的并行性足夠,眾核能夠維持性能繼續按照摩爾定律增長。所以眾核對并行性的需求也是遵循摩爾定律的,但是程序的并行性及其開發受多種因素限制很難滿足需求,這就導致了眾核性能的下降和空閑核的存在。實際的眾核處理器如MIC的利用效率通常很低,利用空閑的核進行冗余執行容錯就成了一個具有吸引力的選擇。 設備視圖是一種為物理設備提供編程調用的驅動接口技術,針對物理設備一般提供配置、啟用、停用等方法,來實現對物理設備的編程調用。
    技術實現思路
    本專利技術要解決的技術問題是:針對現有技術的上述技術問題,提供一種可靠性高、軟件調用方便、容錯靈活、容錯成本低、錯誤發現實時、容錯執行效率高,能夠充分利用空閑的核資源、對系統性能影響小的。 為了解決上述技術問題,本專利技術采用的技術方案為:一種,步驟包括:1)預先在眾核處理器指定的主核和冗余核中加入用于容錯檢測的可靠設備單元,且針對可靠設備單元提供可供編程調用的設備視圖,所述設備視圖可供編程調用的指令包括設備視圖的配置、啟用和停用;在主核執行應用程序時,如果執行到設備視圖的配置指令,則初始化配置可靠設備單元并向控制核發送中斷請求,控制核根據中斷請求為主核分配一個可用的冗余核,跳轉執行步驟2);2)主核繼續執行應用程序;當主核執行到設備視圖的啟用指令時掛起應用程序,啟用可靠設備單元并將上下文復制給冗余核,冗余核保存上下文并啟用可靠設備單元,控制核分別給主核和冗余核發送冗余執行命令,跳轉執行步驟3); 3)主核、冗余核同時執行設備視圖的啟用指令后的關鍵代碼段,同時控制核根據指定的間隔時間更新主核執行的檢查點,在執行關鍵代碼段的過程中如果主核的可靠設備單元檢測到和冗余核的可靠設備單元執行的結果不一致則向控制核發出中斷請求,則控制核控制主核和冗余核退回上一個檢查點;當主核執行到設備視圖的停用指令時,跳轉執行步驟4);4)主核、冗余核分別停用可靠設備單元,主核繼續執行應用程序。 優選地,所述步驟1)中初始化配置可靠設備單元時包括配置控制核用于更新主核執行的間隔時間。 優選地,所述步驟1)中控制核根據中斷請求為主核分配一個可用的冗余核的步驟包括:控制核收到中斷請求后向各個冗余核發送空閑度查詢指令,各個冗余核基于自帶的性能計數器或者可靠設備單元內置的性能計數器統計指定的時間內該冗余核執行的NULL指令數和總指令數,并將NULL指令數除以總指令數得到該冗余核的空閑度并發送給控制核,控制核根據各個冗余核返回的空閑度為主核分配一個可用的冗余核。 優選地,所述步驟1)中初始化配置可靠設備單元時還包括配置主核的冗余優先級;所述控制核根據各個冗余核返回的空閑度為主核分配一個可用的冗余核時,如果同時只有一個主核向控制核發送中斷請求,則查找一個空閑度最高的有效的冗余核分配給該主核,如果同時存在兩個以上主核同時向控制核發送中斷請求,則控制核根據各個主核的冗余優先級來分配冗余核,冗余優先級最高的主核獲得空閑度最高的有效的冗余核,冗余優先級最低的主核獲得空閑度最低的有效的冗余核,如果沒有足夠的冗余核,則將冗余核優先分配冗余優先級較高的主核,如果控制核沒有足夠的冗余核分配給主核,則向主核返回分配冗余核失敗的消息,主核向控制核發送中斷請求后如果收到發出分配冗余核失敗的消息則退出并繼續正常執行應用程序。 優選地,所述步驟3)的詳細步驟包括:主核、冗余核同時執行設備視圖的啟用指令后的關鍵代碼段,同時控制核根據指定的間隔時間更新主核執行的檢查點;在執行關鍵代碼段的過程中,主核判斷當前的指令是否為設備視圖停用指令,如果是則跳轉執行步驟4);否則,主核產生主核執行的跡,所述跡為對寄存器組及存儲器的訪問信息;同時,冗余核產生冗余核執行的跡,冗余核的可靠設備單元提取跡的特征并發送給主核,主核的可靠設備單元提取跡的特征并與冗余核發送的跡的特征進行比較,如果兩者不一致,則主核向控制核發送中斷請求進行錯誤恢復,控制核收到中斷請求后分別控制主核、冗余核退回至上一個檢查點,主核和冗余核繼續從上一個檢查點開始重新執行關鍵代碼段;如果兩者一致,則主核和冗余核繼續執行剩余的關鍵代碼段。 優選地,所述主核產生主核執行的跡時,如果主核同時存在寄存器操作和存儲器操作,則只記錄存儲器操作的訪問信息;所述冗余核產生冗余核執行的跡時,如果冗余核同時存在寄存器操作和存儲器操作,則只記錄存儲器操作的訪問信息。 優選地,所述步驟1)中初始化配置可靠設備單元時包括配置用于可靠設備單元提取跡的特征的壓縮算法類型;所述可靠設備單元提取跡的特征具體是指采用預設的壓縮算法類型提取指定數量的跡的特征,且在每一次提取跡時,將上一次提取得到的特征、當前采集得到的指定數量的跡共同作為壓縮算法的輸入來提取得到本次指定數量的跡的特征。 優選地,所述可靠設備單元包括跡特征提取器、本地FIFO存儲器、遠程FIFO存儲器、比較器、性能計數器以及控制器,在主核產生主核執行的跡后,所述主核的跡特征提取器采用預設的壓縮算法類型提取指定數量的跡的特征并存儲在本地FIFO存儲器中;在冗余核產生冗余核執行的跡后,所述冗余核的跡特征提取器采用預設的壓縮算法類型提取指定數量的跡的特征并存儲在本地FIFO存儲器中,同時冗余核的控制器將本地FIFO存儲器中存儲的冗余核的跡的特征發送并存儲到主核的遠程FIFO存儲器中;主核的比較器針對本地FIFO存儲器、遠程FIFO存儲器中存儲的跡的特征進行比較,如果不一致則向控制器發出報錯信息,主核的控制器如果收到報錯信息則向控制核發送中斷請求進行錯誤恢復。 本專利技術具有下述優點:1、與現有技術的硬件多模冗余相比,本專利技術不是對應用提供一個必要使用的軟硬系統,而是只提供一個容錯設備一可靠設備單元,通過編程調用可靠設備單元的設備視圖即可實現對可靠設備單元的靈活調用,應用可以只在有容錯需求時啟用這個可靠設備單元,相對現有技術的容錯方式而言,使用更加靈活、容錯成本更低,本專利技術尤其適合于開銷敏感型的應用程序容錯,其目的不是提高整個系統所有應用的可靠性,而是利用眾核處理器中的“空閑”資源增強系統中特定的關鍵代碼段的可靠性,其設計的出發點不是盡可能的優化容錯而是盡可能的在不降低整個系統的性能的前提下進行容錯,能夠實現針對關鍵代碼段的按需容錯,具有可靠性高、軟件調用方便、容錯靈活、容錯成本本文檔來自技高網...

    【技術保護點】
    一種基于設備視圖冗余的眾核處理器容錯方法,其特征在于步驟包括:1)預先在眾核處理器指定的主核和冗余核中加入用于容錯檢測的可靠設備單元,且針對可靠設備單元提供可供編程調用的設備視圖,所述設備視圖可供編程調用的指令包括設備視圖的配置、啟用和停用;在主核執行應用程序時,如果執行到設備視圖的配置指令,則初始化配置可靠設備單元并向控制核發送中斷請求,控制核根據中斷請求為主核分配一個可用的冗余核,跳轉執行步驟2);2)主核繼續執行應用程序;當主核執行到設備視圖的啟用指令時掛起應用程序,啟用可靠設備單元并將上下文復制給冗余核,冗余核保存上下文并啟用可靠設備單元,控制核分別給主核和冗余核發送冗余執行命令,跳轉執行步驟3);3)主核、冗余核同時執行設備視圖的啟用指令后的關鍵代碼段,同時控制核根據指定的間隔時間更新主核執行的檢查點,在執行關鍵代碼段的過程中如果主核的可靠設備單元檢測到和冗余核的可靠設備單元執行的結果不一致則向控制核發出中斷請求,則控制核控制主核和冗余核退回上一個檢查點;當主核執行到設備視圖的停用指令時,跳轉執行步驟4);4)主核、冗余核分別停用可靠設備單元,主核繼續執行應用程序。

    【技術特征摘要】
    1.一種基于設備視圖冗余的眾核處理器容錯方法,其特征在于步驟包括: 1)預先在眾核處理器指定的主核和冗余核中加入用于容錯檢測的可靠設備單元,且針對可靠設備單元提供可供編程調用的設備視圖,所述設備視圖可供編程調用的指令包括設備視圖的配置、啟用和停用;在主核執行應用程序時,如果執行到設備視圖的配置指令,則初始化配置可靠設備單元并向控制核發送中斷請求,控制核根據中斷請求為主核分配一個可用的冗余核,跳轉執行步驟2); 2)主核繼續執行應用程序;當主核執行到設備視圖的啟用指令時掛起應用程序,啟用可靠設備單元并將上下文復制給冗余核,冗余核保存上下文并啟用可靠設備單元,控制核分別給主核和冗余核發送冗余執行命令,跳轉執行步驟3); 3)主核、冗余核同時執行設備視圖的啟用指令后的關鍵代碼段,同時控制核根據指定的間隔時間更新主核執行的檢查點,在執行關鍵代碼段的過程中如果主核的可靠設備單元檢測到和冗余核的可靠設備單元執行的結果不一致則向控制核發出中斷請求,則控制核控制主核和冗余核退回上一個檢查點;當主核執行到設備視圖的停用指令時,跳轉執行步驟4); 4)主核、冗余核分別停用可靠設備單元,主核繼續執行應用程序。2.根據權利要求1所述的基于設備視圖冗余的眾核處理器容錯方法,其特征在于:所述步驟I)中初始化配置可靠設備單元時包括配置控制核用于更新主核執行的間隔時間。3.根據權利要求2所述的基于設備視圖冗余的眾核處理器容錯方法,其特征在于:所述步驟I)中控制核根據中斷請求為主核分配一個可用的冗余核的步驟包括:控制核收到中斷請求后向各個冗余核發送空閑度查詢指令,各個冗余核基于自帶的性能計數器或者可靠設備單元內置的性能計數器統計指定的時間內該冗余核執行的NULL指令數和總指令數,并將NULL指令數除以總指令數得到該冗余核的空閑度并發送給控制核,控制核根據各個冗余核返回的空閑度為主核分配一個可用的冗余核。4.根據權利要求3所述的基于設備視圖冗余的眾核處理器容錯方法,其特征在于:所述步驟I)中初始化配置可靠設備單元時還包括配置主核的冗余優先級;所述控制核根據各個冗余核返回的空閑度為主核分配一個可用的冗余核時,如果同時只有一個主核向控制核發送中斷請求,則查找一個空閑度最高的有效的冗余核分配給該主核,如果同時存在兩個以上主核同時向控制核發送中斷請求,則控制核根據各個主核的冗余優先級來分配冗余核,冗余優先級最高的主核獲得空閑度最高的有效的冗余核,冗余優先級最低的主核獲得空閑度最低的有效的冗余核,如果沒有足夠的冗余核,則將冗余核優先分配冗余優先級較高的主核,如果控制核沒有足夠的冗余核分配給主核,則向主核返回分...

    【專利技術屬性】
    技術研發人員:喬寓然,文梅任巨荀長慶范方園,蘇華友張春元黃達飛,
    申請(專利權)人:中國人民解放軍國防科學技術大學,
    類型:發明
    國別省市:湖南;43

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码一区二区三区在线| 日本爆乳j罩杯无码视频| 久久精品国产亚洲AV无码偷窥| 无码区国产区在线播放| 亚洲另类无码一区二区三区| 免费无码一区二区| 亚洲永久无码3D动漫一区| 无码八A片人妻少妇久久| 国产成人AV无码精品| 99久久人妻无码精品系列| 无码国内精品久久人妻麻豆按摩 | 亚洲精品无码MV在线观看| 色综合AV综合无码综合网站| 亚洲AV无码一区二三区| 69久久精品无码一区二区| 亚洲VA中文字幕无码一二三区 | 热の无码热の有码热の综合| 午夜不卡久久精品无码免费| 中文无码乱人伦中文视频在线V | 无码少妇一区二区| 免费无码国产V片在线观看| 91久久九九无码成人网站| 国产AV无码专区亚汌A√| 中文字幕无码一区二区免费| 欧日韩国产无码专区| 亚洲性无码AV中文字幕| 免费A级毛片av无码| 无码国产色欲XXXX视频| 亚洲av无码一区二区三区网站| 国产亚洲精品无码拍拍拍色欲| 无码人妻精品一区二区三区9厂| 一本大道无码av天堂| 日木av无码专区亚洲av毛片| 无码少妇一区二区| 日韩国产成人无码av毛片| 无码人妻久久久一区二区三区| 亚洲AV无码乱码国产麻豆穿越| 免费无码又爽又刺激高潮软件| 久久人妻少妇嫩草AV无码蜜桃| 亚洲精品无码成人片在线观看| 久久人妻少妇嫩草AV无码蜜桃|