提供了用于在重復刪除系統中進行空間預留的各種實施方式。基于至少一個存儲容量閾值與當前被備份和復制數據之一物理消耗的已用存儲空間,將計算的選配比確定為當前額定數據與物理數據的加權比。對計算存儲環境中的最大額定估計空間進行計算。計算剩余空間,該剩余空間定義為所述最大額定估計空間減去計算存儲環境中的當前額定空間。如果剩余空間等于或者小于用戶配置的用于備份操作的預留空間,則數據復制操作被接受并且存儲在計算存儲環境中。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術總體上涉及計算機,尤其涉及用于在可操作于計算存儲環境中的重復刪除(deduplication)系統中進行空間預留的裝置、方法與計算機程序產品實施方式。
技術介紹
重復刪除系統可以表現(externalize)各種邏輯數據存儲實體,例如文件、數據對象、備份圖像、數據快照或虛擬帶盒。常常需要把這種數據存儲實體從其原始站點復制到遠端站點。被復制的數據實體增強了數據的容錯能力和可用性。越來越需要這種容錯性和廣泛的可用性。盡管幾種現有的方法可以用于執行數據復制,具體而言是執行對重復刪除后的數據實體的復制,但是這些方法有附帶的限制,這些限制會不利地影響復制效率、系統性能和數據一致性,需要附加的開銷或者以上所述的組合。
技術實現思路
重復數據刪除是指減少和/或消除冗余數據。在一種重復數據刪除處理中,分別減少或消除數據的重復副本,留下最少量的冗余副本或者數據的單個副本。利用重復刪除處理提供了多種益處,例如所需存儲容量的減小和網絡帶寬的增加。由于這些及其它益處,重復刪除近年來已經作為計算存儲系統中一種非常重要的
脫穎而出。提供重復刪除功能的挑戰包括多個方面,例如有效地找出典型較大存儲倉庫中的重復數據模式,以及把以重復刪除后存儲有效的形式存儲所述數據模式。例如,在一種許多復制發送者與一個同時還充當備份目標的接收者通信的配置中,當前用于重復的復制解決方案面臨備份功能或到來的復制哪個應當具有更高優先級的挑戰。當前,這種挑戰可能導致對可用存儲空間的競爭狀況,如將進一步描述的。鑒于本領域當前的情況,需要一種用于重復刪除后數據的復制的機制,這種機制滿足有效復制處理的全部要求,同時避免如上所述的某些配置中的現有方法的這些限制,由此改進用于重復刪除后數據的復制的現有方法。相應地,提供了用于便于在可操作于計算存儲環境中的重復刪除系統中的空間預留功能的各種實施方式。在一種這樣的實施方式中,僅僅是作為例子,計算的選配比(factoring ratio)是作為當前額定數據與物理數據的加權比基于至少一個存儲容量閾值與當前被備份數據和復制數據之一物理消耗的已用存儲空間來確定的。對計算存儲環境中的最大額定估計空間加以計算。計算定義為計算存儲環境中最大額定估計空間減去當前額定空間的剩余空間。如果剩余空間等于或者小于用戶配置的用于備份操作的預留空間,那么數據復制操作就被接受并且存儲在計算存儲環境中。除了以上的示例性方法實施方式,還提供了其它的示例性系統和計算機產品實施方式并且這些實施方式都提供相關的優點。附圖說明為了使本專利技術的優點更加容易理解,將參考在附圖中例示的具體實施方式給出以上簡單描述的本專利技術的更詳細的描述。應當理解,這些附圖繪出了本專利技術的實施方式,但不能因此就認為是對其范圍的限制,本專利技術將通過附圖的使用以附加的特性與細節進行描述和解釋,附圖中圖I例示了其中可以實現本專利技術多方面的一種示例性計算環境;圖2例示了示例性數據復制與備份配置; 圖3例示了貫穿以下描述和所請求保護主題所使用的多個定義;圖4例示了用于在重復刪除系統中提供空間預留功能的示例性實施方式;圖5例示了依照前面在圖4中繪出的示例性方法的用于對計算選配比加以計算的示例性方法;圖6例示了根據前面在圖4中繪出的示例性方法的用于空間預留功能的處理流程的示例性方法 '及圖7例示了在諸如圖I所示的計算環境的計算環境中包括處理器設備的示例性計算設備。具體實施例方式現在轉向圖1,繪出了計算環境中數據存儲系統(例如,虛擬帶系統)的示例性體系結構10。體系結構10為本地主機18和20提供存儲服務,并且把數據復制到遠端數據存儲系統,如圖所示。與存儲設備14通信的本地存儲系統服務器12經包括例如光纖通道交換機16的部件的網絡連接到本地主機18和20。例如,光纖通道交換機16能夠執行用于帶設備的命令(例如,小型計算機系統接口(SCSI)命令)。本領域技術人員將認識到,體系結構10可以包括多種存儲部件。例如,存儲設備14可以包括傳統的硬盤驅動器(HDD)設備,或者可以包括固態驅動器(SSD)設備。本地存儲系統服務器12經網絡22連接到遠端存儲系統服務器24。遠端服務器24與本地連接的盤存儲設備26通信,并且經另一個網絡和例如光纖通道交換機28的網絡部件28與本地連接的主機30和32通信。網絡22可以包括多種網絡拓撲結構,例如廣域網(WAN)、局域網(LAN)、存儲區域網絡(SAN)及其它配置。類似地,交換機16和28可以包括其它類型的網絡設備。如前面所描述過的,體系結構10為本地主機提供本地存儲服務,并且向遠端數據存儲系統提供復制數據(如利用箭頭34由數據復制功能所指示的)。就象將要描述的,本專利技術的各種實施方式及所請求保護的主題可以在例如體系結構10的體系結構上實現。例如,在一種實施方式中,盤存儲設備14可以是重復刪除后的存儲系統的一部分,存儲重復刪除后的數據實體。然后,重復刪除后的數據實體可以經歷數據復制處理34,由此重復刪除后的數據實體被復制到遠端盤存儲設備26上。這些處理將在下面進一步具體描述。這種把以重復刪除的形式駐留在重復刪除存儲系統中的數據實體復制到遠端重復刪除存儲系統的處理在源系統與目的地系統上關于處理時間和存儲要求都應當是有效的,而且應當有可能利用重復刪除存儲系統的特性來便于這種有效性。把多個系統復制到單個災難恢復(DR)系統上例如對于具有數據存儲要求的機構是常見的,其中數據存儲要求例如服從某些數據安全保存法的那些要求,或者維持來自許多小到中型站點的、具有不同保留期的數據實體復制所需的那些要求。但是,如前面所指出的,當多個發送方配置成與一個接收方通信時,可能會出現潛在的問題。盡管一個或兩個復制發送方可以容易地得到控制,而且接收方可以相應地計劃其容量,但是,多個復制發送方在同時執行復制操作時有可能造成接收方站點的混亂。這個問題在接收方還配置為備份目標時會加劇。再次,如前面所提到的,然后出現哪個具有更高優先級的問題,是備份還是到來的復制?關于優先級的這個問題在傳統的復制實現中總體上來說沒有得到解決。相應地,利用任何傳統的解決方案都對可用的存儲空間帶來了競爭狀況的可能性。在這種情形下,復制和備份都將沒有任何類型的優先級,而且它們將根據等于每個發送方(包括備份主機)能夠產生的吞吐量的輸入/輸出(I/o)來消耗空間。轉向圖2,例示了示例性的多對一復制環境50。在這里,多個發送方52與配置成為來自備份主機58的備份目標的接收方54通信。接收方54還與存儲器56 (如本領域技術人員將認識到的,在許多實現當中,存儲器56可以包括一種或多種存儲設備)通信。由于接收方必須提供到備份主機58的備份功能,但是還要方便到存儲器56的數據復制,因此, 如果不執行對存儲器56的存儲容量的實施措施,那么環境50就在復制與備份之間促成了競爭狀況,使得存儲器56不能優先執行備份或者復制中的任何一種具體操作,從而一旦復制完全填滿了存儲器56的空間,由接收方54為備份主機56提供的備份操作將不能執行,而且將會失敗。為了解決上述情形,所例示的實施方式提供了用于在重復刪除系統中令備份優先于復制的機制,這種機制在運行復制與備份的同時動態地實施這種容量管理事務。每個系統可以具有其自己的、指定為具有本地所有關系的存儲實體本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】...
【專利技術屬性】
技術研發人員:T·Z·陶布,E·德羅布欽科,S·H·阿吉拉夫,O·勒內曼,A·卡羅,D·N·海普內爾,A·K·埃克什坦,
申請(專利權)人:國際商業機器公司,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。