是時候重新審視你的重復數據刪除策略了。如今大部分環境都需要使用重復數據刪除技術,不論是面臨資源瓶頸、規模制約,還是兩者皆有,重復數據刪除已作為一種實用工具迅速普及。但是當面臨持續快速增長的數據時,這項過于依賴基礎硬件設備的策略則可能會產生其他技術問題。
先來看一些數據:平均來說,目前數據正以每年40%的速度增長,換句話說,每兩年翻一番,并且沒有結束的跡象——無論你承認與否,數據增長的事實就擺在眼前1。
面對這樣的現狀,“Parallel Deduplication”(并行重復數據刪除)的概念適時而出,以提供大規模、可擴展和高彈性的重復數據刪除為前提,通過以軟件為中心的方式為最大的數據以及需求最多的應用程序設計,并通過一個基于網格架構和利用重復數據刪除數據庫(DDB)和介質運行的。根據網格結構,并行重復數據刪除將聯合多個DDB一起為數據保護工作(客戶端和子客戶端)提供一個單一、大規模的重復數據刪除池:例如,兩節點平行數據刪除池的架構模型。由此可以通過接近線性的方式擴展重復數據刪除容量和吞吐量,用來支持負載繁重的數據刪除工作。
考慮到這一點,CommVault在其最新推出的Simpana® 10中推出了其第四代重復數據刪除技術,該技術主要基于并行重復數據刪除技術,以應對數據持續爆炸性增長帶來的挑戰。通過全新的基于網格的結構,第四代重復數據刪除在性能及規模上都提升了一倍,從而能夠使企業的基礎設施運行更加智能化。除了可以提供大規模容量和吞吐量,企業也可以將并行重復數據刪除方法與CommVault獨有的GridStor®技術相結合,得到完整的負載平衡和作業故障轉移選項。如果重復數據刪除池的一個節點出現故障,那么其他節點會立刻接管現有任務從而避免任何宕機的可能。
圖示1:兩節點并行重復數據刪除池配置示例
舉例來說(圖示1),將兩個重復數據刪除節點聯合在一起,每個節點最多可保護120TB的前端容量2和大約4.5TB/小時的吞吐量3。通過將兩個節點聯合到一個單一的重復數據刪除池,我們最多可以對240TB的數據和9TB/小時的吞吐量進行重復數據刪除管理。
并行重復數據刪除技術只是Simpana 10眾多功能之一,它可以讓重復數據刪除更加智能。隨著數據的不斷增長和數據處理的復雜性,在制定重復數據刪除策略時,有必要考慮:
1. 將遠程及中央辦公室的重復數據刪除整合到一個單一的軟件架構中。企業可以在遠程站點利用單一節點重復數據刪除策略。然后在中央站點利用并行重復數據刪除策略,采用DASH Copy技術將刪除的重復數據拷貝到中央站點。將單一節點和多節點重復數據刪除功能融為一體,可以為企業提供足夠的靈活性,基于企業的業務需求,對每個站點的數據容量進行相應的調整。
2. 利用DASH FULL技術進行永久增量備份。這可以在最大限度降低對生產服務器和網絡影響的同時,大大提高備份策略的智能性,更好地利用原有的基礎設施。例如,采用傳統的每日增量備份、每周完全備份的方式,虛擬機(VM)每個節點的備份數據僅能達到20-25TB。而采用永久增量和DASH備份技術,每個節點就可備份40-50TB的虛擬機數據。
3. 基于數據類型,通過單一控制臺全面統一管理多個重復數據刪除池,可確保企業創建的重復數據刪除池在刪除重復數據方面帶來最大的效益,從而優化資源的利用。
最后,關于并行重復數據刪除,企業還需要做額外考慮:Simpana 10在并行重復數據刪除策略中支持兩個節點,雖然該策略對重復刪除數據可以聯合的節點沒有硬件上的限制。并且企業可以期待CommVault把單一并行重復數據刪除策略的節點數量推向一個極限;此外,在存儲策略中,需要預先對并行重復數據刪除節點進行配置——單一的節點無法轉換為兩個節點,兩個節點也不會轉換為4個節點,因此應對數據增長的解決方案仍然需要提前進行規劃。
注解:
1 2013年消費傾向調查表,ESG 2013年1月
2 120TB需要使用SSD——DDB商店
3吞吐量初測為Simpana10的標準,這個數字預計在Simpana10的生命周期中還會增長。
Phil Curran,CommVault基礎設施解決方案產品營銷總監。