VTL

VTL

虛擬磁帶庫(VTL-Virtual Tape Library)是指將磁碟仿真(虛擬)成物理磁帶庫,使備份伺服器把磁碟陣列作為物理磁帶庫對待,從而實現在備份作業中用磁碟代替磁帶來存儲數據的目的。

基本介紹

  • 中文名:虛擬磁帶庫
  • 外文名:VTL
VTL概述,虛擬磁帶庫的優勢,VTL並行控制器技術,並行VTL的成因,並行控制VTL廠商,VTL並行技術的套用方案,VTL廠商,VTL軟體基本技術指標,分散式VTL,分散式VTL原理,雲的數據安全問題,分散式VTL對雲的保護,主要作用,

VTL概述

VTL(Virtual Tape Library,虛擬磁帶庫)通常為一種專用的計算工具(Appliance),它可以仿真物理磁帶庫驅動器和(並且)在磁碟上存儲備份映像。VTL允許使用現有的磁帶備份軟體,管理人員之所以對這些工具感興趣是因為用於備份管理的範例(paradigm)與使用磁帶時的範例相同。
VTL由三部分組件構成: 計算機硬體,通常為Intel處理器(基於Linux作業系統且由該系統供電),或者相近的變體; 套用軟體(用於仿真磁帶庫和磁帶驅動器); 和一組基於RAID技術的磁碟驅動器(在硬碟失效時它們可避免丟失任何數據)。 個別產商常常把這些組件捆綁成一個工具。 然而,也有可能從一家廠商購買計算機硬體和軟體,再到另外一家不同的廠商那裡購買磁碟陣列
VTL允許客戶配置虛擬磁帶驅動器、虛擬磁帶盒和指定磁帶盒容量。 廠商不同,支持虛擬磁帶驅動器的最大數目也不同,變化範圍從個位數到無窮。 與物理磁帶庫不同,物理磁帶庫需要購買並安裝額外的磁帶驅動器,但對VTL來說通過改變軟體結構(configuration)即可增加虛擬磁帶驅動器,而這不需要花費任何額外的硬體成本。
大概可以分為三種類型:磁碟陣列型(Disk Array Based)、套用伺服器型(VTL Appliance)、備份軟體型(Backup Software)。
磁碟陣列型
顧名思義,它是以磁碟陣列為基礎發展的虛擬磁帶櫃,透過內建於磁碟陣列控制器(RAID Controller)內的虛擬軟體,將儲存空間仿真成磁帶櫃具備的所有特徵。這類型的虛擬磁帶櫃用戶以大型企業為主,採用光纖信道主機接口,支持FC SAN儲域網路環境,儲存容量通常在數十TB以上,有的甚至可達上百TB。
套用伺服器型
透過安裝在PC伺服器上的虛擬磁帶軟體,將伺服器內的硬碟,或是可被伺服器控制的外接磁碟陣列,做為存放備份數據的虛擬磁帶空間。由於軟體架構在標準的x86平台和Linux作業系統上,成本相對較便宜,而且儲存裝置的限制較低,只要伺服器支持,可以採用任何SCSI或光纖信道接口的磁碟陣列,與備份伺服器端可以藉由SCSI、iSCSI或光纖信道等傳輸接口相連,部署套用上較有彈性。這類型產品相當多,國外有Maxxan SVT 100、Diligent VTF Open,國內也有精業、耐特普羅等系統整合廠商推出軟硬體合一的虛擬磁帶櫃。
備份軟體型
直接將虛擬磁帶功能整合至備份軟體內,由於純粹是依靠軟體來達成仿真磁帶的目的,運用上相當具有彈性,不但沒有最大容量限制,可仿真的磁帶櫃數量、磁帶數量與每卷磁帶容量也都是無限的,只要儲存空間足夠,亦不限定需採用何種廠牌的儲存系統,不過這類方案的限制是無法和其它廠牌備份軟體搭配使用。

虛擬磁帶庫的優勢

新一代 VTL 不僅具有快取的功能,並且與備份管理軟體的兼容性也較好,還具有不改變備份流程、提高設備性能、可擴展性高和利用率高等特點。磁碟通過軟體仿真成物理磁帶庫,雖然其內部構造、外觀、速度和物理磁帶庫截然不同,但對於備份軟體主機系統而言,VTL具有磁帶識別的特徵,可被認作物理磁帶庫設備。這使得設備在可用性及備份的可靠性等方面都得到大幅提升,並無縫、平滑地集成到原有系統環境中,配合傳統的備份軟體和物理磁帶庫,提高設備使用率和備份性能。
設備可用性增強:VTL利用內部程式虛擬機械手”和“磁帶驅動器”,來代替物理磁帶庫中裸露、易損的機械裝置,從而降低設備的故障率。其採用的基於 RAID保護和熱備磁碟(Hot Spare Disk)技術,很好地提高了硬體和備份的可靠性(不同VTL廠商選用保護方式不同)。電源、風扇、數據通路均採用冗餘設計,且支持自動報警和線上熱恢復功能,最大限度地避免對操作的影響。與開放式結構的磁帶介質相比,封閉式磁碟介質的MTBF(平均無故障間隔)一般高出5倍以上。因此,新一代VTL可從不同角度提升設備的可用性。
備份恢復速度大幅提升:相對磁帶,以磁碟為備份介質能大大提高讀寫速度。同時,虛擬進程的“機械手”和“磁帶驅動器”對磁帶的抓取、載入及機械定位檔案等模擬機械動作能夠在極短時間內完成,將所有機械動作節省的時間用作備份,進一步降低了數據備份、恢復所需時間。
功能實現快:VTL使用計算機匯流排的結構代替磁帶庫的物理電機等機械結構,通過電子信號為媒介控制實現功能,相對於物理磁帶庫的電機控制,快了多個數量級
整體維護成本下降:物理磁帶庫的維護成本過高,且維修庫體和組件的價格也非常昂貴。而VTL採用電路設計,避免了機械磨損的風險,是可靠性得到提升。而且作為主機架構的系統不需要額外成本就可以通過遠程系統監控、管理及配置。同時,與同容量級別的物理磁帶庫相比,VTL的占地空間要小很多,充分體現了高集成性和高可用性
備份不受故障節點的影響:物理磁帶庫具有很多單點故障,比如電源、電機、機械手等關鍵部件一旦發生故障,整個設備將癱瘓。而VTL備份則通過多節點進行,即使某節點出現故障,備份仍可完成,其關鍵部件冗餘機制很好的提高了設備可靠性。
設備安裝與集成簡單:VTL採用堆疊式機架結構及預調試安裝,備份系統可以根據用戶需求隨意組裝。安裝方面更加簡便,能夠快速地集成到用戶的SAN架構中或者直接連線到備份伺服器上。客戶需要擴容時,只需增加磁碟陣列櫃就能簡單、快速實現容量擴容。避免了傳統物理帶庫在部署時候需要繁瑣的順平校準等步驟。
繼承了磁帶的數據保密性:雖然使用磁碟為存儲介質,但VTL不使用通用檔案系統,而是通過使用磁帶的不可直接獲取數據的格式,禁止了病毒和盜竊帶來的安全隱患。
提供眾多最佳化功能:VTL可以實現物理磁帶庫無法實現的最佳化功能,如:重複數據刪除,數據遠程複製等,不僅提高單位容量利用率,加強可擴展性,更讓遠程網路複製成為現實。這些最佳化功能既大大降低總擁有成本,同時還提高了數據的可用性和安全性。
隨著雲存儲的到來,業務數據對備份的時效性、可靠性與易用性要求越來越高,一方面VTL通過軟體功能來應對苛刻要求,而另一方面在VTL硬體架構上也有了進一步的突破。

VTL並行控制器技術

並行VTL的成因

隨著虛擬磁帶庫發展,目前控制器成為了I/O瓶頸,於是開始陸續有廠家做出了並行架構的控制器。對於數據量激增的今天,並行控制器可以有效提高性能。
我們知道虛擬帶庫對VTL而言和物理帶庫並無兩樣,需要有磁帶驅動、機械臂、磁帶組成。而備份任務都是通過磁帶驅動器寫入磁帶中,那么性能瓶頸就到了一個磁帶驅動器上。從備份軟體端看,可以虛擬更多的磁帶驅動器來解決單驅動器性能瓶頸,但從硬體上看,單個物理設備上運行驅動器數量不是無止境的,而是一個拋物線,當超過一定數量後,整體備份性能會驟然下降。而如果能夠將磁帶驅動器放到多個物理硬體上,隨著使用需求自由增加刪減,那么硬體上性能瓶頸問題就迎刃而解。這點其實與目前一直提出的集群、scale-out、等等有異曲同工之效,只是將前端存儲技術延伸到了備份領域。

並行控制VTL廠商

目前VTL廠商較多比較知名的如EMC、昆騰、IBM、SOUL、飛康、怡敏信、SEPATON等,由於各家廠商戰略重點不同,產品定位不同,所以目前擁有並行控制器技術的廠商只有3家,國外兩家:SEPATON、飛康(FalconStor ),國內有一家:眾志和達(SOUL)。對於常規VTL咱們不再做深入探討,主要看看這3家的並行技術的特點與優勢
SEPATON可以算是並行的鼻祖,這應該是全球首家做並行虛擬磁帶庫的廠商,但國內客戶群較少。其控制器架構主要採用的是類似於格線計算的模式,可以超過32個控制器並行的能力,實現了多控制器並發讀寫,極大的提高了系統整體性能。這種模式十分適合於目前數據中心裏面海量數據備份使用。
飛康,國內有很多廠商OEM該產品,例如UIT、同有等等都使用過飛康VTL軟體。其實嚴格上說,飛康並不算是真正的並行,而是HA模式的VTL,沒兩個控制器HA,能夠支持4組控制器。而後端可以採用N+1模式的冗餘盤陣,保證其可靠性,這種模式下,性能確實可以有所提升,但擴展性卻受到了一定限制。
VTL
飛康VTL在HA觸發時候需要重啟設備進行切換動作,這種HA可以算是不完整的主備模式;另外4組VTL雙A模式控制器在前端備份主機看到的是4台獨立設備,相當於備份軟體管理4台虛擬磁帶庫
不過飛康這種VTL軟體卻符合當下最流行的軟體定義存儲這個理念,純軟體化的虛擬磁帶庫,可以安裝於任何設備直接套用這種,如果依據軟體重構IT這個理念看,未來可能這種模式是一個大趨勢。
SOUL,做虛擬磁帶庫起家的國內企業,其並行技術與SEPATON類似,但並沒有採用格線計算的模式。每個控制器可以虛擬多個磁帶驅動器,有效提升整體備份性能,且可以隨著需求逐步增加控制器以及磁帶驅動。而後端更具創造性的,採用了分散式檔案系統作為數據存儲單元,這可能是目前市面上首個將分散式套用於備份領域的廠家。
VTL

VTL並行技術的套用方案

在中小型備份套用環境中,單控制器的VTL產品就能夠滿足一般的備份性能和存儲要求。但在高性能備份套用中,由於控制器和後端存儲性能的局限性,採用單控制器的VTL往往難以達到滿意的效果。尤其在套用伺服器較多或SAN的存儲集成範圍有限以及VTL主機接口有限的情況下,實現高速並發備份十分困難。採用並行技術的產品具備極強的並行數據處理能力,可以靈活地為高端備份提供所需的高性能。
1、依然採用傳統物理磁帶庫的習慣使用方式
對主機和備份套用軟體而言,並行控制器和單控制器都被視為普通物理磁帶庫訪問。同時,通過仿真與並行控制器的擴展、組合方式更像大型物理磁帶庫,既可擴充磁帶驅動器,也可以擴充磁帶槽。
2、容量和性能的無限擴展
並行技術採用的是模組化體系結構,擴展引擎可以按需配置或擴展。用戶可以在備份存儲系統建設初期只購買並行控制器的主引擎單元,實現一般的VTL備份存儲功能。當業務系統規模擴大,備份性能要求提高,再通過增加必要的擴展引擎,來實現所需的備份性能。
3、設備利舊實現高性能
很多用戶都有一些過時或淘汰的磁碟陣列,希望能夠連線到VTL設備上使用。這種情況下,建議每台擴展引擎連線一台獨立的存儲盤陣,即使每台後端存儲盤陣的性能有限,也能使VTL的總體性能達到較高水平。
4多備份系統分享高性能
在大型套用環境下,用戶往往擁有多套數據備份系統或需要使用磁帶庫作為存儲設備的其它套用系統,如:數據遷移系統。採用並行技術可以同時模擬多台磁帶庫。這時,可以使多台主引擎分別協調不同的虛擬帶庫,或者集中在一台主引擎上協調控制所有的虛擬帶庫。可根據實際套用環境來靈活配置並行控制器的使用方式。

VTL廠商

VTL軟體廠商
SureSave:眾志和達自有產品
FalconStorEMCIBM、SUN、同有、浪潮等多家OEM
Sepaton:自有產品、HP OEM
Alacritus:已被NetApp收購
Diligent:HDS OEM,Overland OEM、SUN OEM
NearTek:EMC開始收購Neartek公司的VTL資產。
VTL硬體廠商:
國際:EMC 、NetApp、HP、IBM 、Quantum、Sepaton、SUN、StorgeTek、Spectra Logic、Mirage、Maxxan、Copan Systems。
國內:同有、眾志合達、浪潮等

VTL軟體基本技術指標

Falcon
Sepaton
SureSave
Diligent
體系結構
軟體虛擬磁帶庫。PC SERVER+Linux+Falcon VTL。
軟體虛擬磁帶庫。PC SERVER+作業系統+ sepaton VTL。
軟體虛擬磁帶庫。PC SERVER+作業系統+SureSave VTL。
軟體虛擬磁帶庫。PC SERVER+Linux+Falcon VTL。
由PC SERVER提供,可支持ISCSIFC接口
支持 FC光纖主機通道;
支持 FC光纖主機通道;
支持 FC光纖主機通道;
性能
主要看PC SERVER性能和接口
主要看PC SERVER性能和接口
主要看PC SERVER性能和接口
主要看PC SERVER性能和接口
可以虛擬的磁帶驅動器類型
LTO-1,LTO-2,LTO-3,DLT7000,DLT8000,SDLT1,SDLT320,AIT-2,AIT-3,3590,9840,9940,SAIT;
HP Ultrium 230 (LTO1),HP Ultrium 460 (LTO2),HP Ultrium 960 (LTO3),DLT 7000, DLT 8000, SDLT 320.
LTO-1,LTO-2,LTO-3,DLT7000,DLT8000,SDLT1,SDLT320,AIT-2,AIT-3,3590,9840,9940,SAIT;
DLT7000,P3000 ATL
可以虛擬的物理磁帶庫類型
ADIC Scalar100/1000/i2000, HP ESL9000,IBM 3584/3583/3590,Qualstar TLS4222,SONY CSM200,Quantum 1000/3000/4000/7000/7100STK L20/40/80/180/700,STK 9710/9714/9730;
ADIC Scalar 24/1000/10K;HP ESL; STK L180/700;Quantum/ATL P1000/3000/4000/7000;
ADIC Scalar100/1000/i2000, HP ESL9000,IBM 3584/3583/3590,Qualstar TLS4222,SONY CSM200,Quantum 1000/3000/4000/7000/7100STK L20/40/80/180/700,STK 9710/9714/9730;
ADIC Scalar 24/1000/10K;HP ESL; STK L180/700;Quantum/ATL P1000/3000/4000/7000;
可支持的備份軟體
Veritas NetBackup;Veritas BackupExec;CA BrightStor Enterprice Backup;Legato Networker;IBM TSM;HP DP;BakBone Netvault;Commvault
VERITAS NetBackup, VERITAS Backup Exec, Legato Networker, CommVault Galaxy, IBM Tivoli, and others.
Veritas NetBackup;Veritas BackupExec;CA BrightStor Enterprice Backup;Legato Networker;IBM TSM;HP DP;BakBone Netvault;Commvault
Legato Networker、CommVault GalaxyAtempo Time Navigator、Symantec VERITAS NetBackup、HP Data Protector、CA Brightstor ARCServe、Tivoli Storage Manager
是否可以連線物理磁帶庫實現磁帶的導入導出功能
可以;Falcon VTL產品支持連線物理磁帶庫實現磁帶的導入導出功能,同時可以提供制定策略來控制虛擬磁帶到物理磁帶的自動導出功能,通過此功能可以完全將虛擬磁帶庫作為物理磁帶庫的Cache來使用;
不可以
可以;SureSave產品支持連線物理磁帶庫實現磁帶的導入導出功能,同時可以提供制定策略來控制虛擬磁帶到物理磁帶的自動導出功能,通過此功能可以完全將虛擬磁帶庫作為物理磁帶庫的Cache來使用;
未知
虛擬磁帶庫管理方式
支持JAVA GUI管理方式,
基於JAVA的GUI管理方式
支持JAVA GUI管理方式,
未知
是否具備類似物理磁帶庫數據壓縮功能
可在PC SERVER內添加硬體壓縮卡,支持硬體壓縮。
壓縮功能 50:1
壓縮功能 50:1
2:0.1
支持
支持
支持
支持
硬碟冗餘技術
控制器容量單元一體或由後端陣列提供
由後端磁碟陣列提供
控制器容量單元一體或由後端陣列提供
由後端磁碟陣列提供

分散式VTL

分散式VTL原理

由於非結構化數據增長率過高,而dedupe對於非結構化數據的重刪能力捉襟見肘,使得大量非結構化數據在備份時候出現備份視窗過長的問題,當天備份任務沒有執行完,第二天的備份任務又開始了。如何提高備份性能是當務之急。並行控制可以有效解決備份I/O速率,但隨著發展漸漸發現瓶頸變成了設備內部,簡單理解就是吃的太快消化速度跟不上了。如何讓內部性能得大幅提升,帶著這個問題,我們看到了分散式這個熱點辭彙。
前端採用並行控制器,而對後端存儲來說,每一個VTL控制器變成了分散式的客戶端節點,我們可以將分散式VTL簡單的理解為分散式系統的一種套用方式,但實際上其中涉及的各種最佳化內容相當龐大。右圖我們可以看到分散式VTL內部架構圖。目前中間通過萬兆連線,後期甚至於可以採用infiniband進行連線,內部速率將得到更大提升。
VTL
而說到速率方面我們可以看到,與傳統並行相比,控制器並行提升性能,而後端盤陣擴展僅僅是提供容量的提升;在分散式中,控制器並行擴展依然提升性能,而與此同時如果擴展後端容量節點,則性能也會隨著大幅提升。

雲的數據安全問題

如果說過去幾年數據安全領域裡面聊海量數據,有點為了吹噓自己找點冠冕堂皇的接口之意,那么今天再拋出這個話題時候則需要絕對正視。常規我們的業務數據依舊在不斷的增加著;而雲套用的今天數位電視、3G上網、GPS定位、統一監控等等各種各樣新鮮的商用、民用業務誕生,每一個用戶一個簡單的操作可能就會生成幾KB大小的數據。而過去面對這些我們可以將其作為垃圾回收,但今天我們需要通過分析得到裡面潛在的商業價值。所以在雲時代的今天我們保護的數據不僅僅是日常業務數據更多的是以前被認為是垃圾的海量非結構化話數據。而隨著物聯網發展以及大數據挖掘帶來的巨大商業價值,讓越來越多的人類行為習慣被捕獲變為數據化,這就加速了非結構化話數據的產生。面對爆炸增長的數據,對現有數據保護技術提出新的挑戰。

分散式VTL對雲的保護

全方位最佳化機制——在採用並行與分散式技術的基礎上,進一步系統最佳化,從內部I/O機制、寫入檔案、數據塊大小等方面提升系統性能,通過對分散式故障切換調優、多副本模式建立提升數據可靠性。
負載均衡——通過並行控制器實現了前端I/O的負載均衡,系統內部通過分散式架構再次將每個控制器的I/O進行負載均衡,這種雙模式負載均衡,徹底打破了原有單個節點性能瓶頸,實現了任意節點對數據I/O動態的均衡處理。
並行通道技術——通過對內部I/O匯流排的最佳化,保證每個控制器中的驅動器都會有獨立的一組執行緒專門對其進行處理,對比傳統動態調度執行緒處理,專用執行緒處理性能明顯提升。在此基礎上,每個磁帶驅動器對應自己專用快取空間,極大地加速了I/O讀寫效率。從前端看,每個備份任務都將有專用通道直接對應到後端位置,這種獨立通道技術,極大加速系統的I/O處理性能。
硬體級壓縮技術——通過硬體壓縮卡,可以在不占用控制器資源的情況下,完成數據的線上縮減。不僅提高了磁碟可用空間,更能大幅降低內部I/O量,以及磁碟讀寫次數,進而提升了內部的I/O性能。
動態故障切換——通過對分散式架構最佳化,當任意節點故障時,將自動斷開故障節點,尚未寫入的數據會被轉發到其他節點,保證了前端任務的不中斷運行,為海量數據備份提供了高可靠的環境。
多副本保存模式——區別於傳統意義的複製原理,而是在數據I/O下發時採用多副本保存,該機制使得同一數據的幾份副本不會落在同一個物理節點上,保證了寫入數據的絕對高可靠,任意多個節點故障甚至不可修復的完全損毀也可以正常恢復重要數據。同時也能依據數據重要性進行個性化調整,包括是否需要多副本、副本數量、多種模式共存等選項。
高可靠的保障——採用並行技術保證了當任意控制器出現故障時,不影響整體備份任務;而分散式架構保證了任意容量單元故障任務可以不中斷運行;多副本模式保證了任意節點完全損毀依然可以找回重要數據;多種RAID模式可以依據客戶對磁碟可靠性的需求進行保護;同時全冗餘架構保證了基礎硬體設備的高可靠,全方位保障了數據備份的高可靠性。

主要作用

越來越多的企業開始部署虛擬磁帶庫(VTL),將其作為主要的備份目標和恢復來源。對於前端的備份伺服器或套用伺服器來說,VTL和磁帶設備是完全一樣的,前端完全不會知道後端的"磁帶",實際上是VTL系統以磁碟仿真出來的空間,因此能相當程度地替代磁帶的作用。

相關詞條

熱門詞條

聯絡我們