數據恢復

數據恢復

存儲介質出現損傷或由於人員誤操作、作業系統本身故障所造成的數據看不見、無法讀取、丟失。工程師通過特殊的手段讀取卻在正常狀態下不可見、不可讀、無法讀的數據。

數據恢復(Data recovery)是指通過技術手段,將保存在台式機硬碟、筆記本硬碟伺服器硬碟存儲磁帶庫移動硬碟、隨身碟、數碼存儲卡、Mp3等等設備上丟失的電子數據進行搶救和恢復的技術。

基本介紹

  • 中文名:數據恢復
  • 外文名:Data recovery
  • 存儲介質台式機硬碟、筆記本硬碟
  • 定義:搶救和恢復丟失的電子數據的技術
  • 全稱:電子數據恢復
原理,方法,分區,檔案分配表,刪除,格式化,覆蓋,防止數據丟失,數據恢複種類,數據恢複方法,硬碟數據恢復,硬碟物理故障,隨身碟數據恢復,Unix數據恢復,知識擴展,數據恢復軟體,數據恢復技巧,數據恢復技能,RAID 介紹,RAID級別,RAID 0,RAID 1,RAID 0+1,RAID 3,RAID 5,RAID 6,RAID 7,NAS的概念,NAS的特點,

原理

數據存儲及恢復的基本原理
現實中很多人不知道刪除、格式化等硬碟操作丟失的數據可以恢復,以為刪除、格式化以後數據就不存在了。事實上,上述簡單操作後數據仍然存在於硬碟中,懂得數據恢復原理知識的人只需幾下便可將消失的數據找回來,不要覺得不可思議,在了解數據在硬碟、優盤、軟碟等介質上的存儲原理後,你也可以親自做一回魔術師
硬碟內部圖硬碟內部圖

方法

分區

硬碟存放數據的基本單位為扇區,我們可以理解為一本書的一頁。當我們裝機或買來一個移動硬碟,第一步便是為了方便管理--分區。無論用何種分區工具,都會在硬碟的第一個扇區標註上硬碟的分區數量、每個分區的大小,起始位置等信息,術語稱為主引導記錄(MBR),也有人稱為分區信息表。當主引導記錄因為各種原因(硬碟壞道、病毒、誤操作等)被破壞後,一些或全部分區自然就會丟失不見了,根據數據信息特徵,我們可以重新推算計算分區大小及位置,手工標註到分區信息表,“丟失”的分區回來了。

檔案分配表

為了管理檔案存儲,硬碟分區完畢後,接下來的工作是格式化分區。格式化程式根據分區大小,合理的將分區劃分為目錄檔案分配區和數據區,就像我們看得小說,前幾頁為章節目錄,後面才是真正的內容。檔案分配表內記錄著每一個檔案的屬性、大小、在數據區的位置。我們對所有檔案的操作,都是根據檔案分配表來進行的。檔案分配表遭到破壞以後,系統無法定位到檔案,雖然每個檔案的真實內容還存放在數據區,系統仍然會認為檔案已經不存在。我們的數據丟失了,就像一本小說的目錄被撕掉一樣。要想直接去想要的章節,已經不可能了,要想得到想要的內容(恢複數據),只能憑記憶知道具體內容的大約頁數,或每頁(扇區)尋找你要的內容。我們的數據還可以恢復回來。

刪除

我們向硬碟里存放檔案時,系統首先會在檔案分配表內寫上檔案名稱稱、大小,並根據數據區的空閒空間在檔案分配表上繼續寫上檔案內容在數據區的起始位置。然後開始向數據區寫上檔案的真實內容,一個檔案存放操作才算完畢。
刪除操作卻簡單的很,當我們需要刪除一個檔案時,系統只是在檔案分配表內在該檔案前面寫一個刪除標誌,表示該檔案已被刪除,他所占用的空間已被“釋放”, 其他檔案可以使用他占用的空間。所以,當我們刪除檔案又想找回他(數據恢復)時,只需用工具將刪除標誌去掉,數據被恢復回來了。當然,前提是沒有新的檔案寫入,該檔案所占用的空間沒有被新內容覆蓋。

格式化

格式化操作和刪除相似,都只操作檔案分配表,不過格式化是將所有檔案都加上刪除標誌,或乾脆將檔案分配表清空,系統將認為硬碟分區上不存在任何內容。格式化操作並沒有對數據區做任何操作,目錄空了,內容還在,藉助數據恢復知識和相應工具,數據仍然能夠被恢復回來。
注意:格式化並不是100%能恢復,有的情況磁碟打不開,需要格式化才能打開。如果數據重要,千萬別嘗試格式化後再恢復,因為格式化本身就是對磁碟寫入的過程,只會破壞殘留的信息。

覆蓋

數據恢復工程師常說:“只要數據沒有被覆蓋,數據就有可能恢復回來”。
因為磁碟的存儲特性,當我們不需要硬碟上的數據時,數據並沒有被拿走。刪除時系統只是在檔案上寫一個刪除標誌,格式化和低級格式化也是在磁碟上重新覆蓋寫一遍以數字0為內容的數據,這就是覆蓋。
一個檔案被標記上刪除標誌後,他所占用的空間在有新檔案寫入時,將有可能被新檔案占用覆蓋寫上新內容。這時刪除的檔案名稱雖然還在,但他指向數據區的空間內容已經被覆蓋改變,恢復出來的將是錯誤異常內容。同樣檔案分配表內有刪除標記的檔案信息所占用的空間也有可能被新檔案名稱檔案信息占用覆蓋,檔案名稱也將不存在了。
當將一個分區格式化後,有拷貝上新內容,新數據只是覆蓋掉分區前部分空間,去掉新內容占用的空間,該分區剩餘空間數據區上無序內容仍然有可能被重新組織,將數據恢復出來。
同理,克隆、一鍵恢復、系統還原等造成的數據丟失,只要新數據占用空間小於破壞前空間容量,數據恢復工程師就有可能恢復你要的分區和數據。

防止數據丟失

關於防止數據丟失的3個方法:
1. 永遠不要將你的檔案數據保存在作業系統的同一驅動盤上
我們知道大部分文字處理器會將你創建的檔案保存在“我的文檔”中,然而這恰恰是最不適合保存檔案的地方。對於影響作業系統的大部分電腦問題(不管是因為病毒問題還是軟體故障問題),通常唯一的解決方法就是重新格式化驅動盤或者重新安裝作業系統,如果是這樣的話,驅動盤上都所有東西都會數據丟失。
另外一個成本相對較低的解決方法就是在你的電腦上安裝第二個硬碟,當作業系統被破壞時,第二個硬碟驅動器不會受到任何影響,如果你還需要購買一台新電腦時,這個硬碟還可以被安裝在新電腦上,而且這種硬碟安裝非常簡便。
如果你對安裝第二個驅動盤的方法不很認可,另一個很好的選擇就是購買一個外接式硬碟,外接式硬碟操作更加簡便,可以在任何時候用於任何電腦,而只需要將它插入USB連線埠或者firewire連線埠。
2. 定期備份你的檔案數據,不管它們被存儲在什麼位置
將你的檔案全部保存在作業系統是不夠的,應該將檔案保存在不同的位置,並且你需要創建檔案的定期備份,這樣我們就能保障檔案的安全性,不管你的備份是否會失敗:光碟可能被損壞,硬碟可能遭破壞,軟碟被清除等原因。如果你想要確保能夠隨時取出檔案,那么可以考慮進行二次備份,如果數據非常重要的話,你甚至可以考慮在防火層保存重要的檔案。
3. 提防用戶錯誤
雖然我們不願意承認,但是很多時候是因為我們自己的問題而導致數據丟失。可以考慮利用文字處理器中的保障措施,例如版本特徵功能和跟蹤變化。用戶數據丟失的最常見的情況就是當他們在編輯檔案的時候,意外地刪除掉某些部分,那么在檔案保存後,被刪除的部分就丟失了,除非你啟用了保存檔案變化的功能。
如果你覺得那些功能很麻煩,那么我建議你在開始編輯檔案之前將檔案另外儲存為不同名稱的檔案,這個辦法不像其他辦法一樣組織化,不過這確實是一個好辦法,也能夠解決數據丟失的問題。

數據恢複種類

邏輯故障數據恢復
邏輯故障是指與檔案系統有關的故障。硬碟數據的寫入和讀取,都是通過檔案系統來實現的。如果磁碟檔案系統損壞,那么計算機就無法找到硬碟上的檔案和數據。邏輯故障造成的數據丟失,大部分情況是可以通過數據恢復軟體找回的。
硬體故障數據恢復
硬體故障占所有數據意外故障一半以上,常有雷擊、高壓、高溫等造成的電路故障,高溫、振動碰撞等造成的機械故障,高溫、振動碰撞、存儲介質老化造成的物理壞磁軌扇區故障,當然還有意外丟失損壞的固件BIOS信息等。
硬體故障的數據恢復當然是先診斷,對症下藥,先修復相應的硬體故障,然後根據修復其他軟故障,最終將數據成功恢復。
電路故障需要我們有電路基礎,需要更加深入了解硬碟詳細工作原理流程。機械磁頭故障需要100級以上的工作檯或工作間來進行診斷修復工作。另外還需要一些軟硬體維修工具配合來修復固件區等故障類型。
磁碟陣列RAID數據恢復
磁碟陣列的存儲原理這裡不作講解,可參看本站陣列知識文章,其恢復過程也是先排除硬體及軟故障,然後分析陣列順序、塊大小等參數,用陣列卡或陣列軟體重組或者是使用DiskGenius虛擬重組RAID,重組後便可按常規方法恢複數據。

數據恢複方法

硬碟數據恢復

硬碟軟故障:系統故障:系統不能正常啟動、密碼或許可權丟失、分區表丟失、BOOT區丟失、MBR丟失; 檔案丟失:誤操作、誤格式化、誤克隆、誤刪除、誤分區、病毒破壞、黑客攻擊、PQ操作失敗、RAID磁碟陣列失效等; 檔案損壞:損壞的Office系列Word、Excel、Access、PowerPoint檔案Microsoft SQL資料庫復、Oracle資料庫檔案修復、Foxbase/foxpro的dbf資料庫檔案修復;損壞的郵件Outlook Express dbx檔案,Outlook pst檔案的修復;損壞的MPEG、asf、RM等媒體檔案的修復。

硬碟物理故障

CMOS不認盤; 常有一種“咔嚓咔嚓”的磁頭撞擊聲; 電機不轉,通電後無任何聲音; 磁頭錯位造成讀寫數據錯誤; 啟動困難、經常當機、格式化失敗、讀寫困難; 自檢正常,但“磁碟管理”中無法找到該硬碟; 電路板有明顯的燒痕等。 磁碟物理故障分類: 盤體故障:磁頭燒壞、磁頭老化、磁頭晶片損壞、電機損壞、磁頭偏移、零磁軌壞、大量壞扇、碟片劃傷、磁組變形; 電路板故障:電路板損壞、晶片燒壞、斷針斷線。 固件信息丟失、固件損壞等。

隨身碟數據恢復

隨身碟,優盤,XD卡,SD卡,CF卡,MEMORY STICK,,SM卡,MMC卡,MP3,MP4,記憶棒,數位相機,DV,微硬碟光碟,軟碟等各類存儲設備。硬碟,移動盤,閃盤,SD卡、CF卡等數據介質損壞或出現電路板故障、磁頭偏移、碟片劃傷等情況 下,採用開體更換,載入,定位等方法進行數據修復
數位相機記憶體卡,如,SD卡,CF卡,記憶棒等,隨身碟,甚至最新的SSD固態硬碟。由於沒有盤體,沒有碟片,存儲的數據是FLASH晶片。如果出現硬體故障,只有極少數數據恢復公司可以恢復此類介質,這是由於一般的數據恢復公司做此類介質時,需要匹配對應的主控晶片,而主控晶片在買來備件後需要拆開後才能知道,備件一拆,立馬毀了,如果主控晶片不能配對,數據仍然無法恢復。即使碰巧配上主控型號,也不代表一定可以讀出數據,因此恢復的成本和代價非常之高。一般的數據恢復公司碰上此類介質,成功率非常低,基本上放棄,這種恢復技術和原理是大多數數據恢復的做法。但是,對於恢復FLASH類的介質,已經新出一種數據恢復技術,可以不需要配對主控晶片,通過一種特殊的硬體設備,直接讀取FLASH晶片里的代碼,然後配上特殊的算法和軟體,通過人工組合,直接重組出FLASH數據。這種恢複方法和原理,成功率幾乎接近100%。但是受制於此類設備的昂貴,同時對數據恢復技術要求很高,工程師不但要精通硬體,還需要軟體,更要精通檔案系統,因此全國只有極個別的數據恢復公司可以做到成功率接近100%,有些公司花了很高代價採購此設備後,由於工程師技術所限,不會使用,同樣無法恢復。雖然從技術上解決了FLASH恢復的難題,但是對客戶而言,此類恢復的成本非常之高,比硬碟的硬體故障恢復價格要高。2G左右的恢復費接近千元,32G,64G容量的恢復費用基本上在3000-5000。

Unix數據恢復

基於Solaris SPARC 平台的數據恢復,基於INTEL 平台的Solaris 數據恢復,可恢復SCO OPERNSERVER數據,HP-UNIX的數據恢復,IBM-AIX的數據恢復
Linux數據恢復Linux作業系統中的數據備份工作是Linux系統管理員的重要工作和職責。傳統的Linux伺服器數據備份的方法很多,備份的手段也多種多樣。常見的Linux數據恢復備份方式僅僅是把數據通過TAR命令壓縮拷貝到磁碟的其它區域中去。還有比較保險的做法是雙機自動備份,不把所有數據存放在一台計算機上,否則一旦這台計算機的硬碟物理性損壞,那么一切數據將不復存在了。所以雙機備份是商業伺服器數據安全的基本要求。

知識擴展

數據恢復軟體

效率源DATACOMPASS、salvtiondata、PC-3000、Final Data、 Easy Recovery、easy undelete、PTDD、WinHex、R-STUDIO、DiskGenius、RAID Reconstructor、AneData安易硬碟數據恢復軟體、D-Recovery達思數據恢復軟體、易我數據恢復嚮導等。
Easyrecovery是一個非常著名的老牌數據恢復軟體。該軟體功能可以說是非常強大。無論是誤刪除/格式化還是重新分區後的數據丟失,其都可以輕鬆解決,其甚至可以不依靠分區表來按照簇來進行硬碟掃描。但要注意不通過分區表來進行數據掃描,很可能不能完全恢複數據,原因是通常一個大檔案被存儲在很多不同的區域的簇內,即使我們找到了這個檔案的一些簇上的數據,很可能恢復之後的檔案是損壞的。所以這種方法並不是萬能的,但其提供給我們一個新的數據恢複方法,適合分區表嚴重損壞使用其他恢復軟體不能恢復的情況下使用。Easyrecovery最新版本加入了一整套檢測功能,包括驅動器測試、分區測試、磁碟空間管理以及製作安全啟動盤等。這些功能對於日常維護硬碟數據來說,非常實用,我們可以通過驅動器和分區檢測來發現檔案關聯錯誤以及硬碟上的壞道
R-Studio是功能超強的數據恢復、反刪除工具,採用全新恢復技術,為使用 FAT12/16/32、NTFS、NTFS5(Windows 2000系統)和 Ext2FS(Linux系統)分區的磁碟提供完整數據維護解決方案!同時提供對本地和網路磁碟的支持,此外大量參數設定讓高級用戶獲得最佳恢復效果。具體功能有:採用 Windows資源管理器操作界面;通過網路恢復遠程數據(遠程計算機可運行Win95/98/ME/NT/2000/XP、Linux、UNIX 系統);支持 FAT12/16/32、NTFS、NTFS5 和 Ext2FS檔案系統;能夠重建損毀的RAID陣列;為磁碟、分區、目錄生成鏡像檔案恢復刪除分區上的檔案、加密檔案(NTFS 5)、數據流(NTFS、NTFS 5);恢復FDISK或其它磁碟工具刪除過得數據、病毒破壞的數據、MBR 破壞後的數據;識別特定檔案名稱;把數據保存到任何磁碟;瀏覽、編輯檔案或磁碟內容等等。
頂尖數據恢復軟體能夠恢復硬碟、移動硬碟、隨身碟、TF卡、數位相機上的數據,軟體採用多執行緒引擎,掃描速度極快,能掃描出磁碟底層的數據,經過高級的分析算法,能把丟失的目錄和檔案在記憶體中重建出來。同時,本軟體不會向硬碟內寫入數據,所有操作均在記憶體中完成,能有效地避免對數據的二次破壞。
安易硬碟數據恢復軟體是一款檔案恢復軟體,能夠恢復經過資源回收筒刪除掉的檔案、被Shift+Delete鍵直接刪除的檔案和目錄、快速格式化/完全格式化的分區、分區表損壞、盤符無法正常打開的RAW分區數據、在磁碟管理中刪除掉的分區、被重新分區過的硬碟數據、一鍵Ghost對硬碟進行分區、被第三方軟體做分區轉換時丟失的檔案、把整個硬碟誤Ghost成一個盤等。本恢復軟體用唯讀的模式來掃描檔案數據信息,在記憶體中組建出原來的目錄檔案名稱結構,不會破壞源盤內容。支持常見的NTFS分區、FAT/FAT32分區、exFAT分區的檔案恢復,支持普通本地硬碟、USB移動硬碟恢復、SD卡恢復、隨身碟恢復、數位相機和手機記憶體卡恢復等。採用嚮導式的操作界面,很容易就上手,普通用戶也能做到專業級的數據恢復效果。

數據恢復技巧

1.不必完全掃描
如果你僅想找到不小心誤刪除的檔案,無論使用哪種數據恢復軟體,也不管它是否具有類似EasyRecovery快速掃描的方式,其實都沒必要對刪除檔案硬碟分區進行完全的簇掃描。因為檔案被刪除時,作業系統僅在目錄結構中給該檔案標上刪除標識,任何數據恢復軟體都會在掃描前先讀取目錄結構信息,並根據其中的刪除標誌順利找到剛被刪除的檔案。所以,你完全可在數據恢復軟體讀完分區的目錄結構信息後就手動中斷簇掃描的過程,軟體一樣會把被刪除檔案的信息正確列出,如此可節省大量的掃描時間,快速找到被誤刪除的檔案數據。
2.儘可能採取NTFS格式分區
NTFS分區的MFT以檔案形式存儲在硬碟上,這也是EasyRecovery和Recover4all即使使用完全掃描方式對NTFS分區掃描也那么快速的原因——實際上它們在讀取NTFS的MFT後並沒有真正進行簇掃描,只是根據MFT信息列出了分區上的檔案信息,非常取巧,從而在NTFS分區的掃描速度上壓倒了老老實實逐個簇掃描的其他軟體。不過對於NTFS分區的檔案恢復成功率各款軟體幾乎是一樣的,事實證明這種取巧的辦法確實有效,也證明了NTFS分區系統的檔案安全性確實比FAT分區要高得多,這也就是NTFS分區數據恢復在各項測試成績中最好的原因,只要能讀取到MFT信息,就幾乎能100%恢復檔案數據。
3.巧妙設定掃描的簇範圍
設定掃描簇的範圍是一個有效加快掃描速度的方法。像EasyRecovery的高級自定義掃描方式、FinalData和File Recovery的默認掃描方式都可以讓你設定掃描的簇範圍以縮短掃描時間。當然要判斷目的檔案在硬碟上的位置需要一些技巧,這裡提供一個簡單的方法,使用作業系統自帶的硬碟碎片整理程式中的碎片分析程式(千萬小心不要碎片整理啊,只是用它的碎片分析功能),在分區分析完後程式會將硬碟的未使用空間用圖形方式清楚地表示出來,那么根據圖形的比例估計這些未使用空間的大致簇範圍,搜尋時設定只搜尋這些空白的簇範圍就好了,對於大的分區,這確實能節省不少掃描時間。
4.使用檔案格式過濾器
以前沒用過數據恢復軟體的朋友在第一次使用時可能會被軟體的能力嚇一跳,你的目的可能只是要找幾個誤刪的檔案,可軟體卻列出了成百上千個以前刪除了的檔案,要找到自己真正需要的檔案確實十分麻煩。這裡就要使用EasyRecovery獨有的檔案格式過濾器功能了,在掃描時在過濾器上填好要找檔案的擴展名,如“*.doc”,那么軟體就只會顯示找到的DOC檔案了;如果只是要找一個檔案,你甚至只需要在過濾器上填好檔案名稱和擴展名(如important.doc),軟體自然會找到你需要的這個檔案,很是快捷方便。

數據恢復技能

數據恢復是一個技術含量比較高的行業,數據恢復技術人員需要具備彙編語言和軟體套用的技能,還需要電子維修和機械維修以及硬碟技術。
第一:軟體套用和彙編語言基礎
在數據恢復的案例中,軟體級的問題占了三分之二以上的比例,比如檔案丟失、分區表丟失或破壞、資料庫破壞等,這些就需要具備對DOS、Windows、Linux以及Mac的作業系統以及數據結構的熟練掌握,需要對一些數據恢復工具和反彙編工具的熟練套用。
第二:電子電路維修技能
在硬碟的故障中,電路的故障占據了大約一成的比例,最多的就是電阻燒毀和晶片燒毀,作為一個技術人員,必須具備電子電路知識已經熟練的焊接技術。
第三:機械維修技能
隨著硬碟容量的增加,硬碟的結構也越來越複雜,磁頭故障和電機故障也變的比較常見,開盤技術已經成為一個數據恢復工程師必須具備的技能。
第四:硬碟固件級維修技術
硬碟固件損壞也是造成數據丟失的一個重要原因,固件維修不當造成數據破壞的風險相對比較高,而固件級維修則需要比較專業的技能和豐富的經驗。

RAID 介紹

如何增加磁碟的存取速度,如何防止數據因磁碟的故障而丟失及如何有效的利用磁碟空間,一直是電腦專業人員和用戶的困擾,而大容量磁碟的價格非常昂貴,對用戶形成很大的負擔。磁碟陣列技術的產生一舉解決了這些問題。
過去十幾年來,CPU的處理速度增加了五十多倍,記憶體的存取速度也大幅增加,而數據儲存裝置--主要是磁碟--的存取速度只增加了三、四倍,形成電腦系統的瓶頸,拉低了電腦系統的整體性能,若不能有效的提升磁碟的存取速度,CPU、記憶體及磁碟間的不平衡將使CPU及記憶體的改進形成浪費。
磁碟陣列中針對不同的套用使用的不同技術,稱為RAID 等級。RAID是Redundant Array of Independent Disks的縮寫,而每一等級代表一種技術。目前業界最經常套用的RAID等級是RAID 0~RAID 5。這個等級並不代表技術的高低,RAID 5並不高於RAID 3。至於要選擇那一種RAID 等級的產品,純視用戶的操作環境及套用而定,與等級的高低沒有必然的關係。

RAID級別

下面將簡單描述一些常用的RAID等級,澄清一些套用的問題:

RAID 0

(Striped Disk Array without Fault Tolerance)
RAID 0是把所有的硬碟並聯起來成為一個大的硬碟組。其容量為所有屬於這個組的硬碟的總和。所有數據的存取均以並行分割方式進行。由於所有存取的數據均以平衡方式存取到整組硬碟里,存取的速度非常快。越是多硬碟數量的RAID 0陣列其存取的速度就越快。容量效率方面也是所有RAID格式中最高的,達到100%。但RAID 0有一個致命的缺點–就是它跟普通硬碟一樣沒有一點的冗餘能力。一旦有一個硬碟失效時,所有的數據將盡失。沒法重組回來!一般來講,RAID 0隻用於一些已有原數據載體的多媒體檔案的高速讀取環境。如視頻點播系統的數據共享部分等。RAID 0隻需要兩個或以上的硬碟便能組成。

RAID 1

(Mirroring)
RAID 1是硬碟鏡像備份操作。由兩個硬碟所組成。其中一個是主硬碟而另外一個是鏡像硬碟。主硬碟的 數據會不停的被鏡像到另外一個鏡像硬碟上。由於所有主硬碟的數據會不停地鏡像到另外一個硬碟上, 故RAID 1具有很高的冗餘能力。達到最高的100%。可是正由於這個鏡像做法不是以算法操作,故它的容量效率非常的低,只有50%。RAID 1隻支持兩個硬碟操作。容量非常有限,故一般只用於作業系統中。

RAID 0+1

(Mirroring and Striping)
RAID 0+1即由兩組RAID 0的硬碟作RAID 1的鏡像容錯。雖然RAID 0+1具備有RAID 1的容錯能力和RAID 0的容量性能。但RAID 0+1的容量效率還是與RAID 1一樣只有50%,故同樣地沒有被普及使用。

RAID 3

(Striping with dedicated parity)
RAID 3在安全方面以奇偶校驗(parity check)做錯誤校正及檢測,只需要一個額外的校檢磁碟(parity disk)。奇偶校驗值的計算是以各個磁碟的相對應位作XOR的邏輯運算,然後將結果寫入奇偶校驗磁碟, 任何數據的修改都要做奇偶校驗計算。如某一磁碟故障,換上新的磁碟後,整個磁碟陣列(包括奇偶校驗 磁碟)需重新計算一次,將故障磁碟的數據恢復並寫入新磁碟中,如奇偶校驗磁碟故障,則重新計算奇偶 校驗值,以達容錯的要求。

RAID 5

(Striping with distributed parity)
RAID 5也是一種具容錯能力的RAID 操作方式,但與RAID 3不一樣的是RAID 5的容錯方式不套用專用容錯硬碟,容錯信息是平均的分布到所有硬碟上。當陣列中有一個硬碟失效,磁碟陣列可以從其他的幾個硬碟的對應數據中算出已掉失的數據。由於我們需要保證失去的信息可以從另外的幾個硬碟中算出來,我們就需要在一定容量的基礎上多用一個硬碟以保證其他的成員硬碟可以無誤地重組失去的數據。其總容量為(N-1)x最低容量硬碟的容量。從容量效率來講,RAID 5同樣地消耗了一個硬碟的容量,當有一個硬碟失效時,失效硬碟的數據可以從其他硬碟的容錯信息中重建出來,但如果有兩個硬碟同時失效的話,所有數據將盡失。

RAID 6

與RAID 5相比,RAID 6增加了第二個獨立的奇偶校驗信息塊。兩個獨立的奇偶系統使用不同的算法,數據的可靠性非常高,即使兩塊磁碟同時失效也不會影響數據的使用。但RAID 6需要分配給奇偶校驗信息更大的磁碟空間,相對於RAID 5有更大的“寫損失”,因此“寫性能”非常差。較差的性能和複雜的實施方式使得RAID 6很少得到實際套用。
常見的RAID6組建類型 RAID 6(6D + 2P)
1 RAID 6(6D + 2P)原理
和RAID 5相似,RAID 6(6D + 2P)根據條帶化的數據生成校驗信息,條帶化數據和校驗數據一起分散存儲到RAID組的各個磁碟上。在圖1中,D0,D1,D2,D3,D4和D5是條帶化的數據,P代表校驗數據,Q是第二份校驗數據。
RAID 6校驗數據生成公式(P和Q):
P的生成用了異或
P = D0 XOR D1 XOR D2 XOR D3 XOR D4 XOR D5
Q的生成用了係數和異或
Q = A0*D0 XOR A1*D1 XOR A2*D2 XOR A3*D3 XOR A4*D4 XOR A5*D5
D0~D5:條帶化數據
A0~A5:係數
XOR:異或
*:乘
在RAID 6中,當有1塊磁碟出故障的時候,利用公式1恢複數據,這個過程是和RAID 5一樣的。而當有2塊磁碟同時出故障的時候,就需要同時用公式1和公式2來恢複數據了。
各係數A0~A5是線性無關的係數,在D0,D1,D2,D3,D4,D5,P,Q中有兩個未知數的情況下,也可以聯列求解兩個方程得出兩個未知數的值。這樣在一個RAID組中有兩塊磁碟同時壞的情況下,也可以恢複數據。
上面描述的是校驗數據生成的算法。其實RAID 6的核心就是有兩份檢驗數據,以保證兩塊磁碟同時出故障的時候,也能保障數據的安全。

RAID 7

這是一種新的RAID標準,其自身帶有智慧型化實時作業系統和用於存儲管理的軟體工具,可完全獨立於主機運行,不占用主機CPU資源。RAID 7可以看作是一種存儲計算機(Storage Computer),它與其他RAID標準有明顯區別。除了以上的各種標準,我們可以如RAID 0+1那樣結合多種RAID規範來構築所需的RAID陣列,例如RAID 5+3(RAID 53)就是一種套用較為廣泛的陣列形式。用戶一般可以通過靈活配置磁碟陣列來獲得更加符合其要求的磁碟存儲系統

NAS的概念

網路存儲伺服器NAS(Network Attached Storage),是一個專用為提供高性能、低擁有成本和高可靠性的數據保存和傳送產品。NAS設備是為提供一套安全,穩固的檔案和數據保存,容易使用和管理而設計,其定義為特殊的獨立的專用數據存儲伺服器,內嵌系統軟體,可以提供 NFS、SMB/CIFS 檔案共享。NAS是基於IP協定的檔案級數據存儲,支持現有的網路技術,比如乙太網、FDDI等。NAS設備完全以數據為中心,將存儲設備與伺服器徹底分離,集中管理數據,從而有效釋放頻寬,大大提高了網路整體性 能,也可有效降低總擁有成本,保護用戶投資。把檔案存放在同一個伺服器里讓不同的電腦用戶共享和集合網路里不同種類的電腦正是NAS網路存儲的主要功能。正因為NAS網路存儲系統套用開放的,工業標準的協定,不同類型的電腦用戶運行不同的作業系統可以實現對同一個檔案的訪問。所以已經不再在意到底是Windows 用戶或UNIX用戶。他們同樣可以安全地和可靠地使用NAS網路存儲系統中的數據。

NAS的特點

NAS以其流暢的機構設計,具有突出的性能:
·移除伺服器 I/O 瓶頸:
NAS是專門針對檔案級數據存儲套用而設計的,將存儲設備與伺服器完全分離,從而將伺服器端數據 I/O瓶頸徹底消除。伺服器不用再承擔向用戶傳送數據的任務,更專注於網路中的其它套用,也提高了 網路的整體性能。
·簡便實現 NT與UNIX下的檔案共享:
NAS支持標準的網路檔案協定,可以提供完全跨平台檔案混合存儲功能。不同作業系統下的用戶均可將數據存儲一台NAS設備中,從而大大節省存儲空間,減少資源浪費。
·簡便的設備安裝、管理與維護:
NAS設備提供了最簡便快捷的安裝過程,經過簡單的調試就可以流暢套用。一般基於圖形界面的管理系 統可方便進行設備的掌控。同樣,網路管理員不用分別對設備進行管理,集中化的數據存儲與管理, 節省了大量的人力物力。
·按需增容,方便容量規劃:
NAS設備可以提供線上擴容能力,大大方便了網路管理員的容量設計。即使應付無法預見的未來存儲容 量增長,也顯得異常輕鬆自如。而且,這種數據容量擴充的時候,不用停頓整個網路的服務,這將極大的減少因為停機造成的成本浪費。
·高可靠性:
除了剛才我們提到的因為移除伺服器端I/O瓶頸而大大提高數據可用性外,NAS設備還採用多種方式提高數據的可用性、可靠性,比如RAID技術的採用、冗餘部件(電源、風扇等)的採用以及容錯系統的設計等,當然對於不同的設備,可能也會採用其他更高性能的方式或解決方案。
·降低總擁有成本:
NAS有一個最吸引用戶的地方,就是具有極低的總擁有成本.
NAS的主要長處
· 第一,NAS適用於那些需要通過網路將檔案數據傳送到多台客戶機上的用戶。NAS設備在數據必須長距離傳送的環境中可以很好地發揮作用。
· 第二,NAS設備非常易於部署。可以使NAS主機、客戶機和其他設備廣泛分布在整個企業的網路環境中。NAS可以提供可靠的檔案級數據整合,因為檔案鎖定是由設備自身來處理的。
· 第三,NAS套用於高效的檔案共享任務中,例如UNIX中的NFS和Windows NT中的CIFS,其中基於網路的檔案級鎖定提供了高級並發訪問保護的功能。
SAN的概念
SAN(Storage Area Network,存儲區域網),被定義為一個共用的高速專用存儲網路,存儲設備集中在伺服器的後端,因此SAN是專用的高速光纖網路。架構一個真正的SAN,需要接專用的光纖交換機集線器存儲區域網路網路體系結構中一種相對新的概念,也是連結伺服器和獨立於工作網路的線上存儲設備的網路。雖然,網路依然在發展過程中,但最重要的 SAN 技術似乎是用於 SCSI 匯流排連線的光纖通道改進功能。
SAN的優勢
SAN的優勢可以表現在一下幾個方面:
以光纖為接口的存儲網路SAN提供了一個高擴展性、高性能的網路存儲機構。光纖交換機、光纖存儲陣列 同時提供高性能和更大的伺服器擴展空間,這是以SCSI為基礎的系統所缺乏的。同樣,為企業今後的套用提供了一個超強的可擴展性。
·加強存儲管理:
SAN 存儲網路各組成部分的數據不再在乙太網絡上流通從而大大提高乙太網絡的性能。正由於存儲設備與 伺服器完全分離,用戶獲得一個與伺服器分開的存儲管理理念。複製、備份、恢複數據趨向和安全的管理 可以中央的控制和管理手段進行。加上把不同的存儲池 (Storage Pools)以網路方式連線,企業可以以任 何他們需要的方式訪問他們的數據,並獲得更高的數據完整性
·加強備份/還原能力的可用性:
SAN的高可用性是基於它對災難恢復線上備份能力和對冗餘存儲系統和數據的時效切換能力而來。
·同種伺服器的整合:
在一個SAN系統中,伺服器全連線到一個數據網路。全面增加對一個企業共有存儲陣列的連線,高效率和 經濟的存儲分配可以通過聚合的和高磁碟使用率中獲得。
綜合SAN的優勢,它在高性能數據備份/恢復、集中化管理數據及遠程數據保護領域得到廣泛的套用。
SAN與NAS的比較
SAN和NAS是目前最受人矚目的兩種數據存儲方式,對兩種數據方式的爭論也在一直進行著,即使繼續發展其他的數據存儲方式,也或多或少的和這兩種方式存在聯繫。NAS和SAN有一個共同的特點,就是實現了數據的集中存儲與集中管理,但相對於一個存儲池來講,SAN和NAS還是有很大差別的。NAS是獨立的檔案伺服器,存儲作業系統不停留在通用伺服器端,因此可以實現同一存儲池中數據的獨享與共享,而SAN中的數據是基於塊級的傳輸,檔案系統仍在相應的伺服器上,因此對於一個混合的存儲池來講,數據仍是獨立存在的,或者說是伺服器在獨享存儲池中的一部分空間。這兩個存儲方案的最大分別是在於他們的訪問方法。SAN存儲網路系統是以塊(Block)級的方式操作而NAS網路存儲系統是以檔案(File)級的方式表達。這意味著NAS系統對於檔案級的服務有著更高效和快速的性能,而套用數據塊(Block)的資料庫套用和大數據塊(Block)的I/O操作則以SAN為優先。基於SAN和NAS的很大不同,很多人將NAS和SAN絕對的對立起來,就當前的發展觀點來看,這一絕對的對立是不能被市場接受的,相反更多的數據存儲解決方案趨向於將NAS和SAN進行融合,這是因為:
·一些分散式的套用和用戶要求訪問相同的數據
·對提供更高的性能,高可靠性和更低的擁有成本的專有功能系統的高增長要求
·以成熟和習慣的網路標準包括TCP/IP, NFS和CIFS為基礎的操作
·一個獲得以套用為基礎而更具商業競爭力的解決方案欲望
·一個全面降低管理成本和複雜性的需求
·一個不需要增加任何人員的高擴展存儲系統
·一套可以通過重構劃的系統以維持當前擁有的硬體和管理人員的價值
由於在一個位置融合了所有存儲系統,用戶可以從管理效率、使用率和可靠性的全面提高中獲得更大的好處。SAN已經成為一個非常流行的存儲集中方案,因為光纖通道能提供非常龐大的設備連線數量,連線容易和存儲設備與伺服器之間的長距離連線能力。同樣地,這些優點在NAS系統中也能體驗出來。一套會聚SAN和NAS的解決方案全面獲得套用光纖通道的能力,從而讓用戶獲得更大的擴展性,遠程存儲和高性能等優點。同樣這種存儲解決方案全面提供一套在以塊(Block)和檔案(File)I/O為基礎的高效率平衡功能從而全面增強數據的可用性。套用光纖通道的SAN和NAS,整個存儲方案提供對主機的多層面的存儲連線、高性能、高價值、高可用和容易維護等優點,全由一個網路結構提供。
-----------------
RAID是英文Redundant Array of Inexpensive Disks的縮寫,中文簡稱為廉價磁碟冗餘陣列。RAID就是一種由多塊硬碟構成的冗餘陣列。
雖然RAID包含多塊硬碟,但是在作業系統下是作為一個獨立的大型存儲設備出現。利用RAID技術於存儲系統的好處主要有以下三種:
1. 通過把多個磁碟組織在一起作為一個邏輯卷提供磁碟跨越功能
2. 通過把數據分成多個數據塊(block)並行寫入/讀出多個磁碟以提高訪問磁碟的速度
3. 通過鏡像或校驗操作提供容錯能力
最初開發RAID的主要目的是節省成本,當時幾塊小容量硬碟的價格總和要低於大容量的硬碟。目前來看RAID在節省成本方面的作用並不明顯,但是RAID可以充分發揮出多塊硬碟的優勢,實現遠遠超出任何一塊單獨硬碟的速度和吞吐量。除了性能上的提高之外,RAID還可以提供良好的容錯能力,在任何一塊硬碟出現問題的情況下都可以繼續工作,不會受到損壞硬碟的影響。
RAID技術分為幾種不同的等級,分別可以提供不同的速度,安全性和性價比。根據實際情況選擇適當的RAID級別可以滿足用戶對存儲系統可用性、性能和容量的要求。常用的RAID級別有以下幾種:NRAID,JbOD,RAID0,RAID1,RAID0+1,RAID3,RAID5等。經常使用的是RAID5和RAID(0+1)。
總結
這只是讓大家基本了解數據存儲和數據恢復的基本原理,不是給那些數據恢復高手看的。目的是讓大家不再感覺到數據恢復的神秘,懂得一點數據恢復的知識和數據恢復原理,可以最大限度的拯救遭遇意外的數據,避免更大的損失。真正的原理和數據恢復工作要稍微複雜一些。
注意:當數據出現問題時請勿自行操作以免造成數據覆蓋無法恢復,切記!!!
數據恢復案例分析
一、修復重裝XP後的Ubuntu引導分區
前天,我的windows xp崩潰了,於是重裝xp,把原來的Ubuntu引導分區表mbr給衝掉了,不過沒關係,修復一下mbr就可以了。 首先說一下mbr的作用:當我們啟動計算機時。計算機首先運行Power On Self Test(POST),即加電自檢。POST檢測系統的總記憶體以及其他硬體設備的現狀。如果計算機系統的BIOS(基礎輸入/輸出系統)是即插即用的,那么計算機硬體設備將經過檢驗以及完成配置。計算機的基礎輸入/輸出系統(BIOS)定位計算機的引導設備,然後MBR(Master Boot Record-硬碟主導記錄)被載入並運行。如果用戶僅安裝Windows98,則被自動引導到桌面。如果是WindowsXP/2000/2003,那么則會將控制權交給NTLDR-系統載入器,調用Boot.ini,顯示多重選單檔案。抹MBR就是抹硬碟引導記錄
當我們重裝了windows以後,由於硬碟mbr被重寫,即把原來mbr中grub的信息清除了,那么grub自然就不能啟動了,也就不能引導linux了,此時很多人可能就只能重裝linux了,但其實只需簡單的對mbr修復一下就可以了。
下面就說一下修復mbr的方法:
首先,把Ubuntu的安裝光碟放進去,然後啟動.正常進入安裝界面,打開終端:
1、輸入:sudo grub,於是變成
grub>
2、先找到你的ubuntu的啟動分區在哪(就是你的/boot目錄所在的分區)
輸入:find /boot/grub/stage1
我機器上回車之後顯示:(hd0,2) 這裡hd0是指第一個硬碟,2代表第3個分區,即Ubuntu根目錄所在分區(0代表第一個分區)。
3、輸入:grub>root (hd0,2)
4、輸入:grub>setup (hd0)
如果出現successed,就表示成功了。
5、輸入:grub>quit,然後重啟。
對於有多個硬碟的朋友,請但是注意一點,如果你的windows裝在第一塊磁碟,而linux裝在第二塊磁碟,而你的bios設定為從第一塊磁碟啟動,那么在進行以上第3步的時候,一定要把參數設為你的第一塊磁碟。即要把grub裝入引導硬碟的mbr里,當然,比較傻瓜的,你可以將grub裝入每塊硬碟的mbr,不信你試試看,肯定可以啟動,這只是一個先後次序問題
二、NTFS格式大硬碟數據恢復特殊案例
公司一塊80G 邁拓金九硬碟,某天突然進不了分區,提示為“無法訪問X: 參數錯誤”。硬碟上為該公司為本市攝製和編輯的運動會視頻和音頻檔案,攝錄磁帶中已清除,運動會也不可能再開一次。先前到某電腦公司去試過,結果沒能解決問題。廣告公司經理和我的一個朋友是朋友,知道此事後就轉來我處。
修復過程:該硬碟為只有一個NTFS分區的數據盤,先在DOS下用扇區編輯軟體查看LBA0--63扇區,結果發現分區表和63扇區都有錯誤,1—62扇區間有大量扇區被寫上不明代碼,87-102扇區不正常,先手工修復分區表,恢復63引導扇區,刪除1—62扇區間的代碼。87-102扇區之間暫不處理,到WINDOWS下檢查,結果還是出現同樣的提示,試用恢復軟體1,可以看到目錄結構,再試FINALDATE,這個軟體此時太不盡人意;用恢復軟體1選擇某目錄進行試恢復,結果28個試恢復檔案只恢復2個,其餘的全部為0位元組,恢復工作陷入困境。再次對79-102扇區進行分析,79扇區面目全非,被嚴重篡改破壞,80-86扇區被清空,87-102扇區的內容也不正常。經過一番苦思冥想,對某些扇區進行備份後做清除,備份被放到1-62扇區之間,以備不測時改回原樣。
再次在WINDOWS下用恢復軟體1進行恢復,讓其讀該盤約10秒鐘,停止掃描,看到的內容和前面提到的相同,試恢復一個資料夾,從恢復過程能看到這時恢復動作正常了,隨後對其餘的檔案和資料夾進行恢復,近3個多小時後,63.9G資料全部恢復,檔案中幾乎就AVI、WAV、PSD和其它格式的圖形檔案,逐個打開完全正常。恢復工作順利結束,大功告成。
後來一個朋友說這個分區應該是2000格式化出來的,mft在分區的前面,很容易被破壞,象此案里裡面87-102扇區里大約有6個左右的用戶檔案/資料夾是恢復不出來的,但102~~以後的檔案應該能完全恢復的。在ntfs裡面,一般90扇區以後的mft才是用戶的檔案信息,前面的是系統的一些元檔案,對數據恢復影響不大的。
個人覺得ntfs還是比較先進的,檔案碎片都放在一個mft裡面,只要這個扇區沒有被破壞,就可以恢復。
NTFS的結構確實比較複雜,正常情況下所有的操作MFT中有記錄。但是,那些扇區被使用,那些沒被使用,這些概念還是很有用的。
實驗盤被刪除79-102扇區內容後,開機後不需要第三方軟體,檔案和目錄直接可以讀出拷貝到其它地方。查看被刪除扇區內容,95扇區後的內容都自動修復了,80-94嘛。。。。看來MFT中應該還有一個備份,或是具有自動修復功能。
故障盤為何就不能自動修復?且不讓訪問。故障盤中某些扇區看來是被利用了。它的數據恢復是通過第三方軟體得到的,對第三方軟體來講,就算格式化了,絕大部分數據還是能找回來的。

相關詞條

熱門詞條

聯絡我們