十年網(wǎng)站開發(fā)經(jīng)驗 + 多家企業(yè)客戶 + 靠譜的建站團隊
量身定制 + 運營維護+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
俗話說的好,正常的服務器都是正常運行的,不正常的服務器卻各有各的故障。作為一名從業(yè)了十多年的服務器數(shù)據(jù)恢復工作者來說,近些年來遇到的服務器數(shù)據(jù)恢復案例中故障情況大多相似了,沒見過的故障越來越少,我想一方面是自己從事服務器數(shù)據(jù)恢復工作的時間越來越長,一般的故障都見識過了,另一方面是服務器廠商對產(chǎn)品的安全性能不斷優(yōu)化的結果。不過雖然導致服務器數(shù)據(jù)丟失的故障情況比較單一了,但是服務器數(shù)據(jù)恢復的案例卻并沒有明顯減少,今天還是通過一個近期處理的服務器數(shù)據(jù)丟失案例來為大家介紹一下服務器硬盤掉線的數(shù)據(jù)恢復過程。
首先介紹故障服務器基本狀況,出現(xiàn)數(shù)據(jù)丟失的服務器里面是一組raid6磁盤陣列,陣列包含8塊硬盤,單塊硬盤的容量是500G,服務器是一臺web服務器,主要用來運行數(shù)據(jù)庫,另外一部分空間用來存放普通辦公文件。由于管理員疏于管理也或者是存在僥幸心理,在這個陣列中已經(jīng)有兩塊硬盤離線的情況下依然沒有對服務器進行更換硬盤,很快陣列中又有一塊硬盤離線,而這最后一塊離線的硬盤就成了服務器崩潰的直接原因。
在我們接到客戶這臺服務器之前已經(jīng)有過一家北京的數(shù)據(jù)恢復公司對服務器進行過數(shù)據(jù)恢復操作了,恢復了大部分的數(shù)據(jù),但是數(shù)據(jù)遭到嚴重損壞無法使用,辦公文件也有近40天的數(shù)據(jù)丟失,于是該數(shù)據(jù)恢復公司只好推薦了我們,客戶帶著服務器來到我們公司進行第二次數(shù)據(jù)恢復嘗試。
我們的服務器數(shù)據(jù)恢復工程師簡單了解了客戶的服務器故障情況后首先將所有硬盤鏡像到數(shù)據(jù)恢復安全存儲池中,雖然不確定上一家數(shù)據(jù)恢復公司是否也做了同樣的操作,但是為確保數(shù)據(jù)原始性,我們還是必須要對客戶原始服務器進行鏡像操作,一方面是對我們數(shù)據(jù)恢復公司自己負責,另一方面也是對客戶數(shù)據(jù)的負責。
接下來服務器數(shù)據(jù)恢復工程師對可恢復服務器的鏡像文件進行分析發(fā)現(xiàn)陣列內(nèi)最先離線的兩塊硬盤離線時間非常早,至少有2個月不再有新的數(shù)據(jù)寫入了,所以數(shù)據(jù)恢復的關鍵點就落在了這最后一塊離線的硬盤上面了??蛻舻倪@臺服務器陣列使用的雙校驗,但是由于有兩塊硬盤長時間處于離線狀態(tài),普通的異或運算已經(jīng)無法對服務器進行數(shù)據(jù)恢復,只能使用基于Reed-Solomon算法生成的第二種校驗方式進行恢復數(shù)據(jù),這種數(shù)據(jù)恢復方法目前還屬于我們公司的核心算法之一,市面上也并沒有與之相似的其他算法和軟硬件產(chǎn)品,所以這也是上一家數(shù)據(jù)恢復公司沒有能夠成功恢復數(shù)據(jù)的根本愿意你了。
既然是核心算法,那么我就不詳細描述我們分析和恢復數(shù)據(jù)的過程了,服務器數(shù)據(jù)恢復工程師們編寫了一個通用的小程序?qū)⒈黄茐牡臄?shù)據(jù)進行了重組和提取,然后生成為完整鏡像,在安全存儲池內(nèi)對恢復出的數(shù)據(jù)進行驗證沒有問題后聯(lián)系客戶來進行最終驗證數(shù)據(jù)。經(jīng)客戶最終驗證,該服務器內(nèi)所有數(shù)據(jù)全部恢復,數(shù)據(jù)庫可以正常使用,本次服務器數(shù)據(jù)恢復100%成功。