十年網(wǎng)站開(kāi)發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營(yíng)維護(hù)+專業(yè)推廣+無(wú)憂售后,網(wǎng)站問(wèn)題一站解決
服務(wù)器
[服務(wù)器raid5磁盤(pán)陣列情況簡(jiǎn)介]
西藏某政府機(jī)構(gòu)使用的一臺(tái)MS SQL SERVER服務(wù)器,是由4塊硬盤(pán)組成的raid5磁盤(pán)陣列,劃分一個(gè)邏輯卷,單盤(pán)為73GSCSI硬盤(pán),組建于一臺(tái)IBM X225型號(hào)服務(wù)器上。操作系統(tǒng)為WINDOWS 2003。
[服務(wù)器磁盤(pán)陣列故障經(jīng)過(guò)]
A、服務(wù)器在正常使用中raid忽然癱瘓,檢查服務(wù)器發(fā)現(xiàn)已經(jīng)有有3塊硬盤(pán)為離線狀態(tài)。
B、管理員采用了隨便選擇2塊硬盤(pán)進(jìn)行強(qiáng)制上線操作,但是操作系統(tǒng)無(wú)法啟動(dòng)。
C、使用WINPE光盤(pán)啟動(dòng)操作系統(tǒng)后,可以看到數(shù)據(jù)。
D、把備份好的數(shù)據(jù)庫(kù)文件使用zip文件格式拷貝到移動(dòng)硬盤(pán)上,在其他服務(wù)器機(jī)器上測(cè)試后發(fā)現(xiàn)備份文件無(wú)法正確解壓但文件大小、名稱都正確。
E、聘請(qǐng)第三方維保公司對(duì)服務(wù)器進(jìn)行更換raid卡操作并且重建一組raid5陣列。
F、管理員在raid上重裝系統(tǒng)后正常工作,同時(shí)試圖修復(fù)zip文件中的數(shù)據(jù)庫(kù),經(jīng)過(guò)一天的時(shí)間依然沒(méi)有成功。
[服務(wù)器磁盤(pán)陣列數(shù)據(jù)恢復(fù)結(jié)論]
這個(gè)案例的結(jié)果完全不同于我以前分享的服務(wù)器數(shù)據(jù)恢復(fù)案例,因?yàn)閿?shù)據(jù)遭到了嚴(yán)重破壞,無(wú)法按照客戶的要求進(jìn)行數(shù)據(jù)恢復(fù)。
[raid5 數(shù)據(jù)恢復(fù)失敗的原因分析和raid5數(shù)據(jù)恢復(fù)建議]
A,服務(wù)器在使用RAID5陣列進(jìn)行存儲(chǔ)時(shí)一定要及時(shí)對(duì)raid進(jìn)行維護(hù),保證raid正常,一旦發(fā)現(xiàn)有一塊硬盤(pán)離線后即使服務(wù)器可以運(yùn)行但一定要及時(shí)備份數(shù)據(jù),并且對(duì)出現(xiàn)故障的磁盤(pán)陣列進(jìn)行rebuild操作。等到服務(wù)器癱瘓后才對(duì)raid磁盤(pán)陣列進(jìn)行檢查已經(jīng)是事后補(bǔ)救了,數(shù)據(jù)恢復(fù)的難度也相應(yīng)增大。
B,如果由于運(yùn)維工作不及時(shí)或其他原因?qū)е聄aid5陣列2塊以上硬盤(pán)離線,切記不可隨意選擇硬盤(pán)上線,如果在選錯(cuò)盤(pán)的情況下啟動(dòng)系統(tǒng)將有可能導(dǎo)致raid狀態(tài)改變,破壞磁盤(pán)陣列中的重要數(shù)據(jù),導(dǎo)致數(shù)據(jù)恢復(fù)失敗。具體應(yīng)對(duì)方法可以參考張宇工程師的《RAID損壞后,我們?cè)撊绾尉o急應(yīng)對(duì)?》這篇文章。
C,只要目錄區(qū)正常或者部分正常,就可以使用PE看到目錄,但這并不意味著數(shù)據(jù)區(qū)一定正常,其實(shí)在第二步中系統(tǒng)無(wú)法啟動(dòng)就是因?yàn)閺?qiáng)勢(shì)上線的操作是錯(cuò)誤的,此時(shí)應(yīng)該停止繼續(xù)操作。而管理員在PE里讀到目錄,實(shí)際上已經(jīng)對(duì)文件系統(tǒng)進(jìn)行了載入,破壞了正常文件系統(tǒng)的元數(shù)據(jù)區(qū)(只是有可能破壞的不影響要恢復(fù)的數(shù)據(jù))。
D,ZIP文件無(wú)法解壓的原因是RAID結(jié)構(gòu)錯(cuò)誤。管理員通過(guò)強(qiáng)制上線操作上線了2塊硬盤(pán),此時(shí)共有3塊硬盤(pán)在線,但是這3塊硬盤(pán)中有一塊是先離線的磁盤(pán),這就導(dǎo)致了最新數(shù)據(jù)與先離線盤(pán)中的舊數(shù)據(jù)混合在一起。此時(shí)目錄正確但數(shù)據(jù)區(qū)是混亂的,如果不對(duì)這3塊硬盤(pán)進(jìn)行全面的數(shù)據(jù)同步的話基本上市可以完整恢復(fù)數(shù)據(jù)的。
E,如果自己無(wú)法解決raid5陣列出現(xiàn)的故障需要聘請(qǐng)維保公司進(jìn)行解決時(shí)要注意合同中確定有數(shù)據(jù)恢復(fù)的項(xiàng)目,可以讓其代為進(jìn)行數(shù)據(jù)恢復(fù)處理(但最好還是咨詢幾家專業(yè)的數(shù)據(jù)恢復(fù)公司,確定一下數(shù)據(jù)恢復(fù)方案)。如果維保公司沒(méi)有數(shù)據(jù)恢復(fù)的服務(wù)范圍,那么最好優(yōu)先或者直接選擇數(shù)據(jù)恢復(fù)公司。因?yàn)榇蠖鄶?shù)情況維保公司沒(méi)有數(shù)據(jù)恢復(fù)服務(wù)無(wú)法進(jìn)行數(shù)據(jù)恢復(fù)只好再找數(shù)據(jù)恢復(fù)公司,這其中的轉(zhuǎn)折不僅對(duì)數(shù)據(jù)的安全、流程規(guī)范等方面無(wú)法直接掌控,增加數(shù)據(jù)恢復(fù)難度、降低數(shù)據(jù)恢復(fù)成功率,而且導(dǎo)致費(fèi)用增加(有時(shí)候大得可怕)。
F,導(dǎo)致本案例中數(shù)無(wú)法恢復(fù)的最致命操作就是重建RAID5。IBM X225使用SERVER RAID SUPPORT CD重建RAID時(shí),默認(rèn)會(huì)對(duì)所有數(shù)據(jù)進(jìn)行清0。其它型號(hào)的服務(wù)器通常也會(huì)在重建raid時(shí)重新同步校驗(yàn),打亂原有數(shù)據(jù)結(jié)構(gòu),不過(guò)完整同步的過(guò)程需要一定的時(shí)間,如果在同步?jīng)]有完成的情況下中斷同步還是可以對(duì)未同步的剩余數(shù)據(jù)進(jìn)行數(shù)據(jù)恢復(fù)。
G,管理員進(jìn)行了一天的同步,73G的RAID成員盤(pán)都已經(jīng)同步完成了。數(shù)據(jù)已經(jīng)完全毀了。
網(wǎng)站題目:你做了什么自己沒(méi)數(shù)嗎?現(xiàn)在這個(gè)樣子我們也沒(méi)辦法—陣列故障操作不當(dāng)導(dǎo)致無(wú)法恢復(fù)數(shù)據(jù)
文章來(lái)源:http://m.jiaotiyi.com/article/cphegi.html