十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營(yíng)維護(hù)+專業(yè)推廣+無(wú)憂售后,網(wǎng)站問(wèn)題一站解決
關(guān)于oracle實(shí)例恢復(fù)的一些理解,一直都有誤區(qū),今天通過(guò)查看相關(guān)資料和與同學(xué)探討,發(fā)覺了自己的錯(cuò)誤,探討結(jié)果如下:
實(shí)例恢復(fù):當(dāng)數(shù)據(jù)庫(kù)非正常關(guān)閉的時(shí)候(斷電或者shu abort等等非一致性關(guān)閉),當(dāng)你從新啟動(dòng)數(shù)據(jù)庫(kù)的時(shí)候,數(shù)據(jù)庫(kù)相關(guān)進(jìn)程自動(dòng)進(jìn)行實(shí)例恢復(fù),無(wú)須人工干預(yù)。
什么時(shí)候需要實(shí)例恢復(fù)
在shutdown normal or shutdown immediate下,也就是所謂的clean shutdown,checkpoint也會(huì)自動(dòng)觸發(fā),并且把SCN紀(jì)錄寫回。 當(dāng)發(fā)生checkpoint時(shí),會(huì)把SCN寫到四個(gè)地方:
三個(gè)地方于control file內(nèi):
SYSTEM CHECKPOINT SCN
Datafile checkpoint SCN
Stop SCN:就是在實(shí)例一致性關(guān)閉的時(shí)候,更新
一個(gè)在datafile header內(nèi):
Start SCN
正常open的狀態(tài)下一致性的數(shù)據(jù)庫(kù),SYSTEM CHECKPOINT SCN,Datafile checkpoint SCN和數(shù)據(jù)文件頭Start SCN的這三個(gè)SCN是一致,并且儲(chǔ)存在control file中的stop scn就會(huì)恢復(fù)為NULL值。
Clean shutdown 時(shí)
當(dāng)clean shutdown 時(shí),checkpoint會(huì)進(jìn)行,并且此時(shí)datafile的stop scn和控制文件里的start scn會(huì)相同, 等到open數(shù)據(jù)庫(kù)時(shí),Oracle檢查datafile header中的start scn和存于control file中的datafile的scn是否相同, 如果相同,接著檢查start scn和stop scn是否相同,如果仍然相同,數(shù)據(jù)庫(kù)就會(huì)正常開啟,否則就需要recovery。
等到數(shù)據(jù)庫(kù)開啟后,儲(chǔ)存在control file中的stop scn就會(huì)恢復(fù)為NULL值,此時(shí)表示datafile是open在正常模式下了。
非正常shutdown
如果不正常SHUTDOWN (shutdown abort),則mount數(shù)據(jù)庫(kù)后,會(huì)發(fā)現(xiàn)stop scn并不是等于其它位置的scn, 而是等于NULL,這表示Oracle在shutdown時(shí)沒有進(jìn)行checkpoint,下次開機(jī)必須進(jìn)行crash recovery(實(shí)例恢復(fù))。
注意一點(diǎn):
啟動(dòng)數(shù)據(jù)庫(kù)時(shí),如果發(fā)現(xiàn)STOP SCN = NULL,表示需要進(jìn)行crash recovery;
啟動(dòng)數(shù)據(jù)庫(kù)時(shí),如果發(fā)現(xiàn)有datafile header的START SCN 不等于儲(chǔ)存于CONTROLFILE的DATAFILE SCN,表示需要進(jìn)行Media recovery
實(shí)例恢復(fù)的具體過(guò)程
當(dāng)數(shù)據(jù)庫(kù)突然崩潰,而還沒有來(lái)得及將buffer cache里的臟數(shù)據(jù)塊刷新到數(shù)據(jù)文件里,同時(shí)在實(shí)例崩潰時(shí)正在運(yùn)行著的事務(wù)被突然中斷,則事務(wù)為中間狀態(tài),也就是既沒有提交也沒有回滾。這時(shí)數(shù)據(jù)文件里的內(nèi)容不能體現(xiàn)實(shí)例崩潰時(shí)的狀態(tài)。這樣關(guān)閉的數(shù)據(jù)庫(kù)是不一致的。
下次啟動(dòng)實(shí)例時(shí),Oracle會(huì)由SMON進(jìn)程自動(dòng)進(jìn)行實(shí)例恢復(fù)。實(shí)例啟動(dòng)時(shí),SMON進(jìn)程會(huì)去檢查控制文件中所記錄的、每個(gè)在線的、可讀寫的數(shù)據(jù)文件的END SCN號(hào)。
數(shù)據(jù)庫(kù)正常運(yùn)行過(guò)程中,該END SCN號(hào)始終為NULL,而當(dāng)數(shù)據(jù)庫(kù)正常關(guān)閉時(shí),會(huì)進(jìn)行完全檢查點(diǎn),并將檢查點(diǎn)SCN號(hào)更新該字段,所以可以通過(guò)END SCN號(hào)是否為null來(lái)判斷是不是需要實(shí)例恢復(fù)。
而崩潰時(shí),Oracle還來(lái)不及更新該字段,則該字段仍然為NULL。當(dāng)SMON進(jìn)程發(fā)現(xiàn)該字段為空時(shí),就知道實(shí)例在上次沒有正常關(guān)閉,于是由SMON進(jìn)程就開始進(jìn)行實(shí)例恢復(fù)了。
SMON進(jìn)程進(jìn)行實(shí)例恢復(fù)時(shí),會(huì)從控制文件中獲得檢查點(diǎn)位置。于是,SMON進(jìn)程到聯(lián)機(jī)日志文件中,找到該檢查點(diǎn)位置,然后從該檢查點(diǎn)位置開始往下,應(yīng)用所有的重做條目,從而在buffer cache里又恢復(fù)了實(shí)例崩潰那個(gè)時(shí)間點(diǎn)的狀態(tài)。這個(gè)過(guò)程叫做前滾,前滾完畢以后,buffer cache里既有崩潰時(shí)已經(jīng)提交還沒有寫入數(shù)據(jù)文件的臟數(shù)據(jù)塊,也還有事務(wù)被突然終止,而導(dǎo)致的既沒有提交又沒有回滾的事務(wù)所弄臟的數(shù)據(jù)塊。
前滾一旦完畢,SMON進(jìn)程立即打開數(shù)據(jù)庫(kù)。但是,這時(shí)的數(shù)據(jù)庫(kù)中還含有那些中間狀態(tài)的、既沒有提交又沒有回滾的臟塊,這種臟塊是不能存在于數(shù)據(jù)庫(kù)中的,因?yàn)樗鼈儾]有被提交,必須被回滾。打開數(shù)據(jù)庫(kù)以后,SMON進(jìn)程會(huì)在后臺(tái)進(jìn)行回滾。
有時(shí),數(shù)據(jù)庫(kù)打開以后,SMON進(jìn)程還沒來(lái)得及回滾這些中間狀態(tài)的數(shù)據(jù)塊時(shí),就有用戶進(jìn)程發(fā)出讀取這些數(shù)據(jù)塊的請(qǐng)求。這時(shí),服務(wù)器進(jìn)程在將這些塊返回給用戶之前,由服務(wù)器進(jìn)程負(fù)責(zé)進(jìn)行回滾,回滾完畢后,將數(shù)據(jù)塊的內(nèi)容返回給用戶。
為什么數(shù)據(jù)庫(kù)的實(shí)例恢復(fù)是先前滾再回滾
回滾段實(shí)際上也是以回滾表空間的形式存在的,既然是表空間,那么肯定就有對(duì)應(yīng)的數(shù)據(jù)文件,同時(shí)在buffer cache 中就會(huì)存在映像塊,這一點(diǎn)和其他表空間的數(shù)據(jù)文件相同。
當(dāng)發(fā)生DML操作時(shí),既要生成REDO(針對(duì)DML操作本身的REDO Entry)也要生成UNDO(用于回滾該DML操作,記錄在UNDO表空間中),但是既然UNDO信息也是使用回滾表空間來(lái)存放的,那么該DML操作對(duì)應(yīng)的UNDO信息(在BUFFER CACHE生成對(duì)應(yīng)中的UNDO BLOCK)就會(huì)首先生成其對(duì)應(yīng)的REDO信息(UNDO BLOCK's REDO Entry)并寫入Log Buffer中。
這樣做的原因是因?yàn)锽uffer Cache中的有關(guān)UNDO表空間的塊也可能因?yàn)閿?shù)據(jù)庫(kù)故障而丟失,為了保障在下一次啟動(dòng)時(shí)能夠順利進(jìn)行回滾,首先就必須使用REDO日志來(lái)恢復(fù)UNDO段(實(shí)際上是先回復(fù)Buffer Cache中的臟數(shù)據(jù)塊,然后由Checkpoint寫入U(xiǎn)NDO段中),在數(shù)據(jù)庫(kù)OPEN以后再使用UNDO信息來(lái)進(jìn)行回滾,達(dá)到一致性的目的。
生成完UNDO BLOCK's REDO Entry后才輪到該DML語(yǔ)句對(duì)應(yīng)的REDO Entry,最后再修改Buffer Cache中的Block,該Block同時(shí)變?yōu)榕K數(shù)據(jù)塊。
實(shí)際上,簡(jiǎn)單點(diǎn)說(shuō)REDO的作用就是記錄所有的數(shù)據(jù)庫(kù)更改,包括UNDO表空間在內(nèi)。
總 結(jié)
今天最重要的一點(diǎn)我知道了,所謂的前滾,是應(yīng)用redo來(lái)恢復(fù)buffer cache的數(shù)據(jù),將buffer cache恢復(fù)到crash之前狀態(tài),所以此時(shí)buffer cache 中既有崩潰時(shí)已經(jīng)提交還沒有寫入數(shù)據(jù)文件的臟數(shù)據(jù)塊,也還有事務(wù)被突然終止,而導(dǎo)致的既沒有提交又沒有回滾的事務(wù)所弄臟的數(shù)據(jù)塊(也就是沒有commit,但是dbwr已經(jīng)將改變刷新到底層磁盤),還有一點(diǎn)是控制文件中還有一個(gè) end scn,用來(lái)記錄數(shù)據(jù)庫(kù)正常關(guān)閉的時(shí)候的數(shù)據(jù)庫(kù)文件頭的scn,并且可以通過(guò)這個(gè)scn是否為null來(lái)判斷需或者不需實(shí)例恢復(fù)。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。