一 寫在前面
常言道,“知其然,更要知其所以然”。但是沒有知其然,何談知其所以然。本系列文章呈現給你的更多是怎麼做,爲什麼這樣做也會有所涉及。但是由於水平有限,所以原理性的東西講解不夠深刻,還望讀者海涵。
最近看了很多資料,也在思考我們我在追逐的技術究竟能給這個社會帶來什麼價值。走在技術的道路上多少有些枯燥,但這又何妨?
二 RMAN備份和恢復控制文件講解
我們經常在說“備份重於一切”,如果出現問題可以從備份文件中恢復。此係列文章講解RMAN的備份與恢復。RMAN(Recovery Manager),可以用來備份和還原數據庫文件、歸檔日誌和控制文件,它也可以用來執行完全或不完全的數據庫恢復。RMAN備份方式有:完全備份(Full Backup)與增量備份(Incremental Backup)、打開備份(Open Backup)或關閉備份(Closed Backup)、一致備份(Consistent Backup)與不一致備份(Inconsistent Backup)。RMAN恢復有完全恢復和不完全恢復。其中不完全恢復,可以基於時間,基於SCN,基於日誌序列號、基於備份控制文件。
控制文件記錄了數據庫的結構和行爲,對於數據庫而言,控制文件是相當重要的,如果控制文件有問題,並且參數文件沒有問題,數據庫只能啓動到NOMOUNT狀態。ORACLE 11g控制文件默認兩個,一個存放在數據目錄,另一個存放在閃回目錄。真實環境中控制文件也是多個,一般3個爲宜。
RMAN備份與恢復控制文件,首先我們要對數據庫進行備份,如果沒有備份何來的恢復。備份數據庫的過程是這樣的:RMAN發出備份全庫命令後,RMAN生成到目標數據庫的bequeath連接,也就是說會檢查ORACLA_SID變量中的實例名,並在該在實 例上產生一個服務器進程,然後作爲sysdba登陸,然後會產生一個作爲備份的通道(其實也是進程,在PGA或者是在SGA分配存儲)。隨後RMAN調用 SYS.DBMS_RCVMAN請求數據庫結構信息,包括控制文件的信息(當前序列號,創建時間……),由於指定了備份全庫,所以RMAN會請求數據庫中數據文件信息,並判斷是否存在offline數據文件(包括所在的位置和工作方式)。RMAN開始備份,爲了保持數據一致性RMAN必須構建控制文件快照,接下來RMAN調用DBMS _BACKUP_RESTORE數據包,該調用可以創建備份片。RMAN擁有文件列表,所以它爲數據文件讀取操作分配內存緩衝區,分配緩衝區後RMAN初始化備份片。一旦初始化了備份片, RMAN會判斷是否使用了服務器參數文件,如果使用了則會做爲備份的一部分,還要備份控制文件,之後纔開始備份數據文件,並將其推至內存。 爲了實現這一功能,通道進程在磁盤上執行預讀取操作,並且將多個數據文件讀入內存中,RMAN會判斷數據塊頭信息是否仍然爲零,如果數據塊沒有被使用過,就不會發生到輸出緩衝區的寫操作,同時會丟棄這個數據塊(這就RMAN爲什麼會只備份使用過的數據的原因,也是它的優點)。 RMAN還會執行檢查數據塊有沒有corruption操作。當檢查通過了就被寫入到輸出緩衝區。一旦輸出緩衝區填滿了,就被推至備份文件位置。在備份數據塊的時候,RMAN影子進程會得到備份狀態信息,並將它傳給V$session_longops視圖,查詢它能得到信息。 當數據文件的所有數據塊都被讀入輸入緩衝區並確定了狀態之後RMAN就會通過將這個數據文件寫入備份片來結束該文件的備份操作。所有數據文件寫入備份片之後,RMAN生成最後一個對SYS DBMS BACKUP RESTORE數據包的調用,該調用在控制文件中寫入備份信息(包括備份片名,啓動備份操作時的檢查點的SCN和完成備份的時間),至此完成備份!
備份數據庫完成後,我們需要一致性關閉數據庫,因爲數據庫處於運行狀態會向控制文件寫內容,如果不關閉,會出現控制文件版本不一致。一致性關閉數據庫後,我們需要模擬控制文件丟失,爲了避免恢復出錯,我們不使用rm命令,真實環境中使用此命令也是很危險的,我們使用mv命令。接着我們啓動數據庫到NOMOUNT狀態,爲什麼是NOMOUNT,因爲數據庫啓動會經過三個階段,實例啓動,數據庫裝載,數據庫打開,NOMOUNT階段使用的是參數文件,因爲我們的控制文件丟失,所以無法讀取,只能啓動到NOMOUNT狀態。然後RMAN中通過備份的控制文件還原,因爲控制文件恢復完成,可以啓動數據庫到MOUNT狀態,所以我們接着使數據庫到MOUNT狀態,因爲數據庫的控制文件是通過RMAN恢復的,我們需要恢復數據庫,使控制文件生效,並進行控制文件版本的校對和同步。然後我們使用RESETLOGS(重置日誌)方式打開數據庫,因爲日誌文件被清空了,以前的備份無效,所以我們應該再次對數據庫進行備份。這一點至關重要。
我們還可以使用RUN命令把所有的操作寫入一個人腳本,這樣可以減少很多操作,前提是這樣的腳本經過嚴格的測試。
控制文件丟失使用run命令
語法:
RUN{
STARTUP MOUNT;
RESTORE CONTROLFILE FROM '/';
ALTER DATABASE MOUNT;
RECOVER DATABASE;
ALTER DATABASE OPEN RESETLOGS;
}
示例:
RUN{
STARTUPNOMOUNT;
RESTORECONTROLFILE FROM '/u01/oracle/fast_recovery_area/JUSTDB/backupset/2013_12_11/o1_mf_ncsnf_TAG20131211T164208_9bj9c8rp_.bkp';
ALTERDATABASE MOUNT;
RECOVERDATABASE;
ALTERDATABASE OPEN RESETLOGS;
}
當然,這只是模擬,真實環境中控制文件基本上不會丟失。
三 控制文件丟失模擬
Step 1,備份數據庫
RMAN> BACKUP DATABASE; Starting backup at 11-DEC-13 using channel ORA_DISK_1 channel ORA_DISK_1: starting full datafile backup set channel ORA_DISK_1: specifying datafile(s) in backup set input datafile file number=00001 name=/u01/oracle/oradata/justdb/system01.dbf input datafile file number=00002 name=/u01/oracle/oradata/justdb/sysaux01.dbf input datafile file number=00003 name=/u01/oracle/oradata/justdb/undotbs01.dbf input datafile file number=00004 name=/u01/oracle/oradata/justdb/users01.dbf channel ORA_DISK_1: starting piece 1 at 11-DEC-13 channel ORA_DISK_1: finished piece 1 at 11-DEC-13 piece handle=/u01/oracle/fast_recovery_area/JUSTDB/backupset/2013_12_11/o1_mf_nnndf_TAG20131211T162913_9bj8lscl_.bkp tag=TAG20131211T162913 comment=NONE channel ORA_DISK_1: backup set complete, elapsed time: 00:00:07 channel ORA_DISK_1: starting full datafile backup set channel ORA_DISK_1: specifying datafile(s) in backup set including current control file in backup set including current SPFILE in backup set channel ORA_DISK_1: starting piece 1 at 11-DEC-13 channel ORA_DISK_1: finished piece 1 at 11-DEC-13 piece handle=/u01/oracle/fast_recovery_area/JUSTDB/backupset/2013_12_11/o1_mf_ncsnf_TAG20131211T162913_9bj8m1gt_.bkp tag=TAG20131211T162913 comment=NONE channel ORA_DISK_1: backup set complete, elapsed time: 00:00:01 Finished backup at 11-DEC-13
Step 2,一致性關閉數據庫
RMAN> SHUTDOWN IMMEDIATE; database closed database dismounted Oracle instance shut down
Step 3,模擬控制文件丟失
[oracle@orcl dbs]$ \mv /u01/oracle/oradata/justdb/control01.ctl /opt/learn/ -v `/u01/oracle/oradata/justdb/control01.ctl' -> `/opt/learn/control01.ctl' removed `/u01/oracle/oradata/justdb/control01.ctl' [oracle@orcl dbs]$ \mv /u01/oracle/fast_recovery_area/justdb/control02.ctl /opt/learn/ -v `/u01/oracle/fast_recovery_area/justdb/control02.ctl' -> `/opt/learn/control02.ctl' removed `/u01/oracle/fast_recovery_area/justdb/control02.ctl'
Step 4,啓動數據庫到NOMOUNT狀態
RMAN> STARTUP NOMOUNT; connected to target database (not started) Oracle instance started Total System Global Area 1269366784 bytes Fixed Size 2227984 bytes Variable Size 754974960 bytes Database Buffers 503316480 bytes Redo Buffers 8847360 bytes
Step 5,還原控制文件
RMAN> RESTORE CONTROLFILE FROM '/u01/oracle/fast_recovery_area/JUSTDB/backupset/2013_12_11/o1_mf_ncsnf_TAG20131211T162913_9bj8m1gt_.bkp'; Starting restore at 11-DEC-13 allocated channel: ORA_DISK_1 channel ORA_DISK_1: SID=19 device type=DISK channel ORA_DISK_1: restoring control file channel ORA_DISK_1: restore complete, elapsed time: 00:00:01 output file name=/u01/oracle/oradata/justdb/control01.ctl output file name=/u01/oracle/fast_recovery_area/justdb/control02.ctl Finished restore at 11-DEC-13
Step 6,切換數據庫到MOUNT狀態
RMAN> ALTER DATABASE MOUNT; database mounted released channel: ORA_DISK_1
Step 7,恢復數據庫
RMAN> RECOVER DATABASE; Starting recover at 11-DEC-13 Starting implicit crosscheck backup at 11-DEC-13 allocated channel: ORA_DISK_1 channel ORA_DISK_1: SID=1 device type=DISK Crosschecked 6 objects Finished implicit crosscheck backup at 11-DEC-13 Starting implicit crosscheck copy at 11-DEC-13 using channel ORA_DISK_1 Finished implicit crosscheck copy at 11-DEC-13 searching for all files in the recovery area cataloging files... cataloging done List of Cataloged Files ======================= File Name: /u01/oracle/fast_recovery_area/JUSTDB/backupset/2013_12_11/o1_mf_ncsnf_TAG20131211T162913_9bj8m1gt_.bkp using channel ORA_DISK_1 starting media recovery archived log for thread 1 with sequence 1 is already on disk as file /u01/oracle/oradata/justdb/redo01.log archived log file name=/u01/oracle/oradata/justdb/redo01.log thread=1 sequence=1 media recovery complete, elapsed time: 00:00:00 Finished recover at 11-DEC-13
Step 8,以RESETLOGS方式打開數據庫
RMAN> ALTER DATABASE OPEN RESETLOGS; ALTER DATABASE OPEN RESETLOGS; database opened
Step 9,查看數據庫狀態
[oracle@orcl ~]$ sqlplus [uniread] Loaded history (97 lines) SQL*Plus: Release 11.2.0.3.0 Production on Wed Dec 11 16:32:16 2013 Copyright (c) 1982, 2011, Oracle. All rights reserved. Connected to: Oracle Database 11g Enterprise Edition Release 11.2.0.3.0 - 64bit Production With the Partitioning, Oracle Label Security, OLAP, Data Mining, Oracle Database Vault and Real Application Testing options SQL> SELECT open_mode FROM v$database; OPEN_MODE -------------------- READ WRITE
Step 10,備份數據庫
RMAN> BACKUP DATABASE;
四 參考資料
http://www.itpub.net/thread-1024391-1-1.html
http://blog.csdn.net/inthirties/article/details/5367152
五 相關文章
我的郵箱:[email protected] 新浪微博:@jutdb 微信公衆平臺:JustOracle(微信號:justoracle) 數據庫技術交流羣:336882565(加羣時驗證 From CSDN XXX) All is well 2014年1月14日 By Larry Wen
@Wentasy 博文僅供參考,歡迎大家來訪。如有錯誤之處,希望批評指正。原創博文如需轉載請註明出處,謝謝 :) [CSDN博客] |