淺談數據庫系統中的cache(轉)

淺談數據庫系統中的cache(轉)

Cache和Buffer是兩個不同的概念,簡單的說,Cache是加速“讀”,而buffer是緩衝“寫”,前者解決讀的問題,保存從磁盤上讀出 的數據,後者是解決寫的問題,保存即將要寫入到磁盤上的數據。在很多情況下,這兩個名詞並沒有嚴格區分,常常把讀寫混合類型稱爲buffer cache,本文後續的論述中,統一稱爲cache。

Oracle中的log buffer是解決redo寫入的問題,而data buffer cache則解決data block的讀寫問題。對於Oracle來說,如果IO沒有在SGA中命中,都會發生物理IO,Oracle並不關心底層存儲的類型,可能是一套存儲系 統,可能是本地磁盤,可能是RAID 10,也可能是RAID 5,可能是文件系統,也可能是裸設備,或是ASM。總之,Oracle把底層的存儲系統稱爲存儲子系統。

在存儲系統中,cache幾乎無處不在(在後面的論述中,我們統稱爲cache),文件系統有cache,存儲有cache,RAID控制器上有 cache,磁盤上也有cache。爲了提高性能,Oracle的一個寫操作,很有可能寫在存儲的cache上就返回了,如果這時存儲系統發生問 題,Oracle如何來保證數據一致性的問題。

Oracle數據庫最重要的特性是:Write ahead logging,在data block在寫入前,必須保證首先寫入redo log,在事務commit時,同時必須保證redo log被寫入。Oracle爲了保證數據的一致性,對於redo log採用了direct IO,Direct IO會跳過了OS上文件系統的cache這一層。但是,OS管不了存儲這一層,雖然跳過了文件系統的cache,但是依然可能寫在存儲的cache上。

一般的存儲都有cache,爲了提高性能,寫操作在cache上完成就返回給OS了,我們稱這種寫操作爲write back,爲了保證掉電時cache中的內容不會丟失,存儲都有電池保護,這些電池可以供存儲在掉電後工作一定時間,保證cache中的數據被刷入磁盤, 不會丟失。不同於UPS,電池能夠支撐的時間很短,一般都在30分鐘以內,只要保證cache中的數據被寫入就可以了。存儲可以關閉寫cache,這時所 有的寫操作必須寫入到磁盤才返回,我們稱這種寫操作爲write throuogh,當存儲發現某些部件不正常時,存儲會自動關閉寫cache,這時寫性能會下降。

RAID卡上也有cache,一般是256M,同樣是通過電池來保護的,不同於存儲的是,這個電池並不保證數據可以被寫入到磁盤上,而是爲 cache供電以保護數據不丟失,一般可以支撐幾天的時間。還有些RAID卡上有flash cache,掉電後可以將cache中的內容寫入到flash cache中,保證數據不丟失。如果你的數據庫沒有存儲,而是放在普通PC機的本地硬盤之上的,一定要確認主機中的RAID卡是否有電池,很多硬件提供商 默認是不配置電池的。當然,RAID卡上的cache同樣可以選擇關閉。

磁盤上的cache,一般是16M-64M,很多存儲廠商都明確表示,存儲中磁盤的cache是禁用的,這也是可以理解的,爲了保證數據可靠性,而 存儲本身又提供了非常大的cache,相比較而言,磁盤上的cache就不再那麼重要。SCSI指令中有一個FUA(Force Unit Access)的參數,設置這個參數時,寫操作必須在磁盤上完成纔可以返回,相當於禁用了磁盤的寫cache。雖然沒有查證到資料,但是我個人認爲一旦磁 盤被接入到RAID控制器中,寫cache就會被禁用,這也是爲了數據可靠性的考慮,我相信存儲廠商應該會考慮這個問題。

至此,我們可以看到Oracle的一個物理IO是經歷了一系列的cache之後,最終被寫入到磁盤上。cache雖然可以提高性能,但是也要考慮掉電保護的問題。關於數據的一致性,是由Oracle數據庫,操作系統和存儲子系統共同來保證的。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章