Hash與Btree的區別
當記錄號不是用於數據存取的主鍵時,應該使用 Hash和Btree算法
。 (如果記錄號是用於數據存取的一個二級關鍵字,那麼還是可以選擇Btree算法,因爲它支持一個主鍵和一個記錄號同時存取。)
Btree中的主鍵是有序存儲
,記錄間的關聯是依靠次序。並且其結構能隨數據的插入和刪除進行動態調整。爲了代碼的簡單,DB沒有實現對關鍵字的前綴碼壓縮。Btree支持對數據查詢、插入、刪除的常數級速度。關鍵字可以爲任意的數據結構。 因此,當在主鍵有序時,Btree算法應該被使用
。例如,如果主鍵是時間戳, 那麼8點時間戳後面跟隨的就是9點時間戳, 這種情況下,Btree算法一般是正確的選擇。再來個例子:如果主鍵是名字,應用需要取出所有同姓的記錄,那麼Btree 存取方法同樣是個好選擇。
Hash 和 Btree 兩種方式在小的數據集合上幾乎沒有性能的差別
。不過,由於Hash使用的是擴展線性HASH算法(extended linear hashing),可以根據HASH表的增長進行適當的調整。所以當一個數據集合足夠大且關鍵字爲隨機分佈時,採用Hash算法比較好
。
Queue和Recno區別
當用記錄號作爲數據存取的主鍵時,應該使用 Queue和Recno存取方法
。記錄號由算法本身生成。實際上,這和關係型數據庫中邏輯主鍵通常定義爲int AUTO型是同一個概念。兩者基本上都是建立在Btree算法之上,提供存儲有序數據的接口。Queue的優勢在於:由於其記錄爲定長,在插入操作時把記錄插入到隊列的尾部,所以速度最快,而且它執行上鎖和併發處理的水平也相當高。 Recno 的長處在於它支持一些Queue不能實現的特徵,比如可變長記錄和支持flat-text文件。
記錄號可以是可變的或者不變的: 可變指的是當記錄被刪除或者插入記錄號發生變化;不變指的是記錄號無論數據庫如何操作,記錄號都不會發生改變。 基於記錄號存取在Btree方式下也是可行的。但是,記錄號是可變,當記錄刪除或插入時,數據庫內的其他記錄的記錄號都將發生改變。 Queue存取方法總是用固定的方式運行,不管數據庫如何操作,記錄號始終改變。 Recno 可以被設置爲不變和可變兩種形式。
另外,Recno爲數據庫提供支持flat-text文件的永久存儲和數據在讀或修改時提供一個快速的臨時存儲空間。
一個表格:
存儲方式 | 描述 | 選擇場景 |
BTree |
關鍵字有序存儲,並且其結構能隨數據的插入和刪除進行動態調整。 爲了代碼的簡單, Berkeley DB 沒有實現對關鍵字的前綴碼壓縮。 B+ 樹支持對數據查詢、插入、刪除的常數級速度。關鍵字可以爲任意的數據結構 |
1 、 當 Key 爲複雜類型時。 2 、 當 Key 有序時。 |
Hash |
DB 中實際使用的是擴展線性 HASH 算法( extended linear hashing ), 可以根據 HASH 表的增長進行適當的調整。關鍵字可以爲任意的數據結構。 |
1 、 當 Key 爲複雜類型。 2 、 當數據較大且 key 隨機分佈時。 |
Recno |
要求每一個記錄都有一個邏輯紀錄號,邏輯紀錄號由算法本身生成。 相當於關係數據庫中的自動增長字段。 Recho 建立在 B+ 樹算法之上,提供了一個存儲有序數據的接口。 記錄的長度可以爲定長或不定長。 |
1 、 當 key 爲邏輯記錄號時。 2 、 當非高併發的情況下。
|
Queue |
和 Recno 方式接近 , 只不過記錄的長度爲定長。 數據以定長記錄方式存儲在隊列中,插入操作把記錄插入到隊列的尾部, 相比之下插入速度是最快的。 |
1 、 當 key 爲邏輯記錄號時。 2 、 定長記錄。 3 、 高併發的情況下。 |