HBase介紹

簡介
  • 高可靠,高性能,面向列,可伸縮,實時讀寫的==分佈式數據庫==
  • 利用HDFS作爲其文件存儲系統,支持MR程序讀取數據
  • 存儲非結構化和半結構化數據

 RowKey:主鍵,數據唯一標識,按字典排序
 Column Family:列族,多個列的集合,最多不要超過3個

HBase能做什麼?

  • 海量數據存儲
  • 準實時查詢

HBase應用場景點
 交通、金融、電商、移動

HBase特點

  • 容量大:HBase單表可以有百億行、百萬行,數據矩陣橫向和縱向兩個維度所支持的數據量級都非常具有彈性。(單表不超過500w行、30列)
  • 面向列:HBase是面向列的存儲和權限控制,並支持獨立檢索。列式存儲,其數據在表中是按照某列存儲的,這樣在查詢只需要少數幾個字段的時候能大大減少讀取的數據量。(HBase能動態增加列,能單獨對列操作)
  • 多版本:HBase每一個列的數據存儲有多個Version。
  • 稀疏性:爲空的列並不佔用存儲空間,表可以設計的非常稀疏。
  • 擴展性:底層依賴於HDFS
  • 高可靠性:WAL(Write-Ahead-Log預寫日誌)機制保證了數據寫入時不會因集羣異常而導致寫入數據丟失;Replication機制保證了在集羣出現嚴重的問題時,數據不會發生丟失或損壞。而且HBase底層使用HDFS,HDFS本身也有備份。
  • 高性能:底層的LSM數據結構和Rowkey有序排列等架構上的獨特設計,使得HBase具有非常高的寫入性能。region切分、主鍵索引和緩存機制使得HBase在海量數據下具備一定的隨機讀取性能,該性能針對Rowkey的查詢能夠到達毫秒級別。

如何選擇Hbase的版本
官方版本:http://archive.apache.org/dist/hbase/
CDH版本:http://archive.cloudera.com/cdh5 #穩定,兼容性

HBase架構體系
image

HBase表結構模型

image
只設計這個表格中有多少個列即可,指定表中的列簇

HBase數據模型

image

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章