HBase初探(二):Shell命令、布隆過濾器

一、Shell命令

通用命令

  1. help:查詢hbase中所有命令得幫助文檔 e.g. help ‘status’
  2. status: 查詢當前hbase得集羣狀態
  3. table_help:引用表得命令

命名空間命令

  1. list_namespace:查詢所有得命名空間(默認有hbase,default)
  2. list_namespace_tables:查詢命名空間下面的tables
  3. create_namespace:創建namespace
  4. describe_namespace:查詢命名空間信息
  5. alter_namespace 修改命名空間
  6. drop_namespace 刪除命名空間

DDL命令

  1. create 建表命令 create ‘命名空間:表名’ {name=>‘列簇名’,version=>最多版本號}
  2. list 查詢所有表
  3. describe 查詢表結構 describe ‘命名空間:表名’
  4. alter 修改表 alter ‘命名空間:表名’,{name=>‘列簇名’}
  5. drop/disable/enable 刪除表 先讓表失效(disable) 然後在刪除(drop)

DML命令

  1. put 插入數據 put ‘表名’ ,‘rowkey’,‘列簇:列’,‘value’
  2. scan 掃描表信息
  3. scan ‘t1’,{raw=>true,version=>5} 查詢指定版本數據
  4. scan ‘t1’ ,{column =>‘列簇:列名’}查詢指定列數據
  5. can ‘t1’ ,{column=>[‘列簇’],limit=>10 ,startrow =>‘001’} 分頁查詢
  6. get ‘t1’ ,‘rowkey’ ,‘列簇:列名’ 獲取指定表指定列簇的信息
  7. incr ‘t1’,‘005’,'列簇:列’插入一條數據 插入的數據的值可以自增長 但是數據類型不是String

二、布隆過濾器

  1. 定義
    Bloom filter 是基於二進制向量的數據結構,具有很好的空間和時間效率。一般用作於檢測一個元素是否在一個指定的集合中,如果檢測是true,但是不能百分之百保證存在,如果false則必然不存在
  2. 應用範圍
    應用於爬蟲中。
  3. 在hbase中運用
    減少特定的訪問模式(get/scan)的查詢時間,會少量消耗內存和內存負擔
    ①none:不適用布隆過濾去
    ②row:行鍵使用布隆過濾去
    ③rowcol:行建和列簇使用。細度更細
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章