一、Shell命令
通用命令
- help:查詢hbase中所有命令得幫助文檔 e.g. help ‘status’
- status: 查詢當前hbase得集羣狀態
- table_help:引用表得命令
命名空間命令
- list_namespace:查詢所有得命名空間(默認有hbase,default)
- list_namespace_tables:查詢命名空間下面的tables
- create_namespace:創建namespace
- describe_namespace:查詢命名空間信息
- alter_namespace 修改命名空間
- drop_namespace 刪除命名空間
DDL命令
- create 建表命令 create ‘命名空間:表名’ {name=>‘列簇名’,version=>最多版本號}
- list 查詢所有表
- describe 查詢表結構 describe ‘命名空間:表名’
- alter 修改表 alter ‘命名空間:表名’,{name=>‘列簇名’}
- drop/disable/enable 刪除表 先讓表失效(disable) 然後在刪除(drop)
DML命令
- put 插入數據 put ‘表名’ ,‘rowkey’,‘列簇:列’,‘value’
- scan 掃描表信息
- scan ‘t1’,{raw=>true,version=>5} 查詢指定版本數據
- scan ‘t1’ ,{column =>‘列簇:列名’}查詢指定列數據
- can ‘t1’ ,{column=>[‘列簇’],limit=>10 ,startrow =>‘001’} 分頁查詢
- get ‘t1’ ,‘rowkey’ ,‘列簇:列名’ 獲取指定表指定列簇的信息
- incr ‘t1’,‘005’,'列簇:列’插入一條數據 插入的數據的值可以自增長 但是數據類型不是String
二、布隆過濾器
- 定義
Bloom filter 是基於二進制向量的數據結構,具有很好的空間和時間效率。一般用作於檢測一個元素是否在一個指定的集合中,如果檢測是true,但是不能百分之百保證存在,如果false則必然不存在 - 應用範圍
應用於爬蟲中。 - 在hbase中運用
減少特定的訪問模式(get/scan)的查詢時間,會少量消耗內存和內存負擔
①none:不適用布隆過濾去
②row:行鍵使用布隆過濾去
③rowcol:行建和列簇使用。細度更細