hive的桶表類似於hash分區,桶表在hdfs中存儲是以文件形式存儲的
與其他分區表不同,桶表的分區條件是從表中列名選取的,然後做hash運算,如果hash值相同那麼就放入一個桶表中
創建桶表的示例:
create table emp5
(empno int,
ename string,
job string,
mgr int,
hiredate string,
sal int,
comm int,
deptno int)
clustered by (job) into 4 buckets
row format delimited fields terminated by ',';
然後再插入數據(這裏的emp表示我們之前導入的)
insert into table emp5 select * from emp;
然後我們可以在hdfs中查看建立的4個桶表
我們也可以使用hdfs命令查看一下文件中的內容
至此測試桶表已經完畢