對大數據平臺中表分析

原創

2020-06-17 14:41

假如數據表爲Demo，這裏中的最大值、最小值、平均值的計算要單位一致，如果單位不一致計算有誤。這裏給出的只是命令，命令使用，需要依據實際環境調整。因爲hadoop刪除處理大塊文件，碎片化文件過多會嚴重消耗集羣資源，影響查詢效率。
獲取表當前分區數

hadoop fs -ls  hdfs://nameservice1/inceptor1/user/hive/warehouse/Demo | wc -l

獲取表當前分區最小值

hadoop fs -du -h  hdfs://nameservice1/inceptor1/user/hive/warehouse/risk.db/hive/Demo | sort -n |sed -n '1p'

獲取表當前分區最大值

hadoop fs -du -h  hdfs://nameservice1/inceptor1/user/hive/warehouse/Demo | sort -n |sed -n '$p'

獲取表分區平均值

hadoop fs -du -h  hdfs://nameservice1/inceptor1/user/hive/warehouse/Demo | sort -n |awk '{sum+= $1}END{printf sum/NR "\n"}'

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Tensorflow的離線安裝包及安裝成功測試代碼

微信公衆號：WELTest 離線安裝包安裝如果是在外網，下載安裝包，解壓文件之後使用pip安裝： pip install tensorflow-1.9.0-cp36-cp36m-win_amd64.whl 該包經過測試，不

WEL测试

2020-06-17 08:41:45

在liunx安裝並配置xampp

在liunx安裝xampp 一、下載xmapp： wget wget https://nchc.dl.sourceforge.net/project/xampp/XAMPP%20Linux/7.3.11/xampp-linux-x

WEL测试

2020-06-17 07:41:35

多個wordpress共享用戶信息、共享Cookie

背景信息由於wordpress的問答平臺QA主題與插件githuber-md-1.10.1不能共存，爲了編寫博文方便，因此重新創建了博客論壇。爲了解決用戶無縫銜接的困擾，因此打算兩個網站公用一個數據庫，共享用戶信息。共享用戶信

WEL测试

2020-06-17 07:41:35

ORACLE 12的ORA-01033問題操作過程

[oracle@localhost ~]$ sqlplus / as sysdba SQL*Plus: Release 12.2.0.1.0 Production on 星期五 11月 29 18:23:54 2019 Copyri

WEL测试

2020-06-17 07:41:35

論軟件測試人員的自我修養

論軟件測試人員的自我修養軟件測試也是近幾年才火爆起來，由於其入門低、容易上手、對學歷要求低等特點，使其迅速蓬勃發展起來。但俗話"入門容易成才難"，軟件測試包羅萬象從文檔靜態測試、手工測試、自動化測試、單元測試、集

WEL测试

2020-06-17 06:51:52

Tensorflow的離線安裝包及安裝成功測試代碼

WEL测试

2020-06-17 08:41:45

在liunx安裝並配置xampp

在liunx安裝xampp 一、下載xmapp： wget wget https://nchc.dl.sourceforge.net/project/xampp/XAMPP%20Linux/7.3.11/xampp-linux-x

WEL测试

2020-06-17 07:41:35

多個wordpress共享用戶信息、共享Cookie

WEL测试

2020-06-17 07:41:35

ORACLE 12的ORA-01033問題操作過程

[oracle@localhost ~]$ sqlplus / as sysdba SQL*Plus: Release 12.2.0.1.0 Production on 星期五 11月 29 18:23:54 2019 Copyri

WEL测试

2020-06-17 07:41:35

論軟件測試人員的自我修養

WEL测试

2020-06-17 06:51:52

24小時熱門文章

對大數據平臺中表分析

Android啓動過程-萬字長文(Android14)

【SQL進階】CASE語句的使用

optional install error: Error: Unsupported URL Type: npm:vue-loader@^16.1.0

這種嵌套字典類型的數據，我想把它讀取到df裏，如何操作？

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺

iNeuOS工業互聯網操作系統，增加電力IEC104協議

微服務實踐k8s&dapr開發部署實驗（3）訂閱發佈

chromedriver版本

kbgressdb之數據結構V0.2

LINUX expect實例講解

對大數據平臺中表分析

Tensorflow的離線安裝包及安裝成功測試代碼

在liunx安裝並配置xampp

多個wordpress共享用戶信息、共享Cookie

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結