原创 數據自習室第二週·Python數據分析基礎0722-0728

文章目錄 Numpy(Numerical Python) Pandas 補充 Numpy(Numerical Python) 是一個功能強大的Python庫,主要用於對多維數組執行計算,其提供了大量的庫函數,可應用於矩陣的計算,圖像的處理

原创 數據自習室第一週·數據的描述性統計0715-0721

學習筆記第一週 數據的描述性統計0715-0721   目錄   一、數據的集中趨勢  1.衆數: 一組數據中,出現次數最多的那個數,用大寫字母 M 表示。 一組數據可以有多個衆數,也可以沒有衆數。 用衆數代表一組數據,可靠性較差,不過

原创 切換用戶su hdfs出現This account is currently not available.

    切換用戶su hdfs進入不了 出現This account is currently not available.   用vi看看 hdfs的帳號信息 # cat /etc/passwd|grep hdfs hdfs:x:995

原创 Windows Terminal powershell 內置SSH使用、SSH指定端口鏈接遠程服務器

首先吹一波 Windows Terminal真滴好用,舒服簡潔好看  hhh迴歸正題, 使用windows Terminal SSH指定端口號鏈接遠程服務器  1. 打開Terminal 2. 在控制檯中使用SSH命令 ssh usr

原创 記一次通過跳板機鏈接遠程數據庫以及備份mysql和恢復

    場景:本機通過一臺ECS服務器,再去連遠程服務器上的mysql數據庫。並且對Mysql庫進行備份 / 恢復到本地mysql 有多種方式可操作:1. haproxy tcp代理 (https://www.cnblogs.com/qi

原创 hive on tez 執行任務報錯

  hive on tez,在執行任務的時候報錯,這種情況原因是container資源被搶佔或者是資源不足。而task最大的失敗次數默認是4,am自己失敗的最大重試次數默認是2次。 報錯日誌: Vertex did not succe

原创 hive的巧用:查詢兩個表中不一樣的數據

一個有趣的SQL: select a.* FROM A a left outer join B b on a.qq = b.qq WHERE b.qq is null; 恩,很好。 WHERE b.qq is null; ......

原创 Navicat 查看密碼 破解保存的密碼 + 密碼解密

(baidu搜索的文章寫的都不全,於是自己總結好寫一個) 如果想要破解一個已經連接好的數據庫密碼,可以參考這個方法。   一、查看navicat保存的密碼 1. 進入註冊表 win + R 輸入 regedit 回車 2.找到 navi

原创 hivesql常見的與不常見的日期格式轉換 (持續更新)

12/31/2015 00:00:00 12/31/2015 00:00:00 1/4/2016 00:00:00 1/4/2016 00:00:00 故事起源於某日接手了 ↑ 這種日期格式的數據 mm/dd/yyyy HH:mm:s

原创 數據自習室第三週·常見概率分佈0728-0804

    基本概念 隨機變量 1.連續性隨機變量 如果隨機變量X的所有可能取值不可以逐個列舉出來,而是取數軸上某一區間內的任一點的隨機變量 2.離散型隨機變量 設X是一個隨機變量,如果它全部可能的取值只有有限個或可數無窮個,則稱X爲一個離散

原创 虛擬機安裝Centos7.6

寫在前面 網上有非常多的各種安裝文檔,有詳細有粗略,都不一樣,所以寫下自己的安裝文檔,總結一下自己遇到過的坑。   準備:VMware12 、 Centos7.6 這裏使用: VMware版本:VMware pro12 Centos版本

原创 在java開發中,使用EL表達式時需要注意的問題

EL表達式處理字符串時:在list中使用了EL表達式,但add,update中未添加 isELIgnored="false"出現的問題:1. find能夠獲取值,但是頁面上不顯示  通過添加 isELIgnored="false" 解決2