原创 Greenplum數據庫的分佈鍵
Greenplum是分佈式系統,創建表時需要指定分佈鍵(創建表需要CREATEDBA權限),目的在於將數據平均分佈到各個segment。選擇分佈鍵非常重要,選擇錯了會導致數據不唯一,更嚴重的是會造成SQL性能急劇下降。 Green
原创 Greenplum數據庫常用操作語句
Greenplum 大數據平臺基於MPP(大規模並行處理)架構,具有良好的彈性和線性擴展能力,內置並行存儲、並行通訊、並行計算和優化技術,兼容 SQL 標準,具備強大、高效、安全的PB級結構化、半結構化和非結構化數據存儲、處理和
原创 Linux常用命令
一.系統管理命令 shutdown:關閉、重啓計算機 -h:關閉計算機 -r:重啓計算機 如:立即關機: shutdown -h now 10分鐘後關機:shutdown -h +10 23:30分關機:shutdown -h
原创 Notepad++遠程連接服務器
一.安裝Notepad++ 安裝其實很簡單,找個Notepad++安裝包,直接下一步下一步就OK。 安裝包資源: 百度網盤:https://pan.baidu.com/s/1fNE80dpRC3qyEzgPsC4RPA 提取碼:b
原创 Sqoop的使用
最近在使用sqoop的時候遇到了一些坑,在此就sqoop做一些介紹並且記錄自己的爬坑過程,希望對看到的朋友有所幫助 1. sqoop的介紹 作用: 在Hadoop和RDBMS之間高效傳輸數據: 1.hadoop大數據存儲平臺:
原创 創建Maven項目時 pom.xml 出現的MavenArchiveConfiguration問題
eclipse寫入新的maven項目時,pom.xml第一行報錯: org.apache.maven.archiver.MavenArchiver.getManifest(org.apache.maven.project.Mave
原创 Python中具有布爾意義的值
Python中很多特殊值具有false意義: NONE; False(布爾類型); 所有值爲零的數: 0(整型) 0.0(浮點數) 0L(長整型) 0.0+0.0j(複數) ""(空字符串) [](空列表)
原创 Linux中的文件權限
展示下Linux的用戶分組 Linux系統中的每個文件和目錄都有訪問許可權限,如下面所示: 實例展示: ypy@ubuntu:~$ ls -l drwxr-xr-- 2 ypy ypy 4096 Nov 30 18:3
原创 vim/vi 如何高效使用
衆所周知,vi/vim 是全世界最powerful的編輯器,掌握並熟練使用vi/vim,可以讓我們非常高效的happy地coding,使用linux系統時也會讓我們順手很多。 不會熟練使用vi/vim的夥伴,永遠都離IT高手有一段距
原创 Java性能優化:細節優化,提高代碼運行效率
代碼 優化 ,一個很重要的課題。可能有些人覺得沒用,一些細小的地方有什麼好修改的,改與不改對於代碼的運行效率有什麼影響呢?這個問題我是這麼考慮的,就像大海里面的鯨魚一樣,它吃一條小蝦米有用嗎?沒用,但是,吃的小蝦米一多之後,鯨魚就被餵
原创 Azkaban的使用
1.工程主界面功能 2.執行主界面介紹 調度配置 失敗後(跳過失敗的/結束任務) 失敗通知 並行執行 動態傳參數 跳過某一個任務 3.執行操作 立即執行 定時執行 4.查看日誌 && 5.查看歷史任務 一、工程主界面功能 Pro
原创 如何在CSDN上轉載他人文章 【技巧】如何在CSDN上轉載他人文章
原 【技巧】如何在CSDN上轉載他人文章 2018年10月09日 22:47:12 FG成長空間 閱讀數:66 </div> <div class="op
原创 Git實用操作和GitKraken工具使用
gitgit是現在最流行的版本管理工具,應用範圍非常廣泛,工作中基本都會用到(除了一些互聯網金融公司外)。使用git好處有很多,包括但不限於便於多分支開發,歷史管理跟回滾方便,發佈等。配合webhook,可以在ci上集成自動發佈
原创 Spark-submit工具參數說明
spark-submit工具參數說明 執行時需要傳入的參數說明 Usage: spark-submit [options] <app jar | python file> [app options] 參數名稱 含義 --
原创 NoSQL之Redis數據庫基本知識
目錄 NoSQL的簡單介紹 NoSQL 和SQL數據的比較: 1.Redis概念 2.Redis優勢 3.Redis 適用場景 4.Redis存儲的數據結構詳解 String--字符串 List--列表