原创 TopK 問題

問題:海量日誌數據,提取出某日訪問百度次數最多的那個IP 分析:百度作爲國內第一大搜索引擎,每天訪問它的IP數量巨大,如果想一次性把所有IP數據裝進內存處理,則內存容量明顯不夠,故針對數據太大,內存受限的情況,可以把大文件轉化成(取模映射

原创 《Kafka權威指南》知識梳理

第1章  初識Kafka 消息:Kafka數據單元 批次:一組消息 主題:Kafka通過主題進行分類,由於一個主題包含幾個分區,因此無法保證整個主題範圍內消息的順序,但可以保證消息在單個分區內的順序 生產者、消費者:消費者把每個分區最後讀

原创 Hive壓縮文件格式轉換方案

執行與測試過程: 1. 創建lzo相關表:(驗證過程,可忽略) create external table test_lzo( id int )partitioned by(`date_par` string) ROW FORMAT S

原创 計算機網絡知識梳理

IP地址   訪問一個網頁的過程: IP獲取DNS解析(本地/更高層次的DNS服務器) 建立TCP連接 OSPF找出最佳路徑 ARP協議負責求下一個節點Mac地址 返回渲染   三次握手:   TIME_WAIT意義: 1、解決有足夠時

原创 Java基礎知識易忘點梳理

  List  ArrayList、Vector、LinkedList Map HashMap、HashTable、LinkedHashMap、TreeMap、WeakHashMap   LinkedHashMap  acc

原创 Maven編譯報錯:Cannot run program "bash" :CreateProcess error=2,系統找不到指定的文件

運行報錯: Caused by: java.io.IOException: Cannot run program "bash" (in directory "F:\IdeaProjects\hive-1.1.0-cdh5.7.0\com

原创 仿“知乎”網站項目梳理

GitHub地址:https://github.com/vicotorz/zhangdizhihu SQL 建表語句: 評論:comment id                 int(11), content        text

原创 Hadoop Delegation Tokens詳解

轉載自:《Hadoop Delegation Tokens詳解》 https://www.jianshu.com/p/617fa722e057 本文是cloudera公司的一篇技術博客,原文地址:Hadoop Delegation Tok

原创 《Hive實戰》梳理

ASF是一個支持多種軟件開發項目的組織 Hive不是數據庫,而是一個友好且爲我們熟悉的接口,可以查詢存儲在HDFS上的底層數據文件 SerDe:序列化、反序列化 HCatlog促進了各種Hadoop組件之間實現模式共享,HCatlog的作

原创 DB2安裝與卸載

uname -a  查看linux系統位數 DB2的安裝包獲取:http://blog.sina.com.cn/s/blog_8ea8e9d50102w2s6.html step1:安裝包解壓後執行: ./db2_install -p

原创 Intellij IDEA 快捷鍵整理

快捷鍵 說明 Alt + Enter 提示 Alt + 上(下) 擴大/縮小區域 Ctrl + D 複製 Ctrl + X 剪切 Ctrl + Alt + 回車 上面插行 Ctrl + 回車 後面插行 Ctrl + Shift + 回

原创 Netty知識梳理

Netty 是一款異步的事件驅動的網絡應用程序框架,支持快速地開發可維護的高性能的面向協議的服務器和客戶端。擁有比Java核心API更高的吞吐量以及更低的延遲。 阻塞IO缺點: (1)大量線程處於休眠狀態 (2)需要爲每個線程的調

原创 Linux安裝MYSQL

安裝步驟 1.  軟件包下載 wget http://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.11-linux-glibc2.5-x86_64.tar.gz 或 wget http

原创 hadoop hdfs 讀寫錯誤解決:java.io.IOException: Filesystem closed

報錯信息:java.io.IOException: Filesystem closed 參考:https://blog.csdn.net/posa88/article/details/41018031?utm_source=blogxg

原创 Git Patch

Git 如何打patch參考: https://blog.csdn.net/liuhaomatou/article/details/54410361 https://juejin.im/post/5b5851976fb9a04f844ad