原创 maven工程裏編譯運行main函數出錯:“ You must specify a valid lifecycle phase or a goal in the format”
命令行編譯Maven工程時碰到如下錯誤,先記錄下解決方案: *****************************************************************************************
原创 Spark知識系統化整理分享
在學習和使用Spark的過程中,發現了這篇文章。感覺真不錯,便於我們從宏觀上了解Apache Spark的歷史和現狀。 爲尊重原文作者,本文僅轉載連接如下,建議Spark初學者必讀: http://www.3
原创 Spark集羣資源調度
在學習和使用Spark過程中,簡單瞭解下Spark如何在不同計算間分配資源,總的來說可以分爲如下兩個角度去分析(請路過高手指正):1> 每個Spark應用被分配到獨立的進程(Executor)集上,Cluster Manager負責在不
原创 關於Linux下前後臺程序的一點疑惑(& , (cmd &), setsid )--- (kafka-stop-server.sh不工作問題)
前幾天啓動kafka時一不小心這樣操作的: $ (./bin/kafka-start-server.sh &), 後來執行 $ kafka-stop-server.sh 卻發現無法停止 kafka進程。 查看kafka-stop-ser
原创 關於Storm和Thrift
簡單總結下自己看Storm中thrift相關源碼的理解,請高手指正。 Thrift是一個支持多種程序語言開發的框架,其核心是Thrift編譯器和Thrift Server。 Storm使用T
原创 Linux如何刪除一些亂碼命名的文件
工作中碰到幾次類似問題,現總結下解決方案,以備後用: $ ls ??????????_??????b6?S??.a test.war.bk test.war.bk1 ??z?2??F? [test@testPC /home/test
原创 java與C++區別之String字符串
本文轉自csdn博客: http://blog.csdn.net/flywithmj/article/details/7568765 記下來作爲Java學習筆記。 從概念上講,java字符串就是Unicode字符序列。
原创 數據挖掘--支持向量機(SVM)基礎
最近在看一些針對數據挖掘的課題,發現一個鏈接對SVM的講解非常通俗易懂,特分享一下。 後續會逐步加入自己的理解: h
原创 java程序如何獲取命令行參數
java可以通過類gnu.getopt.Getopt 獲取命令行參數。 參考文獻: http://www.urbanophile.com/aren
原创 Linux容器家族之Rocket
Rocket代碼: https://github.com/coreos/rkt Rocket ( 也叫rkt,Go語言實現 ) 是一個類似Docker的命令行工具。她可以打包應用和依賴包到可移植容器中,簡化搭環境等部署工作。 Rock
原创 如何檢查Linux存儲空間不足情況
記下來作爲筆記。 先執行 $ df -h 可以看到那個分區對應目錄已滿 然後進入對應目錄下,執行 $ du -sh ./* 即可列出該目錄下所有一級目錄的文件大小(是該目錄下所有文件大小之和,不是隻包含目錄文件),可能該步執行比較慢。
原创 Linux 如何調整虛擬內存大小
我用的CentOS, 直接貼操作步驟,供參考: [root@1pad ~]# free -m total used free shared buffers cache
原创 Spark 1.3.0源碼編譯及部署
Spark源碼編譯 1. Spark1.3.0安裝版本要求: Spark 1.3.0 Java 6+ Python 2.6+ Scala 2.10.x2. 安裝Maven至 /usr/local/maven-3.1
原创 Kafka的Producer和Consumer源碼學習
本文記錄自己的一些理解,盼路過高手指正。 先解釋下兩個概念: high watermark (HW) 它表示已經被commited的最後一個message offset(所謂commited, 應該是ISR中所有repli
原创 Java NIO
作爲C/C++程序員,初次聽到Java NIO這個名詞有點茫然。仔細學習了Java NIO的細節和用法,個人理解如下: 其實Java NIO的功能對C程序員並不陌生,和我們經常接觸的 select / p