原创 Hadoop節點上負載過高的問題分析

最近發現我們的hadoop集羣的客戶端機器負載經常飆到幾百,導致機器反應很慢, 客戶反應無法提交job,或者job跑的很慢。針對這種情況通常有幾個解決方案,一個是增加客戶端機器數量,把他們做到一個pool裏面,根據系統負載情況來自動切換不同

原创 python抓取系統metrics吐給kafka

本篇介紹用python寫腳本,抓取系統metrics,然後調用kafka client library把metrics吐給kafka的案例分享。對於用kafka的同學實用性很高。在運行本實例前需要先下載兩個python庫到本地 : six和

原创 把python源碼轉變成rpm包

摘要在linux系統上操作的同學都熟悉rpm,它是包管理軟件,適用度很廣。很多時候我們會想要把我們寫的程序或者別人的源碼變成rpm包,這樣只需要一個rpm文件就可以安裝好我們需要的程序了,方便管理而且應用程序直接在系統默認路徑下,調用對應應

原创 Tcpdump的使用實踐

摘要本文介紹在時間Linux運維過程中用到tcpdump的實際經驗分享。正文tcpdump -i bond0:1 "port 67 and src 10.142.24.25"監聽bond0:1上的67端口,67是DHCP服務器上的監聽端口。

原创 python 多線程的使用

在實際編程過程中經常需要把任務包裝成多進程或者多線程,多進程和多線程的區別在於多線程是內存共享、變量等共享的,多進程的進程間是獨立運行的,所以創建多線程還是多進程取決於不同的需求。python中因爲有全局鎖的機制,所以在python中多線程