淘寶開發的系統監控工具 Tsar 安裝配置詳解

淘寶開發的系統監控工具 Tsar 安裝配置詳解

 

Tsar是淘寶的採集工具,主要用來收集服務器的系統信息(如cpu,io,mem,tcp等)以及應用數據(如squid haproxy nginx等),tsar支持實時查看和歷史查看,方便了解應用和服務器的信息。本文是Tsar的


Tsar(Taobao System Activity Reporter)是淘寶開發的一個非常好用的系統監控工具,在淘寶內部大量使用。它不僅可以監控CPU、IO、內存、TCP等系統狀態,也可以監控Apache,Nginx/Tengine,Squid等服務器狀態。

Tsar介紹

Tsar是淘寶的一個用來收集服務器系統和應用信息的採集報告工具,如收集服務器的系統信息(cpu,mem等),以及應用數據(nginx、swift等),收集到的數據存儲在服務器磁盤上,可以隨時查詢歷史信息,也可以將數據發送到nagios報警。

Tsar能夠比較方便地增加模塊,只需要按照 tsar 的要求編寫數據的採集函數和展現函數,就可以把自定義的模塊加入到tsar中。

安裝

Tsar目前託管在GitHub上,下載編譯安裝步驟:

$git clone git://github.com/kongjian/tsar.git

$cd tsar

$make

$make install

安裝後:

定時任務配置:/etc/cron.d/tsar,負責每分鐘調用tsar執行採集任務;

日誌文件輪轉配置:/etc/logrotate.d/tsar,每個月會把tsar的本地存儲進行輪轉;

Tsar配置文件路徑:/etc/tsar/tsar.conf,tsar的採集模塊和輸出的具體配置;

模塊路徑:/usr/local/tsar/modules,各個模塊的動態庫so文件;

Tsar配置

Tsar剛安裝完,還沒有歷史數據,想要check是否正常,執行tsar -l,查看是否有實時信息輸出:

[[email protected] tsar]$ tsar -l -i 1

Time             ---cpu-- ---mem-- ---tcp-- -----traffic---- --xvda-- -xvda1-- -xvda2---xvda3-- -xvda4-- -xvda5--  ---load-

Time               util     util   retran   pktin  pktout     util    util     util     util    util     util     load1

11/04/13-14:09:10   0.20    11.57    0.00     9.00    2.00    0.00     0.00     0.00    0.00     0.00     0.00     0.00

11/04/13-14:09:11   0.20    11.57    0.00     4.00    2.00    0.00     0.00     0.00    0.00     0.00     0.00     0.00

Tsar的配置主要都在/etc/tsar/tsar.conf中,常用的有:

  • 增加一個模塊,添加 mod_<yourmodname> on 到配置文件中
  • 打開或者關閉一個模塊,修改mod_<yourmodname> on/off
  • output_stdio_mod 能夠配置執行tsar時的輸出模塊
  • output_file_path 採集到的數據默認保存到的文件(如果修改的話需要對應修改輪轉的配置/etc/logrotate.d/tsar)
  • output_interface 指定tsar的數據輸出目的,默認file保存本地,nagios/db輸出到監控中心/數據庫中,這兩個功能還需要結合其它配置,具體見後面。

Tsar使用

查看歷史數據,tsar

  • -l/–list 查看可用的模塊列表
  • -l/–live 查看實時數據,tsar -l –cpu
  • -i/–interval 指定間隔,歷史,tsar -i 1 –cpu
  • –modname 指定模塊,tsar –cpu
  • -s/–spec 指定字段,tsar –cpu -s sys,util
  • -d/–date 指定日期,YYYYMMDD或者n代表n天前
  • -C/–check 查看最後一次的採集數據
  • -d/–detail 能夠指定查看主要字段還是模塊的所有字段
  • -h/–help 幫助功能

高級功能

  • 輸出到nagios

配置: 首先配置output_interface file,nagios,增加nagios輸出,然後配置nagios服務器和端口,以及發送的間隔時間。

####The IP address or the host running the NSCA daemon

server_addr nagios.server.com

####The port on which the daemon is running - default is5667

server_port 8086

####The cycle of send alert to nagios

cycle_time 300

由於是nagios的被動監控模式,需要制定nsca的位置和配置文件位置:

####nsca client program

send_nsca_cmd /usr/bin/send_nsca

send_nsca_conf /home/a/conf/amon/send_nsca.conf

接下來制定哪些模塊和字段需要進行監控,一共四個閥值對應nagios中的不同報警級別:

####tsar mod alert config file

####threshold[hostname.]servicename.key;w-min;w-max;c-min;cmax;

threshold cpu.util;50;60;70;80;

  • 輸出到mysql

配置: 首先配置output_interface file,db,增加db輸出,然後配置哪些模塊數據需要輸出:

output_db_modmod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io

然後配置sql語句發送的目的地址和端口:

output_db_addr console2:56677

目的地址在該端口監聽tcp數據,並且把數據入庫即可,可以參照tsar2db

模塊開發

Tsar的一個比較好的功能是能夠增加自己的採集,這時候需要編寫模塊代碼,編譯成so文件即可。

首先安裝tsardevel,剛纔安裝時,如果執行make tsardevel,就會把模塊開發的基本文件安裝到系統然後執行tsardevel ,就能在當前模塊生成一個模塊目錄:

[[email protected] tsar]$ tsardevel test

build:make

install:make install

uninstall:make uninstall

[[email protected] tsar]$ ls test

Makefile  mod_test.c  mod_test.conf

按照要求修改mod_test.c中的read_test_stats,set_test_record 完成後make;make install就完成新模塊的配置文件和so的設置,執行tsar –test就能查看效果

另外也可以通過配置文件對自定義模塊傳遞參數,方法是修改配置文件中的mod_test on myparameter 然後在mod_test.c中的read_test_stats函數中,通過parameter參數就可以獲得剛纔配置文件中的內容。

TSAR  源碼地址:https://github.com/alibaba/tsar

TSAR 項目主頁:http://tsar.taobao.org/

如果有關於tsar的問題,可以聯繫諮詢tsar現在的開發同學 @淘空見

 

發佈了79 篇原創文章 · 獲贊 38 · 訪問量 144萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章