原创 Hive開啓Sentry需要注意的點

本文要點不在於配置,需要學習怎麼配置請看https://blog.51cto.com/smilemask/2043930 1.add jar無法使用,原因是因爲sentry認爲引用第三方jar包可以繞過權限來獲取到你想要的數據,那麼真實需要

原创 分佈式監控系統ganglia配置文檔

一、Ganglia的組件Ganglia包括如下程序,他們之間通過XML格式傳遞監控數據,達到監控效果。Gmetad 這個程序負責收集各個cluster的數據,並更新到rrd數據庫中。Gmond 收集本機的監控數據,發送到其他機器上。收集其他

原创 怎樣用命令查看Mysql數據庫大小?

1、進去指定schema 數據庫(存放了其他的數據庫的信息)use information_schema2、查詢所有數據的大小select concat(round(sum(DATA_LENGTH/1024/1024),2), 'MB')

原创 ganglia metric 默認監控項翻譯

http://blog.csdn.net/xiao_qiang_/article/details/8671699

原创 Python特殊語法:filter、map、reduce、lambda [轉]

Python內置了一些非常有趣但非常有用的函數,充分體現了Python的語言魅力!filter(function, sequence):對sequence中的item依次執行function(item),將執行結果爲True的item組成一

原创 rsync 的核心算法

rsync是unix/linux下同步文件的一個高效算法,它能同步更新兩處計算機的文件與目錄,並適當利用查找文件中的不同塊以減少數據傳輸。rsync中一項與其他大部分類似程序或協定中所未見的重要特性是鏡像是隻對有變更的部分進行傳送。rsyn

原创 MySQL sql-mode

最近在做一個項目的時候錯了一個相當奇怪的問題:代碼是我從svn上直接checkout出來的,數據庫是從別人的機器上直接dump出來的。環境配置妥當以後,就是在我的機器上不能正常下訂單。剛開始不明白,爲什麼同樣的代碼,同樣的數據庫在別人的機器

原创 mysql explain

在 explain的幫助下,您就知道什麼時候該給表添加索引,以使用索引來查找記錄從而讓select 運行更快。如果由於不恰當使用索引而引起一些問題的話,可以運行 analyze table來更新該表的統計信息,例如鍵的基數,它能幫您在優化方

原创 CDH Sentry 管理Hive鑑權

在CM管理界面上要開啓一些選項,這裏不做詳細說明,網上一查都有,推薦文章http://www.jianshu.com/p/055c40dcb8c5 但僅限於看配置的內容,至於下面的,作者沒有詳細解釋sentry的權限設置是在hive sql

原创 LVS+keepalived負載均衡實戰

一、爲什麼要使 用負載均衡技術?1、系統高可用性2、  系統可擴展性3、  負載均衡能力LVS+keepalived能很好的實現以上的要求,LVS提 供負載均衡,keepalived提供健康檢查,故障轉移,提高系統的可用性!採用這樣的架構以

原创 LVS的三種模式區別詳解

1. DR模式:(Direct Routing)直接路由模式DR模式的網絡拓撲:1) 工作過程: 當一個client發送一個WEB請求到VIP,LVS服務器根據VIP選擇對應的real-server的Pool,根據算法,在Pool中選擇一臺

原创 python 字符串操作

1.字符串的對齊方式:①:center(int[,str])>>> string = 'Fishhat'>>> string.center(55)'                              Fishhat         

原创 我的友情鏈接

51CTO博客開發

原创 MySQL數據庫事務隔離級別(Transaction Isolation Level)

數據庫隔離級別有四種,應用《高性能mysql》一書中的說明: 然後說說修改事務隔離級別的方法:1.全局修改,修改mysql.ini配置文件,在最後加上1 #可選參數有:READ-UNCOMMITTED, READ-COMMITTED, RE

原创 linux下mysql配置文件my.cnf詳解

basedir = path 使用給定目錄作爲根目錄(安裝目錄)。character-sets-dir = path 給出存放着字符集的目錄。datadir = path 從給定目錄讀取數據庫文件。pid-file = filename 爲