1.監控架構:
1.監控需要與報告的方式展示,有別於zabbix監控,zabbix做一些細節接口,一般核心指標確定,監控項就是固定不變的
2.核心指標項的確定
天兔,獲取日常監控日報
慢查詢監控
表空間大小監控日報
磁盤告警監控日報
3.告警分級,嚴重分電話,常規走釘釘和郵件短信
4.巡檢日報核心指標,週報,和日報。
日報,分所有服務器磁盤使用情況,所有數據庫表大小top50 報告
以上監控搞定,基本數據庫不會出現問題
------------------------------------------------------------------------------------------------------------
2.數據自動化管理平臺: redis,mysql,mssql,mongo
功能,數據庫的增刪改查,導出,ddl,可以走平臺流程化。
-----------------------------------------------------------------------------------------------------------------
3.數據治癒平臺
1,大表歷史歸檔
2.備份恢復- 全量恢復---增量恢復--binlog恢復
3.主從切換
4.數據庫碎片整理
4.歷史回檔自動化操作
----------------------------------------------------------------------------------------------
4.資源管理平臺
------------------------------------------------------------------------------------------
4.資源業務分類管理
vip管理
端口管理
服務器管理
知識庫管理
--------------------------------------------------------------------------------------------
測試環境容器化管理
目的:省資源,易擴展
------------------------------------------------------------------------------------
差點忘了一個東西
還有個自動化創建數據庫架構的工具,可以使用ansible-playbook 寫好自動化搭建架構的腳本。
實現工程化管理,這個我建議也可以接入平臺管理。
-----------------------------------------------------------------------------------------
redis管理
不做持久化
redis熱點key實時監控,過期時間,過期key類型,過期key所屬團隊和業務。
內存管理。
有個開源的redismanager感覺不錯,
redis-cluster
擴展的命令都腳本化,或者用redismanager管理
redis記得基本都是內存的問題,加加內存,管理過期key,
過期key管理好,redis基本不出問題
------------------------------------------
mongo基本上我運維的很少
不知道原因,感覺穩定的一逼
以上平臺搞定,基本很少需要人工接入了
以上是我想到什麼就寫了什麼,
根據我的經驗基本以上搞定,日常基本沒什麼事,只需要關注巡檢日報,拿手機審覈單子。數據庫不可能出問題,除非服務器宕機。
臨時想到寫的一些我所做的一些東西
後續,寫一些以上落地方案的設計和架構。
基本上都實現了之後,你會覺得工作沒意思了。對了大表,大數據量的規範指定好,一切走流程。很重要
以上流程掌握,保你工作清閒
對了,以上構思其實很值錢。。。有的時候懂一樣東西的價值,會比努力更重要。希望構思上對再看的你有幫助