我決定分享我的自動化數據庫運維架構和落地方案

1.監控架構:

   1.監控需要與報告的方式展示,有別於zabbix監控,zabbix做一些細節接口,一般核心指標確定,監控項就是固定不變的

   2.核心指標項的確定

     天兔,獲取日常監控日報

    慢查詢監控

    表空間大小監控日報

    磁盤告警監控日報

3.告警分級,嚴重分電話,常規走釘釘和郵件短信

4.巡檢日報核心指標,週報,和日報。

日報,分所有服務器磁盤使用情況,所有數據庫表大小top50 報告

以上監控搞定,基本數據庫不會出現問題

------------------------------------------------------------------------------------------------------------

2.數據自動化管理平臺: redis,mysql,mssql,mongo

   功能,數據庫的增刪改查,導出,ddl,可以走平臺流程化。

-----------------------------------------------------------------------------------------------------------------

3.數據治癒平臺

    1,大表歷史歸檔

    2.備份恢復-  全量恢復---增量恢復--binlog恢復

   3.主從切換

   4.數據庫碎片整理

   4.歷史回檔自動化操作

----------------------------------------------------------------------------------------------

4.資源管理平臺

------------------------------------------------------------------------------------------

4.資源業務分類管理

vip管理

端口管理

服務器管理

知識庫管理

--------------------------------------------------------------------------------------------

測試環境容器化管理

目的:省資源,易擴展

 

------------------------------------------------------------------------------------

差點忘了一個東西

還有個自動化創建數據庫架構的工具,可以使用ansible-playbook 寫好自動化搭建架構的腳本。

實現工程化管理,這個我建議也可以接入平臺管理。

-----------------------------------------------------------------------------------------

redis管理

不做持久化

redis熱點key實時監控,過期時間,過期key類型,過期key所屬團隊和業務。

內存管理。

有個開源的redismanager感覺不錯,

redis-cluster 

擴展的命令都腳本化,或者用redismanager管理

redis記得基本都是內存的問題,加加內存,管理過期key,

過期key管理好,redis基本不出問題

------------------------------------------

mongo基本上我運維的很少

不知道原因,感覺穩定的一逼

 

 

 

 

 

以上平臺搞定,基本很少需要人工接入了

以上是我想到什麼就寫了什麼,

根據我的經驗基本以上搞定,日常基本沒什麼事,只需要關注巡檢日報,拿手機審覈單子。數據庫不可能出問題,除非服務器宕機。

臨時想到寫的一些我所做的一些東西

後續,寫一些以上落地方案的設計和架構。

基本上都實現了之後,你會覺得工作沒意思了。對了大表,大數據量的規範指定好,一切走流程。很重要

以上流程掌握,保你工作清閒

對了,以上構思其實很值錢。。。有的時候懂一樣東西的價值,會比努力更重要。希望構思上對再看的你有幫助

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章