PANIC: could not locate a valid checkpoint record

原創

2019-10-24 12:56

環境zabbix 4.0 + pgpool + postgres 11.0 cluster + Centos 7.5 +Python2.7.5【3.6】

引起故障的原因，PG Master 磁盤空間150G，由於zabbix監控設備衆多（約1000個點，模板監控項也較多），導致數據庫的歸檔文件增長速度非常快，通常五分鐘左右吃掉一個G的空間。磁盤空間消耗完畢之後,pg&pgpool的服務會停止，進而影響zabbix系統的使用.爲了解決這個問題，創建了bash shell 腳本和crontab 任務定時清理歸檔文件.

故障日誌截圖：

PostgreSQL錯誤PANIC：找不到有效的檢查點記錄

解決辦法:

1. 登錄 postgres : docker run -ti postgres /bin/bash【不是docker環境直接跳過此步驟】
2. 切換到 postgres 用戶
3. 執行修復命令：/usr/pgsql-11/bin/pg_resetwal -f /var/lib/pgsql/11/data  
  【根據環境和安裝方式的不同，可能文件路徑不同，具體可以使用locate或find 命令搜索 pg_resetwal】
  【pg_resetxlog -f DATADIR postgres 低於10.0 以下的版本可以使用該命令；-f  強制執行更新】
4. 如果看到“Write-ahead log reset”，表示修復成功。

     # systemctl start postgresql-11.service 
     # systemctl status postgresql-11.service 
     # systemctl start pgpool-II-11.service
     # systemctl status pgpool-II-11.service 
     # netstat -pltn

此時PG的服務起來了，但是未必數據庫可以正常使用，繼續使用命令檢查

su - postgres

    -bash-4.2$ psql
    psql: FATAL:  xlog flush request 399/FCA1D7D8 is not satisfied --- flushed only to 399/E720DE18
    CONTEXT:  writing block 2225 of relation base/16385/17835
    --此時報的這個錯誤，可以耐心等待一段時間（約十幾分吧），經驗而談pg和pgpool從故障恢復過來都要等一段時間纔可正常使用；
    -bash-4.2$ psql
        psql (11.4)
        Type "help" for help.
        postgres=#

修復postgres集羣建議使用pgpooladmin工具

     備註：只需要點擊紅色箭頭所指“返回/斷開連接” & "重新加載“”，集羣業務即可恢復使用，比命令行管理方便已維護；

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

PANIC: could not locate a valid checkpoint record

故障日誌截圖：

PostgreSQL錯誤PANIC：找不到有效的檢查點記錄

解決辦法:

su - postgres

修復postgres集羣建議使用pgpooladmin工具

AI 畫圖真刺激，手把手教你如何用 ComfyUI 來畫出刺激的圖

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

數據展示動態（跑分）顯示

公衆號5月C#/.NET熱文一覽

git 下載大陸鏡像地址

PANIC: could not locate a valid checkpoint record

Postgres 11.4 pg_basebackup Permission denied

Zabbix 4.0 監控接口流量Graphs斷斷續續

NTP And System Clock Maintenance

Linux System 磁盤管理之方案二{LVM}

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結