MySQL主從服務器數據一致性的核對與修復

我上一次遇到MySQL主從服務器數據一致性問題,想想是幾年前的事情了,還依稀記得當時驚慌失措的情景,好在最後藉助Maatkit解決了問題。 幾年後,當我再次面對同樣的問題時,Maatkit已經不復存在,轉而成爲了Percona Toolkit的一部分,不變的是我依舊手忙腳亂,所以還是記錄一下吧,保不準啥時候又會遇到這個問題。

如果你在MySQL從服務器上遇到類似下面的錯誤信息,那麼恭喜你中招了:

mysql> SHOW SLAVE STATUS\G Last_Error: Error 'Duplicate entry '...' for key ...' on query.

爲啥會出現唯一索引鍵值重複?最大的可能是錯誤的對從服務器做了寫操作!出現此類錯誤的時候,很多人會用sql_slave_skip_counter操作跳過錯誤,甚至有人寫了腳本,如果有多個錯誤,就循環多次執行sql_slave_skip_counter:

mysql> SET GLOBAL sql_slave_skip_counter = 1; mysql> START SLAVE;

可惜,即便sql_slave_skip_counter操作能夠暫時讓主從恢復工作,但多半數據一致性已經被破壞的更嚴重了,早晚有一天被掩蓋的問題會再次爆發出來。

Percona Toolkit裏的pt-table-checksum和pt-table-sync可以搞定此類問題。它們的安裝很簡單,可以依照自己的操作系統選擇下 載rpm或者deb軟件包來安裝,當然也可以使用源代碼來安裝,不過要注意的是,必須確保系統已經安裝了依賴的Perl軟件包:

shell> perl -MCPAN -e 'install DBI' shell> perl -MCPAN -e 'install DBD::mysql' shell> perl -MCPAN -e 'install Term::ReadKey'

順便說一下,我在安裝某些Perl模塊的時候,出現類似下面的錯誤提示:

Can’t locate object method “install” via package “…”

如果你也遇到了類似的問題,可以進入到Perl命令行安裝:

shell> perl -MCPAN -e shell cpan> install ...

安裝Percona Toolkit的剩餘步驟就是Perl軟件的固定打法了:

shell> perl Makefile.PL shell> make shell> make install

前戲進行到這裏應該可以了,下面讓我們直搗黃龍,看看如何解決問題:

MySQL主從服務器數據一致性的核對

通過在主服務器上運行pt-table-checksum,它會通過一系列的MySQL函數計算每個表的散列值,利用主從複製關係,把同樣的計算過程在從服務器上重放,從而就拿到了主從服務器各自的散列值,只要比較散列值是否相同就OK了。

這裏面有兩點需要說明:

計算表的散列值時,pt-table-checksum並不是直接計算整個表的散列值,而是分塊計算,這樣就避免了造成從服務器長時間的延遲。

因爲通過MySQL函數計算散列的過程需要在從服務器上重放,所以主從複製的格式必須是基於STATEMENT的,不能是基於ROW的。

實際操作時的命令大致如下:

shell> pt-table-checksum \ --replicate=percona.checksums \ --host=<MASTER_HOST> \ --user=<MASTER_USER> \ --password=<MASTER_PASSWORD>

說明:replicate選項指定了結果保存到哪個庫和表中,如果你願意,可以手動查詢:

SELECT db, tbl, SUM(this_cnt) AS total_rows, COUNT(*) AS chunks FROM percona.checksums WHERE ( master_cnt <> this_cnt OR master_crc <> this_crc OR ISNULL(master_crc) <> ISNULL(this_crc)) GROUP BY db, tbl;

BTW:多數情況下,只要比較「master_crc <> this_crc」就可以了。

MySQL主從服務器數據一致性的修復

通過在主服務器上運行pt-table-sync,它會重建數據,數據通過複製從主服務器同步到從服務器,從而修復了一致性,在操作過程中,可以利用pt-table-checksum的結果。

shell> pt-table-sync \ --execute \ --replicate=percona.checksums \ --charset=<CHARSET> \ --host=<MASTER_HOST> \ --user=<MASTER_USER> \ --password=<MASTER_PASSWORD>

說明:因爲pt-table-sync會重建數據,所以有一定的風險,最好提前備份好數據。如果仍然不放心,可以使用它提供的「print」選項,它會打印出相應的SQL,你可以審查一下到底執行了那些操作,然後通過手動執行來完成同步。

本文例子中,我們爲了方便,在運行Percona Toolkit命令的時候直接鍵入了密碼等敏感信息,這在很多時候是不安全的,比如說別人可以通過查看命令歷史拿到密碼。還好我們有「ask-pass」 選項可以解決此類問題,實際上我們還可以更進一步,直接把密碼等敏感信息保存到配置文件中,最容易想到的配置文件是「~/.my.cnf」,此外,還有幾 個更官方的配置文件可供選擇,我們可以在源代碼裏看到它們的蹤影:

default_files => [ "/etc/percona-toolkit/percona-toolkit.conf", "/etc/percona-toolkit/$program_name.conf", "$home/.percona-toolkit.conf", "$home/.$program_name.conf", ] …

俗話說:不怕賊偷,就怕賊惦記着。看待問題的態度亦是如此:不怕出問題,就怕問題潛伏在暗處窺視着你,而你卻一無所知。大家沒事兒的時候多查查主從一致性吧。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章