數據同步解決方案-canal

一、背景

早期,阿里巴巴B2B公司因爲存在杭州和美國雙機房部署,存在跨機房同步的業務需求。不過早期的數據庫同步業務,主要是基於trigger的方式獲取增量變更,不過從2010年開始,阿里系公司開始逐步的嘗試基於數據庫的日誌解析,獲取增量變更進行同步,由此衍生出了增量訂閱&消費的業務,從此開啓了一段新紀元。

ps. 目前內部版本已經支持mysql和oracle部分版本的日誌解析,當前的canal開源版本支持5.7及以下的版本(阿里內部mysql 5.7.13, 5.6.10, mysql 5.5.18和5.1.40/48)

基於日誌增量訂閱&消費支持的業務:

  1. 數據庫鏡像
  2. 數據庫實時備份
  3. 多級索引 (賣家和買家各自分庫索引)
  4. search build
  5. 業務cache刷新
  6. 價格變化等重要業務消息

二、工作原理

mysql主從複製

 

從上層來看,複製分成三步:

  1. master將改變記錄到二進制日誌(binary log)中(這些記錄叫做二進制日誌事件,binary log events,可以通過show binlog events進行查看);
  2. slave將master的binary log events拷貝到它的中繼日誌(relay log);
  3. slave重做中繼日誌中的事件,將改變反映它自己的數據。

canal 原理

原理相對比較簡單:

  1. canal模擬mysql slave的交互協議,僞裝自己爲mysql slave,向mysql master發送dump請求

  2. mysql master收到dump請求,開始推送binary log給canal

  3. canal解析binary log對象(原始爲byte流)

三、環境部署

  1. 1.2.1 mysql開啓binlog模式

    (1)查看當前mysql是否開啓binlog模式。

    SHOW VARIABLES LIKE '%log_bin%'

    如果log_bin的值爲OFF是未開啓,爲ON是已開啓。

  2.  

    (2)修改/etc/my.cnf 需要開啓binlog模式。

     

    [mysqld]
    log-bin=mysql-bin
    binlog-format=ROW
    server_id=1

    修改完成之後,重啓mysqld的服務。

    (3) 進入mysql

    mysql -h localhost -u root -p

    (4)創建賬號 用於測試使用

    使用root賬號創建用戶並授予權限

    create user canal@'%' IDENTIFIED by 'canal';
    GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT,SUPER ON *.* TO 'canal'@'%';
    FLUSH PRIVILEGES;

    1.2.2 canal服務端安裝配置

    (1)下載地址canal

    https://github.com/alibaba/canal/releases/tag/canal-1.0.24

     

     

    (3)修改 exmaple下的實例配置

    vi conf/example/instance.properties 
  3. 修改如圖所示的幾個參數。

    一定要註釋掉下面這個參數,這樣就會掃描全庫

    #canal.instance.defaultDatabaseName =

    (3)啓動服務:

    [root@localhost canal]# ./bin/startup.sh

    (4)查看日誌:

    cat /usr/local/canal/logs/canal/canal.log

     

    這樣就表示啓動成功了。

    1.2.3 canal常見錯誤處理

    錯誤信息如下:

    2019-06-17 19:35:20.918 [New I/O server worker #1-2] ERROR c.a.otter.canal.server.netty.handler.SessionHandler - something goes wrong with channel:[id: 0x7f2e9be3, /192.168.200.56:52225 => /192.168.200.128:11111], exception=java.io.IOException: Connection reset by peer

    解決辦法:

    進入mysql中執行下面語句查看binlog所在位置

    mysql> show master status;
    顯示如下:
    +------------------+----------+--------------+------------------+-------------------+
    | File             | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
    +------------------+----------+--------------+------------------+-------------------+
    | mysql-bin.000001 |      120 |              |                  |                   |
    +------------------+----------+--------------+------------------+-------------------+
    1 row in set (0.00 sec)

    如果file中binlog文件不爲 mysql-bin.000001 可以重置mysql

    mysql> reset master;

    查看canal配置文件

    vim usr/local/canal/conf/example/meta.dat

    找到對應的binlog信息更改一致即可, 或者刪除這個meta.dat也可以.

    "journalName":"mysql-bin.000001","position":43581207,"

    1.3 數據監控微服務

    當用戶執行數據庫的操作的時候,binlog 日誌會被canal捕獲到,並解析出數據。我們就可以將解析出來的數據進行相應的邏輯處理。

    我們這裏使用的一個開源的項目,它實現了springboot與canal的集成。比原生的canal更加優雅。

    https://github.com/chenqian56131/spring-boot-starter-canal

    使用前需要將starter-canal安裝到本地倉庫。

    我們可以參照它提供的canal-test,進行代碼實現。

    (1)創建工程模塊changgou_canal,pom引入依賴

    <dependency>
        <groupId>com.xpand</groupId>
        <artifactId>starter-canal</artifactId>
        <version>0.0.1-SNAPSHOT</version>
    </dependency>

    (2)創建包com.changgou.canal ,包下創建啓動類

    @SpringBootApplication
    @EnableCanalClient
    public class CanalApplication {
    ​
        public static void main(String[] args) {
            SpringApplication.run(CanalApplication.class, args);
        }
    }

    (3)添加配置文件application.properties

    canal.client.instances.example.host=192.168.200.128
    canal.client.instances.example.port=11111
    canal.client.instances.example.batchSize=1000

    (4)創建com.changgou.canal.listener包,包下創建類

    @CanalEventListener
    public class BusinessListener {
    ​
        @ListenPoint(schema = "commodity", table = {"gs_brand_info"})
        public void adUpdate(CanalEntry.EventType eventType, CanalEntry.RowData rowData) {
            System.err.println("廣告數據發生變化");
            rowData.getBeforeColumnsList().forEach((c) -> System.err.println("更改前數據: " + c.getName() + " :: " + c.getValue()));
            rowData.getAfterColumnsList().forEach((c) -> System.err.println("更改後數據: " + c.getName() + " :: " + c.getValue()));
        }
    }

    測試:啓動數據監控微服務,修改commodity的gs_brand_info表,觀察控制檯輸出。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章