开源数据同步神器——canal

liangwenrong

2019-01-10

介绍

canal 是阿里巴巴的一个开源项目，基于java实现，整体已经在很多大型的互联网项目生产环境中使用，包括阿里、美团等都有广泛的应用，是一个非常成熟的数据库同步方案，基础的使用只需要进行简单的配置即可。

canal是通过模拟成为mysql 的slave的方式，监听mysql 的binlog日志来获取数据，binlog设置为row模式以后，不仅能获取到执行的每一个增删改的脚本，同时还能获取到修改前和修改后的数据，基于这个特性，canal就能高性能的获取到mysql数据数据的变更。

开源数据同步神器——canal

使用

canal的介绍在官网有非常详细的说明，如果想了解更多，大家可以移步官网（https://github.com/alibaba/canal）了解。我这里补充下使用中不太容易理解部分。

canal的部署主要分为server端和client端。

server端部署好以后，可以直接监听mysql binlog,因为server端是把自己模拟成了mysql slave，所以，只能接受数据，没有进行任何逻辑的处理，具体的逻辑处理，需要client端进行处理。

client端一般是需要大家进行简单的开发。https://github.com/alibaba/canal/wiki/ClientAPI 有一个简单的示例，很容易理解。

canal Adapter

为了便于大家的使用，官方做了一个独立的组件Adapter，Adapter是可以将canal server端获取的数据转换成几个常用的中间件数据源，现在支持kafka、rocketmq、hbase、elasticsearch，针对这几个中间件的支持，直接配置即可，无需开发。上文中，如果需要将mysql的数据同步到elasticsearch，直接运行 canal Adapter，修改相关的配置即可。

常见问题

无法接收到数据，程序也没有报错？
一定要确保mysql的binlog模式为row模式，canal原理是解析Binlog文件，并且直接中文件中获取数据的。
Adapter 使用无法同步数据？
按照官方文档，检查配置项，如sql的大小写，字段的大小写可能都会有影响，如果还无法搞定，可以自己获取代码调试下，Adapter的代码还是比较容易看懂的。

canal Adapter elasticsearch 改造

因为有了canal和canal Adapter这个神器，同步到elasticsearch、hbase等问题都解决了，但是自己的开发的过程中发现，Adapter使用还是有些问题，因为先使用的是elasticsearch同步功能，所以对elasticsearch进行了一些改造：

elasticsearch初始化

一个全新的elasticsearch无法使用，因为没有创建elasticsearch index和mapping,增加了对应的功能。

elasticsearch配置文件mapping节点增加两个参数：

enablefieldmap: true
 fieldmap:
 id: "text"
 name: "text"
 c_time: "text"

enablefieldmap 是否需要自动生成fieldmap，默认为false,如果需要启动的时候就生成这设置为true,并且设置

fieldmap,类似elasticsearch mapping中每个字段的类型。

esconfig bug处理

代码中获取binlog的日志处理时，必须要获取数据库名，但是当获取binlog为type query时，是无法获取

数据库名的，此处有bug，导致出现 "Outer adapter write failed" ,且未输出错误日志，修复此bug.

后续计划

增加rabbit MQ的支持
增加redis的支持

源码

源码地址：https://github.com/itmifen/canal

canal elasticsearch adapter 数据同步开放源代码

安科网

开源数据同步神器——canal

liangwenrong

介绍

使用

常见问题

后续计划

源码

liangwenrong

相关推荐

Binlog还能这样用之Canal篇

Canal v1.1.4版本避坑指南

canal demo搭建全记录

Canal——原理架构及应用场景

利用Canal完成Mysql数据同步Redis

Cannal实现数据异构

Canal相关理解

利用Canal完成Mysql数据同步Redis

canal 1.0.25 快速启动配置

使用阿里巴巴 Canal 增量订阅&消费组件同步 MySQL 数据到 Redis

阿里巴巴 MySQL 数据库 binlog 的增量订阅&消费组件

MySQL增量订阅&消费组件Canal POC

由 Canal 组件分析集成中间件架构的一般过程

基于阿里巴巴开源的分布式数据同步系统安装配置文档otter

由 Canal 组件分析集成中间件架构的一般过程

liangwenrong