IT科技

MySQL主从复制问题总结及排查过程分享

字号+作者:益华科技来源:IT科技2025-11-05 11:19:31我要评论(0)

一、概述mysql主从是常用的高可用架构之一,也是使用最广泛的的系统架构。在生产环境中mysql主从复制有时会出现复制错误问题。MySQL主从复制中的问题(Coordinator

一、主制问概述

mysql主从是从复常用的高可用架构之一,也是题总使用最广泛的的系统架构。在生产环境中mysql主从复制有时会出现复制错误问题。结及MySQL主从复制中的排查问题(Coordinator stopped beacause there were errors in the workers......)

二、mysql主从复制原理

mysql主从复制是过程一个异步复制过程(总体感觉是实时同步的),mysql主从复制整个过程是由三个线程完成。slave端有两个线程(SQL线程和IO线程),分享Master端有另一个(IO线程)。主制问

MYSQL主从复制过程在Slave服务器上执行start slave,从复开启主从复制开关。题总此时,结及Slave 服务器上的排查 IO 线程通过 Master 服务器上授权复制用户的请求连接到 Master 服务器。它还请求从 binlog 日志文件的过程指定位置发送 binlog 日志内容。 (配置主从复制任务时执行change master命令时指定日志文件名和位置)Master服务器收到Slave服务器IO线程的分享请求后,Master服务器上的主制问IO线程是基于Slave的。 服务器的IO线程请求的免费源码下载信息在指定binlog日志文件的指定位置后读取binlog日志信息,然后返回给Slave端IO线程。除了binlog日志内容,在日志内容返回后Master服务器端还有一个新的binlog。 binlog 中的文件名和下一个指定的更新位置。当 Slave 服务器的 IO 线程从 Master 服务器获取 IO 线程发送的日志内容、日志文件和位置点时,添加 binlog。日志内容依次写入Slave端自身的relay log文件(mysql-relay-bin.xxxxxx)的末尾。并将新的binlog文件名和位置记录到master-info文件中,以便下次读取Master端新的binlog日志时,可以告诉Master服务器从新的binlog日志中从哪个文件以及从哪里开始请求新的binlog日志内容.Slave server端的SQL线程实时检测本地relay log中新增的日志内容,及时relay log。 该文件的内容被解析成在Master端执行的SQL语句的内容,在Slave服务器本身按照语句的顺序执行SQL的b2b信息网应用。经过上述过程,可以保证在Master和Slave端执行相同的SQL语句。当复制状态正常时,Master 端和lave端的数据是完全一致的。

三、问题及解决方法

1、show slave status \G 显示如下报错信息:

Coordinator stopped because there were error(s) in the worker(s). The most recent failure being: Worker 1 failed executing transaction ...

2、根据提示信息定位报错位置

情况一:"**Delete_rows"

**复制select * from performance_schema.replication_applier_status_by_worker \G1.

原因:在master上删除一条记录,而slave上找不到。

解决方法: 由于master要删除一条记录,而slave上找不到故报错,这种情况主上都将其删除了,那么从机可以直接跳过。

复制stop slave;set global sql_slave_skip_counter=1;start slave;1.2.3.

如上命令若报错:ERROR 1858 (HY000): sql_slave_skip_counter can not be set when the server is running with @@GLOBAL.GTID_MODE = ON. Instead, for each transaction that you want to skip, generate an empty transaction with the same GTID as the transaction或者可以换用如下命令:

复制STOP SLAVE;SET @@SESSION.GTID_NEXT= f396f867-d755-11xxx85-005xxxxxb5a:264261655 --在session里设置gtid_next,即跳过这个GTIDBEGIN; COMMIT; --设置空事物SET SESSION GTID_NEXT = AUTOMATIC; -- 恢复GTIDSTART SLAVE;xxxx1.2.3.4.5.

情况二:"Duplicate "

复制Last_SQL_Error: Could not execute Write_rows event on table xxx;Duplicate entry xxx for key PRIMARY,1.2.

原因:在slave已经有该记录,又在master上插入了同一条记录

解决方法:在从库上删除该记录,或者跳过该记录。然后在master上和slave上再分别确认一下。

情况三:"Update_rows" (还未碰到 待验证)

复制Last_SQL_Error: Could not execute Update_rows event on table xxx;Cant find record in xxx,1.2.

参考原因:在master上更新一条记录,而slave上找不到,丢失了数据。

参考方法:在master上,用mysqlbinlog 分析下出错的binlog日志在干什么。

复制/usr/local/mysql/bin/mysqlbinlog --no-defaults -v -v --base64-output=DECODE-ROWS mysql-bin.000010 | grep -A 10 794#120302 12:08:36 server id 22 end_log_pos 794 Update_rows: table id 33 flags:

STMT_END_F

### UPDATE hcy.t1### WHERE### @1=2 /* INT meta=0 nullable=0 is_null=0 */### @2=bbc /* STRING(4) meta=65028 nullable=1 is_null=0 */### SET### @1=2 /* INT meta=0 nullable=0 is_null=0 */### @2=BTV /* STRING(4) meta=65028 nullable=1 is_null=0 */# at 794#120302 12:08:36 server id 22 end_log_pos 821 Xid = 60COMMIT/*!*/;DELIMITER ;

# End of log file

ROLLBACK /* added by mysqlbinlog */;/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.

在slave上,查找下更新后的那条记录,应该是企商汇不存在的。

复制mysql> select * from t1 where id=2; Empty set (0.00 sec)1.

然后再到master查看

复制ysql> select * from t1 where id=2;+----+------+| id | name |+----+------+| 2 | BTV |+----+------+1 row in set (0.00 sec)1.2.3.4.5.6.7.

把丢失的数据在slave上填补,然后跳过报错即可。

复制mysql> insert into t1 values (2,BTV);Query OK, 1 row affected (0.00 sec)mysql> select * from t1 where id=2;+----+------+| id | name |+----+------+| 2 | BTV |+----+------+1 row in set (0.00 sec)mysql> stop slave ;set global sql_slave_skip_counter=1;start slave;Query OK, 0 rows affected (0.01 sec)Query OK, 0 rows affected (0.00 sec)Query OK, 0 rows affected (0.00 sec)mysql> show slave status\G;

……

Slave_IO_Running:

Yes

Slave_SQL_Running: Yes1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.

四、通用解决方法

mysql主从复制,经常会遇到错误而导致slave端复制中断,这个时候一般就需要人工干预,跳过错误才能继续 跳过错误有两种方式

4.1 跳过指定数量的事务 复制mysql>slave stop;mysql>SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1

#跳过一个事务

mysql>slave start1.2.3. 4.2 跳所有错误或指定类型的错误

修改mysql的配置文件,通过slave_skip_errors参数来跳所有错误或指定类型的错误

复制vi /etc/my.cnf[mysqld]#slave-skip-errors=1062,1053,1146

#跳过指定error no类型的错误

#slave-skip-errors=all #跳过所有错误1.2.3.4.

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 常见的Flash播放器插件安装是这样的:复制代码代码如下:sudo ln -fs /usr/lib/adode-flashplugin/libflashplayer.so /usr/lib/mozilla/plugins/libflashplayer.so 5.重启firefox,即可。BUT....复制代码代码如下:E:无法获得锁/var/lib/dpkg/lock- open (11:资源暂时不可用)复制代码代码如下:sudo rm -rf /var/cache/apt/archives/lock复制代码代码如下:E: dpkg 被中断,您必须手工运行 sudo dpkg --configure -a 解决此问题。既然系统给出了这样的提示,那咱照大爷说的办呗,所以老老实实运行:复制代码代码如下:sudo dpkg --configure -a结果却是:我可以说脏话吗?嗯,不能吗?好吧,继续想办法解决问题!头痛医头脚痛医脚,这里我当时有两条思路。第一是结束掉dpkg的进程,然后再次运行sudo dpkg --configure -a,结果当然是失败告终。所以还是得从卸载掉之前安装的flashplugin下手,值得注意的是,这里并不是运行系统提示我们运行的sudo dpkg --configure -a,而是sudo dpkg -r flashplugin-installer,所以运行:复制代码代码如下:sudo dpkg -r flashplugin-installer但是这时显示:复制代码代码如下:dpkg: error: dpkg status database is locked by another process神马!你又被锁定了?so,老办法搞定它!搞定之后需要再次执行未成功的卸载命令复制代码代码如下:sudo rm -rf /var/lib/dpkg/lock复制代码代码如下:ps -af | grep dpkg这时可以看到dpkg的具体进程信息:复制代码代码如下:root 4439 4427 0 01:42 pts/3 00:00:00 /bin/sh /var/lib/dpkg/info/update-notifier-common.postinst configure 0.119ubuntu8.1 ray 4659 3635 0 01:42 pts/4 00:00:00 grep --color=auto dpkg抓住它就不要放过它!捉住干掉,执行:复制代码代码如下:sudo kill -9 4439至此,卸载工作就算是成功告终了,下面步入安装flashplugin的正轨。首先去Adobe官网下载复制代码代码如下:cd /home/aa/Downloads复制代码代码如下:sudo cp -r usr/* /usrsudo cp libflashplayer.so /usr/lib/firefox/plugins/这时候已经完成了复制工作,可以使用sudo vim /usr/lib/firefox/plugins/libflashplayer.so来验证是否完成了动作,假如看到了一堆的乱码,那就是成功完成了步骤。输入:q即可退出vim。

    常见的Flash播放器插件安装是这样的:复制代码代码如下:sudo ln -fs /usr/lib/adode-flashplugin/libflashplayer.so /usr/lib/mozilla/plugins/libflashplayer.so 5.重启firefox,即可。BUT....复制代码代码如下:E:无法获得锁/var/lib/dpkg/lock- open (11:资源暂时不可用)复制代码代码如下:sudo rm -rf /var/cache/apt/archives/lock复制代码代码如下:E: dpkg 被中断,您必须手工运行 sudo dpkg --configure -a 解决此问题。既然系统给出了这样的提示,那咱照大爷说的办呗,所以老老实实运行:复制代码代码如下:sudo dpkg --configure -a结果却是:我可以说脏话吗?嗯,不能吗?好吧,继续想办法解决问题!头痛医头脚痛医脚,这里我当时有两条思路。第一是结束掉dpkg的进程,然后再次运行sudo dpkg --configure -a,结果当然是失败告终。所以还是得从卸载掉之前安装的flashplugin下手,值得注意的是,这里并不是运行系统提示我们运行的sudo dpkg --configure -a,而是sudo dpkg -r flashplugin-installer,所以运行:复制代码代码如下:sudo dpkg -r flashplugin-installer但是这时显示:复制代码代码如下:dpkg: error: dpkg status database is locked by another process神马!你又被锁定了?so,老办法搞定它!搞定之后需要再次执行未成功的卸载命令复制代码代码如下:sudo rm -rf /var/lib/dpkg/lock复制代码代码如下:ps -af | grep dpkg这时可以看到dpkg的具体进程信息:复制代码代码如下:root 4439 4427 0 01:42 pts/3 00:00:00 /bin/sh /var/lib/dpkg/info/update-notifier-common.postinst configure 0.119ubuntu8.1 ray 4659 3635 0 01:42 pts/4 00:00:00 grep --color=auto dpkg抓住它就不要放过它!捉住干掉,执行:复制代码代码如下:sudo kill -9 4439至此,卸载工作就算是成功告终了,下面步入安装flashplugin的正轨。首先去Adobe官网下载复制代码代码如下:cd /home/aa/Downloads复制代码代码如下:sudo cp -r usr/* /usrsudo cp libflashplayer.so /usr/lib/firefox/plugins/这时候已经完成了复制工作,可以使用sudo vim /usr/lib/firefox/plugins/libflashplayer.so来验证是否完成了动作,假如看到了一堆的乱码,那就是成功完成了步骤。输入:q即可退出vim。

    2025-11-05 11:06

  • Oracle数据库查询登录用户名所属表空间及其使用情况

    Oracle数据库查询登录用户名所属表空间及其使用情况

    2025-11-05 09:33

  • ServiceStack.Redis的问题与修正

    ServiceStack.Redis的问题与修正

    2025-11-05 09:32

  • 少打一个字母,多个 PyPI 软件包引入恶意依赖

    少打一个字母,多个 PyPI 软件包引入恶意依赖

    2025-11-05 09:20

网友点评