IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    MySQL5.1 中Innodb事务完整性Bug

    朝阳发表于 2009-03-17 11:43:50
    love 0

    今天和 51.com 的 MySQL DBA 景春同学一起遇到了个 MySQL 非常扯淡的Bug:在 5.1 版本中,Innodb 存储引擎如果使用autocommit=0的情况下,单条SQL在执行过程中如果异常中断的话,事务完整性可能无法保证,不论是STATEMENT还是MIXED的binlog_format,都存在相同的问题,可以重现,屡试不爽。
    测试环境如下:
    OS:SunOS 5.10 Generic_137138-09
    DB:MySQL 5.1.31/32-log Source distribution
    binlog_format:MIXED/STATEMENT
    tx_isolation:REPEATABLE-READ

    测试脚本如下:

    [root@dc-5 /tmp]#cat deletetest.sh
    #/bin/sh
    mysql -uadmin -h127.0.0.1 -pxxx -e"set autocommit=0;delete from test.test;"
    [root@dc-5 /tmp]#cat killtest.sh
    #/bin/sh
    mysqladmin -uroot processlist |grep "admin"|awk '{print $2}'|xargs mysqladmin -uroot kill

    将删除的脚本放到后台执行,然后执行kill脚本:

    [root@dc-5 /tmp]#time ./deletetest.sh &
    [1] 6708
    [root@dc-5 /tmp]#./killtest.sh
    ERROR 1053 (08S01) at line 1: Server shutdown in progress

    real 0m2.901s
    user 0m0.007s
    sys 0m0.007s
    [root@dc-5 /tmp]#
    [1]+ Exit 1 time ./deletetest.sh

    到Master 和 Slave 两端分别检查数据,看上去很正常:

    root@dc-5 : (none) 01:35:43> select count(*) from test.test;
    +----------+
    |
    count(*) |
    +----------+
    |
    1000000|
    +----------+
    1 row in set (1.71 sec)

    root@dc-6 : (none) 01:36:01> select count(*) from test.test;
    +----------+
    |
    count(*) |
    +----------+
    |
    1000000|
    +----------+
    1 row in set (1.69 sec)

    我们再将set autocommit=0拿掉试试看,也就是允许系统自动提交:

    [root@dc-5 /tmp]#cat deletetest.sh
    #/bin/sh
    mysql -uadmin -h127.0.0.1 -pxxx -e"delete from offer1.test;"
    [root@dc-5 /tmp]#time ./deletetest.sh &
    [1] 6722
    [root@dc-5 /tmp]#./killtest.sh
    [root@dc-5 /tmp]#ERROR 1053 (08S01) at line 1: Server shutdown in progress

    real 0m2.462s
    user 0m0.006s
    sys 0m0.007s

    [1]+ Exit 1 time ./deletetest.sh

    再检查 Master 和 Slave 两端的数据:

    root@dc-5 : (none) 01:40:30> select count(*) from offer1.test;
    +----------+
    |
    count(*) |
    +----------+
    |
    887377 |
    +----------+
    1 row in set (1.66 sec)
    root@dc-6 : offer1 01:44:05> select count(*) from offer1.test;
    +----------+
    |
    count(*) |
    +----------+
    |
    1000000|
    +----------+
    1 row in set (1.70 sec)

    Master 和 Slave 两端数据居然出现不一致,在 Master 端已经删除掉了部分数据,在 Slave 端却没有任何变化。执行 deletetest.sh 脚本前后检查 Master 的 Binary Log(SHOW Master STATUS),没有任何变化。这个 Bug 简直是太扯淡了,数据完全没有事务完整性可言了啊。



沪ICP备19023445号-2号
友情链接