事务的Xid_log_event 存在,就要提交。事务的Xid_log_event 不存在,就要回滚。恢复的过程非常简单:从Binlog中读出所有的Xid_log_event 告诉InnoDB提交这些XID的事务InnoDB回滚其它的事务。
当启动Binlog后,事务会产生Binlog Event,这些Event被看做事务数据的一部分。因此要保证事务的Binlog Event和InnoDB引擎中的数据的一致性。
为了保证带Binlog的CrashSafe,MySQL内部使用的两阶段提交(Two Phase Commit)。2 - MySQL的Two Phase Commit(2PC) 在开启Binlog后,MySQL内部会自动将普通事务当做一个XA事务来处理:
自动为每个事务分配一个唯一的ID;COMMIT会被自动的分成Prepare和Commit两个阶段;Binlog会被当做事务协调者(Transaction Coordinator),Binlog Event会被当做协调者日志。
想了解2PC,可以参考文档:【
https://en.wikipedia.org/wiki/Two-phase_commit_protocol。
分布式事务ID(XID) 使用2PC时,MySQL会自动的为每一个事务分配一个ID,叫XID。XID是唯一的,每个事务的XID都不相同。XID会分别被Binlog和InnoDB记入日志中,供恢复时使用。MySQ内部的XID由三部分组成:
前缀部分 前缀部分是字符串"MySQLXid";Server ID部分 当前MySQL的server_id;query_id部分 为了保证XID的的唯一性,数字部分使用了query_id。MySQL内部会自动的为每一个语句分配一个query_id,全局唯一。参考代码:sql/xa.h的struct xid_t结构。
事务的协调者Binlog Binlog在2PC中充当了事务的协调者(Transaction Coordinator)。由Binlog来通知InnoDB引擎来执行prepare,commit或者rollback的步骤。事务提交的整个过程如下:
1. 协调者准备阶段(Prepare Phase) 告诉引擎做Prepare,InnoDB更改事务状态,并将Redo Log刷入磁盘。
2. 协调者提交阶段(Commit Phase) 2.1 记录协调者日志,即Binlog日志。2.2 告诉引擎做commit。注意:记录Binlog是在InnoDB引擎Prepare(即Redo Log写入磁盘)之后,这点至关重要。
在MySQ的代码中将协调者叫做tc_log。在MySQL启动时,tc_log将被初始化为mysql_bin_log对象。参考sql/binlog.cc中的init_server_components():if (opt_bin_log) tc_log= &mysql_bin_log;而事务提交时,会依次执行:tc_log->prepare();tc_log->commit();参考代码:sql/binlog.cc中的ha_commit_trans()。当mysql_bin_log是tc_log时,prepare和commit的代码在sql/binlog.cc中:MYSQL_BIN_LOG::prepare();MYSQL_BIN_LOG::commit()。
协调者日志Xid_log_event 作为协调者,Binlog需要将事务的XID记入日志,供恢复时使用。Xid_log_event有以下几个特点:
仅记录query_id 因为前缀部分不变,server_id已经记录在Event Header中,Xid_log_event中只记录query_id部分。标志事务的结束 在Binlog中相当于一个事务的COMMIT语句。一个事务在Binlog中看起来时这样的:Query_log_event("BEGIN");DML产生的events; Xid_log_event;DDL没有BEGIN,也没有Xid_log_event ;仅InnoDB的DML会产生Xid_log_event 因为MyISAM不支持2PC所以不能用Xid_log_event ,但会有COMMIT Event。Query_log_event("BEGIN");DML产生的events;Query_log_event("COMMIT")。
问题:Query_log_event("COMMIT")和Xid_log_event 有不同的影响吗?Xid_log_event 中的Xid可以帮助master实现CrashSafe。Slave的CrashSafe不依赖Xid_log_event 事务在Slave上重做时,会重新产生XID。所以Slave服务器的CrashSafe并不依赖于Xid_log_event 。Xid_log_event 和Query_log_event("COMMIT"),只是作为事务的结尾,告诉Slave Applier去提交这个事务。因此二者在Slave上的影响是一样的。
3 - 恢复(Recovery) 这个机制是如何保证MySQL的CrashSafe的呢,我们来分析一下。这里我们假设用户设置了以下参数来保证可靠性:
恢复前事务的状态 在恢复开始前事务有以下几种状态:
InnoDB中已经提交 根据前面2PC的过程,可知Binlog中也一定记录了该事务的的Events。所以这种事务是一致的不需要处理。InnoDB中是prepared状态,Binlog中有该事务的Events。需要通知InnoDB提交这些事务。InnoDB中是prepared状态,Binlog中没有该事务的Events。因为Binlog还没记录,需要通知InnoDB回滚这些事务。Before InnoDB Prepare 事务可能还没执行完,因此InnoDB中的状态还没有prepare。根据2PC的过程,Binlog中也没有该事务的events。需要通知InnoDB回滚这些事务。
恢复过程 从上面的事务状态可以看出:恢复时事务要提交还是回滚,是由Binlog来决定的。
事务的Xid_log_event 存在,就要提交。事务的Xid_log_event 不存在,就要回滚。恢复的过程非常简单:
从Binlog中读出所有的Xid_log_event 告诉InnoDB提交这些XID的事务InnoDB回滚其它的事务。2024-12-12