MHA自动切换的步骤1、MHA manager启动时的校验阶段 根据配置文件校验复制配置以及识别当前的master导致监控终止情形:复制配置异常,存在的异常slave,一些需要的脚本脚本异常MHA manager启动前可以通过masterha_check_ssh以及masterha_check_repl检测
2、监控master server阶段MHA manager启动成功后,输出日志[info] Ping(SELECT) succeeded, waiting until MySQL doesn't respond.. MHA会定期ping master,缺省的间隔为1秒,直到master死掉MHA manager不会监控slave的状态,任意的Stopping/Restarting/Adding/Removing slaves不影响当前MHA监控 当添加或移除slave节点时,建议修改配置文件以及重启MHA manager
3、侦测到master server异常阶段 3次连续ping master失败,参数secondary_check_script可用于double check
4、开启failover阶段MHA再次读取配置文件(防止主从配置已更改),校验master以及当前masetr的从库MHA也会校验诸如复制异常以及是否存在一些从库有不同的主 启动failover(排除上次failover失败或者failover时间间隔太短)
5、隔离master server阶段(可选)
如果配置文件定义了IP漂移脚本则此时会关闭master IP如果配置文件定义了关闭master脚本,则调用脚本关闭master以避免脑裂
6、恢复一个新的master从slave节点获取最新的end_log_pos (Read_Master_Log_Pos)位置 从上一步获取的位置开始,读取及保存crashed master全部二进制日志文件(ssh可达) 决定新的master(根据配置文件定义的优先级别) 产生差量的binary/relay log events并且apply到新的master
7、激活一个新的master如果配置文件定义了IP漂移脚本则此时会将IP漂移到新master
8、恢复剩余的slave对所有从库并行地产生差量binary/relay log events并用apply差量binary/relay log events到各从库 启动复制
9、通过切换结果(可选) 邮件发送 备份作业,管理工具调整等
新闻热点
疑难解答