§ GreatSQL高可用特性之MGR切主后断开应用连接


在单主模式的MGR集群中,当Primary节点发生切换时,旧Primary节点上已创建的应用端连接并不会自动断开,需要应用端进行异常状态判断或设置响应超时控制机制,这会造成应用端短暂不可用。

从GreatSQL 8.0.32-25版本开始,新增选项 greatdb_ha_mgr_exit_primary_kill_connection_mode 用于设置在MGR发生Primary节点切换时,是否主动断开旧Primary节点上的所有连接。该选项默认值为 0/OFF,即默认不会自动断开旧Primary节点上的所有应用连接。

提示:启用该特性后,当MGR Primary节点发生切换时,会断开原来Primary节点上的所有连接,可能会对只读业务、监控业务等应用造成影响,因此请谨慎评估使用。

§ 启用特性

  • 启用 greatdb_ha 插件

修改 my.cnf,添加下面两行

plugin_load_add = greatdb_ha.so

#MGR切主后断开旧Priamry节点上的所有应用连接
loose-greatdb_ha_mgr_exit_primary_kill_connection_mode = 1
1
2
3
4

或者在GreatSQL启动后,手动启用

greatsql> INSTALL PLUGIN greatdb_ha SONAME 'greatdb_ha.so';
greatsql> SET GLOBAL greatdb_ha_mgr_exit_primary_kill_connection_mode = 1;
1
2

§ 其他

在MGR中,当Primary节点因故障处于少数派时,该节点此时不能提供写服务,但是可以提供读服务。如果此时也想让该节点断开所有应用连接,还需设置 group_replication_unreachable_majority_timeout 不为0。在等待 group_replication_unreachable_majority_timeout 时间后,旧Primary节点会主动退出MGR集群,从而触发Primary切换这个动作,也就会自动断开所有应用连接。

如果想确保旧Primary节点退出后其他多数派节点才能选出新Primary节点,可以设置 group_replication_unreachable_majority_timeout < group_replication_member_expel_timeout,这样可以确保处于少数派的旧Primary完全退出后,多数派才会重新选出新Primary节点。

greatsql-wx