§ MGR 读写动态 VIP


GreatSQL支持在单主(Single-Primary)模式下,在读写节点(以下称呼:Primary节点)绑定动态VIP,使得高可用切换更便捷。

还可以为只读节点(以下称呼:Secondary节点)绑定只读VIP,业务可以通过该VIP来访问Secondary节点,实现Secondary节点的动态VIP漂移。

特别提醒

  1. 动态VIP解绑以后,通过读写VIP与MGR Primary节点建立的连接会被主动kill掉,前提是需要添加配置 bind_address="0.0.0.0";如果绑定某个固定IP地址,则无法实现MGR Primary节点切换后主动kill连接。该特性可参考:MGR切主后断开应用连接

  2. 为了保证MGR节点间能正常通信,需要在各个MGR节点的系统 /etc/hosts 文件中配置各个节点的host和ip对应关系,更推荐的做法是在每个MGR节点中都配置 report_host,以确保能够通过 performance_schema.REPLICATION_GROUP_MEMBERS 表中的 MEMBER_HOST 列连接到其他节点,否则有可能导致MGR节点角色切换时VIP漂移绑定失败。

  3. 动态绑定VIP需要新启动一个额外通信端口,请修改防火墙规则,确保该端口不会被屏蔽。

  4. 只支持MGR单主模式(single-primary mode),不支持多主模式(multi-primary mode),所以要确保这两个选项设置正确值 group_replication_single_primary_mode = ON 以及 group_replication_enforce_update_everywhere_checks= OFF

  5. 当存在多张网卡时,可能出现 VIP 漂移后无法主动广播 MAC 地址的情况,需要在服务器上定时主动执行 arping 对外广播 MAC 地址。例如:

/usr/sbin/arping -U -I bond0 -c 3 172.17.140.254
1

其中,172.17.140.250 是绑定的 VIP 地址。参数 -U 的作用是无理由的(强制的)ARP模式去更新别的主机上的ARP CACHE列表中的本机的信息,不需要响应。参数 -c 3 表示发送 3 次请求。

也可以采用下面的方法:

/usr/sbin/arping -U -I bond0 -c 3 172.17.140.140 -s 172.117.140.250
1

其中,-s 172.17.140.250 是指定广播的 IP 为绑定的 VIP 地址,172.17.140.140 是其他节点的 IP 地址。

如果想启用 IPv6 支持,有以下几点注意事项:

  1. 目前 IPv6 仅支持同网段下通信。

  2. 在设置 report_host / group_replication_group_seeds / group_replication_local_address 等几个参数时也需要使用 IPv6 地址。

  3. 不支持 IPv4 和 IPv6 混用。

  4. 需要关闭系统层的 DAD 检测,否则 VIP 漂移之后会无法绑定。新增或修改 /etc/sysctl.d/local.conf 文件,配置内容参考如下,编辑保存退出后重启服务器:

net.ipv6.conf.all.accept_dad = 0
net.ipv6.conf.default.accept_dad = 0
net.ipv6.conf.eth0.accept_dad = 0
net.ipv6.conf.eth1.accept_dad = 0
# IPv6 Privacy Extensions (RFC 4941)
net.ipv6.conf.all.use_tempaddr = 0
net.ipv6.conf.default.use_tempaddr = 0
1
2
3
4
5
6
7

§ 启用内置VIP插件

  • 开启新插件

my.cnf 配置文件 [mysqld] 区间中,增加下面这行配置:

[mysqld]
plugin_load_add=greatdb_ha.so
1
2

或者在启动数据库实例后,执行下面的 SQL 命令:

INSTALL PLUGIN greatdb_ha SONAME 'greatdb_ha.so';
1

§ 新增配置参数

my.cnf 配置文件 [mysqld] 区间中,增加下面的配置项。

  • 配置开启内置支持绑定VIP功能
loose-greatdb_ha_enable_mgr_vip = ON
1
  • 配置Primary节点绑定的VIP
loose-greatdb_ha_mgr_vip_ip = "172.17.140.250"
1
  • 配置ARP包广播重复次数。当节点绑定浮动IP以后,会广播ARP包来更新广播域内的ARP缓存,此参数是广播次数,默认是5次,合法取值范围为3-20
loose-greatdb_ha_send_arp_packge_times = 5
1
  • 配置Secondary节点绑定的VIP,如果想绑定多个只读VIP,只需用逗号 , 隔开
loose-greatdb_ha_mgr_read_vip_ips = "172.17.140.251"

# 或绑定多个只读VIP
# loose-greatdb_ha_mgr_read_vip_ips = "172.17.140.251,172.17.140.252"
1
2
3
4
  • 当只读VIP所在节点意外不可用后的处理方式,可选值为 ["TO_PRIMARY", "TO_ANOTHER_SECONDARY"]。设置为 TO_PRIMARY 表示重新将只读VIP绑定到Primary节点上;设置为 TO_ANOTHER_SECONDARY 表示重新将只读VIP绑定到另外的Secondary节点上;默认值是 TO_PRIMARY,即重新绑定到Primary节点上。
loose-greatdb_ha_mgr_read_vip_floating_type = "TO_ANOTHER_SECONDARY"
1
  • 配置动态绑定VIP服务专用通信端口,通过该端口进行通信数据传输。当MGR节点发生状态变更时,Primary节点根据预设的VIP绑定关系,按照 变更小、平均分配 的原则重新分配VIP绑定关系,并将VIP绑定关系通过专用通信端口发送给Secondary节点,Secondary节点根据绑定关系解绑或绑定指定VIP。
loose-greatdb_ha_port = 33062
1
  • 可以强制配置只读VIP的绑定关系。但是一旦发生状态变更,可能需要重新配置:
      1. 该参数不能在配置文件配置
      1. 变更命令只能在主上执行
      1. 不能通过此命令修改写vip的绑定关系
      1. 不能通过此命令添加或移除vip(即拓扑关系里面的vip只能是读、写vip中的成员)
      1. 不能通过此命令添加或移除成员(即拓扑关系里面的uuid只能是先有mgr集群中的uuid,不能增加也不能删除)
SET GLOABL greatdb_ha_vip_tope = "node1_uuid1::vip1; node2_uuid2::vip2,vip3; node3_uuid3::vip4";
1
  • 配置要绑定的网卡名,插件会将vip绑定到MGR主(Primary)节点所在机器的指定网卡上,比如配置为eth0,为了防止网卡原有的ip被覆盖,实际绑定后,会绑定在名为eth0:0的网卡上
loose-greatdb_ha_mgr_vip_nic = 'eth0'
1

如果在同一个服务器中运行多实例,则需要分别对每个实例设置不同的网卡名,而不能多个实例对同一个网卡绑定不同的 VIP。如第一个实例设置 loose-greatdb_ha_mgr_vip_nic = 'eth0:0',第二个实例设置为 loose-greatdb_ha_mgr_vip_nic = 'eth0:1',将二者区分开来。同样地,各个实例也要设置不同的 greatdb_ha_port 参数值。

  • 配置掩码
loose-greatdb_ha_mgr_vip_mask = '255.255.255.0'
1
  • 目前只支持在单主模式下才能启用内置vip特性,所以还需要设置下面参数:
loose-group_replication_single_primary_mode = ON
loose-group_replication_enforce_update_everywhere_checks= OFF
1
2
  • 选项 greatdb_ha_mgr_vip_broad 已废弃不再使用。
  • 上述参数如果没有配置,或者配置格式不对时,内置VIP功能会失效(目前没有格式检查报错的功能)。
  • 除了上述新增参数,其他MGR相关参数按照常规单主MGR配置要求即可。
  • 上述参数支持在线动态修改。

上述配置说明的完整示例如下(MGR组内每个实例都需要配置):

[mysqld]
#GreatSQL MGR vip
plugin-load-add=greatdb_ha.so
loose-greatdb_ha_enable_mgr_vip = ON
loose-greatdb_ha_mgr_vip_ip = "172.17.140.250"
loose-greatdb_ha_mgr_vip_mask = "255.255.255.0"
loose-greatdb_ha_mgr_vip_nic = "eth0"
loose-greatdb_ha_port = 33062
loose-greatdb_ha_mgr_read_vip_ips = "172.17.140.251"
#loose-greatdb_ha_mgr_read_vip_ips = "172.17.140.251,172.17.140.252"
loose-greatdb_ha_mgr_read_vip_floating_type = "TO_ANOTHER_SECONDARY"
loose-greatdb_ha_send_arp_packge_times = 5
report_host = "172.17.140.10"
report_port = 3306

#single-primary mode
loose-group_replication_single_primary_mode = ON
loose-group_replication_enforce_update_everywhere_checks = OFF
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

当 MGR Primary 节点上绑定的 VIP 被手动删除或者出现异常导致 VIP 绑定行为异常时,可以通过在 MGR Primary 节点上执行 SQL 命令 SET GLOBAL greatdb_ha_force_change_mgr_vip = ON 命令去重新获取 MGR 拓扑结构,从而重新绑定 VIP,该命令执行之后,参数 greatdb_ha_force_change_mgr_vip 值仍然为OFF,这个是符合预期的行为。

如果物理网卡由于异常或人为原因关闭又再次启用后,可能会由于 MGR 成员间通信异常而导致 MGR 发生报错,比如发生网络分区等情况,这时候也会导致 VIP 绑定关系发生异常,需要手动修复这个异常错误。修复完毕后,如果 VIP 绑定还是不对的话,可以在 MGR Primary 节点上执行 SQL 命令 SET GLOBAL greatdb_ha_force_change_mgr_vip = ON 操作修复该问题。

§ 启动说明

配置VIP需要相关内核权限,获取相关权限有两种方式,以下三选一即可(推荐采用方法一):

  1. 【推荐方法】修改systemd服务文件,增加AmbientCapabilities参数,例如:
[Unit]
Description=GreatSQL Server
Documentation=man:mysqld(8)
Documentation=http://dev.mysql.com/doc/refman/en/using-systemd.html
After=network.target
After=syslog.target
[Install]
WantedBy=multi-user.target
[Service]
User=mysql
Group=mysql
Type=notify
TimeoutSec=0
PermissionsStartOnly=true
ExecStartPre=/usr/local/GreatSQL-8.0.32-26-Linux-glibc2.28-x86_64/bin/mysqld_pre_systemd
ExecStart=/usr/local/GreatSQL-8.0.32-26-Linux-glibc2.28-x86_64/bin/mysqld $MYSQLD_OPTS
EnvironmentFile=-/etc/sysconfig/mysql
LimitNOFILE = 10000
Restart=on-failure
RestartPreventExitStatus=1
Environment=MYSQLD_PARENT_PID=1
PrivateTmp=false
#增加这行以保证MGR VIP功能可用
AmbientCapabilities=CAP_NET_ADMIN CAP_NET_RAW
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

然后执行 systemctl daemon-reload 重新加载systemd服务,启动GreatSQL就可以。

备注:感谢社区用户 芬达 提供的建议方法。

  1. 通过setcap命令为mysqld二进制文件添加 CAP_NET_ADMINCAP_NET_RAW 的capability。具体命令如下:
#执行该命令需要sudo权限或root
setcap CAP_NET_ADMIN,CAP_NET_RAW+ep /usr/local/GreatSQL-8.0.32-26-Linux-glibc2.28-x86_64/bin/mysqld
1
2

然后将GreatSQL二进制包的lib/private子目录加载到LD_LIBRARY_PATH中:

$ cat /etc/ld.so.conf.d/greatsql.conf

...
/usr/local/GreatSQL-8.0.32-26-Linux-glibc2.28-x86_64/lib/private
1
2
3
4

执行 ldconfig && ldconfig -p | grep -i libpro 确认配置无误:

$ ldconfig && ldconfig -p | grep -i 'libprotobuf.so'

...
	libprotobuf.so.3.19.4 (libc6,x86-64) => /usr/local/GreatSQL-8.0.32-26-Linux-glibc2.28-x86_64/lib/private/libprotobuf.so.3.19.4
1
2
3
4

之后启动GreatSQL即可。

  1. 给mysqld进程的启动用户,例如是mysql用户,设置root权限。

注意

  • 建议采用 systemd 方式管理GreatSQL服务,或者对启动用户用户(如 mysql)开启sudo权限,利用sudo调用 systemd 再启动GreatSQL服务,这样能确保mysqld进程可获得内核权限,成功绑定VIP。
  • setcap 命令为mysqld二进制文件添加capability以后,需要保证登录系统的用户和启动mysqld的用户保持一致,才能确保mysqld进程可获得内核权限。例如:用root用户登录系统,然后再以普通用户(mysql)启动mysqld进程,setcap无法生效,绑定vip时会失败报错。

§ 在 Docker 容器中使用 VIP

GreatSQL Docker 镜像不支持在 Docker 中使用 VIP 功能。原因如下:

  1. 在 Docker 中,无法用 systemd 方式来启动 GreatSQL。
  2. 在打包时,也没有将 mysqld 程序文件属主改为 root,并加上 setcap 提权。

因此,想要在 Docker 中使用 GreatSQL VIP 的话,需要自行处理。下面介绍如何在 Docker 容器中使用 GreatSQL 绑定 VIP 功能。

如果想要在 Docker 中使用 GreatSQL VIP,可以采用以下方式实现:

  1. 创建一个全新容器,并加上 --privileged 参数。
  2. 安装 GreatSQL 软件包(二进制包或 RPM 包都行)。
  3. 修改 mysqld 程序文件属主为 root,并利用 setcap 给 mysqld 程序文件加上提权属性。
  4. 正确配置相关参数。

正常地,在 Docker 容器中是无法执行绑定 VIP 等影响操作系统层的操作,以避免发生安全风险,这就需要先行提权。

想要在 Docker 容器中使用 VIP,在创建容器时,需要先加上 --privileged 参数,例如:

docker run -itd --privileged --hostname t1 --name t1 centos:8 bash
1

进入容器,并查看初始 IP 信息:

[root@t1 /]# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
233: eth0@if234: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default
    link/ether 02:42:ac:11:00:04 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.17.0.4/16 brd 172.17.255.255 scope global eth0
       valid_lft forever preferred_lft forever
1
2
3
4
5
6
7
8
9

接下来,安装 GreatSQL,这里采用 RPM 包方式,具体过程不赘述。

执行提权操作并确认:

[root@t1 /]# setcap CAP_NET_ADMIN,CAP_NET_RAW+ep /usr/sbin/mysqld
[root@t1 /]# chown root:root /usr/sbin/mysqld

[root@t1 /]# getcap /usr/sbin/mysqld
/usr/sbin/mysqld = cap_net_admin,cap_net_raw+ep

[root@t1 /]# ls -la /usr/sbin/mysqld
-rwxr-xr-x 1 root root 67858088 Jul 30 08:18 /usr/sbin/mysqld
1
2
3
4
5
6
7
8

修改 /etc/my.cnf 配置文件(只展示部分相关内容):

[mysqld]
...
user = root
...
loose-plugin_load_add = 'greatdb_ha.so'
loose-greatdb_ha_enable_mgr_vip = ON
loose-greatdb_ha_mgr_vip_nic = 'eth0'
loose-greatdb_ha_mgr_vip_ip = '172.17.0.40'
loose-greatdb_ha_mgr_vip_mask = '255.255.0.0'
loose-greatdb_ha_port = 33062
#loose-greatdb_ha_mgr_read_vip_ips = "172.17.0.41,172.17.0.42"
loose-greatdb_ha_mgr_read_vip_floating_type = "TO_ANOTHER_SECONDARY"
loose-greatdb_ha_send_arp_packge_times = 5
loose-greatdb_ha_mgr_exit_primary_kill_connection_mode = OFF
report_host = 172.17.0.4
report_port = 3306
...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

在已经完成 GreatSQL 数据初始化操作之后,启动 GreatSQL 服务进程(确认是以 root 身份运行):

[root@t1 /]# /usr/sbin/mysqld &

[root@t1 /]# ps -ef | grep mysqld
root        1518       1  1 07:02 ?        00:00:23 /usr/sbin/mysqld
1
2
3
4

进入 GreatSQL 查看 VIP 绑定/运行状态:

[root@GreatSQL][(none)]> SHOW GLOBAL VARIABLES LIKE 'greatdb_ha%';
+--------------------------------------------------+---------------------------------------------------+
| Variable_name                                    | Value                                             |
+--------------------------------------------------+---------------------------------------------------+
| greatdb_ha_enable_mgr_vip                        | ON                                                |
| greatdb_ha_force_change_mgr_vip                  | OFF                                               |
| greatdb_ha_gateway_address                       |                                                   |
| greatdb_ha_mgr_exit_primary_kill_connection_mode | OFF                                               |
| greatdb_ha_mgr_read_vip_floating_type            | TO_ANOTHER_SECONDARY                              |
| greatdb_ha_mgr_read_vip_ips                      |                                                   |
| greatdb_ha_mgr_vip_broad                         | 255.255.255.255                                   |
| greatdb_ha_mgr_vip_ip                            | 172.17.0.40                                       |
| greatdb_ha_mgr_vip_mask                          | 255.255.0.0                                       |
| greatdb_ha_mgr_vip_nic                           | eth0                                              |
| greatdb_ha_port                                  | 33062                                             |
| greatdb_ha_send_arp_packge_times                 | 5                                                 |
| greatdb_ha_vip_tope                              | bcd374fc-593c-11ef-a05e-0242ac110004::172.17.0.40 |
+--------------------------------------------------+---------------------------------------------------+
13 rows in set (0.00 sec)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

查看 VIP 绑定状态:

[root@t1 /]# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
233: eth0@if234: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default
    link/ether 02:42:ac:11:00:04 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.17.0.4/16 brd 172.17.255.255 scope global eth0
       valid_lft forever preferred_lft forever
    inet 172.17.0.40/16 brd 172.17.255.255 scope global secondary eth0:0
       valid_lft forever preferred_lft forever
1
2
3
4
5
6
7
8
9
10
11

在外部宿主系统环境下检测 VIP 是否可连通:

$ ping 172.17.0.40

...
PING 172.17.0.40 (172.17.0.40) 56(84) bytes of data.
64 bytes from 172.17.0.40: icmp_seq=1 ttl=64 time=0.038 ms
64 bytes from 172.17.0.40: icmp_seq=2 ttl=64 time=0.032 ms
...
1
2
3
4
5
6
7

可以看到,已经正确绑定 VIP 并且可连通。

扫码关注微信公众号

greatsql-wx