mgr成员SECONDARY角色的io特别高,
环境描述:CentOS 7.93.10.0-1160.62.1.el7.x86_64
mysql 8.0.22 mgr环境
问题描述:
通过iostat -x -k 1查看SECONDARY角色服务器的io,发现写入很高,400-500M/s左右。查看网络流量,也不是特别高,数据同步主库的流量也不大, iotop看mysql最大的写入才10-30M左右,mysql show processlist也没有卡的thread,开启了super_read_only的。执行stop group_replication后写入就降下来了,做了两次对比,可以看出是mgr造成的,这个么高的写入是在干啥呢,有什么方法定位什么进程再写,写什么?
<div># iostat 查看io结果
avg-cpu:%user %nice %system %iowait%steal %idle
20.51 0.00 7.44 4.68 0.00 67.37
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_awaitsvctm%util
sda 0.00 1.00105.00 6629.001944.00 404744.50 120.79 2.39 0.36 16.96 0.09 0.1277.80
sdb 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
avg-cpu:%user %nice %system %iowait%steal %idle
22.88 0.00 7.78 3.15 0.00 66.20
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_awaitsvctm%util
sda 0.00 4.00 66.00 8575.001016.00 434029.50 100.69 2.00 0.23 15.45 0.11 0.0764.50
sdb 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
# sar 网卡流量结果
<div>10:37:37 AM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/srxmcst/s
10:37:38 AM eno1 49.00 0.00 4.48 0.00 0.00 0.00 3.00
10:37:38 AM eno2 3551.00 2607.00 2156.61 453.79 0.00 0.00 4.00
10:37:38 AM eno3 2050.00 0.00 796.99 0.00 0.00 0.00 6.00
10:37:38 AM eno4 5592.00 0.00 2820.35 0.00 0.00 0.00 7.00
10:37:38 AM lo 50.00 50.00 12.73 12.73 0.00 0.00 0.00
10:37:38 AM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/srxmcst/s
10:37:39 AM eno1 39.00 0.00 2.52 0.00 0.00 0.00 2.00
10:37:39 AM eno2 1727.00 720.00 1954.22 100.96 0.00 0.00 3.00
10:37:39 AM eno3 1671.00 0.00 556.97 0.00 0.00 0.00 3.00
10:37:39 AM eno4 5938.00 0.00 3517.33 0.00 0.00 0.00 9.00
10:37:39 AM lo 2.00 2.00 0.10 0.10 0.00 0.00 0.00</div>
# iotop
<div>Total DISK READ : 237.74 K/s | Total DISK WRITE : 23189.81 K/s
Actual DISK READ: 239.31 K/s | Actual DISK WRITE:307229.52 K/s</div></div>
参考文档:https://greatsql.cn/docs/8032/user-manual/6-oper-guide/3-monitoring-and-alerting.html#_4-mgr%E7%9B%91%E6%8E%A7
看看MGR的状态监控,估计是在追primary节点发送过来的事务 yejr 发表于 2023-11-2 21:58
参考文档:https://greatsql.cn/docs/8032/user-manual/6-oper-guide/3-monitoring-and-alerting.html#_4-m ...
差距很小。还有一个mgr节点,io没这么高,大约60-100M左右,不像这个达到300-500左右。
+--------------------------------------+--------------------+-----------------------+------------+-----------+------------+
| id | trx_tobe_certified | relaylog_tobe_applied | trx_chkd | trx_done| proposed |
+--------------------------------------+--------------------+-----------------------+------------+-----------+------------+
| 45963125-934f-11ed-b244-9418820bd775 | 0 | 0 | 54580490 |54580502 | 0 |
| 4ced7a3e-38fa-11eb-bcc5-0242ac10000a | 0 | 11 |223563784 | 223563776 | 0 |
| 5fac9d16-f652-11ed-9a51-d4f5ef7d2e2c | 0 | 0 | 2458887987 | 189112 | 2458699014 |
+--------------------------------------+--------------------+-----------------------+------------+-----------+------------+
3 rows in set (0.00 sec)
*************************** 1. row ***************************
RECEIVED_TRANSACTION_SET: 0bb4dd22-35d1-11eb-8cf4-00155d011502:1-2884547767
*************************** 2. row ***************************
RECEIVED_TRANSACTION_SET: 0bb4dd22-35d1-11eb-8cf4-00155d011502:1-2884547767
running_db 发表于 2023-11-3 11:00
差距很小。还有一个mgr节点,io没这么高,大约60-100M左右,不像这个达到300-500左右。
那就用iotop好好排查下
页:
[1]