running_db 发表于 2023-11-1 11:25:43

mgr成员SECONDARY角色的io特别高,

环境描述:
CentOS 7.93.10.0-1160.62.1.el7.x86_64
mysql 8.0.22 mgr环境

问题描述:

通过iostat -x -k 1查看SECONDARY角色服务器的io,发现写入很高,400-500M/s左右。查看网络流量,也不是特别高,数据同步主库的流量也不大, iotop看mysql最大的写入才10-30M左右,mysql show processlist也没有卡的thread,开启了super_read_only的。执行stop group_replication后写入就降下来了,做了两次对比,可以看出是mgr造成的,这个么高的写入是在干啥呢,有什么方法定位什么进程再写,写什么?

<div># iostat 查看io结果
avg-cpu:%user   %nice %system %iowait%steal   %idle
          20.51    0.00    7.44    4.68    0.00   67.37

Device:         rrqm/s   wrqm/s   r/s   w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_awaitsvctm%util
sda               0.00   1.00105.00 6629.001944.00 404744.50   120.79   2.39    0.36   16.96    0.09   0.1277.80
sdb               0.00   0.00    0.00    0.00   0.00   0.00   0.00   0.00    0.00    0.00    0.00   0.00   0.00

avg-cpu:%user   %nice %system %iowait%steal   %idle
          22.88    0.00    7.78    3.15    0.00   66.20

Device:         rrqm/s   wrqm/s   r/s   w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_awaitsvctm%util
sda               0.00   4.00   66.00 8575.001016.00 434029.50   100.69   2.00    0.23   15.45    0.11   0.0764.50
sdb               0.00   0.00    0.00    0.00   0.00   0.00   0.00   0.00    0.00    0.00    0.00   0.00   0.00

# sar 网卡流量结果

<div>10:37:37 AM   IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/srxmcst/s
10:37:38 AM      eno1   49.00      0.00      4.48      0.00      0.00      0.00      3.00
10:37:38 AM      eno2   3551.00   2607.00   2156.61    453.79      0.00      0.00      4.00
10:37:38 AM      eno3   2050.00      0.00    796.99      0.00      0.00      0.00      6.00
10:37:38 AM      eno4   5592.00      0.00   2820.35      0.00      0.00      0.00      7.00
10:37:38 AM      lo   50.00   50.00   12.73   12.73      0.00      0.00      0.00

10:37:38 AM   IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/srxmcst/s
10:37:39 AM      eno1   39.00      0.00      2.52      0.00      0.00      0.00      2.00
10:37:39 AM      eno2   1727.00    720.00   1954.22    100.96      0.00      0.00      3.00
10:37:39 AM      eno3   1671.00      0.00    556.97      0.00      0.00      0.00      3.00
10:37:39 AM      eno4   5938.00      0.00   3517.33      0.00      0.00      0.00      9.00
10:37:39 AM      lo      2.00      2.00      0.10      0.10      0.00      0.00      0.00</div>

# iotop

<div>Total DISK READ :   237.74 K/s | Total DISK WRITE :   23189.81 K/s
Actual DISK READ:   239.31 K/s | Actual DISK WRITE:307229.52 K/s</div></div>



yejr 发表于 2023-11-2 21:58:47

参考文档:https://greatsql.cn/docs/8032/user-manual/6-oper-guide/3-monitoring-and-alerting.html#_4-mgr%E7%9B%91%E6%8E%A7

看看MGR的状态监控,估计是在追primary节点发送过来的事务

running_db 发表于 2023-11-3 11:00:02

yejr 发表于 2023-11-2 21:58
参考文档:https://greatsql.cn/docs/8032/user-manual/6-oper-guide/3-monitoring-and-alerting.html#_4-m ...
差距很小。还有一个mgr节点,io没这么高,大约60-100M左右,不像这个达到300-500左右。


+--------------------------------------+--------------------+-----------------------+------------+-----------+------------+
| id                                 | trx_tobe_certified | relaylog_tobe_applied | trx_chkd   | trx_done| proposed   |
+--------------------------------------+--------------------+-----------------------+------------+-----------+------------+
| 45963125-934f-11ed-b244-9418820bd775 |                  0 |                     0 |   54580490 |54580502 |          0 |
| 4ced7a3e-38fa-11eb-bcc5-0242ac10000a |                  0 |                  11 |223563784 | 223563776 |          0 |
| 5fac9d16-f652-11ed-9a51-d4f5ef7d2e2c |                  0 |                     0 | 2458887987 |    189112 | 2458699014 |
+--------------------------------------+--------------------+-----------------------+------------+-----------+------------+
3 rows in set (0.00 sec)

*************************** 1. row ***************************
RECEIVED_TRANSACTION_SET: 0bb4dd22-35d1-11eb-8cf4-00155d011502:1-2884547767
*************************** 2. row ***************************
RECEIVED_TRANSACTION_SET: 0bb4dd22-35d1-11eb-8cf4-00155d011502:1-2884547767

yejr 发表于 2023-11-5 22:59:58

running_db 发表于 2023-11-3 11:00
差距很小。还有一个mgr节点,io没这么高,大约60-100M左右,不像这个达到300-500左右。




那就用iotop好好排查下
页: [1]
查看完整版本: mgr成员SECONDARY角色的io特别高,