环境:8.0.25 Greatsql-MGR 1、节点所有机器的配置都是一样,无任何差异 2、该节点没有承担额外的负载,基本无读 3、CPU负载基本在20%以下,问题期间该节点的CPU信息和QPS信息 4、磁盘I/O最高在60%,负载都很低 5、死锁信息 1、生产业务设计中有大量的replace into,导致MGR其中一个节点的COUNT_TRANSACTIONS_REMOTE_IN_APPLIER_QUEUE一值增加,导致主节点的commit、update、insert越来越慢,最后接近5s。(产生大量的锁冲突) 2、开发侧修改了一部分replace into的逻辑。死锁不再继续增加。 3、选择关闭从节点的锁冲突检测,然依然没有降低,依然持续上升。 4、最终选择重启该节点,重启从新加入MGR集群,COUNT_TRANSACTIONS_IN_QUEUE重新回放 5、回放结束后,该节点恢复正常,主节点commit、update、insert恢复正常 6、COUNT_TRANSACTIONS_REMOTE_IN_APPLIER_QUEUE监控中的这个值,目前只能通过重启重新回放才能恢复吗?还是通过其他方式可以降低和解决这个等待事务? |
yejr
2023-12-12 11:15:58
| ||
chongzh
2023-12-12 14:03:21
| ||
喜欢就关注我公众号:DBA烂笔头
|
||
yejr
2023-12-12 14:43:15
| ||
myron_mei
2023-12-12 22:56:21
| ||
myron_mei
2023-12-12 22:57:55
| ||
yejr
2023-12-13 10:11:38
| ||
合作电话:010-64087828
社区邮箱:greatsql@greatdb.com