MGR最佳配置参考，PFS里的监测指标要全开吗？

GreatSQL万答

本帖最后由 GreatSQL万答于 2022-8-17 16:56 编辑

问题1，有推荐的MGR运行最佳配置参考吗

在「3306π」社区广州站5月22日的分享会上，万里数据库CTO娄帅给出了他建议的配置参考，我们一起来看下：

复制代码

另外，使用MGR的其他建议有：

问题2，MySQL Performance Schema都建议开启哪些监控采集指标（除了默认自动开启的指标）

先说我的看法：一般建议只开启锁(Lock)监控相关的监测指标。

复制代码

其余的监测指标，例如Memory、Statement、Transaction等，有必要再临时开启。因为从MySQL 5.7开始，PFS支持在线动态开启和关闭，因此非必要的话，不建议一口气全开。

一般而言，PFS里的监测指标全开的话，对性能影响一般5%左右，内存消耗1G左右，整体还是可控的。

已知的问题是在Percona分支版本中，如果同时开启PFS和线程池后，很容易发生OOM。

小结：

问题3，mysqld进程占用内存过高怎么排查

遇到一个比较极端的案例，innodb_buffer_pool_size 值仅设置为2GB，但是mysqld进程却占用了25GB的内存。

复制代码

后面会有专门的文章介绍详细分析排查过程，这里先直接说可能的原因以及解决方案。

可能的原因

1、session（会话）级内存buffer参数设置过高，并且连接数也设置过高，例如

复制代码

当连接数较少时，需要消耗的内存并不多。

但是当遇到突发流量时，可能并发连接数会接近打满，再加上可能有产生临时表、额外排序的低效率的SQL频繁出现，这就很容易导致内存占用快速增长。

因此建议调低session级buffer参数值，并有效控制并发连接数，下面是一个比较通用的设置值参考：

复制代码

2、PFS中开启过多检测指标，造成内存消耗过大。

在上面也提到过，全部开启PFS后，可能需要大约1GB内存。不过在高并发并伴随频繁低效SQL的情况下，可能需要消耗更多内存。

3、可能还用到MyISAM引擎，并且 key_buffer_size 设置过大。

不过现在MyISAM引擎大家一般用得也比较少了。

4、程序内存泄漏风险。

可以用valgrind工具检验是否存在这个问题，如果确定的话，可以考虑升级MySQL版本，或者定期在维护时间重启mysqld实例，或者通过高可用切换方式将有风险的实例重启。

5、glibc的内存管理器自身缺陷导致。

简言之，就是调用glibc申请的内存使用完毕后，归还给OS时没有被正常回收，而变成了碎片，随着碎片的不断增长，就能看到mysqld进程占用的内存不断上升。这时候，我们可以调用函数主动回收释放这些碎片。

复制代码

这就像是在InnoDB表中产生太多碎片后，我们主动执行 OPTIMIZE TABLE 重建表的做法。