2022年是激动人心的一年雷竞技下载官网Praybet雷竞技竞猜在线官网ercona监控和管理(PMM)。我们增加和改进了许多功能,包括警报和备份管理。这些更新旨在保持数据库以最佳性能运行并简化数据库操作。但是随着公司的发展,看到对数据库的需求越来越大,我们需要确保PMM也保持可伸缩性,以便在处理环境的其他部分时不需要担心它的性能。

PMM2使用victoria ametrics (VM)作为其度量存储引擎。雷竞技下载官网Percona的联合创始人Peter Zaitsev写了一篇详细的文章关于从普罗米修斯到维多利亚metrics的迁移的帖子,就性能而言,PMM2最显著的差异之一来自VM的使用,这也可以从Prometheus和VictoriaMetrics之间node_export度量的性能比较

规划PMM服务器主机实例的资源可能很棘手,因为这些数字可能会根据PMM监视的DB实例而变化。raybet雷竞技竞猜在线官网例如,每秒摄取较多的数据样本或具有大量表(1000+)的监视数据库会影响性能;raybet雷竞技竞猜在线官网类似地,导出器的配置或自定义度量解析也会对PMM服务器主机的性能产生影响。重点是PMM的扩展不是线性的,这篇文章只是为了给你一个大概的想法,并在计划建立PMM2时为我们的用户提供一个良好的起点。

victoria ametrics团队也发布了一些最佳实践,在规划建立pmmm2的资源时也可以参考。

PMM2的主页仪表板
我们已经用默认配置测试了PMM 2.33.0版本,它可以监视1000多个MySQL服务,数据库在默认的sysbench读写工作负载下运行。raybet雷竞技竞猜在线官网我们观察到PMM监视1000个数据库服务的总体性能很好,没有观察到明显的资源使用峰值;raybet雷竞技竞猜在线官网这是一个巨大的性能和容量比以前的版本!请注意,这些测试的重点是围绕标准指标的收集和显示,我们将在未来的博客文章中对一些更密集的查询分析(QAN)性能数据进行基准测试。

容量规划和设置细节

我们使用专用的32核CPU和64GB RAM进行测试。

PMM服务器主机系统的CPU使用率

如上图所示,CPU使用率平均为24%。

PMM服务器主机系统的内存利用率

虚拟内存利用率平均为48 GB RAM。

VictoriaMetrics维护一个用于映射的内存缓存活动时间序列转换为内部系列id。缓存大小取决于主机系统中VictoriaMetrics的可用内存;因此,在主机系统上规划足够的RAM对于更好的性能是很重要的,以避免占用过多的内存缓慢的插入

如果我们讨论监视1,000个数据库服务的实例的总体磁盘使用量,那么每个数据点的平均磁盘使用量大约是.25字raybet雷竞技竞猜在线官网节,或者您应该计划大约在500gb之间的存储空间—默认保留30天的存储空间为1tb。

平均数据点大小

平均数据点大小

维多利亚度量的统计数据

我们建议PMM服务器至少有两个GB RAM和一个双核系统,这是设置监视数据库服务的最低要求。raybet雷竞技竞猜在线官网使用这个推荐的最小设置,您最多可以监视三个数据库,甚至更多,这取决于您的环境中已经提到的一raybet雷竞技竞猜在线官网些因素。

根据我们的观察和我们对PMM所做的各种设置,总的来说,对于一个相当强大的PMM服务器主机系统(8 + GB RAM和8 +核),最优的目标是每个核监视32个数据库或每GB RAM监视16个数据库,因此在为各自的监视设置规划资源时,记住这一点非常有用。raybet雷竞技竞猜在线官网

被监控的数据库服务数量raybet雷竞技竞猜在线官网 最低推荐要求
0 - 250的服务 8核,16gb内存
250 - 500年服务 16核,32gb内存
500 - 1000年服务 32核,64 GB内存

通过用户体验和性能研究,PMM的可伸缩性显著提高

在PMM2的早期版本中,Home Dashboard不能加载超过400 DB的服务,导致用户体验很糟糕。与UI元素(如过滤器和日期选择器)交互在以前是不可能的。我们对1,000个数据库服务的Home Dashboard进行了全面的研究,以提高可伸缩性和用户体验。我们的研究结果显示,Home Dashboard的设计严重影响了可伸缩性,UI上的糟糕UX导致页面反应迟钝。

我们重新设计了Home Dashboard作为解决方案,结果非常显著。新的仪表板提供了更好的用户体验,显示了更多的关键信息,并为高达1000 DB服务的环境提供了可伸缩性。总体加载时间显著提高,从50多秒缩短到大约20秒,UI上不再出现任何无响应错误。用户现在可以与其他仪表板上的过滤器无缝交互!

我们仍在努力解决一些限制

  • 实例概述PMM附带的仪表板不能很好地处理如此大量的实例,因此在监视如此多的数据库时,建议不要依赖它们。raybet雷竞技竞猜在线官网它们只能在最多400个数据库服务的情况下正常工作。
  • 有一个已知问题由于一些较大的查询请求,会出现“URI太大”弹出消息,这也会导致设置一个大的时间范围来观察被监控数据库的指标。raybet雷竞技竞猜在线官网我们的团队计划很快对此进行修复。
  • 当监控400多个数据库服务时,加载QAN需要50+秒。raybet雷竞技竞猜在线官网此外,当在大量服务/节点列表中搜索和应用过滤器时,与QAN的整体交互感觉滞后。我们的团队正在努力改善QAN应用程序的整体用户体验,这将很快在PMM的未来版本中得到修复。

不是公式,而是经验法则

PMM中的总体资源使用情况取决于配置和工作负载,并且可能因设置的不同而有所不同,因此很难说“要监视这么多DB服务,就需要这么大的机器”。raybet雷竞技竞猜在线官网本文旨在展示PMM服务器如何在默认设置和所有数据库主机节点配置为默认度量模式(push)的情况下扩展和执行。

我们还计划在另一篇关于性能和可伸缩性的后续文章中强调不同仪表板和QAN的结果,展示我们在过去几个PMM版本中所做的改进。

告诉我们你对PMM的看法!

我们对我们所做的所有改进感到兴奋,但我们还没有完成!对我们如何改进PMM有一些想法,或者想问问题吗?来Percona论坛和我们谈谈,让我们知道你在雷竞技下载官网想什么

PMM论坛

订阅
通知的
客人

0评论
内联反馈
查看所有评论