合理的监控设置能极大减轻云上业务的运维成本
优采云 发布时间: 2021-07-06 22:32合理的监控设置能极大减轻云上业务的运维成本
合理的监控设置可以大大降低云服务的运维成本和压力。设置合理的监控可以让您实时了解系统业务的运行状态,可以帮助您提前发现问题,避免可能出现的业务故障。同时,报警机制让您在故障发生时第一时间发现问题,缩短故障排除时间,尽快恢复业务。
先决条件
在设置云监控之前,您需要完成以下操作:
背景信息
使用云监控的Dashboard功能,您可以对自己的业务系统的云资源设置全局监控概览,随时查看整个业务系统资源的健康状况。为了更好的监控大屏的显示效果,ECS的CPU、内存、磁盘使用率分组显示,RDS的四个指标分两组显示。
本文以网站为例,介绍如何配置和使用云监控。本例使用ECS、RDS、OSS、负载均衡。
设置报警阈值和报警规则
建议您根据实际业务情况对各种监控指标设置告警阈值。阈值过低会频繁触发告警,影响监控业务体验。阈值过高,阈值触发后没有足够的时间响应和处理告警。
以CPU使用率为例。由于需要为服务器预留部分处理性能,以保证服务器的正常运行,建议将CPU告警阈值设置为70%,连续3次超过阈值后开始告警。
如果您还需要为其他资源设置报警规则,请点击添加报警规则继续设置内存或磁盘的报警规则和报警通知器。示例如下:
设置进程监控
对于常见的web应用,设置进程监控不仅可以实时监控应用进程的运行状态,还可以帮助排查排查。下图是Java进程的相关监控示例。具体操作请参考。
设置站点监控
在云服务器外层的监控服务中,站点监控主要用于模拟真实用户访问情况,实时测试业务可用性,帮助排查排查。
如果以上监控选项不能满足您实际的业务监控需求,您可以使用自定义监控。查看详情。