0
点赞
收藏
分享

微信扫一扫

监控AKS自动缩放节点池达到最大节点时触发告警

监控AKS自动缩放节点池达到最大节点时触发告警

为了保证运行在AKS内的业务系统的稳定运行,一般情况下都会对Pod配置HPA来保障面对突发流量的时候有足够的资源可以处理请求。和Pod HPA配合使用的就是AKS的节点池自动缩放功能

监控AKS自动缩放节点池达到最大节点时触发告警_K8S

一般情况下对于启用了节点池自动缩放的AKS群集,我们都希望可以在自动缩放达到配置的最大节点是收到告警,这要有助于即时了解群集运行情况,从而可以进一步的调整节点池设置,以更好的匹配其承载的工作负载。接下来我们就一起看下如何配置。

 

对AKS群集启用诊断设置

首先,需要对AKS启用“Kubernetes Cluster Autoscaler”诊断设置,同时将数据发送到指定的Log Analytics工作区,具体配置如下:

找到对应的AKS 群集点击监控 > 诊断设置 > 添加诊断设置:

监控AKS自动缩放节点池达到最大节点时触发告警_AKS_02

创建告警规则

配置好诊断设置以后,需要创建一个告警规则。

导航到“监控” > “警报” > “创建” > “预警规则”,在条件部分选择“自定义日志搜索”,然后粘贴如下KQL查询语句。

注意需要将'AKSClusterName'替换为群集名称。

AzureDiagnostics
| where Category == 'cluster-autoscaler'
    and Resource =~ 'AKSClusterName'
    and log_s has 'exceeds node group set capacity, capping to'
    and TimeGenerated >= ago(5min)
| order by TimeGenerated
| project TimeGenerated, log_s

在警报逻辑为止配置如下:

监控AKS自动缩放节点池达到最大节点时触发告警_K8S_03

在操作部分,选择新建一个操作组,同时选择通知类型为电子邮件并设置电子邮件地址:

监控AKS自动缩放节点池达到最大节点时触发告警_K8S_04

详细信息部分根据实际情况设置提示信息,然后点击“审阅+创建”:

监控AKS自动缩放节点池达到最大节点时触发告警_K8S_05

 测试日志告警

 配置完成后,可以在AKS群集内启用一个消耗资源的Pod,从而触发AKS节点的自动扩展,节点扩展达到上限后所配置的邮箱会收到如下告警:

监控AKS自动缩放节点池达到最大节点时触发告警_安全_06

 

举报

相关推荐

0 条评论