上云无忧 > 文档中心 > 腾讯云容器服务 TKE 标准集群 - 监控告警概述
容器服务 TKE
腾讯云容器服务 TKE 标准集群 - 监控告警概述

文档简介:
概述: 腾讯云容器服务 TKE 提供集群、节点、工作负载、Pod、Container 5个层面的监控数据收集和展示功能。良好的监控环境为腾讯云容器服务高可靠性、高可用性和高性能提供重要保证。通过告警配置您可以为不同资源收集不同维度的监控数据,方便掌握资源的使用状况,轻松定位故障。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

概述

腾讯云容器服务 TKE 提供集群、节点、工作负载、Pod、Container 5个层面的监控数据收集和展示功能。良好的监控环境为腾讯云容器服务高可靠性、高可用性和高性能提供重要保证。通过告警配置您可以为不同资源收集不同维度的监控数据,方便掌握资源的使用状况,轻松定位故障。
收集监控数据有助于您建立容器集群性能的正常标准。通过在不同时间、不同负载条件下测量容器集群的性能并收集历史监控数据,您可以较为清楚地了解容器集群和服务运行时的正常性能,并能快速根据当前监控数据判断服务运行时是否处于异常状态,及时找出解决问题的方法。例如,您可以监控服务的 CPU 利用率、内存使用率和磁盘 I/O。

监控

容器服务的监控功能使用指引请参见 查看监控数据。 目前覆盖的监控指标请参见 监控及告警指标列表

告警

为了方便您及时发现容器服务的异常状况,以保证您业务的稳定性和可靠性。建议您为所有生产集群配置必要告警,告警配置指引请参见 设置告警。 目前覆盖的告警指标请参见 监控及告警指标列表

相关说明

容器服务提供的监控和告警功能主要覆盖 Kubernetes 对象的核心指标或事件,请结合 腾讯云可观测平台 提供的基础资源监控(如云服务器、块存储、负载均衡等)使用,以保证更细的指标覆盖。
若腾讯云容器服务提供的基础监控能力无法满足您的诉求,您可以使用腾讯云推出的 Prometheus 监控 服务。Prometheus 监控致力于提供轻量、稳定、高可用的服务。保留原生 Prometheus 的特性,支持采集自定义指标,支持多集群监控,支持千万级指标上报,提供基于 Grafana 的优秀可视化能力和默认面板,提供稳定的多渠道的告警能力,无侵入式架构几乎不占用您的集群资源,高度自由化的配置方式助您构建云原生场景下最适合自己的监控平台。具体操作请参见 腾讯云 Prometheus 一键关联监控容器服务
相似文档
  • 操作场景: 腾讯云容器服务默认为所有集群提供基础监控功能,您可以通过以下方式查看容器服务的监控数据。 查看集群指标、 查看节点指标、 查看节点内 Pod 指标、 查看工作负载指标、 查看工作负载内 Pod 指标、 查看 Pod 内 Container 指标。
  • 目前容器服务提供了以下维度的监控告警指标,所有指标均为统计周期内的平均值。
  • 组件介绍: TKE 开发了 elastic-gpu-exporter 组件用于获取 GPU 相关监控指标,主要包含: GPU 卡利用率、 Pod / 容器 GPU 资源利用率。 部署方式: elastic-gpu-exporter 通过 DaemonSet 的方式部署到集群里。
  • 操作场景: 日志采集功能是容器服务 TKE 为用户提供的集群内日志采集工具,可以将集群内服务或集群节点特定路径文件的日志发送至 腾讯云日志服务 CLS、消息队列 CKafka。日志采集功能适用于需要对 Kubernetes 集群内服务日志进行存储和分析的用户。
  • 本文将介绍如何在容器服务控制台配置日志采集规则并投递到 腾讯云日志服务 CLS。 操作步骤: 创建日志采集规则: 1. 登录 容器服务控制台,选择左侧导航栏中的日志管理 > 日志规则。 2. 在日志规则页面上方选择地域和需要配置日志采集规则的集群,单击新建。如下图所示:
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部