上云无忧 > 文档中心 > 腾讯云容器服务实战教程 - 腾讯云 Prometheus 一键关联监控容器服务
容器服务 TKE
腾讯云容器服务实战教程 - 腾讯云 Prometheus 一键关联监控容器服务

文档简介:
实践背景: 众所周知,Prometheus 是容器场景的最佳监控工具,但自建 Prometheus 对于运维人力有限的中小型企业而言,成本太高;对于业务发展快速的大企业又容易出现性能瓶颈。因而使用云上托管 Prometheus 已成为越来越多上云企业的第一选择。下列将为您介绍如何使用 托管 Prometheus 监控腾讯云容器服务 TKE。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

实践背景

众所周知,Prometheus 是容器场景的最佳监控工具,但自建 Prometheus 对于运维人力有限的中小型企业而言,成本太高;对于业务发展快速的大企业又容易出现性能瓶颈。因而使用云上托管 Prometheus 已成为越来越多上云企业的第一选择。下列将为您介绍如何使用 托管 Prometheus 监控腾讯云容器服务 TKE。

前提条件

已创建腾讯云 Prometheus 监控实例,详情请参考 Prometheus 监控服务-创建实例

实践步骤

步骤1:Prometheus 监控实例绑定集群

方式1:在 Prometheus 监控实例绑定新建集群

说明:
仅支持新建标准集群和 Serverless 集群时绑定。
1. 登录容器服务控制台
2. 在左侧菜单栏中单击集群,在集群管理页面单击新建。
3. 选择集群类型。
选择标准集群类型
选择 Serverless 集群
根据页面提示进行配置,更多配置说明可参考 标准集群-创建集群
在第4步骤-组件配置中绑定 Prometheus 实例。

根据页面提示进行配置,更多配置说明可参考Serverless 集群-创建实例
在高级配置中绑定 Prometheus 实例。

4. 所有配置项完成后,单击完成即绑定成功。

方式2:在 Prometheus 监控实例中绑定已有集群

说明:
支持已有的标准集群、Serverless 集群、注册集群、边缘集群绑定 Prometheus 实例。
1. 登录容器服务控制台
2. 在左侧菜单栏中单击 Prometheus 监控,进入 Prometheus 监控列表页。
3. 在 Prometheus 监控列表页,找到对应的 Prometheus 实例,单击操作列中的实例管理
4. 在集群监控页面中,单击关联集群。
5. 在关联集群页面选择对应的集群类型,勾选对应的集群。
6. 完成后,单击确定即绑定成功

步骤2:数据采集配置

1. 登录容器服务控制台
2. 在左侧菜单栏中单击 Prometheus 监控,进入 Prometheus 监控列表页。
3. 在 Prometheus 监控列表页,找到对应的 Prometheus 实例,单击操作列中的实例管理
4. 进入集群监控页面,在页面中找到对应的集群 ID,在操作列中单击数据采集配置。
5. 在数据采集配置-基础监控页面,单击指标详情,勾选需要监控的指标。详细配置说明请参考数据采集配置,指标说明请参考容器服务指标

步骤3:登录 Grafana 查看监控数据

1. 登录容器服务控制台
2. 在左侧菜单栏中单击 Prometheus 监控,进入 Prometheus 监控列表页。
3. 在 Prometheus 监控列表页中,单击实例名称右侧的 Grafana 图标,输入账号名称和密码,进入 Grafana 服务平台。
4. 在 Grafana 服务平台 > Dashboard 搜索列表,默认预设了容器相关的监控面板,单击某个面板名称。

5. 进入面板页面,即可查看预设的监控数据图表。

步骤4:配置告警策略

1. 登录容器服务控制台
2. 在左侧菜单栏中单击 Prometheus 监控,进入 Prometheus 监控列表页。
3. 在 Prometheus 监控列表页,找到对应的 Prometheus 实例,单击操作列中的实例管理。
4. 在左侧菜单栏中选择告警配置,在告警配置页面单击新建告警策略。
5. 您可以在新建告警策略页,选择预设的模板类型,无需手动配置,告警通知可选择腾讯云可观测平台已有的通知模板,从而实现快速配置告警。

更多操作说明请参考:
自定义上报指标
Prometheus 监控服务-操作指南
相似文档
  • 操作场景: 在容器服务 TKE 的众多场景中,例如 K8S 版本升级、内核版本升级等,都需要进行节点移出再移入的操作。本文详细介绍了节点移出再移入的过程,主要分为以下几个步骤: 1. 驱逐节点上运行的 Pod。 2. 将节点移出集群再重新添加到集群,该节点将重装系统。 3. 解除封锁。
  • 操作场景: 容器服务 TKE 集群新增节点可通过在“自定义数据”中填入脚本来进行批量操作,例如统一修改内核参数。但如需对已新增的存量节点进行批量操作,您可参考本文使用开源工具 Ansible 进行操作。
  • 使用场景: 当发生人为误操作、应用出现 bug、恶意程序调用 apiserver 接口,集群资源会被删除或修改。此时可通过集群审计功能记录 apiserver 的接口调用,即可根据条件检索和分析审计日志找到问题原因。本文介绍了集群审计功能的具体使用场景及使用示例,您可参考本文开始使用集群审计功能。
  • 操作场景: 使用容器服务 TKE 控制台创建的 Ingress 配置的证书,会引用 SSL 证书 中托管的证书,若 Ingress 使用时间较长,证书存在过期的风险。证书过期会对线上业务造成巨大影响,因此需要在证书过期前进行续期,您可参考本文为 Ingress 证书续期。
  • 概述: 随着 HTTPS 不断普及,大多数网站开始由 HTTP 升级到 HTTPS。使用 HTTPS 需要向权威机构申请证书,并且需要付出一定的成本,如果需求数量多,则开支也相对增加。cert-manager 是 Kubernetes 上的全能证书管理工具,支持利用 cert-manager 基于 ACME 协议与 Let's Encrypt 签发免费证书并为证书自动续期,实现永久免费使用证书。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部