上云无忧 > 文档中心 > 腾讯云容器服务 云原生 Prometheus 监控 - 数据采集配置
容器服务 TKE
腾讯云容器服务 云原生 Prometheus 监控 - 数据采集配置

文档简介:
操作场景: 本文档介绍如何为已完成关联的集群配置监控采集项。 前提条件: 在配置监控数据采集项前,您需要完成以下操作: 已成功创建 Prometheus 监控实例。 已将需要监控的集群关联到相应实例中。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

操作场景

本文档介绍如何为已完成关联的集群配置监控采集项。

前提条件

在配置监控数据采集项前,您需要完成以下操作:
已成功创建 Prometheus 监控实例。
已将需要监控的集群关联到相应实例中。

操作步骤

配置数据采集

1. 登录 容器服务控制台,选择左侧导航栏中的 Prometheus 监控
2. 在监控实例列表中,选择需要配置数据采集规则的实例名称,进入该实例详情页。
3. 数据采集 > 集成容器服务页面,单击实例右侧的数据采集配置,进入数据采集配置列表页。如下图所示:

4. 单击指标详情,在指标列表中勾选您需要采集的指标,单击确定。如下图所示:

5. 单击新建自定义监控,新增数据采集配置。Prometheus 监控服务预置了部分采集配置文件,用来采集常规的监控数据。您可以通过以下两种方式配置新的数据采集规则来监控您的业务数据。
通过控制台新增配置
通过 yaml 文件新增配置

监控 Service

1. 单击新增自定义监控
2. 新建采集配置中,填写配置信息。如下图所示:

监控类型:选择 “Service监控” 。
名称:填写规则名称。
命名空间:选择 Service 所在的命名空间。
Service:选择需要监控的 Service 名称。
ServicePort:选择相应的 Port 值。
MetricsPath:默认为 /metrics,您可根据需求自行填写采集接口。
查看配置文件:单击配置文件可查看当前配置文件。如果您有 relabel 等相关特殊配置的需求,可以在配置文件内进行编辑。
探测采集目标:单击探测采集目标,即可显示当前采集配置下能够采集到的所有 target 列表,您可通过此功能确认采集配置是否符合您的预期。

监控工作负载

1. 单击新增自定义监控
2. 新建采集配置中,填写配置信息。如下图所示:

监控类型:选择 “工作负载监控” 。
名称:填写规则名称。
命名空间:选择工作负载所在的命名空间。
工作负载类型:选择需要监控的工作负载类型。
工作负载:选择需要监控的工作负载。
targetPort:填写暴露采集指标的目标端口,通过端口找到采集目标。若端口填写错误将无法获取到正确的采集目标。
MetricsPath:默认为 /metrics,您可根据需求执行填写采集接口。
查看配置文件:单击配置文件可查看当前配置文件。如果您有 relabel 等相关特殊配置的需求,可以在配置文件内进行编辑。
探测采集目标:单击探测采集目标,即可显示当前采集配置下能够采集到的所有 target 列表,您可通过此功能确认采集配置是否符合您的预期。
1. 单击 YAML 新增
2. 在弹窗中,选择监控类型,并填写相应配置。 您可以按照社区的使用方式通过提交相应的 yaml 来完成数据采集的配置。
工作负载监控:对应配置为 PodMonitors。
service 监控:对应配置为 ServiceMonitors。
RawJobs 监控:对应配置为 RawJobs。
6. 单击确定完成配置。
7. 在该实例的数据采集配置页面,查看采集目标状态。如下图所示:

其中,targets(1/1)表示(实际抓取的 targets 数为1 / 探测的采集目标数为1)。当实际抓取数和探测数的数值相等时,显示为 up,即表示当前抓取正常。当实际抓取数小于探测数时,显示为 down,即表示有部分 endpoints 抓取失败。 单击上图中的字段值(1/1)即可查看采集目标的详细信息。down 的失败状态如下图所示:

查看已有配置

1. 登录 容器服务控制台,选择左侧导航栏中的 Prometheus 监控
2. 在监控实例列表页,选择需要配置数据采集规则的实例名称,进入该实例详情页。
3. 数据采集 > 集成容器服务页面,单击实例右侧的数据采集配置,进入采集配置列表页。选择“基础监控”或者“自定义监控”,单击右侧的编辑
4. 在弹出的编辑 RawJobs 窗口,查看 yaml 文件中当前配置的所有监控对象。如下图所示:

查看采集目标

1. 登录 容器服务控制台,选择左侧导航栏中的 Prometheus 监控服务
2. 在监控实例列表页,选择需要查看 Targets 的实例名称,进入该实例详情页。
3. 数据采集 > 集成容器服务页面,单击实例右侧的查看采集目标

4. 在 Targets 列表页即可查看当前数据拉取状态。

说明:
状态为“不健康”的 endpoints 默认显示在列表上方,方便及时查看。
实例中“采集目标”页面支持检索,可以按资源属性进行过滤。

相关操作

挂载文件到采集器

在配置采集项的时候,如果您需要为配置提供一些文件,例如证书,可以通过以下方式向采集器挂载文件,文件的更新会实时同步到采集器内。
prometheus.tke.tencent.cloud.com/scrape-mount = "true" prom-xxx 命名空间下的 configmap 添加如上 label,其中所有的 key 会被挂载到采集器的路径 /etc/prometheus/configmaps/[configmap-name]/
prometheus.tke.tencent.cloud.com/scrape-mount = "true" prom-xxx 命名空间下的 secret 添加如上 label,其中所有的 key 会被挂载到采集器的路径 /etc/prometheus/secrets/[secret-name]/
相似文档
  • 注意: TMP 已于2022年10月27日调整免费指标的免费存储时长为15天。存储时长超过15天的实例,将按照超出的天数,收取免费指标的存储费用。具体收费规则可参考 计费说明。
  • 操作场景: 本文档介绍如何在云原生监控功能服务中查看告警历史。 前提条件: 在查看告警历史前,需要完成以下前置操作: 已成功创建 Prometheus 监控实例。 已将需要监控的集群关联到相应实例中。 已将需要采集的信息添加到集群数据采集配置。 已配置告警规则。
  • 使用 Prometheus 监控服务(TMP)时,将会在您的账户下创建 TKE Serverless 集群、内外网 负载均衡 CLB 资源。Prometheus 服务将收取 Prometheus 服务本身的费用,及用户实际使用的云资源费用。本文向您介绍使用 Prometheus 监控服务时资源的使用情况。
  • 操作场景: 当您不需要再使用 Prometheus 监控服务监控集群时,可以通过 Prometheus 监控控制台删除所有监控实例,系统会自动卸载监控组件并销毁相关资源。
  • 云原生 AI 简介: 云原生业已成为了云计算行业下一代的标准。目前,除了传统应用与基础架构的云原生化,AI 与大数据也开始拥抱云原生的架构。 腾讯云容器服务基于在云原生领域的技术沉淀,推出模块化,低耦合、高扩展性的云原生 AI 服务。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部