上云无忧 > 文档中心 > 腾讯云容器服务 云原生 AI - AI 组件管理
容器服务 TKE
腾讯云容器服务 云原生 AI - AI 组件管理

文档简介:
简介: 创建好 AI 环境以后,您可以自行拼装 AI 组件,搭建 AI 平台。本文档将介绍如何对 AI 组件进行增删改查: 注意: AI 组件底层基于 Helm Chart 实现。创建 AI 环境后,不建议您前往应用市场相关页面管理 AI 组件,请直接在 AI 环境管理 AI 组件,以免造成数据不一致的情况。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

简介

创建好 AI 环境以后,您可以自行拼装 AI 组件,搭建 AI 平台。本文档将介绍如何对 AI 组件进行增删改查:
注意
AI 组件底层基于 Helm Chart 实现。创建 AI 环境后,不建议您前往应用市场相关页面管理 AI 组件,请直接在 AI 环境管理 AI 组件,以免造成数据不一致的情况。

AI 组件列表

组件名称
业务场景
组件介绍
TF Operator
模型训练
安装后,用户可以运行 TF 单机 / 分布式训练任务。
PyTorch Operator
模型训练
安装后,用户可以运行 PyTorch 单机 / 分布式训练任务。
MPI Operator
弹性训练
用户可以运行弹性训练任务,充分利用算力资源。
Fluid
缓存加速
Fluid 通过使用分布式缓存引擎(GooseFS/Alluxio)为云上应用提供数据预热与加速,同时可以保障缓存数据的可观测性,可迁移性和自动化的水平扩展。
Elastic Jupyter Operator
算法调试
为用户按需提供弹性的 Jupyter Notebook 服务,按需分配计算资源。

AI 组件生命周期管理

创建 AI 组件

1. 登录 容器服务控制台 ,选择左侧导航栏中的云原生 AI
2. 在 “AI 环境” 列表页面,选择目标 AI 环境 ID,进入该 AI 环境 “基本信息” 页面。
3. 选择左侧菜单栏中的组件管理,进入 “组件列表” 页面。
4. 单击新建,进入 “新建 AI 组件” 页面,参考以下提示进行设置。如下图所示:

主要参数信息如下:
组件名:自定义组件名称。
命名空间:安装组件的命名空间
Chart:对应组件的安装包,一次只能安装一个组件。
参数:和组件配置有关的参数,创建组件以后仍然可以参考 “更新 AI 组件” 指引来更新相关参数。
5. 单击完成即可创建 AI 组件。

查看 AI 组件

成功创建 AI 环境后,可以在 AI 环境内查看已经安装的 AI 组件列表,如下图所示:


删除 AI 组件

1. 选择某个 AI 环境 id,进入 AI 环境的 “基本信息” 页面。
2. 选择左侧菜单栏中的组件管理,进入 “组件列表” 页面。
3. 选择需更新的组件所在行右侧的删除

4. 在弹出的 “删除组件” 弹窗中,阅读删除说明并单击确定完成删除。 

更新 AI 组件
1. 选择某个 AI 环境 id,进入 AI 环境的 “基本信息” 页面。
2. 选择左侧菜单栏中的组件管理,进入 “组件列表” 页面。
3. 选择需更新的组件所在行右侧的更新配置。
4. 在弹出的 “更新组件” 页面中,按需进行组件参数配置,并单击完成。

相似文档
  • 简介: Fluid 是一个开源的 Kubernetes 原生分布式数据集编排和加速引擎,目前它由云原生计算基金会 CNCF 作为 Sandbox 项目托管。主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI 应用等。
  • 简介: TF-Operator 是 Kubeflow 社区开发,用以支持在 Kubernetes 上部署执行 TensorFlow 分布式训练任务的组件。 在部署完成之后,用户可以创建、查看、删除 TFJob。
  • 简介: PyTorch-Operator 是 Kubeflow 社区开发,用于支持在 Kubernetes 上执行 PyTorch DDP(distributed data parallel)模式分布式训练任务的组件。 在部署完成之后,用户可以创建、查看、删除 PyTorchJob。
  • 简介: MPI-Operator 是 Kubeflow 社区开发,用于支持以 Horovod 为代表的数据并行分布式训练在 Kubernetes 集群上部署运行的组件。 在部署完成之后,用户可以创建、查看、删除 MPIJob。
  • 简介: elastic-jupyter-operator 是 Kubernetes 原生的弹性 Jupyter 服务。为用户按需提供弹性的 Jupyter Notebook 服务。elastic-jupyter-operator 提供以下特性: GPU 空闲时自动释放资源到 Kubernetes 集群。 资源延迟申请,在使用时按需申请对应 CPU/内存/GPU 资源。 多 Jupyter 共享资源池,提高资源利用率。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部