上云无忧 > 文档中心 > 百度智能云容器引擎服务 CCE 云原生AI概述
容器引擎服务CCE
百度智能云容器引擎服务 CCE 云原生AI概述

文档简介:
云原生AI基于百度智能云容器引擎(CCE)支持 GPU 显存和算力的共享与隔离,同时集成PaddlePaddle、TensorFlow、Pytorch 等主流深度学习框架,通过对 AI 任务的编排、管理,提供低门槛、高效的深度学习训练服务,帮助企业客户提高 GPU 资源使用效率和提升 AI 训练速度,快速降本增效。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

云原生 AI 概述

云原生AI基于百度智能云容器引擎(CCE)支持 GPU 显存和算力的共享与隔离,同时集成PaddlePaddle、TensorFlow、Pytorch 等主流深度学习框架,通过对 AI 任务的编排、管理,提供低门槛、高效的深度学习训练服务,帮助企业客户提高 GPU 资源使用效率和提升 AI 训练速度,快速降本增效。

当前该功能处于公测阶段,需要您申请公测后才能使用。

使用流程

第一步(必选):新建 v1.18 版本的集群,添加带有 GPU 设备的节点;

第二步(必选):安装云原生AI组件,详情请见组件概述;

第三步(可选):为 GPU 节点开启显存共享;

第四步(必选):新建队列,指定资源配额和关联用户,详情请见新建队列;

第五步(必选):新建任务,提交 AI 训练任务,详情请见新建任务。

GPU支持清单

目前包括但不限于以下GPU型号支持显存和算力的共享与隔离,您可以提交工单了解更多:

Tesla系列
Tesla V100-SXM2-16GB
Tesla V100-SXM2-32GB
Tesla T4
相似文档
  • 您可以新建一个队列,为 AI 任务指定运行所需的资源和操作人员。 前提条件: 您已成功创建一个 Kubernetes 集群,详情请见创建集群。 您已成功安装 CCE AI Job Scheduler 和 CCE Deep Learning Frameworks Operator 组件,否则云原生 AI 功能将无法使用。
  • 您可以通过容器引擎管理控制台删除不再需要的队列。 前提条件: 您已成功安装 CCE AI Job Scheduler 和 CCE Deep Learning Frameworks Operator 组件,否则云原生 AI 功能将无法使用。 您已成功创建队列。
  • 您可以根据新的需要修改已有的队列的备注信息、配额信息和资源对象。 前提条件: 您已成功安装 CCE AI Job Scheduler 和 CCE Deep Learning Frameworks Operator 组件,否则云原生 AI 功能将无法使用。 您已成功创建队列。
  • 您可以新建一个 TensorFlow 类型的任务。 前提条件: 您已成功安装 CCE AI Job Scheduler 和 CCE Deep Learning Frameworks Operator 组件,否则云原生 AI 功能将无法使用。 若您是子用户,队列关联的用户中有您才能使用该队列新建任务。
  • 您可以新建一个 Pytorch 类型的任务。 前提条件: 您已成功安装 CCE AI Job Scheduler 和 CCE Deep Learning Frameworks Operator 组件,否则云原生 AI 功能将无法使用。 若您是子用户,队列关联的用户中有您才能使用该队列新建任务。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部