组件概述
组件是百度智能云容器引擎 CCE 提供的扩展功能安装包,您可以根据您的业务需求选择安装所需的组件。您可以在此对组件进行安装、更新配置、卸载等操作。
组件类型
目前组件支持云原生 AI 组件、混部组件,具体组件如下表所示:
组件名称 | 类型 | 组件介绍 |
---|---|---|
CCE GPU Manager | 云原生AI | 一系列 GPU device plugin 的集合,结合配套的 scheduler 可以实现复杂场景下的 GPU 资源调度能力。 |
CCE Deep Learning Frameworks Operator | 云原生AI | 主流深度学习框架 operator 组件,结合 CCE AI Job Scheduler,可实现直接在 CCE 上进行深度学习模型训练。 |
CCE RDMA Device Plugin | 云原生AI | RDMA 通信设备 device plugin。 |
CCE AI Job Scheduler | 云原生AI | 任务调度组件,支持调度管理各种AI任务,结合 CCE Deep Leaning Frameworks Operator,可实现直接在 CCE 上进行深度学习模型训练。 |
CCE Hybrid Manager | 混部调度 | 基于Kubernetes场景下在线、离线作业混部管理组件,通过将作业进行混部,利用在线作业剩余空闲资源运行离线作业,提高集群资源利用率。 |