上云无忧 > 文档中心 > 百度智能云全功能AI开发平台BML开发视觉模型训练时长设置参考
飞桨BML 全功能AI开发平台
百度智能云全功能AI开发平台BML开发视觉模型训练时长设置参考

文档简介:
运行环境说明: 目前 BML 支持选择GPU P4、GPU P40、GPU V100三种运行环境,性能从高到低为V100>P40>P4。具体规格说明如下: 机型 规格说明 GPU V100 TeslaGPU_V100_16G显存单卡_12核CPU_56G内存 GPU P40 TeslaGPU_P40_24G显存单卡_12核CPU_40G内存 GPU P4 TeslaGPU_P4_8G显存单卡_12核CPU_40G内存
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

运行环境说明

目前 BML 支持选择GPU P4、GPU P40、GPU V100三种运行环境,性能从高到低为V100>P40>P4。具体规格说明如下:

机型 规格说明
GPU V100 TeslaGPU_V100_16G显存单卡_12核CPU_56G内存
GPU P40 TeslaGPU_P40_24G显存单卡_12核CPU_40G内存
GPU P4 TeslaGPU_P4_8G显存单卡_12核CPU_40G内存

温馨提示:

  • 未开通付费的情况下,可选的运行环境为GPU P4,我们为每位用户提供了GPU P4运行环境下100(小时*节点)免费算力支持,超出后请您付费购买。详见页面提示的价格说明。
  • 图像分类NASNet网络暂时不支持在 GPU P4环境上运行,若您未开通付费,请选择其他网络。

如何设置节点数及运行时间

1、选择计算节点数:节点数越多运行效率越高,可结合训练数据量及运行效率灵活选择。目前可设置的最高计算节点数为6.

2、最长训练时间:超过最长训练时间后模型会自动停止运行,注意这里设置的最长训练时间与最长计费时长有一定差异,训练计费时长将根据数据增强-自动搜索耗时+训练耗时的总时长进行计算。

注意:实际训练时长与所选机型、节点数、网络、数据量均有关系,其中性能上V100>P40>P4,在同一网络前提下,训练机型新能越高、节点数越多、数据量越少训练速度会越快。

根据历史经验,不同数据量范围、网络的大致耗时范围如下,供辅助参考

图像分类

网络及设置 数据量范围 训练耗时预估
ResNet50(batch size=16) 1-1.5w 2节点预估12-14min左右;4节点11min左右
4-6k 5min左右,10min以内,多节点或单节点不太影响训练时长
1k 以下 2-3min左右,多节点或单节点不太影响训练时长

物体检测

网络及设置 数据量范围 训练耗时预估
Faster_R-CNN-ResNet50-FPN 200-400之间 2节点预估十几-二十分钟左右;4节点预估在十分钟以内
1800-2000 2节点预估在60min左右,4节点预估在40min左右

以下为典型网络在不同数据量、不同机型、不同节点数的实际测试训练耗时,供辅助参考。

图像分类

网络及数据量 机型 节点数 训练耗时
ResNet50(数据量6000+) V100 1 400s
V100 2 326s
V100 6 198s
P40 1 867s
P40 2 562s
P40 6 540s
P4 1 1385s
P4 2 751s
P4 6 302s
MobileNet(数据量6000+) V100 1 259s
V100 2 197s
V100 6 161s
P40 1 396s
P40 2 285s
P40 6 333s
P4 1 630s
P4 2 370s
P4 6 178s

物体检测

网络及数据量 机型 节点数 训练耗时
Faster_R-CNN-ResNet50-FPN(数据量400+)20epoch V100 1 29.1min
V100 2 16.1min
V100 6 6min
P40 1 40min
P40 2 21.8min
P40 6 11.8min
P4 1 66min
P4 2 34.4min
P4 6 13.28min
SSD-MobileNetV1(数据量400+)20epoch V100 1 19min
V100 2 10.3min
V100 6 3.9min
P40 1 28.1min
P40 2 14.6min
P40 6 4.8min
P4 1 25.4min
P4 2 13.4min
P4 6 5.1min
相似文档
  • 图像分类模型评估报告 模型评估报告内容说明 模型训练完成后我们可以在模型列表中看到模型效果及查看模型评估报告的入口。进入模型评估报告页面,我们可以看到整体报告内容中包含以下几个区域内容:
  • EasyDL专业版平台将支持代码级的NLP任务包括文本分类任务、短文本匹配任务、序列标注任务、文本实体抽取任务。同时平台集成了百度大脑文心的ERNIE2.0预训练模型,可以选择ERNIE-Base、ERNIE-Large、ERNIE-Tiny三种类型的预训练模型。
  • 一个项目是指对应的一个场景或者领域的问题,例如智能客服场景、智能教育场景等。在BML中,提供了文本分类单标签、文本分类多标签、短文本相似度、序列标注、文本实体抽取任务的模型训练能力。本章节将通过演示,如何创建一个自然语言处理任务来完成问文本分类的任务。
  • 在新建任务的面板中,可查看相关项目“基本信息”、“配置任务类型”、“添加数据”、“配置任务”等操作,如下图: 配置任务类型时,您可以看到增量训练有一个开关选项。增量训练也成为模型热启动,当您训练完模型但效果不理想想继续添加数据,或您的训练模型超过训练时长被中断是,您可以开启增量训练,使该新任务能在基准任务的基础上继续运行。
  • 当平台跑完NLP任务后,您可以点击“模型效果”进行查看 您可以选择对应任务的不同版本,查看不同的效果数据,如图,当前是V1版本的效果数据: 效果校验 平台提供了针对模型的校验工具,您可以通过上传文本,了解如何模型的识别效果,从而对模型进行校验
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部