上云无忧 > 文档中心 > 百度智能云全功能AI开发平台BML自然语言处理模型-配置NLP任务
飞桨BML 全功能AI开发平台
百度智能云全功能AI开发平台BML自然语言处理模型-配置NLP任务

文档简介:
在新建任务的面板中,可查看相关项目“基本信息”、“配置任务类型”、“添加数据”、“配置任务”等操作,如下图: 配置任务类型时,您可以看到增量训练有一个开关选项。增量训练也成为模型热启动,当您训练完模型但效果不理想想继续添加数据,或您的训练模型超过训练时长被中断是,您可以开启增量训练,使该新任务能在基准任务的基础上继续运行。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠
  1. 在新建任务的面板中,可查看相关项目“基本信息”、“配置任务类型”、“添加数据”、“配置任务”等操作,如下图:

配置任务类型时,您可以看到增量训练有一个开关选项。增量训练也成为模型热启动,当您训练完模型但效果不理想想继续添加数据,或您的训练模型超过训练时长被中断是,您可以开启增量训练,使该新任务能在基准任务的基础上继续运行。在配置任务类型上您需要注意以下几点,如您是第一次新建任务,增量训练的开关将默认关闭,不允许打开。如您在满足已有训练完成或是训练中断的任务的情况下,您可以开启增量训练的开关,选中您想继续的基准任务版本。在设置学习率时,您可以重新设置学习率,也可以加载优化后的学习率。如您选择重新设置学习率,您可以在下方【配置网络】的脚本编辑中修改学习率的大小,如您选择加载优化后的学习率,您将直接继承您选中的基准任务的超参数,在脚本编辑中将不允许再修改。

训练任务,我们需要添加模型训练使用的训练集和模型评测的评测集,如果您没有特别创建评测集,可以将评测集开关设置为“OFF”,系统将从训练集中取出一定比例的数据作为评测集。如果您有准备评测集,则可以将评测集开关设置为“ON”,并上传对应的数据集即可,如下图:

在上传数据的时候,您需要注意,如您打开了增量训练的开关,那么将直接选中您选中的基准任务的使用的数据集。点击查看基准任务标签时,您可以看到基准任务数据集的标签信息,此时您选择增量训练的数据集,您可保留基准任务数据集,也可添加新数据集,但新数据标签须与基准任务保持一致。

  1. 配置网络过程中,您可以选择使用预训练模型ERNIE2.0对应的三个版本:ERNIE2.0_Base、ERNIE2.0_Large和ERNIE2.0_Tiny。本章节演示创建流程,先选择“ERNIE2.0_Tiny”,并选择TextCNN网络。 EasyDL专业版目前支持飞桨(Paddle Paddle)深度学习框架,自然语言训练任务支持的框架脚本为paddle-fluid-v1.6.1。了解飞桨

平台提供了脚本编辑的工具,您可以直接在平台点击“立即编辑”进行脚本编辑,如下图:

注意,当您打开增量开关后,如您选中重新设置学习率,那么您可以脚本编辑中设置学习率,此时,如您修改其他超参数,仍将默认基准任务的超参数。如您选中加载优化后的学习率将脚本将不允许编辑。目前平台为您提供了对应代码的注释,方便您了解如何进行代码编辑和修改。

3.在配置资源部分,目前平台已提供GPU V100、P40两种机型。选中您所需的机型,根据需要设置计算节点数,如您选择多节点进行分布式训练,可有效提升训练速度,节点数越多训练效率越高。在最长训练设置部分,目前文本任务方向没有时间上线,建议您尽量设置较长时长,注意如您使用ERNIE预训练模型,建议训练时长不低于4小时。

  1. 点击提交训练任务,任务将在平台提供的GPU训练资源上进行训练。

提交成功的任务,将会在项目列表中展示状态。

在此,NLP任务的创建,已经完成。

错误码

如果您的任务出现失败情况,您可以通过查看平台反馈的错误码来查询,如下表:

错误码 训练失败原因说明
01-05、07、08、10、11 后端服务超时或训练失败,请提交工单或加入EasyDL官方QQ群(群号:86882600)联系群管解决
6 数据量过少导致训练失败,请补充数据重新提交模型训练
9 代码错误导致训练失败,请检查脚本代码内容修改后重新提交模型训练,有疑问请提交工单或加入EasyDL官方QQ群(群号:868826008)联系群管解决
相似文档
  • 当平台跑完NLP任务后,您可以点击“模型效果”进行查看 您可以选择对应任务的不同版本,查看不同的效果数据,如图,当前是V1版本的效果数据: 效果校验 平台提供了针对模型的校验工具,您可以通过上传文本,了解如何模型的识别效果,从而对模型进行校验
  • 代码模板升级整体说明: 平台于2020年4月16日,对自然语言处理模型训练的代码模板进行了升级,建议您在5月1日前完成对旧版任务的迁移。本次升级,平台的自然语言处理任务将为您提供封装性和灵活性俱佳的开发体验,并支持了飞桨深度学习框架Paddle-Fluid 1.6.1的版本。
  • 脚本调参支持多种表格预测任务,训练得到的模型可以应用到广泛实际场景中。 表格预测模型类型: 表格预测帮助用户通过机器学习技术发现已有数据中的规律,从而创建机器学习模型,并基于机器学习模型处理新的数据,为业务应用生成预测结果。脚本调参中提供的表格数据预测支持创建回归、二分类、多分类三种类型的机器学习模型。
  • 在任务列表点击【创建项目】,在弹窗中提交以下信息完成项目创建: 完善个人信息:填写项目归属、行业、联系方式完成项目创建。 注意:有效的联系方式将有助于后续模型上线的人工快速审核,以及更快的百度官方支持 提交项目信息:提交模型名称、技术方向、任务类型、应用场景及功能描述,即可完成项目创建。其中任务类型与配置任务可选的数据类型一一对应。
  • 表格预测任务支持AutoML和专家两种运行方式: AutoML模式:全流程自动建模,用户只需设置数据集、目标列以及制定任务类型即可,而无需关注数据处理以及算法配置等过程,系统会自动完成建模过程,并从中挑选最优的模型作为训练任务的运行结果。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部