百度智能云飞桨EasyDL零门槛AI开发平台 - 经典版声音分类上传数据集

飞桨EasyDL零门槛AI开发平台

简介/价格/文档

百度智能云飞桨EasyDL零门槛AI开发平台 - 经典版声音分类上传数据集

文档简介：

上传数据要求说明：这里我们对上传数据的要求不仅是格式上的要求，更重要的是介绍怎样的数据可以更有效提升模型效果。设计分类：首先想好分类如何设计，每个分类为你希望识别出的一种结果，如要识别猫狗的叫声，则可以以“猫”、“狗”等分别作为一个分类；

*此产品及展示信息均由百度智能云官方提供。免费试用咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

文档详情

上传数据要求说明

这里我们对上传数据的要求不仅是格式上的要求，更重要的是介绍怎样的数据可以更有效提升模型效果

设计分类

首先想好分类如何设计，每个分类为你希望识别出的一种结果，如要识别猫狗的叫声，则可以以“猫”、“狗”等分别作为一个分类；如果安防监控通过声音判断是否出现异常状态，可以以“正常”“不异常”设计为两类，或者“正常”“异常原因一”、“异常原因二”、“异常原因三”……设计为多类。

注意：目前单个模型的上限为1000类，如果要超过这个量级请在百度云控制台内提交工单反馈

准备数据

基于设计好的分类准备音频数据，每个分类需要准备50个音频文件以上，如果想要较好的效果，建议100个起音频文件，如果某些分类的声音具有相似性，需要增加更多音频。

音频的基本格式要求：目前支持音频文件类型为支持wav,mp3,m4a ，音频文件大小限制在4M以内。一个模型的音频总量限制10万个音频文件。

注意1：训练集音频需要和实际场景要识别的音频环境一致，举例：如果实际场景要识别的声音都是手机采集的，那训练的音频文件也需要同样的场景获得，而不要采用网上随便下载的音频
注意2：考虑实际应用场景可能有的种种可能性，每个分类的音频需要覆盖实际场景里面可能有的可能性，如噪音干扰、多种可能的采集设备，训练集覆盖的场景越多，模型的泛化能力越强。
注意3：如果需要寻求第三方数据采集团队协助数据采集，请在百度云控制台内提交工单反馈

你可能会有的问题：如果训练音频数据无法全部覆盖实际场景要识别的音频，怎么办？

答：本身模型算法会有一定的泛化能力，尽可能覆盖即可。

导入未标注数据

本地数据

已有数据集

支持选择百度云BOS导入、分享链接导入、平台已有数据集导入；支持选择线上已有的数据集，包括其他语音类模型的数据集

导入已标注数据

本地数据

已有数据集

支持选择百度云BOS导入、分享链接导入、平台已有数据集导入；支持选择线上已有的数据集，包括其他语音类模型的数据集

相似文档

百度智能云飞桨EasyDL零门槛AI开发平台 - 经典版声音分类数据集管理API
本文档主要说明当您线下已有大量的已经完成分类整理的音频数据，如何通过调用API完成音频数据的便捷上传和管理。数据集创建API：接口描述：该接口可用于创建数据集。接口鉴权：同发布模型后获取的API鉴权方式： 1、在EasyDL——控制台创建应用。 2、应用详情页获取API Key和Secret Key。
百度智能云飞桨EasyDL零门槛AI开发平台 - 声音分类训练操作说明
数据提交后，可以在导航中找到【训练模型】，按以下步骤操作，启动模型训练：注意：启动训练前请确保数据已经标注完成，否则无法启动训练。 step1：选择模型。选择此次训练的模型。 step2：训练配置。部署方式。可选择「公有云部署」、「EasyEdge本地部署」。
百度智能云飞桨EasyDL零门槛AI开发平台 - 声音分类模型效果评估报告说明
模型训练完成后我们可以在模型列表中看到模型效果及查看模型评估报告的入口。进入模型评估报告页面，我们可以看到整体报告内容中包含以下几个区域内容：模型基本信息。
百度智能云飞桨EasyDL零门槛AI开发平台 - 声音分类训练时长说明
训练时长与数据量、所选算法紧密相关。目前声音分类的训练时长主要影响因素为数据量，以下为内部测试的数据量与训练时长的对应关系，供参考：数据量训练时长数十个音频 60min左右。数百个音频 90min左右。数千个音频 120min左右。数万个音频 150min以上。
百度智能云飞桨EasyDL零门槛AI开发平台声音分类 - 如何提升模型效果
模型校验：在查看模型评估报告基础上，首先使用模型校验功能测试未参与过训练的音频数据进行模型训练，在这一步尽量上传不同类别的数据充分测试，并在测试过程中线下记录识别错误的音频。在测试过程中需要关注以下内容：

文档中心

全民上云·上云补贴申领

免费试用（限企业）

上传数据要求说明

设计分类

准备数据

导入未标注数据

本地数据

已有数据集

导入已标注数据

本地数据

已有数据集