上云无忧 > 文档中心 > 百度智能云全功能AI开发平台BML实例分割导入未标注数据
飞桨BML 全功能AI开发平台
百度智能云全功能AI开发平台BML实例分割导入未标注数据

文档简介:
导入未标注数据方式说明: 为选定的实例分割数据集导入未标注数据(即原始图片)的方式有两种。一种为从本地选择图片文件;一种为从平台中其余同为图片类型数据集中导入。 从本地上传图片导入: 选择无标注数据-本地-上传图片,点击上传图片后选择本地图片文件进行导入。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

目录

  1. 导入未标注数据方式说明
  2. 从本地上传图片导入
  3. 从本地上传压缩包导入
  4. 导入线上已有数据集

导入未标注数据方式说明

为选定的实例分割数据集导入未标注数据(即原始图片)的方式有两种。一种为从本地选择图片文件;一种为从平台中其余同为图片类型数据集中导入。

从本地上传图片导入

选择无标注数据-本地-上传图片,点击上传图片后选择本地图片文件进行导入。
数据格式要求
1、图片类型为jpg/png/ bmp/jpeg ,单次上传限制100个文件。
2、图片大小限制在4M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
3、每个账户图片数据量限制为20w张,超出后可被忽略。如需扩容,请提交工单申请
特别注意:
—对同一数据集存在多个内容完全一致的图片,将会做去重处理
—为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致
单张图片中的标注框须限制在500个之内。如有特殊需求,请通过提交工单咨询。  

从本地上传压缩包导入

选择无标注数据-本地-上传压缩包,点击上传压缩包后选择本地图片压缩包完成数据的批量导入。
数据格式要求
1、压缩包仅支持zip格式,大小限制5GB以内
2、压缩包内图片格式要求为:图片类型为jpg/png/bmp/jpeg,图片大小限制在4M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
3、单个数据集大小限制为10万图片,超出后可被忽略。
特别注意:
—对同一数据集存在多个内容完全一致的图片,将会做去重处理
—为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致。
单张图片中的标注框须限制在500个之内。如有特殊需求,请通过提交工单咨询。

导入线上已有数据

选择无标注数据-线上已有数据集-导入已有数据集,支持从已经上传的其他同类型数据集进行导入。在视觉任务中往往会有存在更换模型类型的可能性,比如某个业务场景问题既可以用物体检测解决又可以用实例分割解决,通过这个功能可以有效的快速切换数据类型,分别测试效果。

由于这里选择上传的是未标注数据,那么在导入线上已有数据的情况下,可以选择导入同为图片类型数据集的全部数据但去掉标注;或者选择未被标注的部分。

相似文档
  • 标注操作说明: 在数据集查看详情页面可以点击开始标注,进入到标注页面。 点击右侧添加标签,输入不同分类名称,完成标签添加。 标签格式说明:目前平台标签名称只支持数字/字母/下划线,暂时不支持中文
  • 1. 创建数据集: 您可以在左侧目录导航栏中选择【数据总览】并点击按钮“创建数据集”,对话框中选择数据类型为“文本”,标注类型选择“文本分类”,当前的文本分类的数据标注模板默认为单文本单标签格式。
  • 1、文本标注: 上传未标注文本后,进入到标注页面,您可以逐一查看每一篇未标注的文本,如下图: 2、设定分类对应的标签 3、创建标签后,即可以进行对文本的标注,在文本的上方标签字段处,会显示对应的分类标签,完成标注
  • 重复样本的定义: 一个样本包括文本内容和标签。重复样本的定义,是指您上传的数据中,存在两个样本的文本内容完全一致。则被判定为两个样本是重复样本。例如: 文本分类-单标签数据重复样本示例:
  • 1. 创建数据集: 您可以在控制面板中,选择“数据总览”并点击按钮“创建数据集”,即可完成一个数据集的创建。 2.导入短文本相似度数据: 进入到新创建的短文本数据集中,如果您手中的数据是未标注数据,可以选择数据标注状态为“无标注信息”
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部