上云无忧 > 文档中心 > 百度智能云飞桨EasyDL零门槛AI开发平台 - 时序数据集简介
飞桨EasyDL零门槛AI开发平台
百度智能云飞桨EasyDL零门槛AI开发平台 - 时序数据集简介

文档简介:
时序数据包含有时序特征,常规时序数据是具有一定频率的并且在连续时间范围内的每个采样点上都有一个值。 一个时序数据集可以包含一个或多个时间序列,如下数据集包含一个品牌在A、B两个地区的每日销售数据:
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

时序数据介绍

时序数据包含有时序特征,常规时序数据是具有一定频率的并且在连续时间范围内的每个采样点上都有一个值。

一个时序数据集可以包含一个或多个时间序列,如下数据集包含一个品牌在A、B两个地区的每日销售数据:

datetime,area,sales_quantity
9/3/2018,A,2000
9/3/2018,B,600
9/4/2018,A,2300
9/4/2018,B,550
9/5/2018,A,2100
9/5/2018,B,650
9/6/2018,A,2400
9/6/2018,B,700
9/7/2018,A,2450
9/7/2018,B,650

上述数据内容可以分为A地区销量时序:

datetime,area,sales_quantity
9/3/2018,A,2000
9/4/2018,A,2300
9/5/2018,A,2100
9/6/2018,A,2400
9/7/2018,A,2450

B地区销量时序:

datetime,area,sales_quantity
9/3/2018,B,600
9/4/2018,B,550
9/5/2018,B,650
9/6/2018,B,700
9/7/2018,B,650

一个时序数据集除具有时间特征以及一个标量特征外,还可以具有其它影响标量取值的特征,如在销量数据场景下,当天的气温、是否节假日等因素也会影响销售数据:

datetime,is_holiday,sales_quantity
9/3/2018,Y,600
9/4/2018,N,550
9/5/2018,N,650
9/6/2018,Y,700
9/7/2018,N,650

数据要求

  • 目前仅支持CSV格式的数据文件
  • 一次仅能上传一个文件,可以是一个CSV文件或由多个CSV文件压缩成的zip包
  • 单个上传文件大小不能超过5GB
  • 一个数据集包含的总文件大小不能超过20GB

数据文件内容要求

  • 当数据文件包含列名时,列名称可以包含字母、数字和下划线(_),但不能以下划线开头。
  • 文件内容以换行符(即字符“\n”,或称为LF)分隔各行,行内容以英文逗号(即字符“,”)分隔各列
  • 必须包含要预测的值即目标列,且目标列的数据类型会决定模型的类型。
  • 文件中文本列取值长度不能超过4096个字符。
  • 文件必须至少包含两列,并至少包含一个日期列,总列数不得超过1000列。
  • 数据集的总行数不能超过1000万行。
  • zip包中的多个CSV文件必须使用相同的编码格式,都包含列名或都不包含列名;且列的顺序必须保持一致
  • 在扩充数据集时,新导入数据文件的首行与数据集的列名相同时,将被视为列名,否则将被视作数据。
相似文档
  • 在EasyDL经典版中,您可以在“数据总览”页面,完成数据集创建、数据导入等操作,为模型构建准备好数据。 创建数据集: 数据集需要先定义,然后再导入数据。 单击“数据总览”,进入数据集列表页面。 单击“创建数据集”,进入数据集创建页面。 输入数据集名称,单击“完成”结束创建。
  • 时序预测模型是基于包含时间特征的结构化数据进行建模,系统会基于用户上传的数据使用预置算法进行模型构建与训练。当完成模型训练后,系统不仅提供了常见的评估指标而且会生成可视化的预测序列效果图,帮助用户检查模型的好坏。对于达到业务要求的时序预测模型,可以部署为在线服务,通过远程调用的方式对新的时间数据进行预测。
  • 在EasyDL中,您可以在“模型中心”进行模型的创建。在EasyDL中模型可以包括多个版本,每次训练会生成一个版本。各个版本的模型之间相互独立,可以分别进行版本发布等操作。
  • EasyDL提供的的时序预测算法不仅性能高、可扩展,还针对速度、规模和准确性进行了优化,可以在大规模数据集上进行训练。 训练模型: 在准备好数据集并创建模型后,可以创建训练任务。 单击“训练模型”,进入模型训练页面。 填写模型训练信息,如下图所示。
  • 训练任务结束后,可以查看模型的各项指标,以确定模型是否满足要求。不同类型的模型包含了不同的指标,用户可以根据实际的业务场景查看关键指标是否满足要求。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部