上云无忧 > 文档中心 > 天翼云数据湖探索使用教程 - 将DLI数据导出至OBS
数据湖探索
天翼云数据湖探索使用教程 - 将DLI数据导出至OBS

文档简介:
本章节主要介绍将DLI数据导出至OBS。 支持将数据从DLI表中导出到OBS服务中,导出操作将在OBS服务新建文件夹,或覆盖已有文件夹中的内容。
*产品来源:中国电信天翼云。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

支持将数据从DLI表中导出到OBS服务中,导出操作将在OBS服务新建文件夹,或覆盖已有文件夹中的内容。

注意
  • 支持导出json格式的文件,且文本格式仅支持UTF-8。

  • 只支持将DLI表(表类型为“Managed”)中的数据导出到OBS桶中,且导出的路径必须指定到文件夹级别。

  • 支持跨帐号导出数据,即,如果B账户对A账户授权后,A账户拥有B账户OBS桶的元数据信息和权限信息的读取权限,以及路径的读写权限,则A账户可将数据导出至B账户的OBS路径中。

导出数据步骤

1.导出数据的入口有两个,分别在“数据管理”和“SQL编辑器”页面。

  • 在“数据管理”页面导入数据。

a. 在管理控制台左侧,单击“数据管理”>“库表管理”。

b. 单击需导出数据的表对应的数据库,进入该数据的“表管理”页面。

c. 在对应表(DLI表)的“操作”栏中选择“更多”中的“导出”,弹出“导出数据”页面。

  • 在“SQL编辑器”页面导出数据。

a. 在管理控制台左侧,单击“SQL编辑器”。

b. 在左侧导航栏选择“数据库”页签,鼠标左键单击需要导出数据的表对应的数据库名,进入“表”区域。

c. 鼠标左键单击需要导出数据的表(Managed表,即DLI表)右侧的,在列表菜单中选择“导出”,选择弹出“导出数据”页面。

2.在“导出数据”对话框,参考下表填写导出数据相关信息。

参数名称 描述
数据库 当前表所在的数据库。
表名称 当前表名称。
数据格式 导出数据的文件格式。当前只支持json格式。
队列 选择队列。
压缩格式 导出数据的压缩方式,选择如下压缩方式。
none
bzip2
deflate
gzip
存储路径 输入或选择OBS路径。
导出路径必须为OBS桶中不存在的文件夹,即用户需在OBS目标路径后创建一个新文件夹。
文件夹名称不能包含下列特殊字符:\ / : * ? " < >l,并且不能以“.”开头和结尾。
导出方式 导出数据的保存方式。
随导出创建指定路径:指定的导出目录必须不存在,如果指定目录已经存在,系统将返回错误信息,无法执行导出操作。
覆盖指定路径:在指定目录下新建文件,会删除已有文件。
表头:无/有 设置导出数据是否含表头。

3.单击“确定”即可导出数据。

4.(可选)您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。

a.在“作业类型”中选择“EXPORT”,输入导出数据的时间段,即可查询出对应条件下的作业列表。

b.单击导出作业名称前的可查看导出作业。

相似文档
  • 本章节主要介绍查看元数据。 元数据说明: 元数据(Metadata)是用来定义数据类型的数据。主要是描述数据自身信息,包含源、大小、格式或其它数据特征。数据库字段中,元数据用于诠释数据仓库的内容。
  • 本章节主要介绍预览数据。 “预览页面”将显示对应表的前10条数据。 预览数据步骤: 预览数据的入口有两个,分别在“数据管理”和“SQL编辑器”页面。
  • 本章节主要介绍 程序包管理概述。 程序包管理概述: Spark程序包管理主要包括如下功能: 程序包组和程序包权限管理、 创建程序包、 删除程序包。
  • 本章节主要介绍创建程序包。 程序包组和程序包权限操作场景: 针对不同用户,可以通过权限设置分配不同的程序包组或程序包,不同用户之间的作业效率互不影响,保障作业性能。
  • 本章节主要介绍创建程序包。 DLI支持用户通过批处理方式将程序包提交至通用队列中运行。 说明 :如果用户需要更新程序包,可以使用相同的程序包或文件上传至DLI的同一个位置(同一个分组),直接覆盖原有的程序包或文件。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部