上云无忧 > 文档中心 > 天翼云数据治理中心 DataArts Studio 管理作业 - 配置HTTP源端参数
数据治理中心 DataArts Studio
天翼云数据治理中心 DataArts Studio 管理作业 - 配置HTTP源端参数

文档简介:
本章节主要介绍配置HTTP源端参数。 作业中源连接为HTTP连接时,源端作业参数如下表所示。当前只支持从HTTP URL导出数据,不支持导入。
*产品来源:中国电信天翼云。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

作业中源连接为HTTP连接时,源端作业参数如下表所示。当前只支持从HTTP URL导出数据,不支持导入。

表 HTTP/HTTPS作为源端时的作业参数

参数名 说明 取值样例
文件URL 通过使用GET方法,从HTTP/HTTPS协议的URL中获取数据。
用于读取一个公网HTTP/HTTPS URL的文件,包括第三方对象存储的公共读取场景和网盘场景。
列表文件 选择“是”,将待上传的文本文件中所有URL对应的文件拉取到OBS,文本文件记录的是HDFS上的文件路径。
列表文件源连接 文本文件存储在OBS桶中,这里需要选择已建立的OBS连接。 obs_link
列表文件OBS桶 存储文本文件的OBS桶名称。 obs-cdm
列表文件或目录 在OBS中存储文本文件文件的自定义目录,多级目录可用“/”进行分隔。 test1
文件格式 当前CDM只支持选择“二进制格式”,不解析文件内容直接传输,不要求原文件格式必须为二进制。 二进制格式
压缩格式 选择对应压缩格式的源文件进行迁移:
无:表示传输所有格式的文件。
GZIP:表示只传输GZIP格式的文件。
ZIP:表示只传输ZIP格式的文件。
TAR.GZ:表示只传输TAR.GZ格式的文件。
压缩文件后缀 压缩格式非无时,显示该参数。 该参数需要解压缩的文件后缀名。当一批文件中以该值为后缀时,才会执行解压缩操作,否则则保持原样传输。当输入*或为空时,所有文件都会被解压。 *
文件分隔符 传输多个文件时,CDM使用这里配置的文件分隔符来区分各个文件,默认为l。列表文件显示为“是”时,显示该参数。 l
QUERY参数 该参数设置为“是”时,上传到OBS的对象使用的对象名,为去掉query参数后的字符。
该参数设置为“否”时,上传到OBS的对象使用的对象名,包含query参数。
加密方式 如果源端数据是被加密过的,则CDM支持解密后再导出。这里选择是否对源端数据解密,以及选择解密算法:
无:不解密,直接导出。
AES-256-GCM:使用长度为256byte的AES对称加密算法,目前加密算法只支持AES-256-GCM(NoPadding)。该参数在目的端为加密,在源端为解密。
AES-256-GCM
忽略不存在原路径/文件 如果将其设为是,那么作业在源路径不存在的情况下也能成功执行。
数据加密密钥 “加密方式”选择“AES-256-GCM”时显示该参数,密钥由长度64的十六进制数组成,且必须与加密时配置的“数据加密密钥”一致。如果不一致系统不会报异常,只是解密出来的数据会错误。

DD0AE00DFECD78BF051BCFDA25BD4E

320DB0A7AC75A1F3FC3D3C56A457DCDC1B

初始化向量 “加密方式”选择“AES-256-GCM”时显示该参数,初始化向量由长度32的十六进制数组成,且必须与加密时配置的“初始化向量”一致。如果不一致系统不会报异常,只是解密出来的数据会错误。 5C91687BA886EDCD12ACBC3FF19A3C3F
MD5文件名后缀 校验CDM抽取的文件,是否与源文件一致。 .md5

相似文档
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部