上云无忧 > 文档中心 > 百度数据仓库 Palo 数据导入总览
百度数据仓库 Palo Doris版
百度数据仓库 Palo 数据导入总览

文档简介:
支持的数据源: PALO 提供多种数据导入方案,可以针对不同的数据源进行选择。 数据导入总体说明: PALO 的数据导入实现有以下共性特征,这里分别介绍,以帮助大家更好的使用数据导入功能 原子性保证: PALO 的每一个导入作业,不论是使用 Broker Load 进行批量导入,还是使用 INSERT 语句进行单条导入,都是一个完整的事务操作。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

支持的数据源

PALO 提供多种数据导入方案,可以针对不同的数据源进行选择。

数据源 导入方式
百度对象存储(BOS)、HDFS、AFS 使用 Broker Load 导入数据
本地文件 导入本地数据
百度消息服务(Kafka) 订阅 Kafka 日志
MySQL、Oracle、PostgreSQL 通过外部表同步数据
通过 JDBC 导入数据 使用JDBC同步数据
导入 JSON 格式数据 JSON 格式数据导入说明
MySQL binlog 敬请期待

数据导入总体说明

PALO 的数据导入实现有以下共性特征,这里分别介绍,以帮助大家更好的使用数据导入功能

原子性保证

PALO 的每一个导入作业,不论是使用 Broker Load 进行批量导入,还是使用 INSERT 语句进行单条导入,都是一个完整的事务操作。导入事务可以保证一批次内的数据原子生效,不会出现部分数据写入的情况。

同时,一个导入作业都会有一个 Label。这个 Label 是在一个数据库(Database)下唯一的,用于唯一标识一个导入作业。Label 可以由用户指定,部分导入功能也会由系统自动生成。

Label 是用于保证对应的导入作业,仅能成功导入一次。一个被成功导入的 Label,再次使用时,会被拒绝并报错 Label already used。通过这个机制,可以在 PALO 测做到 At-Most-Once 语义。如果结合上游系统的 At-Least-Once 语义,则可以实现导入数据的 Exactly-Once 语义。

关于原子性保证的最佳实践,可以参阅 导入事务和原子性。

同步和异步

导入方式分为同步和异步。对于同步导入方式,返回结果即表示导入成功还是失败。而对于异步导入方式,返回成功仅代表作业提交成功,不代表数据导入成功,需要使用对应的命令查看导入作业的运行状态。

支持的数据格式

不同的导入方式支持的数据格式略有不同。

导入方式 支持的格式
Broker Load Parquet,ORC,csv,gzip
Stream Load csv, gzip, json
Routine Load csv, json
相似文档
  • Stream Load 用于将本地文件导入到 PALO 中。 不同于其他命令的提交方式,Stream Load 是通过 HTTP 协议与 PALO 进行连接交互的。 该方式中涉及 HOST:PORT 应为 HTTP 协议端口。 公有云用户必须使用 Compute Node(BE)的 HTTP 协议端口,默认为 8040。
  • 本文档主要介绍如何导入 BOS 中存储的数据。 准备工作: 请先通过以下步骤,在百度对象存储(Baidu Object Storage,BOS)上存放需导入到PALO中的数据。 开通 BOS 服务: 请参阅 开始使用BOS。 创建 Bucket: 请参阅 创建Bucket。 注意:Bucket 所属地域必须和 PALO 集群所属地域相同。PALO 地域通常可以在 PALO 控制台页面左上角查看。
  • 用户可以通过提交例行导入作业,直接订阅Kafka中的消息数据,以近实时的方式进行数据同步。 PALO 自身能够保证不丢不重的订阅 Kafka 中的消息,即 Exactly-Once 消费语义。
  • 用户可以通过 JDBC 协议,使用 INSERT 语句进行数据导入。 INSERT 语句的使用方式和 MySQL 等数据库中 INSERT 语句的使用方式类似。 INSERT 语句支持以下两种语法: * INSERT INTO table SELECT ... * INSERT INTO table VALUES(...)
  • PALO 可以创建通过 ODBC 协议访问的外部表。创建完成后,可以通过 SELECT 语句直接查询外部表的数据,也可以通过 INSERT INTO SELECT 的方式导入外部表的数据。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部