上云无忧 > 文档中心 > 百度智能云数据工厂Pingo的功能
数据工厂Pingo
百度智能云数据工厂Pingo的功能

文档简介:
百度数据工厂Pingo有以下主要功能: ETL:支持SQL及Spark DataFrame API编写ETL程序,支持Java、Python、Scala编写的第三方或者本地代码。 任务调度:支持ETL工作流例行调度,支持按任意周期定时执行作业以及创建依赖作业触发自动执行。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

百度数据工厂Pingo有以下主要功能:

  • ETL:支持SQL及Spark DataFrame API编写ETL程序,支持Java、Python、Scala编写的第三方或者本地代码。
  • 任务调度:支持ETL工作流例行调度,支持按任意周期定时执行作业以及创建依赖作业触发自动执行。
  • 外部数据访问:支持JDBC、ODBC、数据API的方式进行外部数据访问,支持从HDFS、BOS等直接读取数据进行计算。
  • 交互式代码调试:提供Notebook进行交互式代码调试,允许用户在Notebook中直接书写SQL进行查询,支持写入多行SQL。
  • 一键例行:Pingo提供了一键例行的功能,用户可以在Notebook中进行调试,调试OK后可直接通过一键例行功能提交到LS例行执行。
  • 作业组管理:用户提交到LS的所有作业都由作业组管理模块处理,支持用户根据自己的权限来增删查改作业组。
相似文档
  • 统一文件存储抽象: Pingo的文件管理系统PFS不仅为自身提供文件存储功能,还允许外部文件存储系统的接入,诸如BOS,S3等,均可接入到PFS。同时,PFS抽象了这些不同的外部存储系统,对内提供统一的文件访问接口。(目前暂时只支持BOS接入,后续将陆续支持其他文件系统接入。)
  • 数据仓库建设: 海量数据批量处理:企业数据进行整合与处理,对数据进行清洗、转换。 实时数据计算:对流式数据进行实时计算,低延迟输出计算结果。 数据查询分析:多表联合分析查询,即时返回查询结果。
  • 表管理: 命名空间(namespace):表管理对象中的最高级别节点,命名空间的子节点可以是命名空间或者数据库,不能是表。 数据库(database):表管理对象中的中间层级节点,数据库必须是命名空间的子节点,数据库的子节点只能是表。
  • 计费项目: 在使用数据工厂Pingo时,只会收取实际产生的资源费用,Pingo配套的功能目前不收取任何额外费用,数据工厂Pingo所有的收费项目包含:
  • 预付费情况下,您可以按月预支付 Pingo 的使用费用,Pingo 会根据您选择的实例机型配置和个数,计算出按月付费的套餐价格。通常,相同时长的预付费价格要远低于按需付费的价格。 说明:购买前需保证账户无欠款。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部