上云无忧 > 文档中心 > 百度智能云数据工厂Pingo的优势
数据工厂Pingo
百度智能云数据工厂Pingo的优势

文档简介:
统一文件存储抽象: Pingo的文件管理系统PFS不仅为自身提供文件存储功能,还允许外部文件存储系统的接入,诸如BOS,S3等,均可接入到PFS。同时,PFS抽象了这些不同的外部存储系统,对内提供统一的文件访问接口。(目前暂时只支持BOS接入,后续将陆续支持其他文件系统接入。)
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

统一文件存储抽象

Pingo的文件管理系统PFS不仅为自身提供文件存储功能,还允许外部文件存储系统的接入,诸如BOS,S3等,均可接入到PFS。同时,PFS抽象了这些不同的外部存储系统,对内提供统一的文件访问接口。(目前暂时只支持BOS接入,后续将陆续支持其他文件系统接入。)

远端数据加速访问

PFS可以缓存接入的外部文件系统中的文件,将远端的数据缓存在距离计算节点较近的位置,提供数据的加速访问。

多计算引擎同时支持

不仅支持传统的SQL计算引擎,还提供Spark Dataframe,Spark Structed Streaming等业界流行的离线计算框架供用户选择,同时为了照顾习惯于使用SQL的用户方便的使用流式计算,还提供Spark Streaming SQL。

多种作业提交方式

提供多种灵活的提交Job方式,包括Jar包,代码片段,以及Java/Scala API,同时支持将即时调试成功的代码一键生成例行作业。

外部元数据集成

表管理和文件管理不仅能够提供自身存储的元数据信息,同时能够引入外部的元数据信息,通过引入外部的元数据信息,无需用户手动导入,就能够对原本存储在多个数据仓库中的数据进行联合查询。

统一批量与流式数据处理

集成的批量和流式数据处理系统,以统一的接口同时支持流式、批量作业,用户可在Pingo一个系统同时实现批量作业调度和流式数据处理。

全WEB化操作

平台级服务,全Web化操作,无需额外下载插件,用户可通过全Web方式进行数据表管理,作业调试,作业创建与例行调度管理。

多人协作模式开发

支持分组管理与权限管理,用户可通过分组以及授权机制实现多人协作共同管理开发作业。

相似文档
  • 数据仓库建设: 海量数据批量处理:企业数据进行整合与处理,对数据进行清洗、转换。 实时数据计算:对流式数据进行实时计算,低延迟输出计算结果。 数据查询分析:多表联合分析查询,即时返回查询结果。
  • 表管理: 命名空间(namespace):表管理对象中的最高级别节点,命名空间的子节点可以是命名空间或者数据库,不能是表。 数据库(database):表管理对象中的中间层级节点,数据库必须是命名空间的子节点,数据库的子节点只能是表。
  • 计费项目: 在使用数据工厂Pingo时,只会收取实际产生的资源费用,Pingo配套的功能目前不收取任何额外费用,数据工厂Pingo所有的收费项目包含:
  • 预付费情况下,您可以按月预支付 Pingo 的使用费用,Pingo 会根据您选择的实例机型配置和个数,计算出按月付费的套餐价格。通常,相同时长的预付费价格要远低于按需付费的价格。 说明:购买前需保证账户无欠款。
  • 后付费即按使用量付费,在此模式下,您可以按使用时长支付Pingo的使用费用,可随时停止服务或释放资源便停止计费。 购买集群前需保证账户无欠款,且保证账户余额和可用代金券总和大于或等于100元。 计费公式: 费用 = (实例配置费用 + 计算节点单价 × 节点个数)× 使用时长
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部