上云无忧 > 文档中心 > 百度智能云数据工厂Pingo使用教程 - 资源准备与管理
数据工厂Pingo
百度智能云数据工厂Pingo使用教程 - 资源准备与管理

文档简介:
创建实例: 进入创建实例页面,按照以下步骤选择实例配置和计算资源等配置信息,并按照订单信息支付完成实例的创建过程。 选择可用区与网络: 选择付费方式和地域、可用区,以及网络。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

创建实例

进入创建实例页面,按照以下步骤选择实例配置和计算资源等配置信息,并按照订单信息支付完成实例的创建过程。

选择可用区与网络

选择付费方式和地域、可用区,以及网络。

说明:

  • 付费类型:Pingo提供预付费即包年包月套餐和后付费即按量付费套餐,用户可根据需求选择相应的付费方式。
  • 地域:Pingo目前仅支持华北-北京区域,后续会陆续开通其他区域。
  • 可用区:Pingo的可用区与网络与BCC中的概念一致,是指在同一个区域(Region)下,电力、网络等基础设施相互隔离的一个或多个数据中心。
  • 网络:用户可以根据业务需要选择和其他服务相同VPC网络和子网。

配置计算资源

选择资源配置,主要是计算资源,目前提供了几种不同规格的节点,用户可根据业务需求选择计算节点的规格和数量。

说明:

  • 实例名称:名称需遵守“只支持大小写字母和数字的组合,长度小于65个字符”的规则。
  • 实例配置:实例配置为Pingo初始化所需资源,提供一定规格配置的CPU和内存,创建实例必选。
  • 计算资源:计算资源为作业计算和查询所需要的资源,根据业务量选择规格和数量,也可以后续根据业务扩充而扩容。
  • 节点数量:计算资源的节点个数,每个实例需要至少一个计算节点。

配置存储

Pingo的存储由BOS提供,归用户自己管理。Pingo和用户的BOS之间是关联关系,BOS可以存储用户需要分析的数据,也可以用来存储中间计算结果以及写入最终计算结果。

说明:

存储配置:Pingo实例和BOS Bucket需为同一地域。

填写购买信息

配置说明:

购买时长:预付费按月/按年购买,1年8.3折,2年7折,3年5折。 后付费无需填写购买信息,直接进入下一步,确认订单即可。

管理实例

实例状态

购买Pingo资源之后,跳转到实例管理界面,可以看到刚刚购买的实例处于正在创建的状态。实例创建初始化需要一些时间,请耐心等待几分钟。

在实例列表可以查看所有实例的状态,创建完成的实例状态会变为活跃中。如果实例没有作业运行,可以操作停止实例。

实例状态说明:

  • 正在创建:购买实例到实例初始化完成之间的状态。
  • 活跃中:实例创建成功,正常运行中的状态。
  • 已停止:手动操作停止实例,所有调度作业将停止运行。

停止与释放实例

目前 Pingo提供了对实例停止与释放的操作。停止与释放的区别如下:

  • 停止:将Pingo服务停止,服务占用的计算资源会暂时释放,但是会保留用户的集群和作业信息,因此服务停止后用户可以通过启动按钮将服务重新启动起来,服务启动后不需要重新导入数据。在停止状态下Pingo将停止计费,但是请不要将集群关联的BOS bucket删除,否则集群将无法重新启动成功。

    说明:停止操作且停止计费仅适用于后付费套餐,由于预付费套餐用户已支付包年包月费用,将为用户预留资源,故按时长一直计费,无需停止。

  • 释放:将服务占用的资源彻底释放,服务的数据彻底删除,不可以恢复,类似于将本地的程序和数据删除。

用户可以在实例列表页面进行实例的停止和释放操作,也可以点击实例名称进入实例详情页面进行操作。

当点击停止按钮时,实例进入正在停止状态:

约1分钟后,实例处于已停止状态:

此时,实例不可访问。点击启动按钮,可重新启动实例。

当点击释放按钮时,实例立即删除。并且从控制台不可见。

实例扩容

实例在创建时,选择了实例配置和计算资源配置。
目前用于服务初始化和调度的实例资源暂不可变更配置。
仅提供计算资源的节点扩充。您可以在任何时间按需修改计算节点的数目,在实例详情页面,计算资源点击配置变更修改期望的节点数目。

目前 Pingo仅支持扩容节点,计算资源节点允许扩充至最多 100 个节点。暂不支持缩容。

如果您是预付费用户,则配置费用为新增配置费用。如果是按需付费用户,则配置费用为扩容后的总单价费用。

操作完成后,点击 配置变更,并确认订单,即完成实例配置变更的工作。

支付完成之后,实例进入正在扩展的状态。

大约1-5分钟左右扩展工作即可完成。扩容节点状态将会变为 “活跃中”,实例状态也会变成“活跃中”,扩容完成。

相似文档
  • 在系统配置模块,进入Pingo的用户系统管理。 Pingo的用户系统用来管理用户(user)和用户组(group),用户组就是一组用户的集合。他们都是权限分配的单位与载体,也就是在其他模块中进行权限管理时,都是授权给用户或者用户组的。 用户分为管理员和普通用户,区别是管理员可以增、删、改、查任意的用户或者用户组。
  • 从数据管理-表管理进入表数据管理模块,Pingo的表管理系统对结构化数据、半结构化的元数据信息统一集成。如图所示,这里可进行结构化元数据的管理,包括表、数据库、命名空间的增、删、改、查。
  • 文件管理是Pingo的统一文件元数据管理模块,Pingo的文件系统可接入HDFS、S3、BOS等外部文件存储系统,并抽象了这些不同的外部存储系统,对内提供统一的文件访问接口。相当于计算机中的资源管理器,是Pingo中其他模块访问文件的唯一入口。为其他模块访问不同的文件存储系统提供了极大的便利。
  • 传输管理模块的功能主要是将结构化数据与非结构化数据传输到pingo大数据处理系统。 概念介绍: 数据源:指数据传输的来源; 传输任务:每个新建的传输我们称为一个传输任务(对应一个transid),在平台建的批量传输与在调度平台每次调度产生的任务都会产生一个这样的传输任务;
  • 批量作业管理的原型可以理解为Linux上的crontab,按照配置的调度规则自动触发任务的执行。在pingo中扩展了作业间的DAG依赖执行,重试机制,任务以及执行状态管理,以及自定义的任务扩展能力。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部