上云无忧 > 文档中心 > 百度智能云MapReduce开源组件介绍 - Zeppelin
百度智能云MapReduce开源组件介绍 - Zeppelin

文档简介:
Zeppelin简介: zeppelin 是一个交互式数据分析工具,可支持spark、sql等数据分析工具(详细介绍,请参考zeppelin 官网)。 本文将介绍如何在zeppelin上链接配置hiveserver2,来介绍zeppelin上sql的基本使用。
*此产品及展示信息均由百度智能云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

Zeppelin简介

zeppelin 是一个交互式数据分析工具,可支持spark、sql等数据分析工具(详细介绍,请参考zeppelin 官网)。

本文将介绍如何在zeppelin上链接配置hiveserver2,来介绍zeppelin上sql的基本使用。

集群准备

准备百度智能云环境。

  1. 登录控制台(百度智能云登录平台),选择“产品服务->MapReduce BMR”,点击“创建集群”,进入集群创建页,并做如下配置:

    • 设置集群名称
    • 设置管理员密码
    • 关闭日志开关(如果打开,需要选择存放日志用的bos目录,bos目录的bucket必须已经存在
    • 选择镜像版本“BMR 2.0(hadoop 3.1)“ (只有BMR2.0 及以上版本的zeppelin方可用)
    • 选择内置模板“zeppelin” (默认会自动勾选hive;如果需要使用spark,请手动勾选spark组件)
    • 高可用开关默认打开,可选择关闭HA模式
    • 集群网络和安全设置保持默认即可
    • 点击下一步,选择各个组的机器配置(master节点建议cpu核数 >= 8, 内存 >= 16G)和机器数量(master节点跟上一步中的高可用模式打开或者关闭有关)

保持其他配置为默认值,点击下一步后,再请点击“去支付”可在集群列表页可查看已创建的集群,当集群状态由“初始化中”变为“空闲中”时,集群创建成功。

  1. 访问集群

    • 首先参考访问集群建立本地浏览器能访问集群的网络环境(可以是ssh方式也可以是openvpn方式)
    • 登录集群master节点,在终端输入hostname命令可得到集群的fqdn名称(称作hostname_master)
    • 浏览器输入$hosname_master:9995即可链接到zeppelin UI界面
  2. 使用zeppelin

    • login 默认账户名和密码是admin/admin
    • 新建notebook命名为hive

    • 关键参数配置(选择jdbc group,配置hive时,要配置四个选项:driver, user, passwd, jdbc connection url)

    • 执行命令

  

参考文档:

  1. http://zeppelin.apache.org/docs/0.8.0/index.html
  2. https://zeppelin.apache.org/
相似文档
  • Flink简介: Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。
  • Druid简介: Druid是一个高性能的实时数据分析系统,由MetaMarkets公司在2012开源,专门为OLAP场景而设计。Druid遵从Lambda架构,支持批量和实时两种方式导入数据,并提供高性能的数据查询。
  • Impala简介: Impala是Cloudera公司主导开发的MPP架构的查询系统,它提供SQL语义,能够快速的查询存储在HDFS、HBASE中的数据。此外Impala使用与Hive相同的元数据、SQL语法、ODBC驱动。
  • ClickHouse简介: ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。它是由俄罗斯搜索引擎公司Yandex开发,并于2016年6月发布的开源DBMS,与Hadoop,Spark相比,ClickHouse轻量很多。
  • 分布式概述: Kafka是一个分布式,多分区,多副本的流处理消息中间件,具备高吞吐量、高可扩展性、可持久化等特性,广泛应用于实时数据传输、日志收集、实时监控数据聚合等实际应用场景中。BMR中的Kafka是基于开源社区的Kafka,提供一种可快速部署,用户独享的Kafka集群。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部