弹性 MapReduce(EMR)结合云技术和 Hadoop、Hive、Spark、Hbase、Presto、Flink 、Druid、ClickHouse 等社区开源技术,提供安全、低成本、高可靠、可弹性伸缩的云端半托管泛Hadoop大数据架构。您可以在数分钟内创建安全可靠的专属泛 Hadoop 集群,以分析位于集群内数据节点或对象存储 COS 上的 PB 级海量数据。
灵活
只需几分钟,通过网页或 API 的方式,即可按需启动一个安全可靠的专属 Hadoop 集群,也可以根据不同业务部门的需要,组合并选择运行相应版本的 Hive、Spark、Hbase、Presto 等大数据组件。可通过管理控制台,方便的对节点、组件、进程进行监控告警配置和运维操作。
安全
您可以通过便捷的 VPC 网络安全隔离手段规划您的托管 Hadoop 集群网络策略,支持网络 ACL 和安全组,您可从子网和主机维度筛选流量,全方位满足您的网络安全需求。腾讯云品质的安全加固服务为 EMR 集群提供一体化的安全服务,涵盖网络防护、入侵检测、漏洞防护等。
可靠
云盘节点故障热迁移,双 Master 节点容灾设计,备节点秒级拉起,保障大数据服务可用性。Hive 等元数据异地灾备,计算存储分离至对象存储 COS 的数据保障高耐久存储。完备的监控体系,帮助您快速发现并定位集群异常,保障集群的平稳运行。
弹性
借助弹性 MapReduce 产品,您可以立刻获得大数据集群的弹性能力,您可以按业务曲线或监控指标情况,手动或自动伸缩托管的 Hadoop 集群规模。借助计算存储分离,您甚至可以完全销毁集群,实现资源利用的最大化。
成本节约
弹性 MapReduce 集群支持包年包月与按量计费的混合计费模式,借助于弹性能力可以随时调整集群规模,为弹性部分的节点按需付费。借助计算存储分离能力,可以节约您的存储成本超80%,并可同时获得数据高持久性保障。
易用
可通过管理控制台,方便的对节点、组件、进程进行监控告警配置和运维操作。丰富的运维工具支持,助您大幅提升运维工作效率,让工程师更专注于业务本身的商业价值,摆脱重复搭建监控、安全、运维工具等基础设施。
离线数据分析
把游戏、WEB 应用、手机 APP 等业务服务器上的海量日志同步到 EMR 的数据节点或 COS 后,您可以借助于 Hue 等工具使用 Hive、Spark、Presto 等主流计算框架快速获取数据洞察力。
列式存储 HBase
弹性 MapReduce 支持原生 HBase 组件,您可以快速搭建和使用到托管的 HBase 集群。 HBase 是一种高度可拓展的分布式大数据存储,借助于我们集成的 Phoenix,可以对 HBase 表进行低延迟的 SQL 访问。
流式数据处理
在程序/工具中通过 API、SDK 把位于业务服务器上实时产生的数据 Push 到 消息中间件之后,您可以在 EMR 产品中选择合适的流式数据处理引擎来分析数据,以实现对数据的实时计算及决策。
分析 COS 上的数据
您可以通过 EMR 产品快速分析存储于 COS 上的海量数据,以实现彻底的存储计算分离。通过这样的设计,您可以充分利用 COS 提供的丰富数据同步工具,同时还可以让多个不同版本 Hadoop 集群分析同一份数据,以满足数据一致性及历史原因导致的多版本 Hadoop 集群共存的问题。

客户案例