【腾讯云】数据湖解决方案简介_功能优势

【腾讯云】数据湖解决方案

以 COS 为数据湖底座，支持多格式数据存储；通过数据加速器无缝对接机器学习平台，打破数据孤岛。

免费试用

*此产品及展示信息均由腾讯云官方提供。咨询热线：400-826-7010，为您提供专业的售前咨询，让您快速了解云产品，助您轻松上云！微信咨询

免费试用、价格特惠

腾讯旗下

注册资本：14250万元人民币

成立时间：2010-10-21

腾讯云档案>>

以 COS 为数据湖底座，支持多格式数据存储；通过数据加速器无缝对接机器学习平台，打破数据孤岛。

功能特性

多数据源支持
可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据，同时可以按原样存储数据。

计算弹性
通过计算与存储分离，实现计算资源的弹性伸缩，满足客户对计算资源的灵活调度。

成本最优
为集中式存储池，可快速扩展或缩减存储资源，实现存储数据冷热分层，降低大数据分析与机器学习存储成本。

服务集成
无缝支持腾讯云各类计算分析、机器学习产品，包括弹性 MapReduce、流计算 Oceanus 、腾讯云 TI 平台机器学习。

业务架构

方案概述

对象存储 COS 可存储任意规模的结构化、半结构化、非结构化数据，其提供12个9的数据持久性，实现计算与存储分离，发挥计算弹性伸缩能力，同时对存储数据冷热分层，是构建数据湖的首选存储服务。借助 COS 构建的数据湖，搭配数据湖加速器 GooseFS、元数据加速器、AZ 加速器等加速服务，可以高效、低成本地对接各类计算分析和机器学习平台，从而打破数据孤岛，洞察业务价值，指导客户做出更好的决策。

典型应用场景

开源生态数据湖

场景描述
客户基于开源 Hadoop 生态构建大数据处理与分析，会面临计算资源与存储资源扩容速度不匹配、存储系统需对接多数据源的问题。

主要能力
计算存储分离：通过计算与存储分离，实现计算资源弹性伸缩，满足客户对计算资源的灵活调度。
多数据源支持：可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。
高性能业务架构：通过数据湖加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务，提升计算业务访问性能。

交互式查询数据湖

场景描述
客户在 COS 中存储了多种数据源数据，包括实时计算数据，需要对其中的数据进行 OLAP 分析并进行数据可视化展示。

主要能力
多数据源支持：可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速：通过数据湖加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务，实现超越本地 HDFS 的性能。

混合分层模式数据湖

场景描述
在海量大数据分析中，随着时间的推移，分析数据将不断累积，同时数据访问频率逐渐降低，会面临存储数据更低成本的问题。

主要能力
冷热分层：对存储数据冷热分层，降低大数据分析资源成本。
多数据源支持：可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。

机器学习数据湖

场景描述
在经典机器学习场景中，训练数据量大，同时要求很大的内网带宽。

主要能力
超大带宽：可以提供超大的内网带宽，满足机器学习场景大带宽需求。
多数据源支持：可对接多种数据源，允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速：通过数据湖加速器GooseFS、元数据加速器、AZ 加速器等多级加速服务，实现超越本地 HDFS 的性能。

云原生数据湖

场景描述
通过容器服务，结合 Flink、TensorFlow 等开源应用，搭建云原生数据 ETL 集群和分析集群，实现计算资源的弹性化；通过数据湖加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务，提升计算业务访问性能；通过对象存储服务作为数据湖存储底座，实现海量异构数据的低成本存储。

主要能力
计算存储分离：通过计算与存储分离，实现计算资源弹性伸缩，满足客户对计算资源的灵活调度。
高性能业务架构：通过数据湖加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务，提升计算业务访问性能。
丰富生态支持：可存储 Parquet、ORC 多种格式数据源，支持 Spark、Presto、Flink 等多种大数据插件。

相关云产品和功能

对象存储 COS

提供稳定持久、安全可靠、成本最优的云端存储服务，可根据应用程序类型提供各语言 SDK，实现无缝接入。

云 HDFS

提供标准HDFS访问协议和分层命名空间的高性能分布式文件系统。

容器服务

稳定、安全、高效、灵活扩展、简单易用的Kubermetes容器管理平台。

数据湖加速器 GooseFS

提供高性能、高可用、稳定可靠的分布式文件缓存服务，支持AI/大数据等数据密集型业务。

弹性 MapReduce

云端托管的弹性开源泛Hadoop服务，支持Spark、Hbase、Presto、Flink、Druid等大数据框架。

腾讯云 TI 平台

一站式机器学习生态服务平台，涵盖了数据预处理、模型训练、评估、预测全部流程。

相似产品

【腾讯云】存储数据迁移解决方案
想买: 317人简介: 针对对象存储服务的多种数据场景，提供安全可靠，专业高效的数据迁移解决方案，方便客户将已有业务数据快速地迁移到腾讯云。
【腾讯云】高性能对象存储解决方案
想买: 1137人简介: 通过多架构融合、多协议兼容和云上云下数据多级管理能力，将腾讯云存储超高性能、超大规模、超低成本的能力进行有机整合。
【腾讯云】大数据解决方案
想买: 382人简介: 基于腾讯云丰富的大数据产品、服务及实践，助力客户平滑高效构建云端大数据基础设施及应用。
【腾讯云】腾讯位置服务
想买: 1091人简介: 基于海量位置数据，为客户提供定位、地图、搜索、路线规划、导航、位置大数据等专业的 LBS 能力支持，助力行业伙伴业务发展。
【腾讯云】智能客服机器人
想买: 655人简介: 聪明、亲切、功能强大的客服机器人，为您提供全天候、全通路的秒级响应专业服务体验，让客户不再排队等待，最高可节约人力成本68%。

找云产品

上云无忧友情提示

在新打开的页面上进行关联，即可享受腾讯云补贴

合作伙伴：郑州同尘智能科技有限公司

如需帮助，请致电7×24小时客服热线400-826-7010。人工在线客服

全民上云·上云补贴申领

【腾讯云】数据湖解决方案免费试用（限企业）