数据加速器(Data Accelerator Goose File System,GooseFS)采用了分布式集群架构,具备高性能、低延迟、大吞吐等特性;能够为上层计算应用提供统一的命名空间和访问协议,方便用户在不同的存储系统管理和流转数据。GooseFS 能够加速海量数据分析、机器学习、人工智能等业务访问存储的性能,适用于基因计算、自动加速等业务场景。
多数据源支持
可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据,同时可以按原样存储数据。
计算弹性
通过计算与存储分离,实现计算资源的弹性伸缩,满足客户对计算资源的灵活调度。
成本最优
为集中式存储池,可快速扩展或缩减存储资源,实现存储数据冷热分层,降低大数据分析与机器学习存储成本。
服务集成
无缝支持腾讯云各类计算分析、机器学习产品,包括弹性 MapReduce、流计算 Oceanus。
机器学习
在经典机器学习场景中,训练数据量大,同时要求很大的内网带宽。
主要能力
超大带宽:可以提供超大的内网带宽,满足机器学习场景大带宽需求。
多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速:通过数据加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务,实现超越本地 HDFS 的性能。
蔚来
智能电动汽车品牌
提供容器化场景下的高性能访问和文件共享服务,利用 COS 作为数据湖存储底座,为客户提供成本性能兼具的方案。
酷狗
音频媒体播放软件
通过 GooseFS 协助酷狗实时查询大数据业务优化,通过加速 IO 访问的方案协助客户提升 Presto/Spark 业务优化查询速度,实现存储性能优化。
高途
在线教育平台
通过 GooseFS+公有云 CHDFS 的方案实现存算分离,相比友商的本地盘方案,为客户降低了40%的整体成本,提升30%的计算作业性能。
易久批
互联网商城平台
通过 Fluid + GooseFS 的技术方案,加速 AI 训练业务的模型分发速度,有效提升容器启动性能,实现数倍性能优化。
提供产品动态、核心特性、快速入门、开发者指南、部署指南、运维指南、云原生实践等文档指引,方便您快速上手 GooseFS。
产品特性
多数据源支持
可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据,同时可以按原样存储数据。
计算弹性
通过计算与存储分离,实现计算资源的弹性伸缩,满足客户对计算资源的灵活调度。
成本最优
为集中式存储池,可快速扩展或缩减存储资源,实现存储数据冷热分层,降低大数据分析与机器学习存储成本。
服务集成
无缝支持腾讯云各类计算分析、机器学习产品,包括弹性 MapReduce、流计算 Oceanus。
应用场景
机器学习
在经典机器学习场景中,训练数据量大,同时要求很大的内网带宽。
主要能力
超大带宽:可以提供超大的内网带宽,满足机器学习场景大带宽需求。
多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速:通过数据加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务,实现超越本地 HDFS 的性能。
大数据分析
客户基于开源 Hadoop 生态构建大数据处理与分析,会面临计算资源与存储资源扩容速度不匹配、存储系统需对接多数据源的问题。
主要能力
计算存储分离:通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
高性能业务架构:通过数据加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能。
交互式查询
通过容器服务,结合 Flink、TensorFlow 等开源应用,搭建云原生数据 ETL 集群和分析集群,实现计算资源的弹性化;通过数据加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能;通过对象存储服务作为数据湖存储底座,实现海量异构数据的低成本存储。
主要能力
计算存储分离:通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
高性能业务架构:通过数据加速器 GooseFS、元数据加速器、AZ 加速器等多级加速服务,提升计算业务访问性能。
丰富生态支持:可存储 Parquet、ORC 多种格式数据源,支持 Spark、Presto、Flink 等多种大数据插件。
客户案例
蔚来
智能电动汽车品牌
提供容器化场景下的高性能访问和文件共享服务,利用 COS 作为数据湖存储底座,为客户提供成本性能兼具的方案。
酷狗
音频媒体播放软件
通过 GooseFS 协助酷狗实时查询大数据业务优化,通过加速 IO 访问的方案协助客户提升 Presto/Spark 业务优化查询速度,实现存储性能优化。
高途
在线教育平台
通过 GooseFS+公有云 CHDFS 的方案实现存算分离,相比友商的本地盘方案,为客户降低了40%的整体成本,提升30%的计算作业性能。
易久批
互联网商城平台
通过 Fluid + GooseFS 的技术方案,加速 AI 训练业务的模型分发速度,有效提升容器启动性能,实现数倍性能优化。
文档与定价
提供产品动态、核心特性、快速入门、开发者指南、部署指南、运维指南、云原生实践等文档指引,方便您快速上手 GooseFS。
快速入门
提供入门 GooseFS 的关键路径,帮助您快速上手 GooseFS 使用。
产品动态
提供 GooseFS 产品更新说明,方便您了解最新版本能力。
核心特性
提供 GooseFS 核心特性介绍,包括缓存策略、统一命名空间、透明加速、Table 管理等特性。
运维指南
提供 GooseFS 的操作指南,包括部署、运维、监控等,帮助您熟悉 GooseFS 的产品使用。
云原生实践
提供 GooseFS 的云原生实践,帮助您快速了解如何在云原生容器服务上快速上手 GooseFS。