GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚洲第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力
为您提升计算效率的GPU软件
AIACC-Trainng
神龙AI加速训练引擎
AIACC-Training是阿里云推出的神龙AI加速训练引擎,针对阿里云环境进行了深度优化,能够显著提升分布式训练效率,大幅提高网络带宽利用率。目前,AIACC-Training已创造两项世界纪录:
斯坦福Dawnbench Imagenet 训练速度最快,世界第一
斯坦福Dawnbench Imagenet 训练成本最低,世界第一
能够提供
支持四种主流框架
Tensorflow, Pytorch, MXNet和Caffe四种分布式训练框架
性能提升50%至300%
适用于带宽密度的网络模型
单机多卡/多机多卡间高性能通信
支持FP16梯度压缩及混合精度压缩
MXNet的API扩展
支持insightface类型的数据+模型并行
RDMA网络深度优化
支持混合链路通信(RDMA+VPC)
AIACC-Inference
神龙AI加速推理引擎
AIACC-Inference是阿里云推出的神龙AI加速推理引擎,针对阿里云环境进行了深度优化,能够显著提升GPU利用率,大幅提高推理业务性能。目前,AIACC-Inference已创造两项世界纪录:
斯坦福Dawnbench Imagenet 推理延迟最低,世界第一
斯坦福Dawnbench Imagenet 推理成本最低,世界第一
能够提供
支持多个框架
Tensorflow, Pytorch, MXNet及其它可导出ONNX模型的深度学习框架进行GPU推理优化
性能提升30%至400%
适用于计算密集的网络模型
支持两种精度模型
FP32和FP16两种精度的模型优化
FastGPU
阿里云GPU实例集群极速部署工具
FastGPU是一套阿里云GPU实例集群极速部署工具,帮助用户在阿里云上一键部署GPU计算资源,使其简单适配、一键部署、随处运行,为用户提供了省时、经济、便捷的阿里云GPU实例集群即刻构建方案。
能够提供
快速部署
提供便捷的API将线下训练/推理脚本快速部署在阿里云GPU实例集群中
便捷管理
提供便捷的命令行工具用于管理阿里云GPU实例集群的运行状态和生命周期
高效省时
用户无需进行阿里云IAAS层相关的计算、存储、网络等繁琐的部署操作,获取集群资源时自动获取相应环境
EAIS
阿里云弹性加速计算实例
Alibaba Elastic Accelerated Computing Instances(EAIS)是一款弹性加速计算实例,可在Alibaba ECS实例中灵活添加GPU加速资源。您可以针对您的应用程序的整体计算和内存需求在 Alibaba Cloud 中选择最适用的ECS实例,然后再配置所需量级的 GPU 驱动推理加速,有效利用资源,同时火速节约成本高达50%。
能够提供
推理成本降低50%
满足用户选择最合适应用的ECS总体计算实例类型,单独制定所需GPU推理加速量级,相比GPU推理实例成本降低50%
灵活的CPU与GPU配比
根据用户需求灵活配比CPU和GPU资源,准确获取用户需求
弹性伸缩
轻松扩展和缩减推理加速量级,有助于用户仅为所需资源付费
产品特性
超强的计算能力
提供8块NVIDIA Tesla NVLink A100 GPU,5 petaFLOPS的FP16深度学习计算性能,为AI和高性能计算打造功能强大的可扩展GPU加速服务平台。
出色的网络性能
GPU云服务器实例最大支持2,000,000的PPS及25Gbps的内网带宽,当搭配了本地高速缓存盘,配合高效云盘或SSD云盘,在保证数据高可用的前提下,将计算和渲染性能发挥到极致。
灵活的购买方式
支持包年包月、按量付费、抢占式实例多种付费方式,按需购买,享最低折扣。
深度学习
强大的训练能力,优异的推理能力
深度学习已在工业界取得重大突破和广泛应用,自然语言处理为了让计算机能够“读懂”人类的语言,随着深度学习的显著进展,在文本分类、推荐系统等方向都有着广泛应用;而语音合成和语音识别在智能问答、聊天机器人也有着广泛应用。图像领域作为深度学习应用最为成熟的领域,在阿里云强大的GPU算力助力下能够更准确识别图片,蹄筋提供准确率,也提高运行效率。
能够解决
强大的训练能力
最新Tesla A100 Tensor Core GPU 针对AI、数据分析在各种规模上实现出色的加速,应对极其严峻的计算挑战。同时阿里云提供多种GPU实例规格,提供不同算力和场景需求的灵活性。
优异的推理能力
提供业界领先的推理能力,Tesla A100通过全系列精度(FP32、FP16、INT8一直到INT4)加速,实现了强大的多元化用途。
图形可视化
业内领先解决方案,超强性能
适用于工程模拟和分析的业内领先解决方案能够提供高性能、可扩展性及企业级可靠性。借助GPU超大显存容量和超强性能,利用所需计算能力执行复杂模拟并解决极具挑战性的问题。
能够解决
优化的解决方案
进行负责CFD建模,极大缩短解决时间
加速计算电磁学的电子设计
在设计高性能电子产品和组件时,模拟电磁性能,准确预测电磁辐射、干扰和信号传输
工程模拟
在云端,提升工作效率,并让IT部门节省预算开支的应用虚拟化
视频处理
高清视频处理,最佳展示
在视频处理领域同样存在计算量大,处理时间长的问题,而GPU因其计算任务高并行度,可以用于优化。目前GPU主要被用于大规模高清视频转码,4K/8K高清直播,多人视频会议、片源修复等领域
能够解决
高性能
优化程度高,提高计算性能
强计算力
快速处理多帧数据,提供处理大量计算任务的算力
科学计算
高性能计算
在气象预测、油气勘探、分子动力学等需要大规模并行计算的科学计算领域,GPU已在发挥强大的作用。通过提供大规模浮点运算的算力,与弹性计算完美结合,无论在线或离线均能提供高效的计算性能
能够解决
弹性伸缩
与ESS和SLB结合实现弹性扩容
超强计算力
提供最新型号GPU及最便捷的部署方法,满足科学计算的强大计算需求