GPU卡详情
GPU服务器使用的NVIDIA GPU卡基本参数信息如下表所示:
GPU卡型号 | CUDA Cores | 显存容量 | 单精度浮点性能 | 双精度浮点性能 | INT8性能 | INT4性能 | 混合精度 |
---|---|---|---|---|---|---|---|
NVIDIA Tesla T4 | 2560 | 16GB | 8.1 Tflops | -- | 130 Tops | 260 Tops | -- |
NVIDIA Tesla V100-32G | 5120 | 32GB | 15.7 Tflops | 7.8 Tflops | -- | -- | 125 Tflops |
NVIDIA Tesla V100-16G | 5120 | 16GB | 15.7 Tflops | 7.8 Tflops | -- | -- | 125 Tflops |
NVIDIA Tesla P40 | 3840 | 24GB | 12 Tflops | -- | 47 Tops | -- | -- |
NVIDIA Tesla P4 | 2560 | 8GB | 5.5 Tflops | -- | 22 Tops | -- | -- |
NVIDIA Tesla K40 | 2880 | 12GB | 4.29 Tflops | 1.43 Tflops | -- | -- | -- |
NVIDIA深度学习开发卡 | 3584 | 12GB | 11 Tflops | -- | 44 Tops | -- | -- |
GPU使用场景
针对深度学习的离线训练场景,如果您是深度学习的初学者或初创公司,我们向您推荐性价比最高的NVIDIA深度学习开发卡,在创建GPU云服务器时再配合集成GPU驱动镜像进行使用,能帮助您快速完成环境部署和Training实验。
针对深度学习的离线训练场景,如果您是深度学习的重度用户,周期性有大量数据需要训练,我们向您推荐性能和稳定性更好的NVIDIA Tesla P40,如果您对性能有极致的要求,更可选择支持Tensor Core功能的NVIDIA Tesla T4、NVIDIA Tesla V100英伟达最新GPU卡。并可以选择按需使用,训练结束后即可将资源释放节省成本,同时通过自定义镜像功能,快速完成GPU云服务器的服务部署和搭建。
针对深度学习的在线预测场景,相比离线训练对GPU性能的要求降低,但对运行稳定性要求更高,对服务器响应延时也有了更高要求,所以我们向您推荐NVIDIA Tesla T4、NVIDIA Tesla P4 在满足性能要求的同时,提供更具性价比的选择。
当然,没有最好的云资源,只有最适合业务使用的才是最好的。所以我们为您提供了多种GPU类型选择,帮助您依据自身业务特点和资源投入预算来选择不同的云资源。当您对训练能力没有太高要求时,NVIDIA Tesla K40也是个不错的选择;让您对离线训练能力的要求超高时,也可以来申请GPU物理服务器,可以为您提供具备100G网络互联的GPU集群,帮您提速训练任务。