上云无忧 > 文档中心 > 腾讯云计算加速套件 TACO Kit - 容器安装用户态 RDMA 驱动
计算加速套件TACO Kit
腾讯云计算加速套件 TACO Kit - 容器安装用户态 RDMA 驱动

文档简介:
操作场景: 本文介绍如何为容器安装用户态 RDMA 驱动。
*此产品及展示信息均由腾讯云官方提供。免费试用 咨询热线:400-826-7010,为您提供专业的售前咨询,让您快速了解云产品,助您轻松上云! 微信咨询
  免费试用、价格特惠

操作场景

本文介绍如何为容器安装用户态 RDMA 驱动。

操作步骤

说明
本文以 Ubuntu 20.04 操作系统的机器为例。
1. 执行以下命令,下载对应容器中的 OS 版本的 MLNX OFED 驱动。
		
wget https://www.mellanox.com/downloads/ofed/MLNX_OFED-5.4-3.1.0.0/MLNX_OFED_LINUX-5.4-3.1.0.0-ubuntu20.04-x86_64.tgz
若您使用了其他版本操作系统,则请访问 Linux InfiniBand Drivers 下载对应的版本。选择步骤如下图所示:
注意
OFED 版本选择5.4-3.1.0.0

2. 依次执行以下命令,进行解压及安装。
		
tar xf MLNX_OFED_LINUX-5.4-3.1.0.0-ubuntu20.04-x86_64.tgz
		
cd MLNX_OFED_LINUX-5.4-3.1.0.0-ubuntu20.04-x86_64
		
./mlnxofedinstall --user-space-only --without-fw-update --force
安装过程中出现的红色 warning 信息可忽略,直至页面出现 Installation passed successfully 绿色字样,表示安装成功。

相关操作

若您在安装过程中出现如下图所示错误:

请参考以下步骤处理:
1. 由于 neohost 需要依赖 python2,执行以下命令,修改系统默认的 python 版本。
		
ln -sf /usr/bin/python2.7 /usr/bin/python
2. 执行以下命令,确认 python 版本。
		
python --version
如果提示找不到 python 命令,则需要安装 python2.7。
3. 执行以下命令,重新安装 ofed。
		
./mlnxofedinstall --user-space-only --without-fw-update --force
4. 执行以下命令,恢复 python3 作为默认 python 版本。
		
update-alternatives --install /usr/bin/python python /usr/bin/python3 1
相似文档
  • 背景信息: 长期以来,AI 算法用于生产环境大规模模型的推理部署,都存在着多维度的考虑因素: 从企业的角度,需考虑如何选择硬件/基础设施来部署业务从而获得最佳投入产出比。
  • 操作场景: 本文介绍如何在服务器上安装 TACO Infer。TACO Infer 的安装包包括 Python Wheel 包和推理 SDK 包两个部分。Python Wheel 包用于在具有目标加速芯片的机器环境中对模型进行优化,SDK 则用于 C++开发模型推理部署。
  • 优化接口: TACO Infer 为您提供了一套简单易用的模型优化接口。 对于 CPU 计算设备,优化接口为 optimize_cpu:
  • 模型准备: TACO Infer 支持对 Pytorch TorchScript 和 torch.nn.Module 两种模型格式进行优化。通常在生产环境中,性能最优的方式是导出 TorchScript 模型后进行部署。TorchScript 模型也是 TACO Infer 支持最完善的模型格式,推荐您优先使用 TorchScript 模型格式。在优化前,您需要准备好导出后的 TorchScript 模型。
  • 使用TACO Infer产出优化模型,并且验证模型的性能和正确性符合预期之后,接下来就可以将模型部署在实际生产环境中了。
官方微信
联系客服
400-826-7010
7x24小时客服热线
分享
  • QQ好友
  • QQ空间
  • 微信
  • 微博
返回顶部