NVIDIA CUDA GPU Installation
在环境满足如下条件前提下
- GPU驱动 >= 535
- CUDA >= 12.3
- CUDNN >= 9.5
- Python >= 3.10
- Linux X86_64
可通过如下4种方式进行安装
1. 预编译Docker安装(推荐)
注意: 如下镜像仅支持SM 80/90架构GPU(A800/H800等),如果你是在L20/L40/4090等SM 86/89架构的GPU上部署,请在创建容器后,卸载fastdeploy-gpu再重新安装如下文档指定支持86/89架构的fastdeploy-gpu包。
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/fastdeploy-cuda-12.6:2.3.0-rc0 2. 预编译Pip安装
首先安装 paddlepaddle-gpu,详细安装方式参考 PaddlePaddle安装
# Install stable release python -m pip install paddlepaddle-gpu==3.2.1 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/ # Install latest Nightly build python -m pip install --pre paddlepaddle-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/cu126/ 再安装 fastdeploy,注意不要通过pypi源安装,需要通过如下方式安装
如你的 GPU 是 SM80/90 架构(A100/H100等),按如下方式安装
# 安装稳定版本fastdeploy python -m pip install fastdeploy-gpu==2.3.0-rc0 -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-80_90/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple # 安装Nightly Build的最新版本fastdeploy python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/fastdeploy-gpu-80_90/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple 如你的 GPU 是 SM86/89 架构(4090/L20/L40等),按如下方式安装
# 安装稳定版本fastdeploy python -m pip install fastdeploy-gpu==2.3.0-rc0 -i https://www.paddlepaddle.org.cn/packages/stable/fastdeploy-gpu-86_89/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple # 安装Nightly Build的最新版本fastdeploy python -m pip install fastdeploy-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/fastdeploy-gpu-86_89/ --extra-index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple 3. 镜像自行构建
注意
dockerfiles/Dockerfile.gpu默认编译的架构支持SM 80/90,如若需要支持其它架构,需自行修改Dockerfile中的bash build.sh 1 python false [80,90],建议不超过2个架构。
git clone https://github.com/PaddlePaddle/FastDeploy cd FastDeploy docker build -f dockerfiles/Dockerfile.gpu -t fastdeploy:gpu . 4. Wheel包源码编译
首先安装 paddlepaddle-gpu,详细安装方式参考 PaddlePaddle安装
python -m pip install paddlepaddle-gpu==3.2.1 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/ 接着克隆源代码,编译安装
git clone https://github.com/PaddlePaddle/FastDeploy cd FastDeploy # 第1个参数: 表示是否要构建wheel包,1表示打包,0表示只编译 # 第2个参数: Python解释器路径 # 第3个参数: 是否编译CPU推理算子 # 第4个参数: 编译的GPU架构 bash build.sh 1 python false [80,90] 编译后的产物在FastDeploy/dist目录下。
环境检查
在安装 FastDeploy 后,通过如下 Python 代码检查环境的可用性
import paddle from paddle.jit.marker import unified # 检查GPU卡的可用性 paddle.utils.run_check() # 检查FastDeploy自定义算子编译成功与否 from fastdeploy.model_executor.ops.gpu import beam_search_softmax 如上代码执行成功,则认为环境可用。