温馨提示×

在CentOS上部署PyTorch应用的步骤

小樊
53
2025-10-01 02:07:45
栏目: 智能运维

在CentOS上部署PyTorch应用的完整步骤

1. 更新系统及安装基础依赖

首先确保系统为最新状态,避免因旧版本软件包导致兼容性问题:

sudo yum update -y 

安装Python 3、pip(Python包管理器)及开发工具(用于编译依赖库):

sudo yum install -y python3 python3-pip python3-devel gcc cmake3 git 

2. 创建并激活Python虚拟环境(推荐)

为隔离项目依赖,避免与其他项目冲突,建议使用虚拟环境:

python3 -m venv pytorch_env # 创建名为pytorch_env的虚拟环境 source pytorch_env/bin/activate # 激活虚拟环境(激活后终端提示符会显示环境名) 

3. 安装PyTorch

根据硬件配置选择安装CPU版本GPU版本(需提前确认NVIDIA GPU驱动及CUDA版本):

  • CPU版本(无GPU加速):
    pip install --upgrade pip # 升级pip至最新版本 pip install torch torchvision torchaudio 
  • GPU版本(需CUDA支持):
    访问PyTorch官网,选择对应的CUDA版本(如CUDA 11.7),获取安装命令。例如:
    pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117 

    注:若未安装CUDA Toolkit,需先完成CUDA及cuDNN的安装(详见后续可选步骤)。

4. 验证PyTorch安装

在Python交互环境中运行以下代码,检查PyTorch版本及CUDA是否可用:

import torch print("PyTorch版本:", torch.__version__) # 输出PyTorch版本号 print("CUDA是否可用:", torch.cuda.is_available()) # GPU版本应返回True 

5. 部署PyTorch应用

将本地编写的PyTorch应用代码(如app.py)上传至服务器(可使用scpSFTP等工具)。激活虚拟环境后运行应用:

source pytorch_env/bin/activate # 激活虚拟环境 python app.py # 运行应用(替换为你的主程序文件名) 

6. 配置为后台服务(可选,生产环境推荐)

若需让应用随系统启动并持续运行,可使用systemd创建服务:

  • 创建服务文件:
    sudo vi /etc/systemd/system/pytorch_app.service 
  • 添加以下内容(根据实际路径修改ExecStartWorkingDirectoryUser等参数):
    [Unit] Description=PyTorch Application Service After=network.target [Service] User=your_username # 替换为你的系统用户名 Group=your_groupname # 替换为你的系统用户组名 ExecStart=/path/to/pytorch_env/bin/python /path/to/app.py # 替换为Python环境及应用路径 WorkingDirectory=/path/to/app_directory # 替换为应用代码所在目录 Restart=always # 应用崩溃后自动重启 [Install] WantedBy=multi-user.target 
  • 保存并退出编辑器(vi中按Esc→输入:wq→回车)。
  • 启动服务并设置开机自启:
    sudo systemctl daemon-reload # 重新加载systemd配置 sudo systemctl start pytorch_app # 启动服务 sudo systemctl enable pytorch_app # 设置开机自启 
  • 查看服务状态:
    sudo systemctl status pytorch_app # 检查服务是否运行正常 

可选步骤:安装CUDA及cuDNN(GPU版本必备)

若需使用GPU加速,需提前安装NVIDIA CUDA Toolkit及cuDNN库:

  • 安装CUDA Toolkit

    1. 下载对应版本的CUDA Toolkit(如CUDA 11.7):NVIDIA CUDA下载页面
    2. 运行安装脚本(以.rpm文件为例):
      sudo rpm -i cuda-repo-rhel7-11.7.0-515.43.04.x86_64.rpm sudo yum clean all sudo yum install -y cuda 
    3. 配置环境变量(添加至~/.bashrc):
      echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc source ~/.bashrc 
  • 安装cuDNN

    1. 下载与CUDA版本兼容的cuDNN库(需注册NVIDIA开发者账号):NVIDIA cuDNN下载页面
    2. 解压并复制文件至CUDA目录:
      tar -xzvf cudnn-11.7-linux-x64-v8.5.0.96.tgz sudo cp cuda/include/cudnn*.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn* 

通过以上步骤,即可在CentOS系统上完成PyTorch应用的部署。根据实际需求调整环境配置(如虚拟环境、后台服务等),确保应用稳定运行。

0