温馨提示×

如何在CentOS中配置Python机器学习环境

小樊
41
2025-09-24 13:03:04
栏目: 编程语言

一、前置准备:更新系统与安装基础依赖

在配置Python机器学习环境前,需确保系统为最新状态,并安装编译Python、运行机器学习库所需的依赖包。
1. 更新系统软件包
执行以下命令更新CentOS系统至最新版本,避免因软件包过时导致的兼容性问题:

sudo yum update -y 

2. 安装开发工具与依赖库
机器学习库(如TensorFlow、PyTorch)的安装需要编译工具和系统库支持,安装以下组件:

sudo yum groupinstall -y "Development Tools" # 包含gcc、make等编译工具 sudo yum install -y openssl-devel bzip2-devel libffi-devel zlib-devel readline-devel sqlite-devel wget 

这些依赖包将用于后续Python环境的编译与运行。

二、安装Python 3与pip

CentOS 7及以上系统默认安装Python 2.7(已停止维护),需安装Python 3以满足机器学习库的需求。
1. 安装Python 3及pip
通过yum安装Python 3(以Python 3.6+为例),同时安装pip(Python包管理工具):

sudo yum install -y python3 python3-pip 

2. 验证安装
检查Python 3及pip版本,确认安装成功:

python3 --version # 输出类似Python 3.6.8 pip3 --version # 输出pip版本(如pip 21.1.3) 

三、配置Python虚拟环境(推荐)

虚拟环境可隔离不同项目的依赖,避免全局安装导致的库版本冲突。
1. 安装venv模块
若系统未自带venv,通过pip安装:

sudo yum install -y python3-venv 

2. 创建并激活虚拟环境
在项目目录下创建虚拟环境(如命名为my_ml_env),并激活:

python3 -m venv my_ml_env # 创建虚拟环境 source my_ml_env/bin/activate # 激活虚拟环境(激活后命令行提示符会显示环境名) 

激活后,所有后续安装的库将仅存在于该虚拟环境中。

四、安装Python机器学习库

根据项目需求选择合适的机器学习库,以下为常见组合:
1. 基础数据处理与机器学习库
安装NumPy(数值计算)、Pandas(数据处理)、Scikit-learn(传统机器学习)、Matplotlib/Seaborn(数据可视化):

pip install numpy pandas scikit-learn matplotlib seaborn 

2. 深度学习框架(可选)

  • PyTorch(推荐):根据是否有GPU选择安装CPU版或GPU版(需提前安装CUDA/cuDNN)。
    • CPU版:pip install torch torchvision torchaudio
    • GPU版(以CUDA 11.3为例):pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
  • TensorFlow:同样支持CPU/GPU版本,安装命令类似:
    • CPU版:pip install tensorflow
    • GPU版:pip install tensorflow-gpu(需匹配CUDA版本)。

五、验证安装

通过简单代码验证库是否安装成功及环境配置是否正确。
1. 验证基础库
创建test_numpy.py文件,内容如下:

import numpy as np arr = np.array([1, 2, 3]) print(arr * 2) # 输出[2 4 6] 

运行脚本:python test_numpy.py,若输出正确则说明NumPy安装成功。
2. 验证PyTorch(GPU版)
创建test_pytorch.py文件,内容如下:

import torch print(torch.__version__) # 输出PyTorch版本(如2.0.1) print(torch.cuda.is_available()) # 若安装GPU版,输出True;否则False 

运行脚本:python test_pytorch.py,根据输出结果确认PyTorch是否正常工作。

六、可选优化:使用pyenv管理多版本Python

若需要同时使用多个Python版本(如Python 3.8与3.12),可使用pyenv工具进行管理。
1. 安装pyenv
执行以下命令安装pyenv及依赖:

curl https://pyenv.run | bash 

将以下内容添加到~/.bashrc文件中,使pyenv生效:

export PATH="$HOME/.pyenv/bin:$PATH" eval "$(pyenv init --path)" eval "$(pyenv virtualenv-init -)" 

重新加载配置:source ~/.bashrc
2. 使用pyenv安装Python版本
安装指定版本的Python(如3.12.1):

pyenv install 3.12.1 

设置为全局默认版本:pyenv global 3.12.1
3. 创建虚拟环境
结合pyenv创建虚拟环境:pyenv virtualenv 3.12.1 my_ml_env,激活方式与普通虚拟环境一致。

通过以上步骤,即可在CentOS系统上配置好Python机器学习环境,满足数据处理、模型训练等需求。根据实际项目需要,可进一步安装其他库(如OpenCV、XGBoost等)或优化环境配置。

0