在配置Python机器学习环境前,需确保系统为最新状态,并安装编译Python、运行机器学习库所需的依赖包。
1. 更新系统软件包
执行以下命令更新CentOS系统至最新版本,避免因软件包过时导致的兼容性问题:
sudo yum update -y 2. 安装开发工具与依赖库
机器学习库(如TensorFlow、PyTorch)的安装需要编译工具和系统库支持,安装以下组件:
sudo yum groupinstall -y "Development Tools" # 包含gcc、make等编译工具 sudo yum install -y openssl-devel bzip2-devel libffi-devel zlib-devel readline-devel sqlite-devel wget 这些依赖包将用于后续Python环境的编译与运行。
CentOS 7及以上系统默认安装Python 2.7(已停止维护),需安装Python 3以满足机器学习库的需求。
1. 安装Python 3及pip
通过yum安装Python 3(以Python 3.6+为例),同时安装pip(Python包管理工具):
sudo yum install -y python3 python3-pip 2. 验证安装
检查Python 3及pip版本,确认安装成功:
python3 --version # 输出类似Python 3.6.8 pip3 --version # 输出pip版本(如pip 21.1.3) 虚拟环境可隔离不同项目的依赖,避免全局安装导致的库版本冲突。
1. 安装venv模块
若系统未自带venv,通过pip安装:
sudo yum install -y python3-venv 2. 创建并激活虚拟环境
在项目目录下创建虚拟环境(如命名为my_ml_env),并激活:
python3 -m venv my_ml_env # 创建虚拟环境 source my_ml_env/bin/activate # 激活虚拟环境(激活后命令行提示符会显示环境名) 激活后,所有后续安装的库将仅存在于该虚拟环境中。
根据项目需求选择合适的机器学习库,以下为常见组合:
1. 基础数据处理与机器学习库
安装NumPy(数值计算)、Pandas(数据处理)、Scikit-learn(传统机器学习)、Matplotlib/Seaborn(数据可视化):
pip install numpy pandas scikit-learn matplotlib seaborn 2. 深度学习框架(可选)
pip install torch torchvision torchaudiopip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113pip install tensorflowpip install tensorflow-gpu(需匹配CUDA版本)。通过简单代码验证库是否安装成功及环境配置是否正确。
1. 验证基础库
创建test_numpy.py文件,内容如下:
import numpy as np arr = np.array([1, 2, 3]) print(arr * 2) # 输出[2 4 6] 运行脚本:python test_numpy.py,若输出正确则说明NumPy安装成功。
2. 验证PyTorch(GPU版)
创建test_pytorch.py文件,内容如下:
import torch print(torch.__version__) # 输出PyTorch版本(如2.0.1) print(torch.cuda.is_available()) # 若安装GPU版,输出True;否则False 运行脚本:python test_pytorch.py,根据输出结果确认PyTorch是否正常工作。
若需要同时使用多个Python版本(如Python 3.8与3.12),可使用pyenv工具进行管理。
1. 安装pyenv
执行以下命令安装pyenv及依赖:
curl https://pyenv.run | bash 将以下内容添加到~/.bashrc文件中,使pyenv生效:
export PATH="$HOME/.pyenv/bin:$PATH" eval "$(pyenv init --path)" eval "$(pyenv virtualenv-init -)" 重新加载配置:source ~/.bashrc。
2. 使用pyenv安装Python版本
安装指定版本的Python(如3.12.1):
pyenv install 3.12.1 设置为全局默认版本:pyenv global 3.12.1。
3. 创建虚拟环境
结合pyenv创建虚拟环境:pyenv virtualenv 3.12.1 my_ml_env,激活方式与普通虚拟环境一致。
通过以上步骤,即可在CentOS系统上配置好Python机器学习环境,满足数据处理、模型训练等需求。根据实际项目需要,可进一步安装其他库(如OpenCV、XGBoost等)或优化环境配置。