在深度学习领域,PyTorch 是一个非常流行的框架,而 Google Colab 则提供了一个免费的云端环境,可以方便地进行深度学习模型的训练。本文将详细介绍如何使用 PyTorch 在 Google Colab 上训练神经网络。
首先,打开 Google Colab,点击“新建笔记本”创建一个新的笔记本。你可以选择使用 Python 3 作为运行时环境。
Google Colab 默认已经安装了 PyTorch,但如果你想确保使用的是最新版本,可以运行以下命令来安装或更新 PyTorch:
!pip install torch torchvision
在开始训练之前,我们需要导入一些必要的库:
import torch import torch.nn as nn import torch.optim as optim import torch.nn.functional as F from torchvision import datasets, transforms from torch.utils.data import DataLoader
我们将使用 CIFAR-10 数据集作为示例。CIFAR-10 是一个包含 10 个类别的图像分类数据集,每个类别有 6000 张 32x32 的彩色图像。
transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) ]) train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) test_dataset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True) test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)
为了确保数据加载正确,我们可以可视化一些图像:
import matplotlib.pyplot as plt import numpy as np def imshow(img): img = img / 2 + 0.5 # 反归一化 npimg = img.numpy() plt.imshow(np.transpose(npimg, (1, 2, 0))) plt.show() # 获取一些训练图像 dataiter = iter(train_loader) images, labels = dataiter.next() # 显示图像 imshow(torchvision.utils.make_grid(images))
我们将构建一个简单的卷积神经网络(CNN):
class SimpleCNN(nn.Module): def __init__(self): super(SimpleCNN, self).__init__() self.conv1 = nn.Conv2d(3, 32, 3, 1) self.conv2 = nn.Conv2d(32, 64, 3, 1) self.fc1 = nn.Linear(64 * 6 * 6, 128) self.fc2 = nn.Linear(128, 10) def forward(self, x): x = F.relu(self.conv1(x)) x = F.max_pool2d(x, 2) x = F.relu(self.conv2(x)) x = F.max_pool2d(x, 2) x = x.view(-1, 64 * 6 * 6) x = F.relu(self.fc1(x)) x = self.fc2(x) return x model = SimpleCNN()
我们将使用交叉熵损失函数和随机梯度下降(SGD)优化器:
criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
我们将训练模型 10 个 epoch:
num_epochs = 10 for epoch in range(num_epochs): model.train() running_loss = 0.0 for i, data in enumerate(train_loader, 0): inputs, labels = data optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() if i % 100 == 99: # 每 100 个 batch 打印一次损失 print(f'Epoch [{epoch + 1}/{num_epochs}], Step [{i + 1}/{len(train_loader)}], Loss: {running_loss / 100:.4f}') running_loss = 0.0
在训练完成后,我们可以测试模型的性能:
model.eval() correct = 0 total = 0 with torch.no_grad(): for data in test_loader: images, labels = data outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print(f'Accuracy of the model on the 10000 test images: {100 * correct / total:.2f}%')
训练完成后,我们可以将模型保存到磁盘:
torch.save(model.state_dict(), 'simple_cnn.pth')
如果需要加载模型,可以使用以下代码:
model = SimpleCNN() model.load_state_dict(torch.load('simple_cnn.pth')) model.eval()
Google Colab 提供了免费的 GPU 资源,我们可以通过以下代码将模型和数据移动到 GPU 上:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu") model.to(device)
在训练和测试时,记得将数据也移动到 GPU 上:
inputs, labels = inputs.to(device), labels.to(device)
通过本文,我们学习了如何在 Google Colab 上使用 PyTorch 训练一个简单的卷积神经网络。Google Colab 提供了免费的 GPU 资源,使得深度学习模型的训练变得更加高效。希望本文对你有所帮助,祝你在深度学习的旅程中取得成功!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。