PyTorch 教程

news/2024/9/19 14:57:49 标签: pytorch, 人工智能, python

PyTorch 教程

PyTorch 是一个广泛使用的深度学习框架,支持自动求导并提供了灵活的 GPU 加速功能。它的易用性和动态计算图机制使得它在学术研究和工业界中都得到了广泛的使用。本文将带你从基础开始学习 PyTorch,逐步构建神经网络并训练模型。

1. 安装 PyTorch

你可以通过以下命令安装 PyTorch:

pip install torch torchvision

安装时可以根据你的环境选择安装是否支持 CUDA(用于 GPU 加速)。详细的安装选项可以参考 PyTorch 官方安装页面。

2. 张量(Tensor)

张量(Tensor) 是 PyTorch 的核心数据结构,类似于 NumPy 中的 ndarray,但具有 GPU 加速的能力。

2.1 创建张量

你可以通过多种方式创建张量:

python">import torch

# 创建一个空张量
x = torch.empty(2, 3)
print(x)

# 使用随机数填充张量
x = torch.rand(2, 3)
print(x)

# 创建全0张量
x = torch.zeros(2, 3)
print(x)

# 创建全1张量
x = torch.ones(2, 3)
print(x)

# 创建自定义数据的张量
x = torch.tensor([2.0, 3.5, 4.0])
print(x)
2.2 张量的属性
python">x = torch.rand(2, 3)
print(x.size())       # 张量的大小
print(x.dtype)        # 张量的数据类型
print(x.device)       # 张量的设备(CPU or GPU)
2.3 张量的基本操作
python"># 张量加法
y = torch.rand(2, 3)
print(x + y)

# 改变形状
z = torch.randn(4, 4)
z_reshaped = z.view(2, 8)  # 改变为 2x8 张量
print(z_reshaped)

# 张量转 NumPy 数组
x_np = x.numpy()
print(x_np)

# NumPy 转张量
import numpy as np
n = np.array([1, 2, 3])
x_torch = torch.from_numpy(n)
print(x_torch)
2.4 在 GPU 上使用张量

如果你有 GPU,可以将张量移动到 GPU 上进行计算:

python"># 检查是否有可用的 GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

# 将张量移到 GPU
x = torch.rand(2, 3)
x = x.to(device)
print(x)

3. 自动求导

PyTorch 提供了强大的自动求导功能,通过 autograd 模块可以轻松地计算梯度,支持构建神经网络中的反向传播过程。

3.1 创建带梯度的张量
python"># 创建一个带有梯度的张量
x = torch.ones(2, 2, requires_grad=True)
print(x)
3.2 执行张量的计算
python">y = x + 2
z = y * y * 3
out = z.mean()

print(out)

# 反向传播计算梯度
out.backward()

# x的梯度
print(x.grad)

4. 构建神经网络

在 PyTorch 中,神经网络通过 torch.nn 模块来构建。最常用的方式是继承 nn.Module 类,并定义自己的前向传播函数。

4.1 定义一个简单的神经网络
python">import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 将输入平铺成一维
        x = F.relu(self.fc1(x))   # ReLU 激活函数
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 创建网络实例
net = Net()
print(net)
4.2 损失函数和优化器

PyTorch 提供了多种损失函数和优化器,用于训练神经网络。

python">import torch.optim as optim

# 定义损失函数
criterion = nn.CrossEntropyLoss()

# 定义优化器
optimizer = optim.SGD(net.parameters(), lr=0.01)

5. 训练模型

我们将使用 PyTorch 的 torchvision 数据集来加载 MNIST 数据集,并训练一个简单的分类模型。

5.1 加载数据集
python">import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader

# 定义数据预处理
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# 下载并加载 MNIST 数据集
train_dataset = torchvision.datasets.MNIST(root='./data', train=True, transform=transform, download=True)
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)

test_dataset = torchvision.datasets.MNIST(root='./data', train=False, transform=transform, download=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)
5.2 训练循环
python"># 训练神经网络
for epoch in range(2):  # 训练2个轮次
    running_loss = 0.0
    for inputs, labels in train_loader:
        # 将数据移动到 GPU
        inputs, labels = inputs.to(device), labels.to(device)

        # 梯度清零
        optimizer.zero_grad()

        # 前向传播
        outputs = net(inputs)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        loss.backward()
        optimizer.step()

        # 记录损失
        running_loss += loss.item()
    print(f'Epoch {epoch + 1}, Loss: {running_loss / len(train_loader)}')
5.3 测试模型
python"># 测试模型准确率
correct = 0
total = 0
with torch.no_grad():  # 测试时不需要反向传播
    for inputs, labels in test_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        outputs = net(inputs)
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy: {100 * correct / total}%')

6. 保存和加载模型

训练完成后,你可以保存模型的参数,并在之后重新加载。

python"># 保存模型
torch.save(net.state_dict(), 'mnist_net.pth')

# 加载模型
net = Net()
net.load_state_dict(torch.load('mnist_net.pth'))
net.eval()  # 将模型切换为评估模式

7. 完整示例

以下是一个包含加载数据、定义模型、训练和测试的完整 PyTorch 示例:

python">import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader

# 定义神经网络
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 28 * 28)
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 加载 MNIST 数据集
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
train_dataset = torchvision.datasets.MNIST(root='./data', train=True, transform=transform, download=True)
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_dataset = torchvision.datasets.MNIST(root='./data', train=False, transform=transform, download=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

# 创建网络和优化器
net = Net().to(device)
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01)

# 训练网络
for epoch in range(2):
    running_loss = 0.0
    for inputs, labels in train_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        optimizer.zero_grad()
       

 outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
    print(f'Epoch {epoch+1}, Loss: {running_loss/len(train_loader)}')

# 测试网络
correct = 0
total = 0
with torch.no_grad():
    for inputs, labels in test_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        outputs = net(inputs)
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy: {100 * correct / total}%')

8. 总结

通过本教程,我们了解了 PyTorch 的基础知识,包括张量操作、自动求导、神经网络的构建、训练和测试等内容。PyTorch 的灵活性和易用性使得它非常适合研究和实际项目。希望这个教程能帮助你快速上手 PyTorch,并应用于你的深度学习项目。


http://www.niftyadmin.cn/n/5665745.html

相关文章

自用VS Code插件记录

这里记录一下自己用的VS Code中的插件,方便下次重新安装VS Code后快速恢复工作。 自用VS Code插件记录 Python相关JupyterPrettier - Code formattervscode-iconPath IntellisenseImage preview主题相关插件One Dark ProGitHub Theme更改主题 Better CommentsImage …

MySQL篇(约束)(持续更新迭代)

目录 一、作用 二、目的 三、数据的完整性考虑方面 1. 实体完整性(Entity Integrity) 2. 域完整性(Domain Integrity) 3. 引用完整性(Referential Integrity) 4. 用户自定义完整性(User-d…

【C-项目】网盘(一期,线程池版)

网盘二期 概述 登录服务器后,即可浏览服务器的文件系统。通过命令上传或下载文件。 服务器使用线程池技术 创建两个进程,主进程负责接收退出信号,子进程负责管理线程池。子进程中的主线程 (包工头):监听客…

dockerfile案例

dockerfile构建nginx FROM centos:7 RUN rm -rf /etc/yum.repos.d/* ADD Centos-7.repo /etc/yum.repo.d/ ADD epel-7.repo /etc/yum.repo.d/ RUN yum -y install nginx EXPOSE 80 CMD ["/usr/sbin/nginx","-g","daemon off;"]dockerfile构建ng…

大语言模型超参数调优:开启 AI 潜能的钥匙

前言 在人工智能的广袤领域中,大语言模型(LLM)凭借其强大的实力,不断重塑着我们对机器理解语言的认知。然而,要使这些模型在特定应用场景中发挥最大效能,关键在于巧妙调整其超参数。本文将引领你深入探究 …

Axure PR 9 标签 设计交互

大家好,我是大明同学。 这期内容,我们将深入探讨Axure中可编辑标签元件设计与交互技巧。 可移除标签元件 创建可移除标签所需的元件 1.打开一个新的 RP 文件并在画布上打开 Page 1。 2.在元件库中拖出一个文本框元件。 3.选中文本框元件&#xff0c…

如何用站群服务器做抢购秒杀平台

随着各种电商购物节的开幕,全球外贸、直播电商抢购活动愈发火热,外贸行业容纳了海量的公司、组织和个人。为了营销,人们使用海外站群服务器抢货的做法已经不再稀奇,因为使用海外站群服务器操作抢购秒杀商品,可以拥有多…

利用ClasserLoader来实现jar包加载并调用里面的方法

1.ClasserLoader介绍? classloader顾名思义,即是类加载。虚拟机把描述类的数据从class字节码文件加载到内存,并对数据进行检验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。…