迁移学习实例

2023年5月25日上午3:27 • 人工智能 • 阅读 75

在最后一篇文章中，我们介绍了迁移学习的核心思想和过程，并通过一个例子加深了我们的理解。

[En]

In the last article, we introduced the core ideas and processes of transfer learning, and we introduced an example to deepen our understanding.

传送门：迁移学习概述

获取预训练模型

pytorch和tensorflow都封装了很多预训练模型。

pytorch通过工具包torchvision.models模块获取，主要包括AlexNet、VGG系列、

ResNet系列、SqueezeNet和DenseNet等，通过设置参数pretrained=True即可获取。而Tensorflow内置在keras.application里面，当然，也可以通过TensorFlowHub网站自行下载。

from tensorflow.keras.applications import vgg16,resnet
from torchvision.models import AlexNet,VGG,ResNet
from torchvision.models import SqueezeNet,DenseNet

一个实例

下面通过一个例子对迁移学习有个感性的认识。预训练模型采用retnet18网络，一共分为八大步骤。

注：代码均来源于《深入浅出Embedding》第三章

1.导入模块

import torch
from torch import nn
import torch.nn.functional as F
import torchvision
import torchvision.transforms as transforms
from torchvision import models
from torchvision.datasets import ImageFolder
from datetime import datetime

2.加载数据

加载相关数据集,首次下载需要将download设置为True，此外，还对数据做了一些预处理，标准化、图片裁剪等。

trans_train = transforms.Compose(
      [transforms.RandomResizedCrop(224),
       transforms.RandomHorizontalFlip(),
       transforms.ToTensor(),
       transforms.Normalize(mean=[0.485,0.456,0.406],std=[0.229,0.224,0.225])
      ]
)

trans_valid = transforms.Compose(
      [transforms.Resize(256),
       transforms.CenterCrop(224),
       transforms.ToTensor(),
       transforms.Normalize(mean=[0.485,0.456,0.406],std=[0.229,0.224,0.225])
      ]
)

trainset = torchvision.datasets.CIFAR10(root='.\data',train=True,download=True,transform=trans_train)
trainloader = torch.utils.data.DataLoader(trainset,batch_size=64,shuffle=True,num_workers=2)

testset = torchvision.datasets.CIFAR10(root='.\data',train=False,download=True,transform=trans_valid)
testloader = torch.utils.data.DataLoader(testset,batch_size=64,shuffle=False,num_workers=2)

classes = ('plane','car','bird','cat','deer','dog','frog','horse','ship','truck')

下载过程如下：

注：代码直接下载比较慢，可以点击链接直接手动下载，再导入相关路径，再次运行代码download设置为False即可

3.下载预训练模型

net = models.resnet18(pretrained=True)

这一步也需要时间，耐心等待…..如果这一步出错，先手动下载pth模型文件，再执行下面语句，可加载模型：

pthfile = r'/workspace/resnet18-f37072fd.pth'
model = torch.load(pthfile)
net = models.resnet18(pretrained=False)
net.load_state_dict(model)

4.冻结模型参数

将模型参数冻结

for param in net.parameters():
    param.requires_grad = False

5.修改输出类别器

将原来输出的1000类改为只有10类，做以下操作：

device = torch.device("cuda:1" if torch.cuda.is_avaliable() else "cpu")
net.fc = nn.Linear(512,10)

6.查看冻结前后参数情况

toatl_params = sum(p.numel() for p in net.parameters())
print('原参数个数:{}'.format(toatl_params))
toatl_trainable_params = sum(p.numel() for p in net.parameters() if p.requires_grad)
print('可训练参数个数:{}'.format(toatl_trainable_params))

7.定义损失函数及优化器

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.fc.parameters(),lr=1e-3,
                            weight_decay=1e-3,momentum=0.9)

还有评估指标和训练函数

#定义评估指标
def get_acc(output, label):
    total = output.shape[0]
    _, pred_label = output.max(1)
    num_correct = (pred_label == label).sum().item()
    return num_correct / total

def train(net, train_data, valid_data, num_epochs, optimizer, criterion):

    prev_time = datetime.now()
    for epoch in range(num_epochs):
        train_loss = 0
        train_acc = 0
        net = net.train()
        for im, label in train_data:
            im = im.to(device)  # (bs, 3, h, w)
            label = label.to(device) # (bs, h, w)
            # forward
            output = net(im)
            loss = criterion(output, label)
            # backward
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            train_loss += loss.item()
            train_acc += get_acc(output, label)

        cur_time = datetime.now()
        h, remainder = divmod((cur_time - prev_time).seconds, 3600)
        m, s = divmod(remainder, 60)
        time_str = "Time %02d:%02d:%02d" % (h, m, s)
        if valid_data is not None:
            valid_loss = 0
            valid_acc = 0
            net = net.eval()
            for im, label in valid_data:
                im = im.to(device)  # (bs, 3, h, w)
                label = label.to(device) # (bs, h, w)
                output = net(im)
                loss = criterion(output, label)
                valid_loss += loss.item()
                valid_acc += get_acc(output, label)
            epoch_str = (
                "Epoch %d. Train Loss: %f, Train Acc: %f, Valid Loss: %f, Valid Acc: %f, "
                % (epoch, train_loss / len(train_data),
                   train_acc / len(train_data), valid_loss / len(valid_data),
                   valid_acc / len(valid_data)))
        else:
            epoch_str = ("Epoch %d. Train Loss: %f, Train Acc: %f, " %
                         (epoch, train_loss / len(train_data),
                          train_acc / len(train_data)))
        prev_time = cur_time
        print(epoch_str + time_str)

8.训练及验证模型

最后，进行模型训练即可

net=net.to(device)
train(net,trainloader,testloader,20,optimizer,criterion)

参考资料：

《深入浅出Embedding》

https://www.ptorch.com/docs/1/models

Original: https://blog.csdn.net/qq_27388259/article/details/120540776
Author: 整得咔咔响
Title: 迁移学习实例

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/511870/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Flink1.15源码解析–启动脚本—-start-cluster.sh

[root@chb1 bin] bin=dirname "$0" bin=cd "$bin"; pwd . "$bin"…

人工智能 2023年6月27日
00108
hrsc2016数据集xml格式转换为yolo格式，附下载链接

数据集介绍数据集背景： HRSC2016数据集包含27种类型的遥感地物目标提取自Google Earth由西北工业大学于2016年发布采用oriented bounding b…

人工智能 2023年6月4日
00189
密度图+回归线，相关图这样画？seaborn中 joinplot 结合核密度图和回归图（KDE+regplot）

因为jointplot就是联合绘图，通常边缘上绘制分布图，中间绘制其它的（比如核密度图），所以如何去除边缘的分布图，再叠加一条回归线呢,可以用于替换常规散点图表示相关图的方式，如下…

人工智能 2023年7月7日
0079
使用docker安裝GPU版pytorch

1. 在docker pytorch 網址找到自己需要的環境(網址:https://hub.docker.com/r/pytorch/pytorch/tags) 点击复制 deve…

人工智能 2023年7月23日
0073
Pytorch数据读取机制(DataLoader)

小时候，乡愁是一枚小小的邮票，你在这头，我在那头；长大后，乡愁是一张核酸证明，你在家里，我在隔离！一、python读取机制在学习Pytorch的数据读取之前，我们得先回顾一下…

人工智能 2023年7月23日
0058
2021-11-14 Covins跑euroc数据集

此Covins是2021年苏黎世联邦理工大学机器人实验室出的COVINS – A Framework for Collaborative Visual-Inertial SLAM …

人工智能 2023年6月11日
0075
时序预测 | MATLAB实现时间序列回归之偏差仿真

时序预测 | MATLAB实现时间序列回归之偏差仿真目录 * – 时序预测 | MATLAB实现时间序列回归之偏差仿真 – + 基本介绍 + 程序设计 +…

人工智能 2023年6月18日
0079
论文研读-机器学习可视化-面向可视解释的零样本分类主动学习

面向可视解释的零样本分类主动学习 1 文章概要 * 1.1 摘要 1.2 引言 – 1.2.1 零样本分类 1.1.2 解决方案 1.2.3 文章贡献 1.3 组织结构…

人工智能 2023年7月2日
0084
云GPU（恒源云）训练的具体操作流程

简介这篇博客主要讲一下怎么使用云服务器上的GPU跑程序，主要是一些设置和操作步骤，具体的训练步骤可以看我的另一篇博客。以下步骤可能会有遗漏，也可能和你们有一些差别，有什么问题可…

人工智能 2023年6月16日
00159
手把手搭建经典神经网络系列（1）——AlexNet

一、AlexNet简介 AlexNet是Alex和Hinton参加 2012年imagenet比赛时提出的卷积网络框架，夺得了当年ImageNet LSVRC的冠军，且准确率远超…

人工智能 2023年7月26日
0069
java项目-第121期基于SpringBoot+Thymeleaf的党员信息管理系统-java毕业设计

### 回答1： springboot+ thymeleaf 项目_是一种基于 _Java_语言开发的Web应用程序。它采用了Spring Boot框架和 _Thymeleaf_模…

人工智能 2023年6月28日
00109
YOLOX改进之模型轻量化（Lite）

文章内容：给YOLOv5-Lite系列轻量级模型换上YOLOX头部环境：pytorch1.7+cuda11.0注意：YOLOv5版本为5.0，可以匹配YOLOX的主干网络与neck…

人工智能 2023年5月28日
0081
舱内视觉AI应用前装「同比增长近200%」，哪些供应商领跑中国市场

智能汽车行业正在进入舱内、舱外功能融合的关键周期。以智能驾驶为例，目前处于辅助驾驶到无人驾驶的长期演进阶段，人机交互（尤其是一系列AI定义的功能）正在发挥关键作用。比如，此前中国…

人工智能 2023年6月11日
0070
Python中的层次聚类，详细讲解

层次聚类是流行的无监督学习算法之一。层次聚类所做的就是找到数据集中具有相似属性的元素，并将它们组合在一个集群中。最后，我们得到一个单一的大集群，其主要元素是数据点的集群或其他集群的…

人工智能 2023年7月4日
0094
Java分片上传全解决方案，真香

因为我们是做语音识别的，在离线的情况下，需要上传语音，但是因为语音很大，所以需要拆分进行上传，要不然如果网络波动就前功尽弃了，今天就来复述下这个方案 1、解决方案我们的方案是 …

人工智能 2023年5月25日
0083
故障诊断知识图谱

该文档主要参考：概述该项目要求从网络上爬取相关设备故障和维修解决方式，并构建知识库，当设备出现故障时，用户通过输入数控机床相关参数（品牌、型号、故障代码、某个或多个超出阈值参数…

人工智能 2023年7月27日
0056

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

迁移学习实例

大家都在看