Pytorch入门实战（8）：小样本学习实现图片分类（Few-shot Learning, Meta Learning）

2023年7月3日下午1:02 • 人工智能 • 阅读 71

Open In colab

源代码地址: https://github.com/iioSnail/pytorch_deep_learning_examples

文章目录

本文内容涉及知识点
本文内容
环境配置
加载数据集
数据处理
模型构建
训练模型
模型验证

本文内容涉及知识点

小样本学习的基本概念

本文内容

本文会使用Omniglot数据集训练一个孪生网络（相似网络），其可以用来判断两个图片的相似程度，通过该方式来实现小样本学习。

本文使用Omniglot的训练集来训练神经网络，使用其验证集来构造Support Set。本文会从验证集的每个类别中拿出5个样本作为Support Set，一共挑选10个类别，即为10-way 5-shot的小样本学习。

环境配置

本文所使用到的环境如下:

python==3.8.5
torch==1.10.2
torchvision==0.11.3
numpy==1.22.3
matplotlib==3.2.2

导入本文需要使用到的包：

import random

import torch
import torchvision
from torch import nn
from torchvision import transforms

import numpy as np
import matplotlib.pyplot as plt

from tqdm import tqdm

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print("Device:", device)

Device: cuda

加载数据集

我们这里使用Pytorch提供的 torchvision.datasets.Omniglot的方法来加载数据集。

如果你用pytorch下载失败，可以使用百度网盘链接下载，然后解压到当前文件夹下，将 download参数改为 False即可

train_dataset = torchvision.datasets.Omniglot('./dataset', background=True, transform=transforms.ToTensor(), download=True)
validation_dataset = torchvision.datasets.Omniglot('./dataset', background=False, transform=transforms.ToTensor(), download=True)

成功加载完数据集后我们来简单看一下：

image, target = train_dataset.__getitem__(0)
print("image size:", image.size())
print("target:", target)

image size: torch.Size([1, 105, 105])
target: 0

Omniglot数据集都是一张一张的灰度图，和MNIST手写数据集差不多。这个target就是用数字表示的类别，我也不知道对应成实际类别是什么，也不需要知道。

我们来简单绘制一张看一下：

plt.imshow(image.squeeze(), cmap='gray')

Pytorch入门实战（8）：小样本学习实现图片分类（Few-shot Learning, Meta Learning）

数据处理

在孪生网络中，我们一次给到模型的是一对儿图片，然后让模型来区分这对儿图片是否是相同的类别。我们本章就需要来定义这么一个函数，来生成一批样本对儿，其中一半图片对儿是相同类别，另一半图片对儿是不同类别。

我们首先获取一下训练集中的所有target和所有labels：

all_targets = np.array([train_dataset.__getitem__(i)[1] for i in range(len(train_dataset))])
all_labels = np.array(list(set(all_targets)))

print("all_targets:", all_targets)
print("all_labels:", all_labels)

all_targets: [  0   0   0 ... 963 963 963]
all_labels: [  0   1   2 ... 959 960 961 962 963]

准备好了这两个基础数据，我们就可以来构造我们的Sample函数了。其作用就是返回一个batch的图片对儿，其中一半是相同的类别，称为 正样本，另一半是不同的类别，称为 负样本。

def sample_batch(batch_size):
"""
    从train_dataset中sample一些数据对。一半正样本，一半负样本
"""

    positive_labels = np.random.choice(all_labels, batch_size // 2)

    batch = []
    for label in positive_labels:
        labels_indexes = np.argwhere(all_targets == label)
        pair = np.random.choice(labels_indexes.flatten(), 2)
        batch.append((pair[0], pair[1], 1))

    negative_labels = np.random.choice(all_labels, batch_size)
    for sample1, sample2 in negative_labels.reshape(-1, 2):
        sample1 = np.random.choice(np.argwhere(all_targets == sample1).flatten(), 1)
        sample2 = np.random.choice(np.argwhere(all_targets == sample2).flatten(), 1)
        batch.append((sample1.item(), sample2.item(), 0))

"""
    完成上面的动作后，最终得到的batch如下：
        (734, 736, 1),
        (127, 132, 1),
        ...

        (859, 173, 0),
        ...

    其中前两个表示样本对对应在dataset中的index，1表示前两个样本是相同类别。0表示这两个样本为不同类别。
    接下来需要对其进行shuffle处理，然后从dataset中获取到对应数据，最终组成batch.

"""
    random.shuffle(batch)

    sample1_list = []
    sample2_list = []
    target_list = []
    for sample1, sample2, target in batch:
        sample1_list.append(train_dataset.__getitem__(sample1)[0])
        sample2_list.append(train_dataset.__getitem__(sample2)[0])
        target_list.append(target)
    sample1 = torch.stack(sample1_list)
    sample2 = torch.stack(sample2_list)
    targets = torch.LongTensor(target_list)
    return sample1, sample2, targets

完成sample函数后，我们来简单试一下：

sample1, sample2, targets = sample_batch(16)

print("sample1:", sample1.size())
print("sample2:", sample1.size())
print("targets:", targets)

sample1: torch.Size([16, 1, 105, 105])
sample2: torch.Size([16, 1, 105, 105])
targets: tensor([1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1])

其中 sample1[0]和 smaple2[0] 是一对儿， targets[0]是它们的标签，表示它们是否是相同类别。

准备好数据后，我们接下来开始构建模型：

模型构建

我们需要构建的模型也很简单，模型的功能就是输入两张图片，输出这两张图片是否为同一个类别。由于是二分类问题，所以我们最后的值通过Sigmoid处理一下：

class SimilarityModel(nn.Module):

    def __init__(self):
        super(SimilarityModel, self).__init__()

        self.conv = nn.Sequential(
            nn.Conv2d(1, 4, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(4, 16, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(16, 32, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(32, 32, kernel_size=3),
            nn.ReLU(),
        )

        self.sim = nn.Sequential(
            nn.Flatten(),
            nn.Linear(2592, 256),
            nn.ReLU(),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )

    def forward(self, sample1, sample2):

        sample1_features = self.conv(sample1)

        sample2_features = self.conv(sample2)

        return self.sim(torch.abs(sample1_features - sample2_features))

model = SimilarityModel()
model = model.to(device)

模型定义完后，我们来简单的尝试一下：

model(sample1.to(device), sample2.to(device))

tensor([[0.5004],
        [0.5005],
        [0.5003],
        [0.5005],
        [0.5000],
        ...

        [0.5002],
        [0.5003],
        [0.5000],
        [0.5002]], device='cuda:0', grad_fn=<sigmoidbackward0>)
</sigmoidbackward0>

可以看到，由于模型还未训练，所以输出的值都在50%左右。

训练模型

接下来开始训练模型，和普通的二分类问题差别不算很大。

model = model.train()

criteria = nn.BCELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)

batch_size = 512

early_stop = 1500

min_loss = 100.

last_episode = 0

for episode in range(100000):

    sample1, sample2, targets = sample_batch(batch_size)

    outputs = model(sample1.to(device), sample2.to(device))

    loss = criteria(outputs.flatten(), targets.to(device).float())
    loss.backward()

    optimizer.step()
    optimizer.zero_grad()

    if loss < min_loss:
        min_loss = loss.item()
        last_episode = episode
        torch.save(model, 'best_model.pt')

    if episode - last_episode > early_stop:
        break

    if episode % 50 ==  0:
        print(f"episode {episode}, loss {loss}")

print("Finish Training.")

episode 0, loss 0.6931208372116089
episode 50, loss 0.6730687618255615
episode 100, loss 0.6514454483985901
episode 150, loss 0.6112750768661499
...

episode 2600, loss 0.22310321033000946
episode 2650, loss 0.24409082531929016
episode 2700, loss 0.3104301393032074

模型验证

验证前先加载一下之前最好的模型：

model = torch.load('best_model.pt')
model = model.to(device)

接下来我们来验证下我们模型的表现。我们使用上面构造好的validation_dataset。在validation_dataset中，全都是模型之间没有见过的类别，可不是没有见过的图片哦，连这个类别它都没有见过。不信你可以到 dataset/images_evaluation这个目录下表看看那。

我们先来看下验证集中的类别情况：

all_targets = np.array([validation_dataset.__getitem__(i)[1] for i in range(len(validation_dataset))])
all_labels = np.array(list(set(all_targets)))

print("sample size:", len(all_targets))
print("all_targets:", all_targets)
print("all_labels:", all_labels)

sample size: 13180
all_targets: [  0   0   0 ... 658 658 658]
all_labels: [  0   1   2   3  ... 655 656 657 658]

可以看到，在验证集中我们一共有13180个数据，有658个类别，每个类别有20个样本。我们为每个类别选取5个样本作为support set供模型参考，剩下的15个作为验证集来验证模型的表现。

如果对这658个类别全部都做预测的话，相当于我们的任务是一个658-way 5-shot的任务。这样不仅预测过程会非常慢，并且准确率也会非常低，所以上面的简单模型就应付不了了。为了简单期间，我们这里裁剪一下，就使用10个类别来验证我们的模型：

all_targets = all_targets[all_targets < 10]
all_labels = all_labels[:10]
print("sample size:", len(all_targets))
print("all_targets:", all_targets)
print("all_labels:", all_labels)

sample size: 200
all_targets: [0 0 0 0 0 0 0 0 .... 9 9 9 9 9 9]
all_labels: [0 1 2 3 4 5 6 7 8 9]

support_set = []
validation_set = []

for label in all_labels:
    label_indexes = np.argwhere(all_targets == label)
    support_set.append((label_indexes[:5].flatten().tolist()))
    validation_set += label_indexes[5:].flatten().tolist()

print("support set:", support_set[:5])
print("validation set:", validation_set[:5])
print("validation size:", len(validation_set))

support set: [[0, 1, 2, 3, 4], [20, 21, 22, 23, 24], [40, 41, 42, 43, 44], [60, 61, 62, 63, 64], [80, 81, 82, 83, 84]]
validation set: [5, 6, 7, 8, 9]
validation size: 150

我们接下来需要定义一个预测函数，其给定一个图片，输出该图片的target。该函数的思路为：让该图片与support set里的所有类别都比较一下，看看与谁的相似度最高，那么该图片就是什么类别。由于一个类别有5张图片，我们可以通过取平均的方式来得到该图片为该类别的可能性。

def predict(image):
    sim_list = []

    for indexes in support_set:

        tensor_list = []
        for i in indexes:
            tensor_list.append(validation_dataset[i][0])
        support_tensor = torch.stack(tensor_list)

        sim = model(image.repeat(5, 1, 1, 1).to(device), support_tensor.to(device)).mean()
        sim_list.append(sim)

    result_index = torch.stack(sim_list).argmax().item()
    return all_labels[result_index]

我们来试下predict函数：

predict(validation_dataset.__getitem__(validation_set[0])[0])

最后我们一个个的对验证集的数据进行验证，计算正确率。

total = 0
total_correct = 0

random.shuffle(validation_set)
progress = tqdm(validation_set)

for i in progress:
    image, label = validation_dataset.__getitem__(i)
    predict_label = predict(image)

    total += 1
    if predict_label == label:
        total_correct += 1

    progress.set_postfix({
            "accuracy": str("%.3f" % (total_correct / total))
        })

100%|&#x2588;&#x2588;&#x2588;&#x2588;&#x2588;&#x2588;&#x2588;&#x2588;&#x2588;&#x2588;| 150/150 [00:06<00:00, 21.66it s, accuracy="0.700]" < code></00:00,>

print("Accuracy:", total_correct / total)

Accuracy: 0.7

最终，在这150个验证数据中，我们取得了70%的正确率，不算太高，但至少能说明模型是有效果的。

由于模型结构是我拍脑袋随便想的，而且比较小，所以如果用全部的658个类别做预测的话，效果会比较差，正确率大概只有15%左右，感兴趣的朋友可以尝试一下，并且优化模型。

Original: https://blog.csdn.net/zhaohongfei_358/article/details/126453857
Author: iioSnail
Title: Pytorch入门实战（8）：小样本学习实现图片分类（Few-shot Learning, Meta Learning）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/667629/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习开源数据集——自动驾驶、目标检测、人脸识别、文本检测、图像分类

前言在深度学习中，如果没有数据集，就无法训练模型，所以数据是根本，下面列出几个常用数据集。想要更多数据集，可以去这个地址：https://www.cvmart.net/dataS…

人工智能 2023年7月9日
0053
MMDetection 使用示例：从入门到出门

最近对目标识别感兴趣，想做一些有趣目标识别项目自己玩耍，本来选择的是 YOLOV5 的，但无奈自己使用 YOLOV5 环境训练模型时，不管训练多少次 mAP 指标总是为 0，而其它…

人工智能 2023年7月9日
0066
Spring – BeanFactoryAware扩展接口

文章目录 Pre org.springframework.beans.factory.BeanFactoryAware 扩展点说明 Aware接口 Spring内建Aware接口的…

人工智能 2023年7月30日
0048
Density Map Guided Object Detection in Aerial Images （论文阅读笔记）

Density Map Guided Object Detection in Aerial Images 论文阅读笔记出处：CVPR2020 ; 一、介绍文章主要研究的是基于高…

人工智能 2023年7月11日
00107
ABB机器人RobotStudio编程指令大全

ABB编程指令大全指令类型指令说明程序的调用 ProcCall 调用例行程序程序的调用 CallByVar 经过带变量的例行程序名称调用例行程序程序的调用 RETURN 返…

人工智能 2023年6月15日
00227
国科大图数据管理与分析课程项目gStore实验报告

一、gStore数据库探索 gStore是面向RDF知识图谱的开源图数据库系统，支持复杂的SPARQL查询及有效的增删改操作，支持海量三元组规模的RDF知识图谱的数据管理任务。…

人工智能 2023年6月1日
00185
神经网络训练后如何使用,神经网络训练完怎么用

怎么使用已经训练好的BP神经网络 BP（BackPropagation）神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练…

人工智能 2023年6月15日
0068
深度学习相关概念：梯度下降

深度学习相关概念：梯度下降法、动量法与自适应梯度 1. 梯度下降概念 2. 梯度下降的目的 3. 梯度下降的原理 4. 梯度计算 5. 梯度下降算法的类别及计算效率 * 5.1 批…

人工智能 2023年7月13日
0038
一文详解宏基因组组装工具Megahit安装及应用

要点 Megahit简介 Megahit的基本组装原理 Megahit的安装和使用 Megahit实战 hello，大家好，今天为大家带来关于宏基因组组装工具Megahit的超详细…

人工智能 2023年7月15日
0098
pandas DataFrame(5)-合并DataFrame与Series

之前已经学过DataFrame与DataFrame相加,Series与Series相加,这篇介绍下DataFrame与Series的相加: import pandas as pd …

人工智能 2023年6月2日
0052
【强化学习PPO算法】

强化学习PPO算法一、PPO算法二、伪代码三、相关的简单理论 * 1.ratio 2.裁断 3.Advantage的计算 4.loss的计算四、算法实现五、效果六、感悟…

人工智能 2023年6月16日
0090
基于MATLAB实现简单人工神经网络

资源下载地址：https://download.csdn.net/download/sheziqiong/85979688资源下载地址：https://download.csdn….

人工智能 2023年7月13日
0083
Linux网络编程10——libevent库

目录一、介绍、下载、解压和安装 1.1 libevent 库简介 1.2 下载 1.3 解压 1.4 源码包安装二、libevent 框架 2.1 流程 2.2 分析 hell…

人工智能 2023年6月28日
0085
常见的图像滤波方法

0 前言图像滤波，即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制，是图像预处理中不可缺少的操作，其处理效果的好坏将直接影响到后续图像处理和分析的有效性和可靠性。参考文…

人工智能 2023年5月28日
0083
NLP终极入门教程

原文：Ultimate Guide to Understand and Implement Natural Language Processing 大多数自然语言文本形式的数据是 …

人工智能 2023年5月30日
0077
脉冲神经网络（SNN）论文阅读（二）—–STBP算法训练高性能SNN

原文链接：https://blog.csdn.net/qq_43622216/article/details/123739672 Spatio-Temporal Backpropa…

人工智能 2023年7月12日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch入门实战（8）：小样本学习实现图片分类（Few-shot Learning, Meta Learning）

文章目录

大家都在看