kaggle比赛：Classify Leaves（使用resnet50预训练模型进行：图片树叶分类）

2023年7月2日上午10:24 • 人工智能 • 阅读 73

def read_csv_labels(fname):
    """读取 fname 来给标签字典返回一个文件名。"""
    with open(fname, 'r') as f:
        lines = f.readlines()[1:]
    tokens = [l.rstrip().split(',') for l in lines]
    return dict(((name, label) for name, label in tokens))

labels = read_csv_labels(os.path.join(data_dir, 'train.csv'))

def copyfile(filename, target_dir):
    """将文件复制到目标目录。"""
    os.makedirs(target_dir, exist_ok=True)
    shutil.copy(filename, target_dir)

def reorg_train_valid(data_dir, labels, valid_ratio):

    n = collections.Counter(labels.values()).most_common()[-1][1]
    n_valid_per_label = max(1, math.floor(n * valid_ratio))
    label_count = {}
    for train_file in labels:
        label = labels[train_file]
        fname = os.path.join(data_dir, train_file)
        copyfile(
            fname,
            os.path.join(data_dir, 'train_valid_test', 'train_valid', label))
        if label not in label_count or label_count[label] < n_valid_per_label:
            copyfile(
                fname,
                os.path.join(data_dir, 'train_valid_test', 'valid', label))
            label_count[label] = label_count.get(label, 0) + 1
        else:
            copyfile(
                fname,
                os.path.join(data_dir, 'train_valid_test', 'train', label))
    return n_valid_per_label

def reorg_test(data_dir):
    test = pd.read_csv(os.path.join(data_dir, 'test.csv'))
    for test_file in test['image']:
        copyfile(
            os.path.join(data_dir, test_file),
            os.path.join(data_dir, 'train_valid_test', 'test', 'unknown'))

def reorg_leave_data(data_dir, valid_ratio):
    labels = read_csv_labels(os.path.join(data_dir, 'train.csv'))
    reorg_train_valid(data_dir, labels, valid_ratio)
    reorg_test(data_dir)

batch_size = 128
valid_ratio = 0.1
if not os.path.exists(data_dir + "\\" + "train_valid_test"):
    print("start!")
    reorg_leave_data(data_dir, valid_ratio)
else:
    print("Already exists!")
print('finish!')

3、图像增广：

接下来对图像进行变换，也就是 图像增广：这里需要说下，图像增广，这里并没有把每张图片变成多张，保存下来。而是每次读入的时候，随机的变换成一张，然后送入模型。从整个模型运行的角度看，实际上就是将数据集变大了，因为每次送入的图片大概率是不一样的（随机变换的）

transform_train = torchvision.transforms.Compose([
    torchvision.transforms.RandomResizedCrop(224, scale=(0.08, 1.0),
                                             ratio=(3.0 / 4.0, 4.0 / 3.0)),
    torchvision.transforms.RandomHorizontalFlip(),
    torchvision.transforms.ColorJitter(brightness=0.4, contrast=0.4,
                                       saturation=0.4),

    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize([0.485, 0.456, 0.406],
                                     [0.229, 0.224, 0.225])])

transform_test = torchvision.transforms.Compose([
    torchvision.transforms.Resize(256),
    torchvision.transforms.CenterCrop(224),

    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize([0.485, 0.456, 0.406],
                                     [0.229, 0.224, 0.225])])

4、读取数据：

我们前面把数据集划分成训练集、验证集和测试集，并每一个类建立了一个文件夹。接下来我们使用 torchvision 的 ImageFolder方法，将训练集、验证集和测试集读取进来。


train_ds, train_valid_ds = [
    torchvision.datasets.ImageFolder(
        os.path.join(data_dir, 'train_valid_test', folder),
        transform=transform_train) for folder in ['train', 'train_valid']]

valid_ds, test_ds = [
    torchvision.datasets.ImageFolder(
        os.path.join(data_dir, 'train_valid_test', folder),
        transform=transform_test) for folder in ['valid', 'test']]

train_iter, train_valid_iter = [
    torch.utils.data.DataLoader(dataset, batch_size, shuffle=True,
                                drop_last=True)
    for dataset in (train_ds, train_valid_ds)]

valid_iter = torch.utils.data.DataLoader(valid_ds, batch_size, shuffle=False,
                                         drop_last=True)

test_iter = torch.utils.data.DataLoader(test_ds, batch_size, shuffle=False,
                                        drop_last=False)

到目前为止，数据的处理总算完事了，接下来看看模型是如何构造的。

5、模型构造：

我为了练习微调（迁移学习的一种）的做法，选用了resnet50预训练模型，作为这次比赛的模型。这么做也有点道理，因为resnet系列的预训练模型都是在ImageNet数据集上训练的，而ImageNet数据集，我们都知道100万的图片，分类为1000类，有树叶的分类，因此，可以使用迁移学习的方法做。

也可以不用微调，直接把resnet50重新训练一遍，应该效果会更好吧。

下面看看微调的具体做法：


def get_net(devices):
    finetune_net = nn.Sequential()
    finetune_net.features = torchvision.models.resnet50(pretrained=True)
    finetune_net.output_new = nn.Sequential(nn.Linear(1000, 512), nn.ReLU(),
                                            nn.Linear(512, 256), nn.ReLU(),
                                            nn.Linear(256, 176))
    finetune_net = finetune_net.to(devices[0])
    for param in finetune_net.features.parameters():
        param.requires_grad = False
    return finetune_net

6、计算损失：


loss = nn.CrossEntropyLoss(reduction='none')

def evaluate_loss(data_iter, net, devices):
    l_sum, n = 0.0, 0
    for features, labels in data_iter:
        features, labels = features.to(devices[0]), labels.to(devices[0])
        outputs = net(features)
        l = loss(outputs, labels)
        l_sum += l.sum()
        n += labels.numel()
    return l_sum / n

7、模型训练：

def train(net, train_iter, valid_iter, num_epochs, lr, wd, devices, lr_period, lr_decay):
"""
    wd：权衰量,用于防止过拟合
    lr_period：每隔几个epoch降低学习率
    lr_decay：降低学习率的比例
"""
    net = nn.DataParallel(net, device_ids=devices).to(devices[0])
    trainer = torch.optim.SGD(
        (param for param in net.parameters() if param.requires_grad), lr=lr,
        momentum=0.9, weight_decay=wd)
    scheduler = torch.optim.lr_scheduler.StepLR(trainer, lr_period, lr_decay)
    num_batches, timer = len(train_iter), d2l.Timer()
    legend = ['train loss']
    if valid_iter is not None:
        legend.append('valid loss')
    animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs],
                            legend=legend)
    for epoch in range(num_epochs):
        metric = d2l.Accumulator(2)
        for i, (features, labels) in enumerate(train_iter):
            timer.start()
            features, labels = features.to(devices[0]), labels.to(devices[0])
            trainer.zero_grad()
            output = net(features)
            l = loss(output, labels).sum()
            l.backward()
            trainer.step()
            metric.add(l, labels.shape[0])
            timer.stop()
            if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:
                animator.add(epoch + (i + 1) / num_batches,
                             (metric[0] / metric[1], None))
        measures = f'train loss {metric[0] / metric[1]:.3f}'
        if valid_iter is not None:
            valid_loss = evaluate_loss(valid_iter, net, devices)
            animator.add(epoch + 1, (None, valid_loss.cpu().detach()))
        scheduler.step()
    if valid_iter is not None:
        measures += f', valid loss {valid_loss:.3f}'
    print(measures + f'\n{metric[1] * num_epochs / timer.sum():.1f}'
          f' examples/sec on {str(devices)}')

devices, num_epochs, lr, wd = d2l.try_all_gpus(), 10, 1e-4, 1e-4
lr_period, lr_decay, net = 2, 0.9, get_net(devices)
train(net, train_iter, valid_iter, num_epochs, lr, wd, devices, lr_period, lr_decay)

训练结果：

kaggle比赛：Classify Leaves（使用resnet50预训练模型进行：图片树叶分类）

8、模型推理：

对测试集进行分类并提交结果。

devices, num_epochs, lr, wd = d2l.try_all_gpus(), 20, 2e-4, 5e-4
lr_period, lr_decay= 4, 0.9

net, preds = get_net(devices), []
train(net, train_valid_iter, None, num_epochs, lr, wd, devices, lr_period, lr_decay)

test = pd.read_csv(os.path.join(data_dir, 'test.csv'))
for X, _ in test_iter:
    y_hat = net(X.to(devices[0]))
    preds.extend(y_hat.argmax(dim=1).type(torch.int32).cpu().numpy())
sorted_ids = test['image']
df = pd.DataFrame({'image': sorted_ids, 'label': preds})

df['label'] = df['label'].apply(lambda x: train_valid_ds.classes[x])
df.to_csv(r'..\data\classify-leaves\submission.csv', index=False)

结果：

9、上传预测结果到kaggle:

下面是我的得分，分不高，以学习为主。

Original: https://blog.csdn.net/weixin_45901519/article/details/119458683
Author: Ma Sizhou
Title: kaggle比赛：Classify Leaves（使用resnet50预训练模型进行：图片树叶分类）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665244/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【WY】数据分析 — Bokeh交互图表阶段一：进阶语法五 —— 折线图

版权声明：本文为博主原创文章，未经博主允许不得转载。文章目录一、折线图 * 1.1 单线图：p.line() – 1.1.1 例 1：列名：index + colu…

人工智能 2023年7月8日
0051
多标签文本分类MAP（mean average precision）的计算方式及相关代码实现

下面是我从一本书上找到的关于MAP公式的讲解如果要想计算precision以及recall，我们要先知道TP、FP、FN代表什么，通俗来讲， TP:预测有，实际也有 FP：预测有…

人工智能 2023年7月2日
0052
Python毕设-【课堂人脸签到系统】附源码课件/Python练手项目/Python毕业设计

Python毕设-【课堂人脸签到系统】附源码课件/允许白嫖文章目录 Python毕设-【课堂人脸签到系统】附源码课件/允许白嫖系统简介一、本课题拟解决的问题二、系统技术栈 …

人工智能 2023年7月18日
0048
6.线性回归的简单评价指标

均方误差（MSE） [\mathrm{MSE}=\frac{1}{N}\sum_{i=1}^{N}(\hat{y}^{(i)}-y^{(i)})^2 ] 均方根误差（RMSE） […

人工智能 2023年6月4日
0080
机器学习基础（二）——训练集和测试集的划分

from sklearn.datasets import load_iris, fetch_20newsgroups, load_boston from sklearn.model…

人工智能 2023年7月28日
0079
CVPR 2022 最新106篇论文分方向整理｜包含目标检测、动作识别、图像处理等32个方向

CVPR 2022 已经放榜，本次一共有2067篇论文被接收，接收论文数量相比去年增长了24%。在CVPR2022正式会议召开前，为了让大家更快地获取和学习到计算机视觉前沿技术，极…

人工智能 2023年6月25日
0055
旷世开源yolox的目标检测使用

如何使用yolox训练自己的目标检测模型 1. 源码的下载，及网络模型的选择 1.1 源码下载在github官网上搜索yolox，链接pycharm下yolox的目录结构 ; 1…

人工智能 2023年7月10日
0089
语义分割系列11-DAnet（pytorch实现）

DAnet：Dual Attention Network for Scene Segmentation 发布于CVPR2019，本文将进行DAnet的论文讲解和复现工作。论文部分…

人工智能 2023年6月23日
0089
解决No module named numpy问题

目录前沿解决解决方法1：方法2：（强行安装更新更高的版本）前沿最近开始学习python了，由于要简单处理一下图片，奈何能C++力太差，openCV上手有点难，想学习一下…

人工智能 2023年5月26日
0055
引导滤波原理

上级目录：传统图像处理/降噪与滤波原理导向滤波的大前提：如图所示，算法认为目标图像 Q上相邻的点是线性相关的，之所以待处理图 P不清晰是因为，不相关的部分（噪声），引导图…

人工智能 2023年6月20日
0093
机器学习-线性回归

一、回归算法 • 回归算法是一种有监督算法 • 回归算法是一种比较常用的机器学习算法，用于构建一个模型来做特征向量到标签的映射。在算法的学习过程中，试图寻找一个模型，最大程度拟…

人工智能 2023年6月17日
0064
3-2 Pandas的索引操作

Pandas是一个强大的分析结构化数据的工具集，基于NumPy构建，提供了，它是使Python成为强大而高效的数据分析环境的重要因素之一（1）一个强大的分析和操作大型结构化数…

人工智能 2023年7月7日
0039
基本的图像操作和处理（计算机视觉）

文章目录一、图像的灰度变换 * 原理介绍：代码示例：结果展示：二、图像轮廓和直方图 * 1.图像轮廓 2.直方图处理 – 原理介绍直方图的性质 3.代码示例 …

人工智能 2023年6月22日
0075
图神经网络（一）DGL框架搭建GCN图卷积神经网络模型

一、DGL DGL是基于pytorch开发的一个专门用于图神经网络模型搭建的框架，到现在为止，DGL已经高度封装了如GCN、GraphSage、GAT等常见的图神经网络模型，可以直…

人工智能 2023年7月21日
0058
基于MATLAB的车道线识别、自动驾驶识别

使用单目相机的视觉感知这个例子展示了如何构建一个能够进行车道边界和车辆检测的单眼摄像机传感器仿真。该传感器将在车辆坐标系中报告这些检测结果。在本例中，您将了解自动驾驶工具箱™使用…

人工智能 2023年5月28日
0050
机器学习Sklearn总结2——分类算法

目录一、转换器与估计器二、分类算法 K-近邻算法案例代码：模型选择与调优案例代码：朴素贝叶斯算法：朴素贝叶斯算法总结案例代码：决策树总结：案例代码：使用随机森…

人工智能 2023年7月1日
00102

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

kaggle比赛：Classify Leaves（使用resnet50预训练模型进行：图片树叶分类）

目录

大家都在看