基于VGG的图像多标签分类算法详解及实践

2023年7月2日下午4:53 • 人工智能 • 阅读 82

摘要

将深度学习与人物穿着上的服装图像分类结合是目前的研究热点之一,然而目前对服装图像分类主要是分成单个标签单独处理。在现实生活中,随着网络购物等服装商务新模式的出现、复杂决策的迫切需要,单标签服装图像分类已经不能解决问题,多标签服装图像分类成为一个重要的学习问题,展现出巨大的应用价值。多标签服装图像分类的目标是预测每张服装图像的一组服装属性标签。

多标签分类定义

multi-label classification problem：多标签分类（或者叫多标记分类），是指一个样本的标签数量不止一个，即一个样本对应多个标签。

为了方便大家理解多标签，举个例子：一个女生穿个蓝色的裙子

那么黑色加粗字体的标签的可以设置为：

Black

Blue

Dress

Jeans

Red

Shirt

male

famale

…. [“female’ ‘red’ ‘shirt’]01100001…

通过MultiLabelBinarizer()的fit就可以得到上述label的编码。

多标签分类模型的输出问题

传统在进行实现多分类任务时，常采用softmax函数，其输出为：

z = np.array([-1.0, 5.0, -0.5, 5.0, -0.5])
print(Softmax_sim(z))
&#x8F93;&#x51FA;&#x4E3A;[ 0.00123281  0.49735104  0.00203256  0.49735104  0.00203256]

通过使用softmax，我们可以清楚地选择标签2和标签4。但我们必须知道每个样本需要多少个标签，或者为概率选择一个阈值。这显然不是我们想要的，因为样本属于每个标签的概率应该是独立的。因此，在完成整个模型构建之后，最后一步中最重要的是为模型的编译选择损失函数。在多标签分类中，大多使用binary_crossentropy损失而不是在多类分类中使用categorical_crossentropy损失函数。这可能看起来不合理，但因为每个输出节点都是独立的，选择二元损失，并将网络输出建模为每个标签独立的bernoulli分布。整个多标签分类的模型为：

from keras.models import Model
from keras.layers import Input,Dense
inputs = Input(shape=(10,))
hidden = Dense(units=10,activation='relu')(inputs)
output = Dense(units=5,activation='sigmoid')(hidden)
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy']&#xFF09;

多标签数据集

本人的数据集有6类，在网上爬虫分类整理得到的。

女性蓝色裙子：female_bule_dress：415张

女性蓝色T袖：female_bule_shirt：311张

女性红色裙子：female_red_dress:259张

男性黑色T袖：male_black_shirt:257张

男性蓝色T袖：male_bule_shirt:247张

男性红色T袖：male_bule_shirt:194张

模型实现与训练

class SmallerVGGNet:
    @staticmethod
    def build(width, height, depth, classes, finalAct="softmax"):
        model = Sequential()
        inputShape = (height, width, depth)
        chanDim = -1
        if K.image_data_format() == "channels_first":
            inputShape = (depth, height, width)
            chanDim = 1
        model.add(Conv2D(32, (3, 3), padding="same",
            input_shape=inputShape))
        model.add(Activation("relu"))
        model.add(BatchNormalization(axis=chanDim))
        model.add(MaxPooling2D(pool_size=(3, 3)))
        model.add(Dropout(0.25))
        model.add(Conv2D(64, (3, 3), padding="same"))
        model.add(Activation("relu"))
        model.add(BatchNormalization(axis=chanDim))
        model.add(Conv2D(64, (3, 3), padding="same"))
        model.add(Activation("relu"))
        model.add(BatchNormalization(axis=chanDim))
        model.add(MaxPooling2D(pool_size=(2, 2)))
        model.add(Dropout(0.25))
        model.add(Conv2D(128, (3, 3), padding="same"))
        model.add(Activation("relu"))
        model.add(BatchNormalization(axis=chanDim))
        model.add(Conv2D(128, (3, 3), padding="same"))
        model.add(Activation("relu"))
        model.add(BatchNormalization(axis=chanDim))
        model.add(MaxPooling2D(pool_size=(2, 2)))
        model.add(Dropout(0.25))
        model.add(Flatten())
        model.add(Dense(1024))
        model.add(Activation("relu"))
        model.add(BatchNormalization())
        model.add(Dropout(0.5))
        model.add(Dense(classes))
        model.add(Activation(finalAct))
        # return the constructed network architecture
        return model

5.实验结果展示

从上面的损失图中，我们可以看到训练损失在 20 个 epoch 结束之前非常平稳地下降。但是验证损失图波动很大。似乎训练时间超过 20 个 epoch 会导致过度拟合。最终，我们应用测试函数进行了测试：

数据集下载链接：https://download.csdn.net/download/weixin_40651515/22284807

数据集加代码下载资源：https://download.csdn.net/download/weixin_40651515/22286694

代码运行环境配置：python3.6.5,tensorflow==1.12,keras==2.2.4

Original: https://blog.csdn.net/weixin_40651515/article/details/120210828
Author: 就是求关注
Title: 基于VGG的图像多标签分类算法详解及实践

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665836/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

浅谈：多光谱和高光谱图像有什么区别？

多光谱、高光谱甚至是超光谱首先是应用于卫星的遥感，遥感技术已经成为人类获得地球以及其他星球信息重要的手段之一。利用遥感成像系统得到的地球资源信息已成为人类开发、合理的利用、管理和监…

人工智能 2023年6月20日
00114
上海交大情感脑电数据集(SEED)简介

SJTU 情感脑电数据集（SEED）是由BCMI实验室提供的EEG数据集的集合，该实验室由路宝良教授领导。数据集官网以及获取地址： http://bcmi.sjtu.edu.c…

人工智能 2023年6月16日
0077
Redis介绍和使用

一、redis简介简单来说 redis 就是一个数据库，不过与传统数据库不同的是 redis 的数据是存在内存中的，所以读写速度非常快，因此 redis 被广泛应用于缓存方向。另外…

人工智能 2023年7月29日
0068
京东抢购失败？试试用 python 准时自动抢购 (注释详尽)

文章目录 * – + 1. 问题分析 + 2. 基础情况 + 3. 安装 selenium + 4. 下载 Edge 浏览器驱动 + 5. 登录网页京东 + 6. 滑动…

人工智能 2023年7月6日
00155
如何对Tensor对象进行归一化处理

问题背景与介绍在机器学习和深度学习中，归一化处理是一个常用的操作。对于Tensor对象，即多维数组对象，在进行归一化处理时，需要将每个维度上的数据映射到0~1的范围内，以保证数据…

人工智能 2024年1月1日
0075
朋友电脑密码忘了，我当场拔了她的电源，结果。。。

「作者主页」：士别三日wyx「作者简介」：CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 Windows密码忘了怎么办？一、5次shift键弹出粘滞…

人工智能 2023年7月30日
0054
parser.add_argument用法

EurekaLog 7.5 (18-August-2016) 1)..Important: Installation layout was changed. All package…

人工智能 2023年7月21日
0054
部署kubernetes-v1.25.3（k8s）- 基于containerd容器运行时

文章目录前言一、准备开始二、环境配置（所有节点操作）三、安装containerd（所有节点操作） * 3.1、安装containerd 3.2、安装runc 3.3、安装C…

人工智能 2023年6月30日
00103
COCO数据集的介绍和使用

这篇文章是我研究生阶段入学期间学习所记，主要供自己使用，结合了论文原作和源码，中间借鉴的一些b站的视频以及他人博客的解释，会在文章末尾贴出链接。目录 COCO数据集的介绍 COC…

人工智能 2023年7月27日
00170
pandas入门之DataFrame

创建DataFrame 指定索引字典的系列可以传递以形成一个DataFrame。所得到的索引是通过的所有系列索引的并集指定索引 DataFrame属性 values 取出所有…

人工智能 2023年6月2日
00101
Ubuntu18.04安装ROS1和ROS2 Ubuntu18.04安装ROS1-Melodic和ROS2-Dashing 保姆教程

最近在Ubuntu18.04环境下使用realsense，需要配置ROS1和ROS2，查找了多方面教程，最后整理出来一个成功案例，自己测试已经成功（经过多次尝试，如果想使用ROS2…

人工智能 2023年6月1日
00157
动态代理模式下UndeclaredThrowableException的产生

我们先来看下这个异常类的api文档： Thrown by a method invocation on a proxy instance if its invocation han…

人工智能 2023年6月28日
0092
Logistic算法在处理不平衡数据集时可能遇到问题，可以采用过采样或欠采样等方法进行处理

问题背景在机器学习中，数据集的不平衡性是一个常见的问题。当数据集中的不同类别样本数量存在明显差异时，例如正类别样本数量远小于负类别样本数量，传统的机器学习算法会倾向于对多数类别进…

人工智能 2023年12月31日
0041
Self-Attention详解

文章目录 Sequence数据的处理 * Sequence Labeling（输入和输出的大小一样） Self-Attention内部机理 * 如何求解b？ Multi-head …

人工智能 2023年6月25日
0089
【part2】Tensorflow Object detection API Win10使用教程(tensorflow数据集生成教程)

前言：该教程目的是为了把Pascal VOC数据集转换成tensorflow object detection api可用的数据集的格式(.tfrecord)。教程结构：本教…

人工智能 2023年5月24日
0089
【AI框架】MMDetection3D 使用指南

MMDetection3D 是一个基于 PyTorch 的目标检测开源工具箱, 下一代面向 3D检测的平台对安装 MMDetection3D有问题的同学可以看：【星光02】MMD…

人工智能 2023年7月21日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于VGG的图像多标签分类算法详解及实践

大家都在看