基于传统CV实现图片分类（以图搜图）

2023年7月1日下午12:46 • 人工智能 • 阅读 81

图片分类在计算机领域并不是一个新鲜的话题了，相对于传统计算机视觉（CV）方法解决这类问题，深度学习的效果反而更好。但是我们依然需要了解传统做法，说不定在未来研究时可以提供不一样的灵感。

图像描述符

要实现图像分类，首先我们需要提取我们图像库里已有图像的特征，这个过程称为描述图像。图像描述符定义了我们如何量化图像，而其输出可以看作图像本身的抽象。图像描述符的选取可以有很多，可以以颜色，形状为基准或者质地为基准。关于图像描述符更多更详细的介绍将在后面的文章中说明。在本文中，我们使用颜色中的颜色直方图作为图像描述符。

相似度指标

如何判断目标图像和图像库里的某一个图像是否是一类？我们可以通过比较二者的图像描述符来判断。而这个比较方法我们称之为相似度指标，即用来判断两者是否相似的标准。关于相似度指标更多更详细的介绍将在后面的文章中说明。

代码及简单解释

导入必要的库，如果导入失败可以pip安装或者自行搜索导入教程。

import imutils
import cv2
from imutils.paths import list_images
import argparse
import numpy as np
import os

这个是颜色直方图的类，在这里简单介绍一下颜色直方图calcHist()。颜色直方图可以将显示图片中各像素数值区间内像素的数量。例如，我们将bin设为2，那么意味着我们将像素范围[0,255]等比例分为2份[0,127];[128,255]。然后计算图片里属于[0,127]的像素的个数和属于[128,255]的像素的个数。像素数值的大小反映了亮暗程度，各个通道RGB的像素又分别代表了颜色的深浅。于是两幅整体颜色相近的图片的颜色直方图是类似的。
在实际应用时我们也应该注意一点，不同图像的像素数量可能不同，于是我们可以使用归一化normalize(),将数量换成比例。例如[100,300]，经过归一化后变为[0.25,0.75]。这样就可以比较不同大小的图像的颜色直方图。

class ColorHistogram:
    def __init__(self,bins):
        self.bins=bins

    def describe(self,image):
        hist=cv2.calcHist([image],[0,1,2],None,self.bins,
                [0,256,0,256,0,256])
        hist=cv2.normalize(hist,hist)

        return hist.flatten()

初始化，bin选择32。我们要注意bin的选择会影响数据量的多少，对于小数据集来说，bin选取较大时构建颜色直方图的时间似乎并没有增长太多。但是对于后续比较相似度时，bin的大小将会明显影响计算的时间。而且可以肯定的是，bin选取越大对于分类的准确性是有提升的。但是提升的幅度可能在到达某一点后就大幅减少，此时再通过堆计算量来提升那一两个百分点其实是没有必要的，尤其是对于专注于应用的同学。


ap=argparse.ArgumentParser()
ap.add_argument("-d","--dataset",required=True）
ap.add_argument("-i","--image",required=True)
args=vars(ap.parse_args())

index={}
desc=ColorHistogram([32,32,32])

for imagePath in list_images(args["dataset"]):
    k=imagePath[imagePath.rfind("/")+1:]
    image=cv2.imread(imagePath)
    features=desc.describe(image)
    index[k]=features

读取我们的图像库，我的图像库里有从网上下载的20张图片，分别包括海洋，树林和沙漠。

class Classif:
    def __init__(self,index):
        self.index=index

    def classif(self,iFeature):
        results={}
        for (k,features) in self.index.items():
            d=self.chi2_distance(features,iFeature)
            results[k]=d

        results=sorted([(v,k) for (k,v) in results.items()])
        return results

    def chi2_distance(self,histA,histB,eps=1e-10):
        d=0.5*np.sum([((a-b)**2)/(a+b+eps) for (a,b) in zip(histA,histB)])
        return d

读取我们的目标图片，提取图像描述符并进行分类。分类结束后，我们提取图像库中相似度最高的五张图像进行展示。

image=cv2.imread(args["image"])
cv2.imshow("Image",image)

Features=desc.describe(image)

clas=Classif(index)
results=clas.classif(Features)

montage=np.zeros((100*5,200,3),dtype="uint8")

for j in range(0,5):
    (score,imageName)=results[j]
    path=os.path.join(args["dataset"],imageName)
    result=cv2.imread(path)
    result=cv2.resize(result,(200,100))
    if j<5:
        montage[j*100:(j+1)*100,:]=result

cv2.imshow("Result",montage)
cv2.waitKey(0)

结果

看起来不错，但很明显这个分类器对颜色很敏感，并不完全符合我们对于分类器的需求。我们也可以根据我们想要分类图片的特征来选取图像描述符，例如有些图片里物体的形状特征很明显。当然，后期我们也会介绍神经网络，深度学习的方法，这个是目前的主流。

“本站所有文章均为原创，欢迎转载，请注明文章出处：https://blog.csdn.net/kasami_/article/details/123834951。百度和各类采集站皆不可信，搜索请谨慎鉴别。技术类文章一般都有时效性，本人习惯不定期对自己的博文进行修正和更新，因此请访问出处以查看本文的最新版本。”

Original: https://blog.csdn.net/kasami_/article/details/123834951
Author: mini梁翊洲MAX
Title: 基于传统CV实现图片分类（以图搜图）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663375/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使

最近在学习深度学习，记录一下实现的过程对北京大学曹健老师class1课程的总结 1、数据集的准备数据集可以通过sklearn.datasets.load_iris直接获取 fr…

人工智能 2023年5月26日
00162
【房价预测】BP神经网络回归的现实应用-上海市二手房价格影响因素分析——思路剖析和结果分享

最近没发新文的原因：工作很忙，早出晚归正忙着做这个活实验结果：说实话，我真没想到可以实现这种效果，反正比预想的好，( 也只是怀着玩玩的心情 = = )，大部分的差价都在百…

人工智能 2023年6月18日
00125
TransUnet官方代码测试自己的数据集（已训练完毕）

码字不易，收藏之余，别忘了给我点个赞吧！ ———Start 首先参考上一篇的训练过程，这是测试过程，需要用到训练过程的权重。 1. TransU…

人工智能 2023年7月6日
0084
机器学习图像特征提取—SIFT特征提取原理及代码实现

1 SIFT简介 2 SIFT原理及特点 2.1 SIFT算法特点 2.2 SIFT特征检测 3 SIFT代码实现 SIFT，即尺度不变特征变换（Scale-invariant f…

人工智能 2023年6月15日
00103
《模型轻量化-剪枝蒸馏量化系列》YOLOv5无损剪枝（附源码）

今天文章代码不涉密，数据不涉密，使用的是网上开源代码，做了修改，主要介绍如何实现的，另外，数据使用开放数据VisDrone的小部分数据来测试~ 今天的文章很短，主要附带一个视频讲解…

人工智能 2023年6月12日
0075
pycharm读取excel中的数据，文章中含有源码

我们首先通过打开pycharm,首先准备个excel，然后将数据读取到文件中** 提取excel中特定的行或者列 ** import xlrd A=[] xx=xlrd.open_…

人工智能 2023年7月7日
0081
IOS 苹果手机位置修改器 location cleaned 操作汇总贴

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月30日
0092
AdamW优化器（自适应梯度方法）

DECOUPLED WEIGHT DECAY REGULARIZATION解耦权值衰减正则化摘要 L2正则化和权值衰减正则化对于标准随机梯度下降是等价的(当按学习率重新调整时)，…

人工智能 2023年7月13日
00159
R语言ggplot2可视化：通过在element_text函数中设置标签字体大小列表和标签字体形式列表自定义标签可视化效果

[ ggplot2_是 _R语言中_一个常用的数据 _可视化_工具包，它可以通过代码实现各种图表的绘制。其 _中_散点图是一种常用的数据 _可视化_方式，可以利用 _ggplot…

人工智能 2023年7月15日
0080
如何用Pandas读取一个csv文件

一，csv文件 csv文件是什么？csv文件是一个文件类型。这种文件不像excel,word,ppt……这些文件一样，它们的区别就在于，如果你用MacOs(…

人工智能 2023年7月6日
0086
Sophus库安装及make报错解决记录

注：在安装Sophus之前必须先安装eigen。 1.安装 (1).下载Sophus安装包 git clone https://github.com/strasdat/Sophus…

人工智能 2023年6月11日
0074
应用回归分析（知识点整理）（四）——SPSS处理自相关（序列相关）

文章目录自相关 * 自相关产生的原因自相关产生的后果自相关的检验方法 – 图示检验法自相关系数法 DW（杜宾沃森）检验自相关的消除 – 迭代法差…

人工智能 2023年6月17日
0096
利用torch.nn实现softmax回归Fashion-MNIST数据集上进行训练和测试

利用torch.nn 实现softmax 回归Fashion-MNIST 数据集上进行训练和测试：（1 ）（2 ）（3 ）同上（4 ）构建模型（5 ）损失函数和优化算法（6…

人工智能 2023年6月17日
00131
论文阅读：Bridging Knowledge Graph to Generate Scene Graph(ECCV20)

1.目标检测 2.生成场景图（SE和SP）SE（场景图实体结点）：vi：roi featureφ：fc layer SP（场景图谓语结点）：u：union box roi feat…

人工智能 2023年6月1日
0073
CSP-J1 CSP-S1 信奥第1轮初赛数据分析成绩及分数线汇总

2021 CSP-J/S初赛数据大全，全面分析这31个省市！ 2021 CSP-J/S初赛数据大全，全面分析这31个省市！ – 知乎信息学奥赛｜经验总结助力2022…

人工智能 2023年7月15日
00125
Python库-pandas详解

Python库-pandas详解 1. pandas介绍 2. Series 3. DataFrame * 3.1 DataFrame结构 3.2 DataFrame属性与方法 3…

人工智能 2023年7月18日
0045

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于传统CV实现图片分类（以图搜图）

大家都在看