在互联网和数据及其发达的今天，我们每时每刻都要面对海量的图像数据，其内容和形式呈现出复杂多样化。试图通过人工辨识的方法来处理这些图片是不可能的，因为人工辨识需要消耗大量的人力时间和经验去分析和判断图片，这是非常复杂并且费时耗力的工作。因此，利用计算机辅助自动将图片按照人们理解的方式，划分到不同的类别属性的图像分类和识别技术已成为近些年的研究热点。而图像分类识别技术正是解决这个问题的关键技术。

（2）概念及任务

图像分类是从给定的分类集合中给输入的图像匹配一个标签，即输入一个图像，那么输出的是计算机通过判断给这个图像贴上的标签。

图像分类和识别主要任务是学习和判断图像中是否包含某种特定的目标内容（物体或者场景等），并依据其内容信息进行多类单标签或者多类多标签的分类和识别。由于图像分类识别的数据集种类不同，根据输入数据标签对应注释比例的情况主要分为三种，有监督学习、半监督学习和无监督学习。针对不同标签类型的数据集，则需要设计不同的图像分类识别算法。

a. 有监督学习

输入的数据集内的所有样本都被标注了标签，计算机通过对这些图像的特征进行观察和学习，对它们进行分类，当再次输入一幅图像时它就会对该输入进行判断并输出相应的标签。简单来说就像是给计算机标准答案然后让它作同一种类型的题目。

b. 半监督学习

跟有监督学习进行类比，该学习方式是给部分的样本标注了标签，首先计算机通过对数据集的观察得到样本的特征，然后根据部分样本的标签为它们进行分类，也对后续输入进行判别。

c. 无监督学习

数据集中的所有样本都是没有标注标签的，而计算机要做的是通过观察这些样本的特征将它们进行分类聚合，将它认为是一类的样本（相似特征较为明显）进行聚类。

基于KNN的图像分类

基本概念参考：《基于传统机器学习与深度学习的图像分类算法对比分析_刘华祠》

代码实现参考自下面这位博主的文章：Eastmount

大家如果想要深入学习可以进行参考

(1). 基本概念

KNN 算法是通过计算待测样本与已知样本之间的数据点的相似度进行样本点的分类，对于相似度的判定该算法通常使用的是欧氏距离：

简单来说，该算法就是寻找最近的样本点并将其归为一类，也就是物以类聚、人以群分。

一般该算法的判别步骤如下：

step one: 计算测试集特征向量与训练集特征向量之间的距离。

step two: 按照距离的远近进行排序。

step three: 选取距离最近的 K 个点。

step four: 计算前 K 个点所在类别的出现频率。

step five: 统计前 K 个点中出现频率最高的类别，作为测试集的分类类别。

(2). 代码实现

若是直接想手撸这个算法可以参考博主的这篇文章：机器学习实战（一）—— K-近邻算法（KNN）

下面咱们使用 Python 中提供的分类器进行图像的分类，其中使用的训练数据集可以到博主的网盘中下载：

链接：https://pan.baidu.com/s/1MoSYo3bt35UM0I7Vx0popg
提取码：jmh3

我们知道，Python的一大优势就是提供了大量的第三方库，在本文中我们也是调用分类器进行图像的识别，在这之前我们需要对待训练的图像进行一些操作来使它们满足K近邻算法的运算方式，基本步骤以及代码实现如下：

StepOne.切分训练集和数据集

os.listdir(path)：path为需要列出的目录的路径，该函数返回指定文件和文件夹目录。

append():向列表的尾部添加一个新的元素。

split():通过指定的分隔符对字符串进行切片。

"""
Author:XiaoMa
date:2021/12/14
"""
#调用第三方库
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report

第一步 切分训练集和测试集
X = [] #定义图像名称
Y = [] #定义图像分类类标
Z = [] #定义图像像素
for i in range(0, 10):
    #遍历文件夹，读取图片，本例中的图像文件可以在上面分享的链接中提取
    for f in os.listdir("E:\Python\Study\\venv\Lib\photo/%s" % i):
        #获取图像名称
        X.append("photo//" +str(i) + "//" + str(f))
        #获取图像类标即为文件夹名称
        Y.append(i)
X = np.array(X)
Y = np.array(Y)
#随机率为100% 选取其中的30%作为测试集
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.3, random_state = 1)
print(len(X_train), len(X_test), len(y_train), len(y_test))

得到的输出如下:

StepTwo.图像的读取及处理

第二步 图像读取及转换为像素直方图
#训练集
XX_train = []
for i in X_train:
    #读取图像
    image = cv2.imread(i)

    #图像像素大小一致
    img = cv2.resize(image, (256, 256), interpolation=cv2.INTER_CUBIC)

    #计算图像直方图并存储至X数组
    hist = cv2.calcHist([img], [0, 1], None, [256, 256], [0.0, 255.0, 0.0, 255.0])

    XX_train.append(((hist/255).flatten()))

#测试集
XX_test = []
for i in X_test:
    #读取图像
    #print i
    image = cv2.imread(i)
    #图像像素大小一致
    img = cv2.resize(image, (256, 256), interpolation=cv2.INTER_CUBIC)
    #计算图像直方图并存储至X数组
    hist = cv2.calcHist([img], [0, 1], None, [256, 256], [0.0, 255.0, 0.0, 255.0])
    XX_test.append(((hist/255).flatten()))

StepThree.KNN算法分类

第三步 基于KNN的图像分类处理
from sklearn.neighbors import KNeighborsClassifier  #调用分类器

clf = KNeighborsClassifier(n_neighbors=11).fit(XX_train, y_train)
predictions_labels = clf.predict(XX_test)

print('预测结果:')
print(predictions_labels)

print('算法评价:')
print((classification_report(y_test, predictions_labels)))

#输出前10张图片及预测结果
k = 0
while k < 10:
    #读取图像
    print(X_test[k])
    image = cv2.imread(X_test[k])
    print(predictions_labels[k])
    #显示图像
    cv2.imshow("img", image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    k = k + 1

预测结果以及算法评价如下：

下面只展示部分图像的分类结果：

第一张图像选择的是大象并且判断正确

但也会有一些判断出现错误，如下：

就因为图像中出现了1人就将该图像分类到了第一类人类的部分中了。

结束语

本篇文章主要介绍了机器学习的一些基本概念以及基于KNN的图像分类，主要参考的是论文以及前面提到的博主Eastmount的文章，大家如果想深入了解可以去跟他们学习。这几天忙于各种ddl，其他的一些方法寒假再更，加油！

参考论文

Original: https://blog.csdn.net/qq_52309640/article/details/120941410
Author: 一马归一码
Title: Python 计算机视觉（十七）—— 基于KNN的图像分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/720612/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python_Dataframe_去除重复数据

去除指定单列或多列中的完全重复的项通过drop_duplicates()函数实现，需要利用Pandas包。其中： 1、subset=[] 表示整个dataframe基于[]内选定…

人工智能 2023年7月14日
0072
Mac M1配置tensorflow以及切换虚拟环境导入至Spyder

M1芯片基于Arm64架构下搭载tensorflow，现阶段只能参考苹果官方给出的意见，详情链接如下 Apple Developer Metal Mac搭载的系统应当升级至最新版才…

人工智能 2023年5月25日
0072
主成分分析（PCA）详解

主成分分析（PCA)是一种比较基础的数据降维方法，也是多元统计中的重要部分，在数据分析、机器学习等方面具有广泛应用。主成分分析目的是用较少的变量来代替原来较多的变量，并可以反映原来…

人工智能 2023年7月18日
0065
splines | 多项式回归和样条曲线回归

当变量之间存在非线性关系时，线性回归就不再适用，这时可以转而使用其他非线性模型。但是，线性回归毕竟是统计建模的基础，通过本篇的介绍，可以看到即使是非线性关系有时也可以通过变换然后使…

人工智能 2023年6月17日
0090
深度学习面试题

深度学习面试题 1.深度学习常用算法，及相应应用场景有哪些 2.什么数据集不合适做深度学习 3.如何确定CNN卷积核通道数和卷积输出层的通道数 4.什么是卷积 5.什么是CNN的池…

人工智能 2023年6月16日
0077
知识增强的NLP预训练模型【将知识图谱中的三元组向量引入到预训练模型中】

将知识引入到依靠数据驱动的人工智能模型中是实现人机混合智能的一种重要途径。当前以Bert为代表的预训练模型在自然语言处理领域取得了显著的成功，但是由于预训练模型大多是在大规模非结…

人工智能 2023年6月10日
0072
推荐两款桌面OCR识别神器~

前言今天分享的是两款OCR识别软件 PandaOCR：OCR文字识别翻译、游戏机翻懒人视频字幕提取：字幕提取、语音识别转字幕一般OCR识别工具都用的是大厂识别引擎，如百度、搜狗…

人工智能 2023年5月25日
0074
PCL点云：点云数据结构_sensor_orientation_点云颠倒_点云反转_点云可视化与坐标系不匹配问题

刚接触PCL，记录一下掉进去过的几个坑 “可视化点云的时候，点云反转了，与本来的坐标系不匹配了” 仔细琢磨了半天，可能与pcl::PointCloud::s…

人工智能 2023年6月22日
0078
实体对齐算法在电商领域当中的实践和应用

公众号系统之神与我同在本文包括一下四个部分 1、背景介绍 2、技术进展 3、商品图谱对齐 4、总结和展望背景介绍团队介绍：负责语音与声学、自然语言处理、多模态人机对话、知识…

人工智能 2023年5月28日
0090
OHEM – non_local – smooth L1 loss – Libra R-CNN

OHEM – non_local – smooth L1 loss – Libra R-CNN 从目标检测不平衡综述里看到的本文还是主要讲li…

人工智能 2023年7月11日
0048
RDF常用关键字

rdf:about：当前element已经在其他地方被定义过，后接对应idrdf:ID：当前element为首次定义，后接idrdfs:Resource：所有Resource的基类…

人工智能 2023年6月1日
0040
多分类的几种实现方式

尊敬的读者您好：笔者很高兴自己的文章能被阅读，但原创与编辑均不易，所以转载请必须注明本文出处并附上本文地址超链接以及博主博客地址：https://blog.csdn.net/ven…

人工智能 2023年7月1日
0069
【Machine Learning】5.特征工程和多项式回归

特征工程和多项式回归 1. 导入 2.多项式特征 3.特征选择 4.多项式特征与线性特征的关联 5. 特征缩放 Scaling features 6.复杂函数的拟合 7.课后题特…

人工智能 2023年6月17日
0082
机器学习线性回归——实验报告

机器学习实验报告〇、实验报告pdf可在该网址下载一、实验目的与要求二、实验内容与方法 * 2.1 线性回归算法学习与回顾 – 2.1.1 线性回归的原理 2.1….

人工智能 2023年7月26日
00156
解决TypeError: SwinTransformer: __init__() got an unexpected keyword argument ‘embed_dim‘

内容部分转自：原文链接Swin transformer复现遇到的问题及解决方法1）问题：TypeError: SwinTransformer: init() got an unex…

人工智能 2023年6月24日
0077
【机器学习】KNN算法代码练习

本课程是中国大学慕课《机器学习》的”KNN”章节的课后代码。课程地址：https://www.icourse163.org/course/WZU-14640…

人工智能 2023年6月11日
0064

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Python 计算机视觉（十七）—— 基于KNN的图像分类

（1）背景及意义