SML实现图像标注/分类

2023年7月2日上午1:52 • 人工智能 • 阅读 72

本文分享《信息搜索与人工智能》大作业的实现。题目的实现过程全在PPT，下面结合进行说明。

题目描述：任选某类图像为训练样本，编程实现其基于 SML 算法的类模型。要求图像的 GMM 为 6 个分量，类模型的 GMM 为 10 个分量。两级 GMM 模型的初值均由 k-means 算法获得。

1、实现过程总述

图像特征抽取

先用混合高斯模型拟合一组含有共同语义类的图片（就是说我们的数据集，是按类别一批一批处理的），以提取图片的各个特征。

图像语义类建模

之后把描述图片特征的高斯混合模型的参数再作为数据集，用新的一组高斯混合模型来拟合，这样就相当于是对图片的特征进行整合，得到这一类图片的总体样貌。

图像标注或检索

在建模了多组语义类的模型后，对测试图片在不同的模型下计算似然，选择前几进行标注，表示含有相应的语义类。

2、具体实现

数据预处理

对于一个语义类的所有图片：

1）空间变换：读取图片后，从RGB空间转到YBR空间；

2）分块：图片分割成 88 的小块，相邻重叠 2 ，相当于一个 88 的窗隔 6 滑动一次；

3）补0：对于不满 8*8 的小块，进行补 0 操作，有点像信号插值里的补 0；

4）DCT 变换：对于每个小块进行 DCT 变换，获得特征；

ps，如果你的算法在后面的输入需要把图片展出一维，还需要：

5）zigzag 扫描：在 DCT 变换后，可以输出一个小块观察一下，高频在右下，低频在左上，直接按行按列扫描展开，效果不太好，故还需要zigzag扫描（这一部分实现代码在另外一篇文章）

这里其实也可以进行滤波，滤出高频信息，留下低频信息（查找一些资料可以知道能量主要集中在低频，高频反映边缘和细节，这里我没有做，直接展开了，你也可以补充进行）

6）对每个小块 YBR 空间交替扫描展成一维；

特征提取和语义类建模

对一个语义类图片集 D 里一张图片 I 进行分块，可得到 L 个小块（每个图片可以分割成 L 个小块），共有 M 个数据集（即 D 中共含 M 张图片）：

1）每个小块相当于一个样本，每个样本集有 L 个数据，基于这些数据，建立含 6 个分量的高斯混合模型，得到模型参数分别为：每个分量的概率，相应的均值和均方差

2）对同一个语义类的每幅图片都通过高斯混合模型进行建模，提取特征，每幅图片都用 6 个分量的高斯混合模型，共有 M 张图片。把一张图片的高斯混合模型参数（即每个分量的概率，相应的均值和均方差）作为一个样本，一个语义类就有 6*M 个样本数据作为数据集。用含 10 个分量的高斯混合模型拟合这一类图片的参数特征，得到该语义类的整体描绘；

ps：可用拓展EM算法获得更多分量

标注

在获得了不同语义类的模型特征后，对于一个测试图片，分别在不同的语义类下计算似然，最大的几个作为标注。

3、代码部分

这里只稍作说明，详细见链接（CSDN上传资料最少得5币或者1.9元，需要的也可以私信我）。希望还是先自己尝试一下，作业每年都一模一样，参数不同而已，可以在学期开始有空做完，后面可以节约不少时间。

数据预处理部分可用opencv实现，GMM可以用sklearn现有的模块实现，里面GMM初始化参数的方法，包含了k-means。我觉得我前面已经写的很详细了，照着那个步骤，剩下的就是查代码，找模块带的事。唯一一个没有模块的zigzag，我公开了，我有看过一个学长的实现，k-means、GMM、EM全程手撕，很厉害，但是也容易出错，我运行时没有bug，但是跑不动，特别费时间，细看其实也有很多问题的，最后弃疗自己写了。还是建议用模块，如果你很强，也可以试试，但是其实也没必要，我记得老师说这个作业重在过程。

k-means、GMM、EM 算法详解我觉得比较基础，网上有很多，不必写了，写这篇是因为自己在完成作业时发现可以参考的很少，希望对后来者有帮助。祝学业顺利

Original: https://blog.csdn.net/qq_42896431/article/details/122288175
Author: piukaty
Title: SML实现图像标注/分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664479/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器学习】浅谈正规方程法&梯度下降

🤵‍♂️ 个人主页: @计算机魔术师👨‍💻 作者简介：CSDN内容合伙人，全栈领域优质创作者。 🌐 推荐一款找工作神器网站: 牛客网🎉🎉|笔试题库|面试经验|实习招聘内推还没账户的…

人工智能 2023年7月26日
0066
STM32通过DAC输出音频波形

文章目录一、音频及代码获取二、代码部分三、总结四、参考文献一、音频及代码获取打开Adobe Audition，新建一个音频文件采样率8khz，单声道，8bit 点击效…

人工智能 2023年5月23日
00153
openCV安装与环境配置

到官网下载进入官网后，选择library，选择Windows 点击进入后会自动下载（ps:官网下载速度很慢）这个是百度网盘链接链接：https://pan.baidu.com…

人工智能 2023年6月25日
0094
使用SimpleITK进行3D图像连通域分析

一、简介本文叙述了使用SimpleITK进行3D医疗图像连通域分析的方法。（相邻的像素值视为同一个连通域，不区分像素值）非医疗图像需要先封装为SimpleITK.Image，或…

人工智能 2023年5月26日
0093
Opencv-python——视频帧的读取和重新保存

大家在做传统的图像处理和深度学习时经常用到对视频的处理，这里放上python的opencv库实现的源码，功能是读取视频的每一帧，将每一帧进行操作后重新整合成一个新的视频，供大…

人工智能 2023年6月18日
0084
导数求切线

对于一个连续的函数，切点处的导数等于切线斜率。我们只需要知道切点坐标和切点斜率，就能求切线方程。过( 1 , e ) (1,e)(1 ,e )作y = e x y=e^x y =…

人工智能 2023年6月30日
0054
数据包络分析–二阶段网络（考虑各阶段的公平性）

DEA-关注公平的两阶段DEA模型:建模和计算方面文献介绍二阶段网络示意图基础知识——合作和非合作模式 * 非合作模式（Non-cooperative mode） &#821…

人工智能 2023年6月11日
0068
本地搭建自己的电影网站，并发布公网访问 3-3

系列文章本地搭建自己的电影网站，并发布公网访问 1-3 本地搭建自己的电影网站，并发布公网访问 2-3 本地搭建自己的电影网站，并发布公网访问 3-3 上一篇：本地搭建自己的电影…

人工智能 2023年6月26日
00114
MySQL高级SQL语句（存储过程）

MySQL高级SQL语句（存储过程） MySQL高级SQL语句（存储过程） * 一、存储过程的概述 – 1.1 什么是存储过程 1.2 存储过程的有点二、创建、调用和…

人工智能 2023年6月26日
0098
AI 全自动玩斗地主，靠谱吗？Douzero算法教程

你觉得，AI 全自动玩斗地主，胜率能有多高？真就有100%胜率，实现欢乐豆自由？我让这个 AI 自己玩了一小时，结果出乎意料。先不着急说最终结果，我们先来看看这个 AI 有多强…

人工智能 2023年5月26日
00246
图表示学习

文章目录 * – 1.导言 – + 1.1 为什么要研究图（graph） + 1.2 针对图结构的机器学习任务 + 1.3 特征表示的难点 + 1.4 特征…

人工智能 2023年6月15日
0069
python人口统计_python数据分析实例-人口统计折线图

一、前言最近一直在学python数据科学的相关课程，主要看了《数据科学入门》这本动物书，但这本书是真的只入个门，把数据科学相关的各方面知识介绍了一下，真的只是介绍了一下，想要系统…

人工智能 2023年7月7日
0048
权重确定方法四：主成分分析法确定权重（PCA）

我想在列车里和你相爱阳光流淌都漫过我们的灵魂尽头然后看着人间安静的盛开在一扇窗里目录 1.原理介绍 2.步骤详解 2.1 确定指标在各主成分线性组合中的系数 2.2 利用…

人工智能 2023年7月14日
0062
【前端】JavaScript-事件高级

目录一、事件高级注册事件（绑定事件） 1.传统注册方式 2.方法监听注册事件删除事件（解绑事件） 1.删除事件的方式 DOM事件流事件对象阻止事件冒泡事件委托（代理、委…

人工智能 2023年6月28日
0089
（六）多项式回归

文章目录前言 1. 一个例子 2. 多项式回归模型 3. 代码实现前言这篇文章介绍多项式回归。一个例子线性回归可以很好地拟合线性分布的数据，但是对于非线性的数据却派不上…

人工智能 2023年6月23日
0084
19、Java 中的 final 关键字、嵌套类、内部类、静态嵌套类、局部类

文章目录零、关于继承的补充一、final 二、嵌套类（Nested Class）三、内部类（Inner Class）四、内部类内存布局五、静态嵌套类（Static Nes…

人工智能 2023年5月30日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31