卷积神经网络 —— 图像识别与深度学习

2023年6月16日下午6:13 • 人工智能 • 阅读 71

视频教程学习链接： https://www.icourse163.org/learn/XUST-1206363802?tid=1467124640#/learn/content?type=detail&id=1248319353&cid=1275090253

原始数据的形式是多种多样的，除了数字之外，还可能是文字、图像、视频、音频等，下面，就以图像识别为例，来了解深度学习在计算机视觉领域中的应用。

图像识别就是指利用计算机对图像进行处理和分析，使机器能够理解图像中的内容。

在计算机中，灰度图像表示为二维张量的形式，例如这个手写数字 5 ，

就被保存为一个 28 x 28 的二维张量。

其中的每一个元素都对应着图像中的一个像素点的灰度信息。

而彩色图像，则可以表示为一个三维张量，增加的这个维度是 RGB 三个色彩通道，

这个图比较大，我们取其中的一小块显示出其对应的张量。

数据表是计算机看到的图片，可以发现，图像对人来说，很容易理解，而对计算机来说，却非常困难。

因此，

; 图像特征

1、颜色特征

颜色往往和图像中包含的物体或场景十分相关，因此，颜色特征在图像检索和分类中应用非常广泛，最简单的颜色特征，是颜色直方图。

颜色直方图描述了图像中每种颜色的统计信息，例如，下图所示的图像中的颜色直方图都是近似的。

但是仅仅使用颜色直方图这一个特征去识别图像，是远远不够的。例如，下图所示图像中的颜色直方图也是近似的，但却不是我们要找的图像。
卷积神经网络 —— 图像识别与深度学习

这是因为颜色直方图只是描述了不同色彩在整幅图中所占的比例，但是并没有描述图像中颜色的局部分布，以及每种颜色所处的空间位置。

因此，颜色特征需要和其他特征配合使用。

; 2、形状特征和纹理特征

形状特征可以提取出图像中景物的轮廓，或者形状轮廓。纹理特征描述了图像或图像区域中景物的表面性质。

通过这些视觉特征的组合应用，能够更加准确的描述出图像。

例如，苹果的三个特征如下。

而橘子，

在深度学习成为主流之前，解决视觉问题首先需要依靠特征工程，设计出一种最适合当前任务的特征，在过去的 20 年中，出现了很多优秀的图像特征，例如，

特征工程不仅需要大量的专业知识和经验，而且和具体的任务密切相关，对于不同的视觉任务，需要设计出适合这个任务的特征，例如识别图像中的行人，

往往采用 Hog 特征。

而识别人脸，则常常采用 haar 特征。

我们很难设计出应对多种识别任务的特征，而且即使通过精心设计过的视觉特征，计算机对图像的理解仍然可能和人类存在很大的差异。

例如，下图中的两个图像的视觉特征非常相似，

但是，他们的高层语义却完全不同，一个是人，一个是狗。

这种现象，被称为语义鸿沟。

可以看到，下图中的两组图片，也有着相同的问题，即

另外，还有些图像虽然表达同样的语义概念，视觉特征却相差很大。这可能由于光照、拍摄视角、尺寸、形变、背景干扰或者遮挡等原因导致。也可能同类的语义本身就种类繁多，外观差异很大。

语义鸿沟的存在给图像识别带来很大的困扰。例如，下图中都是猫的图像，我们可以轻松的识别它们，但是它们的视觉特征却相差很大，对于计算机来说，是一项极具挑战性的任务。

近年来，随着数据、算法、计算能力的快速发展，深度学习在计算机视觉领域得到了成功的应用。深度学习采用端到端的学习方法，避免了特征工程这项令人头痛的工作。

例如，一个区分猫和狗的程序，只需要把各种猫和狗的照片送入神经网络中，

然后根据图片的标签去训练这个网络，当网络收敛时，神经网络的隐含层就从这些图片中自动的学习到了猫和狗的特征。

现在，输入没有标签的图像，神经网络就能正确的判断出它是猫还是狗。

至于隐含层提取出的特征究竟是什么，我们并不知道，也不需要关心。

这个过程和我们人类的学习过程非常的相似。当我们教小孩子识别猫和狗时，只要让他们看到各种猫和狗的照片，同时告诉他这是猫还是狗，并且与实际的猫和狗进行对照，经过一段时间之后，他基本上就可以认识了，这就是端到端的学习方法。

我们并不用给他详细的描述猫和狗在外观上的区别，只需要告诉他这是猫还是狗，一开始，也许会认错，但是只要立刻纠正，告诉他正确的答案，经过一段时间的训练之后，它的正确率就会越来越高了。

深度神经网络可以看成是对人脑分层机制的模仿，它通过多层隐含层不断组合低层隐含层特征，从而形成更加抽象的高层特征，神经网络中的隐含层越多，提取出的特征就更加抽象，表达能力也就越好。

Original: https://blog.csdn.net/xuechanba/article/details/125075212
Author: xuechanba
Title: 卷积神经网络 —— 图像识别与深度学习

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626028/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PDAugment: Data Augmentation by Pitch and Duration Adjustments for Automatic Lyrics Transcription解读

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0079
ZYNQ图像处理(4)——灰度图像转二值化图像

1、二值化图像简介前面已经完成了摄像头图像的采集和显示，以及RGB图像转灰度图。二值化图像在图像处理领域同样有广泛的应用，本节介绍如何用FPGA实现灰度转二值化图形。灰度实现二值…

人工智能 2023年6月20日
00112
Halcon形态学操作、区域处理相关常用API

膨胀一般用来填补物体中小的空洞和狭窄的缝隙，使物体的尺寸增大。膨胀运算需要生成结构内核才能完成，在HALCON中使用gen_circle来生成圆形结构内核，这个函数的参数中：（1…

人工智能 2023年5月28日
0078
搭建自己的语义分割平台deeplabV3+

文章目录前言一、deeplabV3+ 二、数据准备三、修改代码四、开始训练五、测试前言在上一篇主要了解了语义分割，实例分割，全景分割的区别，以及labelme标注的数…

人工智能 2023年5月26日
0070
torch文件保存与加载——【torch学习笔记】

引用翻译：《动手学深度学习》到目前为止，我们讨论了如何处理数据，如何建立、训练和测试深度学习模型。然而，在某些时候，我们很可能对我们获得的结果感到满意，我们希望保存结果以便以后使…

人工智能 2023年6月16日
00102
这次真的搞定了在Mac M1上安装tensorflow，踩坑踩的我脚都断了

我这个小菜鸡买了m1之后就开始张罗着安装各种软件，尤其是遇到了tensorflow，各种难受，踩了一堆坑，比如各种tf版本不兼容(如signal 4: SIGILL报错)、各种zs…

人工智能 2023年5月26日
0087
毕业设计大数据全国疫情数据分析与3D可视化 – python 大数据

文章目录 0 前言 1 课题背景 2 实现效果 3 设计原理 4 部分代码 5 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，…

人工智能 2023年7月16日
0064
pandas快速入门

开源的数据挖掘库用于数据探索封装了matplotlib,numpy 案例知识点 pd.DataFrame(ndarray)–创建DataFrame pd.date_range(…

人工智能 2023年7月7日
0039
华为手机媒体音量自动静音_原来华为手机的音量键这么多神奇的功能，涨知识了…

正在使用华为手机的宝宝不知道你有没有认真学习过华为手机的音量键功能，它不仅可以调节手机的音量，就这么简单！其实，它也有很多不为人知的提示，而且很实用，我们来看看吧。 [En] Ba…

人工智能 2023年5月27日
00272
边缘计算：基于tflite实现andriod边缘端回归预测推理实战

读了本文，你可以实现从云端利用DNN模型进行训练，模型保存.h5格式（基于keras）或是saved model格式（tf2.0版本），模型转化为tflite，利用android …

人工智能 2023年6月17日
0071
什么是TensorFlow的计算图

什么是TensorFlow的计算图 TensorFlow是一个用于机器学习和深度学习的开源库。在TensorFlow中，计算图是一种用于描述机器学习模型的方式。计算图由一系列的操作…

人工智能 2023年12月31日
0034
【环境配置】RTX 3090+cuda11.2+python39+pytorch1.8.0

网上教程很多，不再赘述。版本根据自己需求来定，我选的是比我之前使用的python版本高但比最新python版本稍低的 python3.9.9，图个稳定。在这个过程中唯一需要提醒的是…

人工智能 2023年7月23日
0081
【PyTorch】torch.utils.data.Dataset 介绍与实战

训练模型一般都是先处理数据的输入问题和预处理问题。Pytorch提供了几个有用的工具：torch.utils.data.Dataset 类和 torch.utils.dat…

人工智能 2023年7月5日
0087
使用labelme工具标注人像数据集

使用labelme工具标注人像数据集一、前言二、安装labelme工具三、使用 todo 一、前言在《基于人脸识别和图像分割技术制作证件照》博文中讲解了如何基于分离出的人像…

人工智能 2023年5月25日
0087
MySQL优化书写高质量sql语句

反例： select * from student; 正例： select id，name, age from student; 理由：只取需要的字段，可以节省资源、减少CPU和…

人工智能 2023年7月29日
0056
超越前作，实现动漫风格迁移——AnimeGANv2

前言之前一直在研究如何将图像动漫化，尝试了阿里云api和百度api，效果都不尽如人意。结果发现了一个宝藏github项目——AnimeGANv2，能够将现实世界场景照片进行动漫风…

人工智能 2023年6月24日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

卷积神经网络 —— 图像识别与深度学习

; 图像特征

1、颜色特征

; 2、形状特征和纹理特征

大家都在看