深度学习（五）-CNN

2023年7月12日上午8:41 • 人工智能 • 阅读 81

计算机视觉分类

图像分类，用于识别图像中物体的类别(如: bottle、cup. cube) 。
(b) object Localization:
目标检测，用于检测图像中每个物体的类别，并准确标出它们的位置。
深度学习（五）-CNN

(c) Semantic Segmentation:
图像语义分割，用于标出图像中每个像素点所属的类别，属于同一类别的像素点用一个颜色标识。
(d) Instance Segmentation:
实例分割，值得注意的是。(b)中的目标检测任务只需要标注出物体位置，而(d)中的实例分割任不仅要标注出物体位置，还需要标注出物体的外形轮廓。

(32条消息) CNN笔记：通俗理解卷积神经网络_v_JULY_v的博客-CSDN博客_cnn卷积神经网络

【什么是CNN？】浙大大佬教你怎么卷CNN，卷积神经网络CNN从入门到实战，通俗易懂草履虫听了都点头(人工智能、深度学习、机器学习、计算机视觉)_哔哩哔哩_bilibili

CNN五层网络结构

1、数据输入层/ Input layer

2、卷积层/CONV layer (提取图像中的局部特征)

卷积层被称为过滤器(filter)或者内核(kernel)或卷积核
对输入图像和滤波矩阵（恒定的滤波器filter）做内积(逐个元素相乘再求和)的操作就是卷积，也是卷积神经网络的名字来源。

卷积计算

步幅（为了减小输入参数的数目，减少计算量）

3、ReLy 激励层/ReLg layer

wx+b
激活函数(加入非线性因素)

作用：

提高模型鲁棒性(抗干扰能力)，非线性表达能力，缓解梯度消失问题、加速模型收敛将当前特征空间映射转换到另一个空间，让数据能够更好的被分类
非线性激活函数
假若网络中全部是线性部件，那么线性的组合还是线性，与单独一个线性分类器无异。网络更加强大，学习复杂的事物，复杂的表单数据，从输入输出之间生成非线性映射。

4、池化层/Pooling layer(降低参数量级)

平均池化（mean pooling）

最大池化（max pooling）

目的：

使特征图变小，简化网络计算复杂度特征压缩，提取主要特征
加快计算速度
防止过拟合
缩小最后全连接层中节点的个数，减少整个神经网络参数

5、全连接层/EC layer

AI Studio

CNN实现猫狗分类 – 飞桨AI Studio (baidu.com)

环境

b008c158886547649a9b06f6ae96df44447427fe65db4bac82b609334bd0d25c (933×459) (bcebos.com)实践总体过程和步骤如下图

结果

Original: https://blog.csdn.net/Miles_SY/article/details/126572407
Author: Miles_SY
Title: 深度学习（五）-CNN

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687307/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Time Series Classification时间序列分类（一）

最近需要做相关的课题，看了一些资料，在此稍作总结。时间信号数据与普通的一维数据不同，因为时间信号在一维上具有比较强的相关性，如果把每个采样点作为一个特征来用的话可能并不能得到比较…

人工智能 2023年7月1日
0077
【Python • 图片识别】pytesseract快速识别提取图片中的文字

提示：本文多图，请手机端注意流量。文章目录前言一、配置环境 * 1. 安装python依赖 2. 安装识别引擎 – 安装tesseract识别引擎（可跳过）验证…

人工智能 2023年7月5日
0078
ROI Align的实现原理2_代码实现

书接上文，上一次分析了一下ROI Align的原理是如何实现的，一直想知道具体细节是如何实现的，这里找了相关资料进行学习．上一篇原理介绍博客：ROI Align的实现原理_dl…

人工智能 2023年7月9日
0071
CVPR2021论文列表（中英对照）

Scale-Localized Abstract Reasoning 尺度本地化抽象推理How Does Topology Influence Gradient Propagati…

人工智能 2023年6月16日
0065
PyTorch | 广播机制（broadcast）

PyTorch | 广播机制（broadcast） 1. 广播机制定义 2. 广播机制规则 3. in – place 语义 ; 1. 广播机制定义 \qquad如果一…

人工智能 2023年7月22日
00107
毕业论文文献总结

面向缺陷检测的图像配准的方法和研究图像配准 Image Registration 图像配准的步骤:（使用基于特征的方法） 1、采用 SURF 特征和局部互相关信息的图像配准算法 …

人工智能 2023年6月22日
0077
2021：Zero-shot Visual Question Answering using Knowledge Graphs使用知识图的零次视觉问答

摘要现在的方法主要采用不同组件的管道方法来学习知识匹配和提取、特征学习等，但是当某些组件性能不佳时，这种管道方法就会受到影响，从而导致错误的传播和整体性能变差。而且，大多现有方法…

人工智能 2023年6月1日
0099
Filterin

关于Filtering的问题在信号处理中，Filtering（滤波）是一种常见的信号处理技术。它用于去除信号中的噪声或者增强感兴趣的频率成分。滤波可以应用于各种领域，如音频处理、…

人工智能 2024年1月2日
0045
【python初学者日记】selenium初体验——“秒杀商品”、“清空购物车”技能养成记（一）

【python初学者日记】selenium初体验——”秒杀商品”、”清空购物车”技能养成记（一）用python解决”清…

人工智能 2023年7月6日
0069
Python神经网络1之TensorFlow

Python神经网络1之TensorFlow 深度学习介绍 * 深度学习与机器学习的区别 – 特征提取方面数据量和计算性能方面要求算法代表深度学习框架介绍 &#8…

人工智能 2023年5月23日
0092
【C++】顺序表，链表，栈的练习（千万要会做）每日小细节007

我们前几天已经学过了线性表：顺序表，链表和栈，但是只有理论知识是绝对不够的，我给大家找了一些很经典的题目，一定要做到立马有思路哦（如果还有小可爱没有看过我的顺序表，链表和栈的知识点…

人工智能 2023年6月29日
0089
Layer Norm

参考ConvNeXt中的Layer Normalization(LN) – 海斌的文章 – 知乎https://zhuanlan.zhihu.com/p/4…

人工智能 2023年6月17日
00102
【对话系统】对话系统核心技术概要

概述人机交互备受学术界的关注，人机对话是人机交互的核心。对话系统是模拟人与人交流的计算机系统。对话系统有很多分类方法。按照应用场景的不同，可分为开放域（闲聊式）和封闭域（检索…

人工智能 2023年6月10日
00110
理解Python中列表，元组，字典，集合里的一些坑

列表对象不能越界访问越界访问 In [1]: list = [1,2,3] In [2]: list[4] IndexError: list index out of range…

人工智能 2023年6月4日
0079
实验三：CART分类决策树python实现（两个测试集）（一）|机器学习

目录 * – python实现 – + 分步 + 源代码（全部） – 测试集1（鸢尾花集） – 测试集2（红酒品类数据集） &#82…

人工智能 2023年6月30日
0076
k means聚类算法_一个完整的K-means聚类算法指南！

点击上方关注，All in AI中国 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:…

人工智能 2023年6月2日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31