CNN是如何模拟人类视觉处理的

2024年1月1日下午2:04 • 人工智能 • 阅读 32

问题：CNN是如何模拟人类视觉处理的？

介绍

卷积神经网络(CNN)是一种深度学习模型，它被设计用来模拟人类视觉系统的处理过程。CNN的出现对计算机视觉任务产生了革命性的影响，它能够通过学习图像中的特征来执行分类、检测、分割等任务。在本文中，我们将详细介绍CNN的算法原理、公式推导、计算步骤和Python代码示例，并解释其中的细节。

算法原理

CNN的算法原理基于神经科学的研究发现，人类视觉系统中的视觉皮层对于图像的处理方式。视觉皮层中的神经元只对特定区域的输入敏感，这被称为感受野。CNN试图通过模拟这种感受野的方式来提取图像中的特征。

CNN的核心思想是通过卷积层、池化层和全连接层来构建一个多层的神经网络。卷积层使用卷积操作来从图像中提取特征，池化层用于减少特征图的尺寸，全连接层用于最终的分类或回归。

公式推导

卷积操作

卷积操作是CNN中最基本的操作之一。对于一个输入图像$I$和一个卷积核$K$，卷积操作可以表示为：

$$
S(i, j) = (I artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls K)(i, j) = \sum{m} \sum_{n} I(m, n) \cdot K(i-m, j-n)
$$

其中，$(i, j)$是输出特征图的坐标，$(m, n)$是输入图像的坐标。卷积操作通过使用权重共享和局部感受野的方式，使得CNN能够从图像中提取空间上的局部特征。

池化操作

池化操作用于减少特征图的尺寸和参数数量，并增强对输入的平移不变性。常见的池化操作有最大池化和平均池化。对于最大池化操作，可以表示为：

$$
O(i, j) = \max(I(i \cdot s_x : i \cdot s_x + k_x, j \cdot s_y : j \cdot s_y + k_y))
$$

其中，$(i, j)$是输出特征图的坐标，$s_x$和$s_y$分别是x和y方向上的步长，$k_x$和$k_y$分别是x和y方向上的池化核大小。

全连接层

全连接层将上一层的特征图展平为一个向量，并通过一个矩阵乘法和激活函数得到最终的输出。全连接层的输出可以表示为：

$$
o = f(Wx + b)
$$

其中，$o$是输出向量，$x$是输入向量，$W$是权重矩阵，$b$是偏置向量，$f$是激活函数。

计算步骤

卷积层：通过卷积操作从输入图像中提取特征。使用多个卷积核并通过非线性激活函数(如ReLU)来增加网络的表达能力。
池化层：通过池化操作减少特征图的尺寸和参数数量。常用的池化操作是最大池化或平均池化。
全连接层：将上一层的特征图展平为一个向量，并应用一个矩阵乘法和激活函数来获得最终的输出。
反向传播：使用反向传播算法来更新网络中的权重和偏置。通过计算损失函数关于网络参数的梯度来更新参数。

复杂Python代码示例

下面是一个使用Python和TensorFlow库实现的简单CNN示例代码：

import tensorflow as tf

# 定义卷积神经网络
def create_model():
 model = tf.keras.models.Sequential([
 tf.keras.layers.Conv2D(16, (3, 3), activation='relu', input_shape=(28, 28, 1)),
 tf.keras.layers.MaxPooling2D((2, 2)),
 tf.keras.layers.Flatten(),
 tf.keras.layers.Dense(10, activation='softmax')
 ])
 return model

# 创建CNN模型
model = create_model()

# 编译模型
model.compile(optimizer='adam',
 loss=tf.keras.losses.SparseCategoricalCrossentropy(),
 metrics=['accuracy'])

# 加载MNIST数据集
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train = x_train[..., tf.newaxis] / 255.0
x_test = x_test[..., tf.newaxis] / 255.0

# 训练模型
model.fit(x_train, y_train, epochs=5)

# 评估模型
model.evaluate(x_test, y_test)

这段代码展示了一个简单的CNN模型的实现过程。包括模型的定义、编译、数据加载和预处理、模型训练和评估等步骤。

代码细节解释

首先，使用create_model函数创建了一个卷积神经网络模型，该模型包含一个卷积层、池化层和全连接层。
然后，通过调用model.compile函数来编译模型，指定优化器、损失函数和评估指标。
接下来，使用mnist.load_data函数加载了MNIST数据集，并进行了数据预处理，将像素值缩放到0到1的范围内。
然后，调用model.fit函数来训练模型，使用训练集的图像和标签进行训练。
最后，调用model.evaluate函数来评估模型的性能，使用测试集的图像和标签进行评估。

这段代码简单展示了一个CNN模型的实现过程，但实际上，真正复杂的CNN模型通常包含更多卷积层、池化层和全连接层，并使用更大的数据集进行训练。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822701/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于opencv的人脸识别

一、需求分析. 1.1 功能与技术需求 1.2 开发环境与运行需求二、设计过程 2.1 主要技术原理 2.2采用的关键技术 2.3系统设计流程 2.4系统各功能模块三、实验运…

人工智能 2023年6月19日
00117
分类任务中常用的Label smoothing

目录 1.Label smoothing的原理 2.pytorh中如何使用Label smoothing 3.适用场景 1.Label smoothing的原理交叉熵损失（sof…

人工智能 2023年7月1日
0089
投顾问答系统建设方案简单介绍

一、常见问答系统方案 1.基于知识库匹配问答基于知识库问答的核心在于需要大量运营人员持续运营知识库，每一个知识点都要有对应的大量的问法。通过将用户问题与知识库中的问法进行相似度计…

人工智能 2023年6月1日
0075
线性回归是一种回归算法，它假设输入特征和输出变量之间存在线性关系。它使用最小二乘法来拟合一个直线或超平面，以便最好地描述输入和输出之间的关系

介绍线性回归是一种用于建立输入特征和输出变量之间线性关系的回归算法。通过使用最小二乘法，它寻找一个最佳拟合的直线或超平面，以描述输入特征和输出变量之间的关系。算法原理线性回归…

人工智能 2023年12月31日
0031
用python程序编写二元多项式_python的多元多项式回归

在python中进行多元多项式回归的简单方法是什么？在比方说，我们有N个样本，每个样本有3个特征，每个样本有40个(当然，也可以是任何数字，但在我的例子中是40个)响应变量。我们…

人工智能 2023年6月18日
0082
keras和tensorflow的版本对应关系

keras和tensorflow的版本对应关系 FrameworkEnv name (–env parameter)DescriptionDocker Image Packages…

人工智能 2023年5月23日
00124
强化学习——多智能体强化学习

文章目录前言多智能体系统的设定合作关系设定下的多智能体系统 * 策略学习的目标函数合作关系下的多智能体策略学习算法MAC-A2C 非合作关系下的多智能体策略学习算法MAC-…

人工智能 2023年7月26日
00105
深度学习中的超参数调整技术有哪些

问题：关于深度学习中的超参数调整技术有哪些？介绍：在深度学习中，超参数（hyperparameters）是在模型训练过程中需要手动设置的参数，而不是通过模型的学习算法进行自动调…

人工智能 2024年1月1日
0042
MobileNet_v2 with transfer learning（修改Mobile_v2 模型）

文章目录载入数据数据增强（Data Augmentation）载入模型，并使用迁移学习修改模型 * 迁移学习（transfer learning）载入数据从文件夹中载入图…

人工智能 2023年5月26日
0078
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师历史笔试详解

百度：机器学习/数据挖掘工程师/自然语言处理历史笔试题为了准备2023届毕业生的秋招汇总的网上分享的题目，自己进行的解析整理 1、用于多分类任务的激活函数 Softmax 2、…

人工智能 2023年7月17日
0073
机器视觉可以应用到哪些场景中？

一、机器视觉的定义机器视觉是一种通过光学设备和非接触式传感器自动接收并处理真实物体的图像的设备，以获得所需信息或控制机器人的运动。机器视觉就是用机器代替人眼进行测量和判断。本质…

人工智能 2023年6月20日
0088
一文了解SpringBoot

目录什么是SpringBoot？ SpringBoot的优点 SpringBoot项目搭建创建一个普通的maven项目修改pom.xml（检查引入的依赖是否正确）准备Spr…

人工智能 2023年6月29日
0083
脑影像分析|数据分析——单个变量或多个变量与y的皮尔逊相关，同时返回r与p值（python）

| 图源皮尔逊相关是计算两个变量之间线性相关关系，或者两个向量共线程度的常用指标，应返回衡量相关程度的r值，和相关显著程度的p值。我们熟知的工具包，如pandas，numpy和s…

人工智能 2023年7月15日
0052
【PyTorch教程】05-如何使用PyTorch训练神经网络模型 (2022年最新)

本期目录使用PyTorch训练神经网络：torch.autograd 1. 神经网络背景 2. 加载预训练模型(有重大更新) * 2.1 新老版本写法对比 2.2 新写法的好处 …

人工智能 2023年6月23日
0095
综述：用于自动驾驶的全景鱼眼相机的理论模型和感知介绍

文章：Surround-view Fisheye Camera Perception for Automated Driving: Overview, Survey & C…

人工智能 2023年6月15日
0054
深度学习-LeNet（第一个卷积神经网络）

文章目录简介数据集模型搭建模型训练模型测试前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。简介 LeNet模型是在1…

人工智能 2023年7月29日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31