01_数据结构与神经网络回顾

2023年5月25日上午2:46 • 人工智能 • 阅读 81

文章目录

常见数据结构
*
标量(有大小无方向)
向量 (1阶张量)
矩阵 (2阶张量)
序列数据 (3阶张量)
图像数据 (4阶张量)
视频数据 (5阶张量)
各种神经网络对比
*
感知器
深度神经网络
卷积神经网络
循环神经网络

; 常见数据结构

在TensorFlow中，其实无论是标量还是n阶向量我们都可以理解为张量。在以前机器学习案例中我们处理矩阵数据都是二阶向量。而现在的深度学习我们一般处理数据类型为3阶（文本序列），4阶（图像），5阶（视频）。接下来用简单的代码对如上内容进行简单回顾

标量(有大小无方向)

import numpy as np

x = np.array(5)
print('x的值:',x)
print('x的阶:',x.ndim)
print('x的类型:',x.dtype)
print('x的形状:',x.shape)

输出结果如下：

x的值: [1 2 3 4 5]
x的阶: 1
x的类型: int32
x的形状: (5,)

向量 (1阶张量)

在机器学习项目中，通常 y (真实值) 就是一阶数据

import numpy as np

y = np.array([1,2,3,4,5])
print('y的值:',y)
print('y的阶:',y.ndim)
print('y的类型:',y.dtype)
print('y的形状:',y.shape)

输出结构如下

x的值: [1 2 3 4 5]
x的阶: 1
x的类型: int32
x的形状: (5,)

矩阵 (2阶张量)

绝大部分机器学习的结构性数据都是2阶张量数据 (样本数 + 特征数)

import numpy as np

x = np.arange(12).reshape(3,4)
print('x的值:\n',x)
print('x的阶:',x.ndim)
print('x的类型:',x.dtype)
print('x的形状:',x.shape)

输出结构如下

x的值:
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
x的阶: 2
x的类型: int32
x的形状: (3, 4)

序列数据 (3阶张量)

RNN循环神经网络主要用于处理文字序列，一般来说数据集的形状为3D张量 (评论数 + 句子 + 词编码)，本质上涉及到句子的分词操作。如果大家对机器学习文本分类感兴趣也可以学习下jieba分词与贝叶斯相关课程

from tensorflow.keras.preprocessing.text import Tokenizer

words = ['LaoWang has a Wechat account.','He is not a nice person.','Be careful.']
tokenizer = Tokenizer(num_words=15)
tokenizer.fit_on_texts(words)
sequences = tokenizer.texts_to_sequences(words)
one_hot_matrix = tokenizer.texts_to_matrix(words,mode='binary')
word_index = tokenizer.word_index
print('这三句话(单词)的one-hot编码:\n',one_hot_matrix)

输出结构如下

这三句话(单词)的one-hot编码:
[[0. 1. 1. 1. 1. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 1. 1. 1. 1. 1. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 1. 0. 0.]]

图像数据 (4阶张量)

图像本身包含高度、宽度、在加上颜色深度通道，对应卷积核的深度。 (样本数，宽，高，通道数)，也有可能为：(样本数，宽，高，RGB颜色值)。之前讲解DNN深度学习时之所以为3阶张量是因为图像是灰度图

import tensorflow as tf

cifar10 = tf.keras.datasets.cifar10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print(x_train.shape,y_train.shape)
print(x_test.shape,y_test.shape)

输出结构如下

(50000, 32, 32, 3) (50000, 1)
(10000, 32, 32, 3) (10000, 1)

视频数据 (5阶张量)

机器学习初学者很少有机会见到比4D更高阶的张量。而视频数据结构就是其中一种。视频本质可以看作一帧一帧的彩色图片组成的数据集 (样本数，帧数，宽，高，通道数)

import cv2

cap = nba = cv2.VideoCapture("../data/video.mp4")
print(cap)

flag, frame = cap.read()
print(flag, frame.shape)

print('视频的帧数', cap.get(propId=cv2.CAP_PROP_FPS))
print('视频的图片总数', cap.get(propId=cv2.CAP_PROP_FRAME_COUNT))
print('视频的图片宽', cap.get(propId=cv2.CAP_PROP_FRAME_WIDTH))
print('视频的图片高', cap.get(propId=cv2.CAP_PROP_FRAME_HEIGHT))

输出结构如下

<VideoCapture 000002212B834F10>
True (544, 960, 3)
视频的帧数 29.731527619143247
视频的图片总数 3948.0
视频的图片宽 960.0
视频的图片高 544.0

各种神经网络对比

感知器

感知器就是神经元它是构成神经网络的基本单位。感知器由 (x,w,b、input function、activation function) 组成

y’ = x1w1 + x2w2 + … + xnwn + w0

; 深度神经网络

有多少个特征则会有多少个输入神经元，有多少个类别则会有多少个输出神经元 (sigmoid, softmax)

卷积神经网络

卷积核个数是每层所拥有的卷积核的数量,而卷积核的深度是每个卷积核的channel通道数量，它与目标图片的channel通道数相同

卷积神经网络下层的特征数目只受上层接收的特征数目的影响，而不是与深度神经网络的完全连接。

[En]

The number of features in the lower layer of the convolution neural network is only affected by the number of features received in the upper layer, rather than the full connection to the depth neural network.

合用功能使用位置的相邻输出的总体统计特征来替换该位置处的网络输出。它本质上是下采样，可以大大减少网络中的参数数量。

[En]

The pooling function uses the overall statistical characteristics of the adjacent outputs of a location to replace the output of the network at that location. It is essentially downsampling, which can greatly reduce the number of parameters in the network.

; 循环神经网络

无论是前面的深度神经网络还是卷积神经网络，无论是从左到右或者从右到左，神经网络得到的结果使完全相同的，预测值与操作特征的次序无关，文本分析与图片不同，它是时序数据，一个字/词如果不结合上下文来一起解释，其意思大相径庭了。而循环神经网络主要是用来处理时序数据，一种带有”记忆” 功能的神经网络。我们在阅读文章时的记忆可以分为瞬时记忆、短期记忆(RNN),长期记忆(LSTM)

RNN (瞬时记忆)：明天我离开南京去北京
LSTM (长期记忆)：苹果 … 乔布斯

时间轴上的节点遍历完毕后，循环就结束了。循环神经网络向下一层的网络输出X’。通过上面的图可以发现，X’受近期的状态影响最大。大家会发现RNN相对DNN或者CNN来说结构还是很不相同的，它主要是处理时序数据因此有个时间序列的概念。下一篇我们来研究下文本是如何转化成向量的。

Original: https://blog.csdn.net/lsqzedu/article/details/122556855
Author: lsqzedu
Title: 01_数据结构与神经网络回顾

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/511638/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas行和列的获取

DataFrame的行和列：df[‘行’, ‘列’] DataFrame行和列的获取分三个维度行和列选取：df[]，一次只能选取行…

人工智能 2023年7月7日
0054
NLP入门干货：手把手教你3种中文规则分词方法

导读：本文将讲解中文自然语言处理的第一项核心技术——中文分词技术，它是中文自然语言处理非常关键和核心的部分。作者：杜振东涂铭来源：大数据DT（ID：hzdashuju）在自…

人工智能 2023年6月10日
0060
PointPillars：基于点云的快速目标检测网络

1 PointPillars简介 PointPillars是一个基于点云的快速目标检测网络，在配置为Intel i7 CPU和1080ti GPU上的预测速度为62Hz，在无人驾驶…

人工智能 2023年7月9日
0086
计算机视觉—车道线检测

计算机视觉—车道线检测一、方案设计目标二、技术要求三、主要研究内容 * 1. 检测过程 2. 视频分解 3. 分割图像 4. 筛选轮廓、计算中心 5. 拟合车道线近似曲…

人工智能 2023年5月26日
0061
matlab神经网络所有传递函数(激活函数)公式详解

关于《老饼讲解神经网络》：本网结构化讲解神经网络的知识，原理和代码。重现matlab神经网络工具箱的算法，是学习神经网络的好助手。一、传递函数名称二、传递函数图象三、传递函数…

人工智能 2023年7月12日
0056
Bert文本分类实战（附代码讲解）

[ BERT_是目前自然语言处理领域最先进的模型之一，拥有强大的语言理解能力和处理文本任务的能力。其中 _BERT_多分类 _文本分类_的应用广泛，可以用于情感分析、垃圾邮件过滤、…

人工智能 2023年7月24日
0045
Identifying relevant concept attributes to support mapping maintenanceunder ontology evolution

名称：Identifying relevant concept attributes to support mapping maintenanceunder ontology ev…

人工智能 2023年6月1日
0069
tensorflow-keras model.load_weights()函数报错解决方法

人工智能 2023年5月26日
0085
使用Vivado HLS进行图像处理的一些个人总结

文章目录前言一、什么是HLS? 二、入门HLS 1.如何学习HLS 2.如何编写HLS 三、用HLS处理图像 1.HLS主函数的编写 2.testbench编写 3.HLS优化…

人工智能 2023年6月20日
0076
【Matting】MODNet：实时人像抠图模型-onnx python部署

上一篇博客【Matting】MODNet：实时人像抠图模型-笔记分析了MODNet的原理，本篇博客将使用python部署MODNet官方提供的onnx模型，其效果如下：在线人像抠…

人工智能 2023年7月14日
0068
conda虚拟环境内pip install报错 TypeError: join() argument must be str or bytes, not ‘int‘

报错Exception:Traceback (most recent call last):File “/home/anaconda3/envs/facenet/lib…

人工智能 2023年5月24日
00154
selenium打开网页被检测，怎么屏蔽和绕过

Selenium 操作被检测屏蔽 selenium打开浏览器模仿人工操作是诸多爬虫小白最万能的网页数据获取方式，但是在做自动化爬虫时，经常被检测到是selenium驱动。前段时间s…

人工智能 2023年7月4日
0063
OpenCV 介绍

OpenCV 介绍 OpenCV 的全称是 Open Source Computer Vision Library，是一个开放源代码的计算机视觉库。OpenCV 是最初由英特尔公司…

人工智能 2023年6月22日
0082
[深度学习][原创]旋转目标检测框架yolov5_obb，paddledetection-s2anet和mmrotate谁最好用?

测试时间：2022年3月10日测试框架：yolov5_obb，paddledetection-s2anet和mmrotate 个人觉得安装难度（从难到易）mmrotate>…

人工智能 2023年6月17日
0084
Pytorch中 nn.Transformer的使用详解与Transformer的黑盒讲解

文章目录本文内容将Transformer看成黑盒 Transformer的推理过程 Transformer的训练过程 Pytorch中的nn.Transformer * nn….

人工智能 2023年6月16日
00328
人工智能导论考试

简答题批量梯度递减和随机梯度递减随机梯度算法（SGD）。相比于正统的批量梯度算法（BGD）网络参数调参策略：全部样例计算一次误差，调整一次参数，SGD的网络参数调参策略是：…

人工智能 2023年6月16日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

01_数据结构与神经网络回顾

文章目录

标量(有大小无方向)

向量 (1阶张量)

矩阵 (2阶张量)

序列数据 (3阶张量)

图像数据 (4阶张量)

视频数据 (5阶张量)

感知器

; 深度神经网络

卷积神经网络

; 循环神经网络

大家都在看