从0开始的深度学习——【tensorflow】创建一个神经网络

2023年7月14日上午6:50 • 人工智能 • 阅读 76

我们用 tf.keras来创建神经网络：
什么是 tf.keras?,简单地说就是tensorflow中已经帮你封装好的一些包，它的作用是可以帮你快速搭建网络模型。
我们以创建一个 能自动识别图片里的数字的神经网络为例子：

大致流程：

其大致步骤如下：

import：
import相关模块，将你要用的模块引用到你的网络中来。
比如

from PIL import Image
import numpy as np
import tensorflow as tf

train,test
告知你要喂入神经网络的数据集和用于测试的数据集
Sequential/Class
搭建网络结构，逐层描述每一层网络，等同于前向传播
model.compile
配置训练方法——选择什么优化器，损失函数，评测指标
model.fit
执行训练过程
model.summary
打印出网络的参数和结构。

认识相关函数

Sequential:

model = tf.keras.models.Sequential([网络结构])
有哪些网络结构呢？

拉直层： tf.keras.layers.Flatten(),这一层不含计算，只是将你的输入特征拉直为一维数组
全连接层： tf.keras.layers.Dense(神经元个数，activation='激活函数'，kernel_regularizer=哪种正则化)。
神经元个数：本层的节点数
激活函数：本层节点的输出与下一层节点的输入之间的函数连接方式（relu,softmax,sigmoid,tanh…）
正则化：为防止过度拟合而加的参数(l1,l2…)
卷积层： tf.keras.layers.Conv2D(filters = 卷积核个数 ，kernel_size= 卷积核尺寸，strides = 卷积步长, padding = “valid” or "same")
LSTM层： tf.keras.layers.LSTM()
eg:

model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(3, activation='softmax', kernel_regularizer=tf.keras.regularizers.l2())
    #                 神经元个数，   选用的激活函数，              选用的正则方法
])

下面是一个多层的神经网络：

model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

它大概长这样：

compile():配置神经网络的学习方法

model.compile(optimizer=优化器,loss=损失函数,metrics=['准确率'])
eg:

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
              metrics=['sparse_categorical_accuracy'])

optimizer可以选择的有：

‘sgd’或 tf.keras.optimizers.SGD(lr=学习率,momentum=动量参数)
‘adagrad’或 tf.keras.optimizers.Adagrad(lr=学习率)
‘adadelta’或 tf.keras.optimizers.Adadelta(lr=学习率)
‘adam’或 tf.keras.optimizers.Adam(lr=学习率,beta_1=0.9,beta_2=0.999)

loss可以选择的有：

‘mse’
tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),后面的参数是在询问是否是原始输出。

metris可以选择的有：

‘accuracy’:y_test和y_train都是数值。
‘categorical_accuracy’:y_test和y_train都是概率分布。
‘sparse_categorical_accuracy’:y_test是数值,y_train是概率分布

fit:执行训练过程

model.fit(
    训练集的输入特征，训练集的标签
    batch_size= 每次喂入神经网络的样本数,
    epochs= 迭代数据集的次数,
    validation_data = (测试集的输入特征,测试集的标签) 或者 validation_spilt = 从训练集划分多少给测试集
    #以上两个函数二选一
    validation_freq = 多少次cpoch测试一次
)

summary

可以打印出网络的结构和参数统计

一些其它的常用函数

load_weights(路径文件名):加载神经网络模型
保存模型：


callback = tf.keras.callbacks.ModelCheckpoint(
   filepath = 路径文件名
   save_weights_only = True/False,#是否只保留模型参数
   save_best_only = True/False#是否只保留最优模型
)
history = model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1,
                   callbacks=[callback])
#在fit函数中再加入回调函数即可

提取训练的参数： model.trainable_variables返回模型中可训练的参数
提取训练数据：history=model.fit(…)
训练集loss:[loss] loss = history.history['loss']
测试集loss:[val_loss] val_loss = history.history['val_loss']
训练集准确率: acc = history.history['sparse_categorical_accuracy']
测试集准确率: val_acc = history.history['val_sparse_categorical_accuracy']
预测结果: predict(输入特征,batch_size=整数)：向前传播得出预测的结果

搭建模型：

import tensorflow as tf
import numpy as np
from PIL import Image
import os

#导入相关的数据
mnist = tf.keras.datasets.mnist
(x_train,y_train),(x_test,y_test) = mnist.load_data()
x_train = x_train /255.0
x_test = x_test / 255.0

#搭建网络框架
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),#拉直层
    tf.keras.layers.Dense(784,activation = 'relu'),
    tf.keras.layers.Dense(10,activation = 'softmax')
    #10个网络节点对应数字0-9
])

#配置学习方法

model.compile(
    optimizer='adam',#采用adam优化
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),#选择损失函数
    metrics=['sparse_categorical_accuracy']
    #因为前面是softmax输出的独热编码所以这里采用这种检验模式
)

#设置保存路径
checkpoint_save_path='./checkpoint/mnist.ckpt'

#如果之前存在这个网络，则加载以前的参数，再进行优化
if os.path.exists(checkpoint_save_path + '.index'):
    print('已有模型数据，正在加载模型')
    model.load_weights(checkpoint_save_path)

#设置存储路径
callback = tf.keras.callbacks.ModelCheckpoint(
    filepath=checkpoint_save_path,
    save_weights_only=True,
    save_best_only=True
)

#执行训练
history = model.fit(
    x_train,y_train,
    batch_size=32,epochs=10,
    validation_data=(x_test, y_test),
    validation_freq=1,
    callbacks=[callback]
)
#输出模型
model.summary()

我们观察第一次运行后的效果：

我们再把这个网络多跑几遍：

就会得到一个拟合效果很不错的网络了。

预测结果：

有了构建好的神经网络，我们只需要把数据喂神经网络，最后得到结果就可以啦
我们搭建好网络：

import tensorflow as tf
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

model_save_path = './checkpoint/mnist.ckpt'

#搭建网络框架
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),#拉直层
    tf.keras.layers.Dense(784,activation = 'relu'),
    tf.keras.layers.Dense(10,activation = 'softmax')
    #10个网络节点对应数字0-9
])

model.load_weights(model_save_path)

test_num = int(input("你想进行的实验次数是："))

for i in range(test_num):
    image_path = input("输入照片文件名")
    img = Image.open(image_path)

    #调整尺寸,灰度
    img = img.resize((28, 28), Image.ANTIALIAS)
    img_arr = np.array(img.convert('L'))

    img_arr = 255.0 - img_arr#颜色反转

    img_arr = img_arr / 255.0
    x_predict = img_arr[tf.newaxis, ...]
    result = model.predict(x_predict)
    pred = tf.argmax(result, axis=1)

    print('\n')
    tf.print(pred)

    plt.pause(1)
    plt.close()

当我向神经网络输入这样一张图片：（5555.png）

神经网络识别的结果为5.

这样一个简单的神经网络就搭建好了。

Original: https://blog.csdn.net/go_bananas/article/details/123648748
Author: go_bananas
Title: 从0开始的深度学习——【tensorflow】创建一个神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691519/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Reading the Manual: Event Extraction as Definition Comprehension

Yunmo Chen1Tongfei Chen1Seth Ebner1Aaron Steven White2Benjamin Van Durme11Johns Hopkins Un…

人工智能 2023年6月1日
0095
论文阅读 dyngraph2vec: Capturing Network Dynamics using Dynamic Graph Representation Learning

6 dyngraph2vec: Capturing Network Dynamics using Dynamic Graph Representation Learning207 …

人工智能 2023年6月4日
0090
ORB_SLAM3 算法框架解析

论文地址：https://arxiv.org/abs/2007.11898v1代码地址：https://github.com/UZ-SLAMLab/ORB_SLAM3ORB_SLA…

人工智能 2023年5月26日
0080
kaldi工具搭建语音识别系统——数据处理

Kaldi（http://kaldi-asr.org/doc/）是一个语音识别工具。使用 C++ 开发，基于 Apache 许可证。目的是为语音识别研究者提供。Kaldi 的目标和…

人工智能 2023年6月4日
0069
ROS学习：cv_bridge与opencv版本冲突三种解决方案

cv_bridge与opencv版本冲突三种解决方案 1 问题描述： 2 解决方案： * 2.1 不使用cv_bridge包 2.2 令cv_bridge使用opencv版本切换为…

人工智能 2023年6月2日
00118
《域渗透攻防指南》签名版预售来啦

千呼万唤始出来！终于，在广大粉丝翘首期盼下，国内首本专门讲述域内攻防的书籍《域渗透攻防指南》在2022年最后一个月和大家见面了。为了回馈粉丝的等待，让粉丝早日拿到心仪的书，特此联合…

人工智能 2023年7月30日
0046
BoT-SORT 论文笔记及思考

BoT-SORT: Robust Associations Multi-Pedestrian Tracking BoT-SORT论文链接参考文章最近新出的霸榜的多目标跟踪BoT-…

人工智能 2023年7月28日
0086
【阅读笔记】Using Knowledge Graphs to Search an Enterprise Data Lake

Classes Drive drive使车辆在一些特定地理空间区域（位置/地点）和时间间隔内的使用。部署在车辆上的传感器可以观察使用过程中车辆和/或环境的属性 aso:Drive …

人工智能 2023年6月1日
0057
halcon图像拼接(2行5列)，例程详解

参考例程mosaicking.hdev 原理简要说明：要进行图像拼接，就要求所拍摄图像中有重叠区域，即交集，在这个基础上，才能通过算法找到两张图像的共性特征，此处利用的特征正是图像…

人工智能 2023年6月18日
00103
I. 知识图谱应用案例 — 美团

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0081
【python】自动填写问卷星问卷及提交

前言：问卷是很好的网络调查方式之一，近年来，问卷星被广泛应用于各方面的调查。本文介绍了利用python代码自动填写问卷星基本题目，拥有自动填写、解决智能验证、批量提交问卷等功能。 …

人工智能 2023年7月4日
0068
pandas计算含缺失值中列平均值_Pandas之DataFrame基本操作

pandas中Series和DataFrame基本操作。 DataFrame结果的数据a如下所示： a b one 4 1 1 two 6 2 0 three 6 1 6 一、查看…

人工智能 2023年7月8日
0085
图像分割的方法

导读：数字图像处理技术是一个跨学科的领域。随着计算机科学技术的不断发展，图像处理和分析逐渐形成了自己的科学体系，新的处理方法层出不穷，尽管其发展历史不长，但却引起各方面人士的广泛关…

人工智能 2023年7月27日
0076
《MATLAB 神经网络43个案例分析》：第8章 GRNN网络的预测—-基于广义回归神经网络的货运量预测

《MATLAB 神经网络43个案例分析》：第8章 GRNN网络的预测—-基于广义回归神经网络的货运量预测 1. 前言 2. MATLAB 仿真示例一 3. MATLAB…

人工智能 2023年6月18日
0072
加载pytorch已有模型，修改最后分类头

在加载pytorch已有模型的时候，我们必须要明确的事情: 1 如何获取到pytorch所提供的模型，通过什么方式。2 模型的结构，也就是模型的每个层的名字（key）。3 我们要把…

人工智能 2023年7月1日
0078
《Effective C++》阅读总结（一）:让自己习惯C++

第一章让自己习惯C++ 4月份的任务之一是《Effective C++》这本书看完，这是22年的第二本书籍阅读计划，但最终只看到第30讲，五月份继续看，这里先对前面的内容做一些总…

人工智能 2023年6月4日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31