TensorFlow构建模型一

2023年5月23日下午5:53 • 人工智能 • 阅读 79

免责声明：本文非常简单，适合初学者。

[En]

Disclaimer: this article is very simple and suitable for beginners.

概要

本文是利用tensorflow中的keras构建一个简单的全连接神经网络做多分类任务。数据集使用的是fashion mnist数据集，不用额外下载，可以直接用keras加载： (train_images, train_labels), (test_images, test_labels) = keras.datasets.fashion_mnist.load_data()。模型分为三层，分别为一层输入层，一层隐藏层和一层输出层。

模型构建


import tensorflow as tf
from tensorflow import keras

import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

数据分为训练集（60000个样本）和测试集（10000个样本），数据集有10个类别：0：T恤/上衣；1：裤子；2：套头衫；3：连衣裙；4：外套；5：凉鞋；6：衬衫；7：运动鞋；8：包；9：短靴。通过代码可以查看数据集情况：

train_images.shape
len(train_labels)
set(train_labels)

测试数据集与训练集相似，但样本数量不同。

[En]

The test data set is similar to the training set, but the number of samples is different.

图片数据是一个[28*28]的二维矩阵数据，矩阵中的每个元素都是一个像素值（取值在0~255），可以通过python的画图接口查看图像数据：

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

为了更好的训练模型，我们将数据值映射到[0,1]之间。

train_images = train_images / 255.0
test_images = test_images / 255.0

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5, 5+i)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

我们的模型主要是三层结构，所以模型的构建代码如下：

[En]

Our model mainly has a three-tier structure, so the construction code of the model is as follows:

model = keras.Sequential([
        keras.layers.Flatten(input_shape=(28,28)),
        keras.layers.Dense(128, activation='relu'),
        keras.layers.Dense(10)])

第一层是一个平铺层，将28 × \times × 28的二维数据平铺成1 × \times × 784的一维数据，该层没有需要学习的参数。
第二层是一个全连接层，设置了128个节点，relu激活函数。
第三层是一个输出层，10个节点，每个节点代表一个类别的得分，最终得出图像属于哪一个类别。

在模型训练之前，需要对模型进行一些设置，如优化器、损失函数、评价标准等。

[En]

Before model training, some settings need to be made to the model, such as optimizer, loss function, evaluation criteria, etc.

model.compile(optimize="adam",
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=["accuracy"])

这里我们使用的优化器是Adam；损失函数使用的是稀疏类别交叉熵损失，计算的是标签和预测值之间的交叉熵（如下图TensorFlow中keras的API接口说明）；评估标准用的是准确率【accuracy】。

设置完成后，开始培训模型：

[En]

Once set up, start training the model:


model.fit(train_images, train_labels, epochs=10)

训练结果：

其中损失降到了0.2381，精确度提升到了0.9113。
然后，对模型进行测试

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nTest loss:', test_loss)
print('\nTest accuracy:', test_acc)

可以看出，测试集上的损失函数的值大于训练集的损失函数值，但精度却小于训练集的损失函数值。一般来说，这种现象是会发生的，只要差别不大，这种训练过度适应的现象是可以接受的。

[En]

It can be seen that the value of the loss function on the test set is larger than that of the training set, but the accuracy is smaller than that of the training set. Generally, this phenomenon will occur, as long as it is not very different, this kind of training over-fitting phenomenon is acceptable.

在构建模型的时候，我们说过最后一层是一个节点为10的输出，每个节点代表一个类别得分。因此，在预测时，我们可以给模型加一个softmax层，转换成一个概率输出。

probability_model = tf.keras.Sequential([model,tf.keras.layers.Softmax()])
predictions = probability_model.predict(test_images)
print(np.argmax(predictions[0]))
print(test_labels[0])

以上便完整的构建了一个简单地三层网络结构的全连接模型。其中，构建模型最主要的模块在于keras.Sequential和keras.layers。这两个api中包含很多常用的模型包括卷积网络，循环网络等。

Original: https://blog.csdn.net/superY_26/article/details/123815534
Author: superY25
Title: TensorFlow构建模型一

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/497005/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PCL(5)点云聚类之 VoxelGrid体素采样与ApproximateVoxelGrid体素采样

1 区别 1.1 原理 VoxelGrid体素采样,对点云进行体素化，创建一个三维体素栅格。在每个体素里面，求取该立方体内的所有点云重心点来代表这个立方体的表示，以此达到下采样的目…

人工智能 2023年6月2日
0073
联邦学习（（Federated Learning，FL）

每日一诗：题竹（十三岁应试作于楚王孙园亭）——明*张居正绿遍潇湘外，疏林玉露寒。凤毛丛劲节，只上尽头竿。近期在阅读联邦学习领域相关文献，简单介绍如下文。本文仅供学习，无其它…

人工智能 2023年6月25日
0084
OpenCV C++案例实战十《车牌号识别》

OpenCV C++案例实战十《车牌号识别》前言一、车牌检测 * 1.1.图像预处理 1.2.轮廓提取 1.3.功能效果 1.4.功能源码二、字符切割 * 2.1.图像预处理…

人工智能 2023年7月20日
0073
7-FreeSwitch-mrcp-plugin-with-freeswitch（亲测可用，自我整理）

文章目录 mrcp-plugin-with-freeswitch 主要目的和技术援助方式第一步安装freeswitch * 1.下载 FreeSWITCH源码： 2.安装依赖库…

人工智能 2023年5月25日
00166
OpenCV中 Mat 的使用方法

Mat 是 OpenCV 中的数据类型，储存矩阵形式的数据，构造 Mat 类型的方法有很多，都是通过 Mat 这个构造函数进行实现（Mat 也是构造 Mat 数据类型的函数）。本…

人工智能 2023年6月20日
00119
Pandas&numpy常用方法

目录 Pandas numpy numpy中的数据类型数字超出指定的dtype范围，numpy没有报错数组的组合垂直组合 vstack 水平组合 hstack 深度组合dst…

人工智能 2023年7月8日
00103
一. 卡尔曼滤波器开发实践之一: 五大公式详解

既然标题名称是开发实践,本系列文章将主要介绍如何在工程实践中使用卡尔曼滤波器,至于卡尔曼滤波器的五大公式如何推导而来,网上有很多大拿们写的都很精彩,这里不再叙述.可以参考了下面两篇…

人工智能 2023年6月25日
0082
「高效程序员的修炼」快速上手Shell编程、执行与定时任务

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0075
基于深度学习的多聚焦图像融合(Multi-Focus Image Fusion)论文及代码整理

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0073
如何5分钟上手使用OCR

随便打开一个Microsoft Visual Studio，新建一个WinForms项目，从下面列表中随便选择一个NET框架。 net35;net40;net45;net451;n…

人工智能 2023年6月4日
0092
ubuntu18.04安装CARLA+CARLA-ROS-BRIDGE

一，安装carla（快速安装版本，源码安装实在是。。。电脑带不动）（1）按照最新的版本的linux build来下载更新依赖，主要是python等一些依赖。建议安装0.9.10-1…

人工智能 2023年6月2日
0070
2022 OpenCV AI 竞赛来啦！详细介绍Spatial AI赛道！

消息快播：OpenCV众筹了一款ROS2机器人rae，开源、功能强、上手简单。来瞅瞅~ 编辑：OAK中国首发：oakchina.cn喜欢的话，请多多👍⭐️✍ ▌前言 Hello，大…

人工智能 2023年7月19日
0060
MER 音乐情感识别-论文笔记7

《EXPLAINING PERCEIVED EMOTION PREDICTIONS IN MUSIC: AN ATTENTIVE APPROACH&#…

人工智能 2023年5月25日
00101
监督学习的三类问题-分类问题,标注问题,回归问题

输出为有限个离散值的监督学习，输入可以是连续或者离散的。二类分类和多类分类。（T/F表示预测结果是否正确，P/N表示预测结果的值） TP – 将正类预测为正类 TN …

人工智能 2023年6月18日
00117
Halcon实现实时骰子识别

Halcon实现实时骰子识别效果：bilibili 输入形式： .avi视频文件视频内容：以一本书为背景，在其上面分批次掷骰子目标：锁定书本区域；完成图像矫正；识别每个骰子的点…

人工智能 2023年6月21日
00129
【目标检测】yolov5与yolox对比

yolov5yolox-DarkNet53yolox-SPP输入端 (注：epoch=15时这两种数据增强方式关闭，由于这种增强效果更好，ImageNet的预训练无意义) back…

人工智能 2023年7月9日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TensorFlow构建模型一

概要

模型构建

大家都在看