【神经网络】(1) 简单网络，实例：气温预测，附python完整代码和数据集

2023年6月15日上午6:31 • 人工智能 • 阅读 67

各位同学好，今天和大家分享一下TensorFlow2.0深度学习中的一个小案例。案例内容：现有348个气温样本数据，每个样本有8项特征值和1项目标值，进行回归预测，构建神经网络模型。

1. 数据获取

导入所需要的库文件，获取气温数据

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
使用keras建模方法
from tensorflow.keras import layers
import warnings
warnings.filterwarnings('ignore')

#（1）数据获取
filepath = 'C:\\...\\temps.csv'
features = pd.read_csv(filepath)

temp_2代表前天的最高温度，temp_1代表昨天的最高温度，预测目标值为actual

2. 数据可视化

我们绘制 日期-温度曲线，首先需要将特征year、month、day组合在一起，拼接成一个字符串，再转变成一个 datetime类型的数据。

处理时间数据，将年月日组合在一起
import datetime
获取年月日数据
years = features['year']
months = features['month']
days = features['day']

将年月日拼接在一起--字符串类型
dates = []  # 用于存放组合后的日期
for year,month,day in zip(years,months,days):
    date = str(year)+'-'+str(month)+'-'+str(day)  #年月日之间用'-'向连接
    dates.append(date)

转变成datetime格式
times = []
for date in dates:
    time = datetime.datetime.strptime(date,'%Y-%m-%d')
    times.append(time)
看一下前5行
times[:5]

处理好了x轴的数据，我们现在来对几个特征绘制曲线

可视化，对各个特征绘图
指定绘图风格
plt.style.use('fivethirtyeight')
设置画布，2行2列的画图窗口，第一行画ax1和ax2，第二行画ax3和ax4
fig,((ax1,ax2),(ax3,ax4)) = plt.subplots(2,2,figsize=(20,10))

==1== actual特征列
ax1.plot(times,features['actual'])
设置x轴y轴标签和title标题
ax1.set_xlabel('');ax1.set_ylabel('Temperature');ax1.set_title('actual temp')
==2== 前一天的温度
ax2.plot(times,features['temp_1'])
设置x轴y轴标签和title标题
ax2.set_xlabel('');ax2.set_ylabel('Temperature');ax2.set_title('temp_1')
==3== 前2天的温度
ax3.plot(times,features['temp_2'])
设置x轴y轴标签和title标题
ax3.set_xlabel('Date');ax3.set_ylabel('Temperature');ax3.set_title('temp_2')
==4== friend
ax4.plot(times,features['friend'])
设置x轴y轴标签和title标题
ax4.set_xlabel('Date');ax4.set_ylabel('Temperature');ax4.set_title('friend')
轻量化布局调整绘图
plt.tight_layout(pad=2)

3. 特征处理

首先我们需要划分特征值和目标值。在原数据中提取特征值和目标值，’actual’存放的是当日最高温度。

获取目标值y，从Series类型变成数组类型
targets = np.array(features['actual'])
获取特征值x，即在原数据中去掉目标值列，默认删除行，需要指定轴axis=1指向列
features = features.drop('axtual',axis=1)
把features从DateFrame变成数组类型
features = np.array(features)

由于特征值中存在字符串类型的数据， ‘week’列都是字符串，因此我们需要对特征值进行 one-hot编码， 将字符串类型转变成数值类型。

week列是字符串，重新编码，变成数值型
features = pd.get_dummies(features)

处理完字符串数据以后，所有数据变成数值型。为防止由于数据单位不一，跨度大等问题导致的模型准确度不高的问题，对数值型数据 进行标准化处理

导入标准化方法库
from sklearn import preprocessing
input_features = preprocessing.StandardScaler().fit_transform(features)

到此，对原始数据的处理结束，接下来构建神经网络模型。

4. 构建网络模型

我们使用keras建模方法，常用参数如下：

activation：激活函数，一般选relu

kernel_initializer, bias_initializer：权重与偏置参数的 初始化方法，有时候不收敛换个初始化方法就好了

kernel_regularizer, bias_regularizer：权重与偏置的正则化

inputs：输入

units：神经元个数

所有参数设置方法的参考：Module: tf | TensorFlow Core v2.7.0 (google.cn)

（1）网络搭建

首先我们导入 keras序列模型， tf.keras.Sequential()，按顺序一层一层添加网络层。layers代表不同层次的实现。

每个隐含层的神经元个数是随意改变的，大家可以自己去试，我们这里需要预测最高温度，因此输出值层只需要一个神经元。权重初始化方法各不相同，大家可以在上面那个文档中寻找合适的。

构建层次
model = tf.keras.Sequential()
隐含层1设置16层，权重初始化方法设置为随机高斯分布，加入正则化惩罚项
model.add(layers.Dense(16,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.01)))
隐含层2设置32层
model.add(layers.Dense(32,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.01)))
输出层设置为1，即输出一个预测结果
model.add(layers.Dense(1,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.01)))

（2）优化器和损失函数

接下来需要指定 优化器和损失函数 model.compile()，在这里优化器使用梯度下降法，损失函数使用MSE均方误差。大家要根据自己的任务来选择，损失函数的选择对网络的结果影响很大。

优化器和损失函数
model.compile(optimizer=tf.keras.optimizers.SGD(0.001),loss='mean_squared_error')

（3）网络训练

制定完成后就可以开始训练了，网络 训练函数 model.fit()。输入特征值input_features，目标值targets，validation_split=0.25指测试集在输入数据中抽取0.25用于测试，epochs指迭代次数100次，每一次迭代128个样本。

==3== 网络训练
model.fit(input_features,targets,validation_split=0.25,epochs=100,batch_size=128)

返回训练损失和测试损失，可看到迭代100次后，训练集的损失24.675和测试集的损失29.01相差不大，证明没有出现过拟合现象 。如果出现训练集的损失很小，测试集的损失很大，说明存在过拟合，需要调整参数。

（4）网络模型结构

我们也可以看一下我们构建的网络模型结构， model.summary()，隐含层1有240个参数，它是怎么计算的呢？输入层的shape为[348,14]，14个特征；第一个全连接层W的shape为[14,16]，16代表隐含层1的特征个数，偏置参数b的shape为[1,16]，y=Wx+b。因此参数个数为14*16+16=240。

（5）预测结果

网络模型预测函数model.predict()

==5== 预测模型结果
predict = model.predict(input_features)

我们这里对有所的样本都预测一下，来比较预测结果和实际结果的差异

5. 结果展示

简单绘制一个散点图来看一下，可以看出预测结果和实际结果大体保持相同，稍微存在偏差。感兴趣的同学可以进一步进行特征工程、调节参数，来达到更好的效果。

真实值，蓝色实现
fig = plt.figure(figsize=(10,5))
axes = fig.add_subplot(111)
axes.plot(dates,targets,'bo',label='actual')
预测值，红色散点
axes.plot(dates,predict,'ro',label='predict')
axes.set_xticks(dates[::50])
axes.set_xticklabels(dates[::50],rotation=45)

plt.legend()
plt.show()

完整代码

回归预测温度
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
使用keras建模方法
from tensorflow.keras import layers
import warnings
warnings.filterwarnings('ignore')

#（1）数据获取
filepath = 'C:\\..\\temps.csv'
features = pd.read_csv(filepath)
tenmp2代表前两天的温度，temp1代表前一天的温度，目标值为actual

#（2）数据预处理
==1== 处理时间数据，将年月日组合在一起
import datetime
获取年月日数据
years = features['year']
months = features['month']
days = features['day']
将年月日拼接在一起--字符串类型
dates = []
for year,month,day in zip(years,months,days):
    date = str(year)+'-'+str(month)+'-'+str(day)
    dates.append(date)
转变成datetime格式
times = []
for date in dates:
    time = datetime.datetime.strptime(date,'%Y-%m-%d')
    times.append(time)
看一下前5行
times[:5]

#（3）可视化，对各个特征绘图
指定绘图风格
plt.style.use('fivethirtyeight')
设置画布，2行2列的画图窗口，第一行画ax1和ax2
fig,((ax1,ax2),(ax3,ax4)) = plt.subplots(2,2,figsize=(20,10))

==1== actual特征列
ax1.plot(times,features['actual'])
设置x轴y轴标签和title标题
ax1.set_xlabel('');ax1.set_ylabel('Temperature');ax1.set_title('actual temp')
==2== 前一天的温度
ax2.plot(times,features['temp_1'])
设置x轴y轴标签和title标题
ax2.set_xlabel('');ax2.set_ylabel('Temperature');ax2.set_title('temp_1')
==3== 前2天的温度
ax3.plot(times,features['temp_2'])
设置x轴y轴标签和title标题
ax3.set_xlabel('Date');ax3.set_ylabel('Temperature');ax3.set_title('temp_2')
==4== friend
ax4.plot(times,features['friend'])
设置x轴y轴标签和title标题
ax4.set_xlabel('Date');ax4.set_ylabel('Temperature');ax4.set_title('friend')
轻量化布局调整绘图
plt.tight_layout(pad=2)

#（4）对字符型数据one-hot编码
week列是字符串，重新编码，变成数值型
features = pd.get_dummies(features)

#（5）划分特征值和目标值
获取目标值y，从Series类型变成数值类型
targets = np.array(features['actual'])
获取特征值x，即在原数据中去掉目标值列，默认删除行，需要指定轴axis=1指向列
features = features.drop('actual',axis=1)
把features从DateFrame变成数组
features = np.array(features)

#（6）标准化处理
from sklearn import preprocessing
input_features = preprocessing.StandardScaler().fit_transform(features)

#（7）keras构建网络模型
==1== 构建层次
model = tf.keras.Sequential()
隐含层1设置16层，权重初始化方法设置为随机高斯分布
加入正则化惩罚项
model.add(layers.Dense(16,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.01)))
model.add(layers.Dense(32,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.01)))
model.add(layers.Dense(1,kernel_initializer='random_normal',kernel_regularizer=tf.keras.regularizers.l2(0.01)))
==2== 指定优化器
model.compile(optimizer=tf.keras.optimizers.SGD(0.001),loss='mean_squared_error')
==3== 网络训练
model.fit(input_features,targets,validation_split=0.25,epochs=100,batch_size=128)
==4== 网络模型结构
model.summary()
==5== 预测模型结果
predict = model.predict(input_features)

#（7）展示预测结果
真实值，蓝色实现
fig = plt.figure(figsize=(10,5))
axes = fig.add_subplot(111)
axes.plot(dates,targets,'bo',label='actual')
预测值，红色散点
axes.plot(dates,predict,'ro',label='predict')
axes.set_xticks(dates[::50])
axes.set_xticklabels(dates[::50],rotation=45)

plt.legend()
plt.show()

Original: https://blog.csdn.net/dgvv4/article/details/121561940
Author: 立Sir
Title: 【神经网络】(1) 简单网络，实例：气温预测，附python完整代码和数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/613960/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

干货！⻘光眼估计和预测的深度学习模型

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！青光眼可对人眼的视力造成不可逆转的损害。青光眼通常通过视野敏感性来诊断。然而，测量视野敏感性是很费时和费力的。最近，…

人工智能 2023年7月17日
0051
【DS with Python】Matplotlib入门(一)：架构概述、面向对象编程绘图与函数式绘图基础

文章目录前言一、Matplotlib架构概述 * 1.1 Backend(后端) 1.2 Artist(美工) – 1.2.1 Figure、Subplot与Axe…

人工智能 2023年6月22日
0076
NameError: name ‘imshow’ is not defined. 和TypeError: Invalid shape (3, 224, 224) for image data

image_path = ‘image_06621.jpg’ img = process_image(image_path) imshow(img) 上面的代码是执行对图像的展示的…

人工智能 2023年5月28日
0089
125w短波通信距离_军用短波电台音频降噪器——凯池TSD303

短波通信是一种波长在100米 ~ 10米之间，频率范围3MHz~ 30MHz的一种无线电通信技术。短波电台具有通信距离远、机动性好、顽存性强等独特的优点，但它同样存在信道不稳定、背…

人工智能 2023年5月27日
0084
修改pip默认安装位置

修改pip默认安装位置默认安装位置是C:\Users\用户名\AppData\Roaming\Python\Python38\Scripts。浅浅建议不把这些东西放到系统盘，而是…

人工智能 2023年7月6日
0080
垃圾图像分类 ResNet34 python

数据下载链接 https://pan.baidu.com/s/1wr3h2Wc720uqUeIroTCIJA 百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳…

人工智能 2023年7月17日
0050
视频实时行为检测——基于yolov5+deepsort+slowfast算法

文章目录前言一、核心功能设计二、核心实现步骤 * 1.yolov5实现目标检测 2.deepsort实现目标跟踪 3.slowfast动作识别三、核心代码解析 * 1.参数…

人工智能 2023年6月17日
00107
富集分析：（一）概述

（全文约6600字） 1.1. 富集分析概念富集分析，本质上是对数据的分布检验，如果分布集中在某个区域，则认为富集。常用的分布检验方法有卡方检验、Fisher精确检验以及KS检…

人工智能 2023年7月14日
0050
蓝牙耳机主动降噪的基础知识介绍

蓝牙耳机有源降噪基础知识介绍 [En] Introduction to the basic knowledge of active noise reduction of Bluet…

人工智能 2023年5月25日
0063
OpenCvSharp (C# OpenCV) 指针方法读取和修改图像像素值(附源码)

导读本文主要介绍如何在OpenCvSharp4中使用指针方法读取和修改图像像素值。详细介绍 At方法读取图像像素值方法请参考下面文章，At方法速度较慢，建议使用指针方法。 C#…

人工智能 2023年7月19日
0050
Collaborativ

介绍 Collaborative Filtering（协同过滤）是一种常用的推荐系统算法，其基本思想是利用用户对物品的偏好信息来预测用户对未知物品的喜好程度。在本文中，我们将详细介…

人工智能 2024年1月2日
0034
数字图像处理·自适应滤波器降低噪声

一.自适应局部降噪滤波器 1.原理自适应局部降噪滤波器函数代码 function [f] = adpfilter(g,&am…

人工智能 2023年6月20日
0069
Python采集某网站小视频内容, m3u8内容下载

前言大家早好、午好、晚好吖~ 目录标题 * – 前言 – 环境使用: – 模块使用: – 模块安装问题: – + * …

人工智能 2023年7月6日
0070
YOLO Air一款面向科研小白的YOLO项目 | 包含大量改进方式教程

YOLO Air一款面向科研小白的YOLO项目|包含大量改进方式教程|适用YOLOv5,YOLOv7,YOLOX,YOLOv4,YOLOR,YOLOv3,transformer等算…

人工智能 2023年6月22日
0087
正态分布（高斯分布）、Q函数、误差函数、互补误差函数（定义，意义及互相之间的关系）高斯分布的分布概率反解

1.正态分布参考博客：https://www.cnblogs.com/htj10/p/8621771.html 概率密度函数的意义：理解概率密度函数 – 知乎 (z…

人工智能 2023年6月24日
00105
RNN及其变体（LSTM、GRU）的介绍

先打个岔，区分一下recurrent neural network循环神经网络和recursive neural network递归神经网络。 recurrent: 时间维度的展开…

人工智能 2023年5月27日
00152

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30