使用tensorflow神经网络预测房价模型

2023年5月23日下午6:34 • 人工智能 • 阅读 90

本例使用kaggle的”House Sales in King County, USA”数据集，共有21613笔房屋数据，每一笔数据有21个不同的信息，如图所示：

下载地址：

链接: https://pan.baidu.com/s/15OjQ5YHpooDaxkhFHfTpjg

提取码: tcg9

第1步，导入必要套件：

import os
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt

from tensorflow import keras
from tensorflow.keras import layers

第2步，读取数据并进行数据预处理

根据列表中第2列date数据提取”年、月、日”这3个有效信息，并放在列表最后，尔后丢弃id与date这2个无用信息。

data = pd.read_csv("kc_house_data.csv")

data['year'] = pd.to_numeric(data['date'].str.slice(0, 4))
data['month'] = pd.to_numeric(data['date'].str.slice(4, 6))
data['day'] = pd.to_numeric(data['date'].str.slice(6, 8))

data.drop(['id'], axis="columns", inplace=True)
data.drop(['date'], axis="columns", inplace=True)

第3步，分割数据集

按照6：2：2的比例将数据集分割为训练（train_data)、验证(val_data)、测试(test_data)3部分。

data_num = data.shape[0]
indexes = np.random.permutation(data_num)
train_indexes = indexes[:int(data_num * 0.6)]
val_indexes = indexes[int(data_num * 0.6):int(data_num * 0.8)]
test_indexes = indexes[int(data_num * 0.8):]

train_data = data.loc[train_indexes]
val_data = data.loc[val_indexes]
test_data = data.loc[test_indexes]

第4步，将数据归一化并建立Numpy array格式的训练数据

数据集中部分数据量较大，如房屋居住面积为1500~2500，与其它数据在一起不好进行训练，因此采用减去平均值再除以均方差的方式，将所有数据化分在[0,1]之间。

train_validation_data = pd.concat([train_data,val_data])
mean = train_validation_data.mean()
std = train_validation_data.std()

train_data = (train_data - mean) / std
val_data = (val_data - mean) / std

x_train = np.array(train_data.drop('price', axis='columns'))
y_train = np.array(train_data['price'])
x_val = np.array(val_data.drop('price', axis='columns'))
y_val = np.array(val_data['price'])

第5步，搭建神经网络模型

model = keras.Sequential(name = 'model-1')
model.add(layers.Dense(64, activation='relu', input_shape=(21,)))
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(1))
model.summary()

第6步，设置模型优化器、损失函数、评价指标

model.compile(keras.optimizers.Adam(0.001),
                loss=keras.losses.MeanSquaredError(),
                metrics=[keras.metrics.MeanAbsoluteError()])

第7步，创建模型存储目录并设置回调函数

model_dir = 'lab-house/models'
os.makedirs(model_dir)

log_dir = os.path.join('lab2-logs', 'model-1')
model_cbk = keras.callbacks.TensorBoard(log_dir=log_dir)
model_mckp = keras.callbacks.ModelCheckpoint(model_dir + 'Best-model-1.h5',
                                            monitor='val_mean_absolute_error',
                                            save_best_only = True,
                                            mode = 'min')

第8步，开始训练

history = model.fit(x_train, y_train,
                    batch_size = 64,
                    epochs = 300,
                    validation_data = (x_val, y_val),
                    callbacks = [model_cbk, model_mckp])

第9步，用测试数据进行房屋价格预测，并与实际价格进行误差百分比的计算

model = keras.models.load_model('lab2-logs/models/Best-model-1.h5')
y_test = np.array(test_data['price'])
test_data = (test_data - mean) / std
x_test = np.array(test_data.drop('price', axis='columns'))
y_pred = model.predict(x_test)
y_pred = np.reshape(y_pred * std['price'] + mean['price'], y_test.shape)
percentage_error = np.mean(np.abs(y_test - y_pred)) / np.mean(y_test)  * 100

print("model_1 Percentage Error: {:.2f}%".format(percentage_error))

结果如下：

证明错误率只有11.84%。

Original: https://blog.csdn.net/heze09/article/details/123645036
Author: heze09
Title: 使用tensorflow神经网络预测房价模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/497298/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

matplotlib之直方图

文本以及后续的系列文章中均会使用到numpy这个库，numpy是Python的一种开源的数值计算扩展，主要用来生产一些随机数作为绘图的原始数据。具体和安装matplotlib类似，…

人工智能 2023年7月15日
0048
基于pytorch-openpose框架的的人体姿态检测

1.在github上下载pytorch-openpose压缩包，网址为：https://github.com/Hzzone/pytorch-openpose 2.解压后所需要cud…

人工智能 2023年7月21日
00205
什么是卷积运算（Convolutiona

关于卷积运算（Convolution）卷积运算是在信号处理与深度学习中经常使用的一种数学运算，用于提取信号中的特征。它广泛应用于计算机视觉、语音处理、自然语言处理等领域。本文将详…

人工智能 2024年1月1日
0021
AI 作画初体验

连续看了几期和菜头的公众号上关于 AI 作画的文章后，我也产生了一些兴趣。作为一名理科生，立马就行动起来，这篇文章就聊一聊我的尝试过程。说起 AI 作画，其实已经出现好几年了。最…

人工智能 2023年6月16日
0074
《天池龙珠 – Python训练营》04.Python数据分析：从0完成一个数据分析实战

目录 1、赛前准备 2、数据处理 3、数据探索与清洗 4、数据分析与数据可视化 5、补充 1、赛前准备按照官方的新手教程，大致可概括为以下内容：数据源介绍（详情参考训练营文档）…

人工智能 2023年6月11日
0068
pandas DataFrame 按照30s 向下取整

print(ss[‘time’]) 0 2014-01-21 03:31:111 2014-01-21 04:53:552 2014-01-21 05:16:183 2014-01…

人工智能 2023年7月8日
0060
python深度学习tensorflow和fme结合，实现档案扫描件数据自动分类

文章目录前言一、深度学习基础知识简介 1、什么是深度学习 2、深度学习的原理 3、深度学习应用场景二、深度学习环境搭建 1.深度学习库的安装 2.CUDA和对应版本的cudn…

人工智能 2023年7月2日
0069
基于费舍尔判别分析的故障与诊断（lunwen+文献综述+翻译及原文+MATLAB程序）

目录1 引言 11.1 故障诊断技术的研究背景 11.1.1 故障诊断技术概述 11.1.2 故障诊断技术的研究对象 11.1.3 故障诊断技术研究的必要性 21.2 国内外基…

人工智能 2023年6月28日
0070
机器学习 —— 支持向量机简单入门

机器学习 —— 支持向量机简单入门第1关：线性可分支持向量机 * 1.线性二分类问题 2.基本思想 3.间隔与支持向量 4.对偶问题 5.选择题第2关：线性支持向量机 * 0….

人工智能 2023年6月16日
0064
CycleGAN的介绍与实现效果

本篇文章将会介绍cyclegan的基本原理以及实现的效果。 1.实现效果首先介绍一下cyclegan的实现的效果，简单来说就是将不同域之间的图像进行转换，而本身的形状保持不变如下…

人工智能 2023年7月20日
0053
Python做双均线策略

data=df[[‘trade_date’,’close’]]#获取交易日期与收盘价数据 data[‘close&#82…

人工智能 2023年7月7日
0065
cv/nlp哪些小方向好发论文?

本文几乎浓缩了cv/nlp方向的精华选题。差不多花了我4个晚上的时间整理，看了1000多个相关方向的论文选题，最好发、最有热度的100个整理给大家，绝对让你大呼过瘾，醍醐灌顶！科…

人工智能 2023年6月24日
0092
【统计学习方法学习笔记】-task01第一章统计学习方法概论

第一章统计学习方法概论 1.1 统计学习 1.2 监督学习 * 1.2.1 基本概念 1.3 统计学习三要素 * 1.3.1 模型 1.3.2 策略 – 1）损失函数和…

人工智能 2023年6月17日
0056
推扫式和快照式高光谱成像系统在红肉掺假检测中的应用

目录摘要推扫式高光谱成像系统的应用快照式高光谱成像系统的应用总结参考文献摘要肉类掺假常见于用低价肉代替高价肉获取非法利益，它不但影响了食品的质量，甚至会威胁到人们的健…

人工智能 2023年6月18日
00101
回归标准差和残差平方和的关系_多重线性回归方法之步进法

多重线性回归（multiple linear regression）是简单线性回归的推广，它考虑多个因素对一个结果的影响，是一种常用的多变量统计分析方法。用y表示因变量，x表示自变…

人工智能 2023年6月18日
00147
opencv-python光学畸变校准

文章目录前言一、光学畸变是什么？二、校准步骤 * 1.标定 2.校准 3.矫正 4.重投影误差分析总结前言开始练习opencv了，对于立体应用方面，这些畸变现象首先需要…

人工智能 2023年5月26日
00102

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

使用tensorflow神经网络预测房价模型

大家都在看