卷积神经网络进行Boston房价预测

2023年7月13日下午3:46 • 人工智能 • 阅读 82

Boston房价预测问题常采用多元线性回归，或者采用前馈神经网络，我这篇博客是采用卷积神经网络的，就是想看一下，卷积神经网络对此类问题的效果。卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积计算且具有深度结构的前馈神经网络（Feedforward Neural Networks），是深度学习（deep learning）的代表算法之一。卷积神经网络具有表征学习（representation learning）能力，能够按其阶层结构对输入信息进行平移不变分类（shift-invariant classification），因此也被称为”平移不变人工神经网络（Shift-Invariant Artificial Neural Networks, SIANN）”。卷积层模拟了人类的视感知，即局部感知功能。卷积层就是一种特征的提取方式。

一般处理图像的时候，优先考虑使用卷积神经网络，因为图像数据维度太高，没办法用全连接的神经网络，所以才想到使用卷积层。

那么卷积层和全连接层有什么区别呢？

conv只建模区域输入间的联系，只是利用小的区域信息得到更高层的抽象。然后通过多层的conv+pooling+fc建立全局关联。你可以把它理解为民主制度，就像”人大代表制度”，通过层层选出人大代表，得到最终决策。

而全连接层是对全局信息进行建模，考虑了全局关联，用全局信息得到更高层的抽象。

所以说，conv是fc的妥协，用为fc会导致网络的参数太多，内存不够，网络深度当然也不深，因为深度越大，会导致隐层的节点数也越多，非线性的表达能力也就越强。

下面我就试一下卷积神经网络的处理一维数据的能力。

代码如下：

#2021.11.11 HIT ATCI LZH
#&#x4E00;&#x7EF4;&#x5377;&#x79EF;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;&#x5B9E;&#x73B0;&#x6CE2;&#x58EB;&#x987F;&#x623F;&#x4EF7;&#x9884;&#x6D4B;&#xFF0C;&#x6570;&#x636E;&#x96C6;&#x4E3A;boston&#x623F;&#x4EF7;&#x4E0E;&#x5468;&#x8FB9;&#x73AF;&#x5883;&#x7B49;&#x56E0;&#x7D20;&#xFF0C;&#x53C2;&#x7167;&#x7F51;&#x4E0A;&#x7684;&#x4F8B;&#x5B50;
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
#&#x52A0;&#x8F7D;boston&#x623F;&#x4EF7;&#x6570;&#x636E;&#x96C6;
boston = tf.contrib.learn.datasets.load_dataset('boston')
X_train, Y_train = boston.data, boston.target
#==============================&#x5BF9;&#x6570;&#x636E;&#x96C6;&#x7684;&#x683C;&#x5F0F;&#x8FDB;&#x884C;&#x89E3;&#x6790;=======================================
#boston&#x6570;&#x636E;&#x96C6;&#x7684;X&#x4E3A;506&#x884C;&#xFF0C;13&#x5217;&#xFF0C;&#x5206;&#x522B;&#x4E3A;&#x5F71;&#x54CD;&#x623F;&#x4EF7;&#x7684;&#x8BF8;&#x591A;&#x56E0;&#x7D20;&#xFF0C;Y&#x4E3A;506&#x884C;&#xFF0C;1&#x5217;&#xFF0C;&#x5373;&#x623F;&#x4EF7;
print('&#x6570;&#x636E;&#x52A0;&#x8F7D;&#x6210;&#x529F;&#xFF01;')
print('boston.type is',type(boston))
print('X_train.type =', type(X_train))
print('X_train.ndim =',X_train.ndim)
print('X_train.shape =',X_train.shape)
print('X_train.dtype =',X_train.dtype)
print('X_train &#x7684;&#x884C;&#x6570; m = {0}, &#x5217;&#x6570; n = {1}'.format(X_train.shape[0],X_train.shape[1]))
print('Y_train.type =', type(Y_train))
print('Y_train.ndim =',Y_train.ndim)
print('Y_train.shape =',Y_train.shape)
print('Y_train &#x7684;&#x884C;&#x6570; m = {0}, &#x5217;&#x6570; n = None'.format(Y_train.shape[0]))
print('Y_train.dtype =',Y_train.dtype)
#==========================================================================================
#&#x5B9A;&#x4E49;&#x5F52;&#x4E00;&#x5316;&#x51FD;&#x6570;
def normalize(X):
    mean = np.mean(X) #&#x5747;&#x503C;
    std = np.std(X)  #&#x9ED8;&#x8BA4;&#x8BA1;&#x7B97;&#x6BCF;&#x4E00;&#x5217;&#x7684;&#x6807;&#x51C6;&#x5DEE;
    X = (X - mean)/std
    return X
X_train = normalize(X_train) #&#x5BF9;&#x8F93;&#x5165;&#x53D8;&#x91CF;&#x6309;&#x5217;&#x8FDB;&#x884C;&#x5F52;&#x4E00;&#x5316;
#==============================&#x7F51;&#x7EDC;&#x53C2;&#x6570;=====================================================
#parameters&#x8D85;&#x53C2;&#x6570;
learning_rate = 0.001
training_iters = 500  #&#x8BAD;&#x7EC3;&#x6B21;&#x6570;
batch_size = 10 #&#x6279;&#x8BAD;&#x7EC3;&#x6837;&#x672C;&#x5927;&#x5C0F;
display_step = 10 #&#x6253;&#x5370;&#x8BAD;&#x7EC3;&#x7ED3;&#x679C;&#x7684;Iter&#x7684;&#x6B65;&#x957F;
#Network Parameters
n_input = 13 #X_train&#x7684;&#x5217;&#x6570;
#==========================================================================================
#&#x4E3A;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x7533;&#x660E;&#x5360;&#x4F4D;&#x7B26;
x = tf.placeholder(tf.float32,[None,n_input])
y = tf.placeholder(tf.float32)
#keep_prob = tf.placeholder(tf.float32) #keep_prob&#x7528;&#x4E8E;&#x6FC0;&#x6D3B;&#x67D0;&#x4E9B;&#x795E;&#x7ECF;&#x5143;&#xFF0C;&#x9632;&#x6B62;&#x8FC7;&#x62DF;&#x5408;
#&#x5B9A;&#x4E49;&#x4E00;&#x4E2A;&#x8F93;&#x5165;&#x4E3A;x&#xFF0C;&#x6743;&#x503C;&#x4E3A;w&#xFF0C;&#x504F;&#x7F6E;&#x4E3A;b&#xFF0C;&#x7ED9;&#x5B9A;&#x6B65;&#x5E45;&#x7684;&#x5377;&#x79EF;&#x5C42;&#xFF0C;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#x662F;ReLu&#xFF0C;padding&#x8BBE;&#x4E3A;SAMEM&#x6A21;&#x5F0F;
def conv2d(x, w, b, strides=1):
    x = tf.nn.conv2d(x, w, strides = [1, strides, strides, 1],
        padding = 'SAME')
    x = tf.nn.bias_add(x,b)
    return tf.nn.relu(x)
#&#x5B9A;&#x4E49;&#x4E00;&#x4E2A;&#x8F93;&#x5165;&#x662F;x&#x7684;maxpool&#x5C42;&#xFF0C;&#x5377;&#x79EF;&#x6838;&#x4E3A;ksize&#x5E76;&#x4E14;padding&#x4E3A;SAME
def maxpool2d(x, k=2):
    return tf.nn.max_pool(x, ksize = [1, k, k, 1],strides = [1, k, k, 1],
            padding = 'SAME')
#&#x5B9A;&#x4E49;&#x5377;&#x79EF;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;&#xFF0C;&#x5176;&#x6784;&#x6210;&#x662F;&#x4E24;&#x4E2A;&#x5377;&#x79EF;&#x5C42;&#xFF0C;&#x4E00;&#x4E2A;droup&#x5C42;&#xFF0C;&#x6700;&#x540E;&#x662F;&#x8F93;&#x51FA;&#x5C42;
def conv_net(x, weights, biases):
    #reshape the input picture
    x = tf.reshape(x, shape = [-1, 13, 1, 1])#&#x5C06;&#x8F93;&#x5165;&#x6570;&#x636E;&#x53D8;&#x4E3A;4-D&#x5F20;&#x91CF;
    #First convolution layer
    conv1 = conv2d(x, weights['wc1'], biases['bc1'])
    fc1 = tf.reshape(conv1, [-1,
    weights['wd1'].get_shape().as_list()[0]])
    #Fully connected layer
    fc1 = tf.add(tf.matmul(fc1, weights['wd1']),biases['bd1'])
    fc1 = tf.nn.relu(fc1)
    #Fully connected layer
    fc2 = tf.add(tf.matmul(fc1, weights['wd2']),biases['bd2'])
    fc2 = tf.nn.relu(fc2)
    #output the class prediction
    out = tf.add(tf.matmul(fc1,weights['out']),biases['out'])
    return out
#&#x5B9A;&#x4E49;&#x7F51;&#x7EDC;&#x5C42;&#x7684;&#x6743;&#x91CD;&#x548C;&#x504F;&#x7F6E;&#xFF0C;&#x7B2C;&#x4E00;&#x4E2A;conv&#x5C42;&#x6709;&#x4E00;&#x4E2A;5*5&#x7684;&#x5377;&#x79EF;&#x6838;&#xFF0C;&#x4E00;&#x4E2A;&#x8F93;&#x5165;&#x548C;32&#x4E2A;&#x8F93;&#x51FA;&#x3002;&#x7B2C;&#x4E8C;&#x4E2A;
#conv&#x5C42;&#x6709;1&#x4E2A;5*5&#x7684;&#x5377;&#x79EF;&#x6838;&#xFF0C;32&#x4E2A;&#x8F93;&#x5165;&#x548C;64&#x4E2A;&#x8F93;&#x51FA;&#x3002;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x6709;1024&#x4E2A;&#x8F93;&#x5165;&#x548C;10&#x4E2A;&#x8F93;&#x51FA;&#x5BF9;&#x5E94;&#x4E8E;&#x6700;&#x540E;
#&#x7684;&#x6570;&#x5B57;&#x6570;&#x76EE;&#x3002;&#x6240;&#x6709;&#x7684;&#x6743;&#x91CD;&#x548C;&#x504F;&#x7F6E;&#x7528;randon_normal&#x5206;&#x5E03;&#x5B8C;&#x6210;&#x521D;&#x59CB;&#x5316;&#xFF1A;
weights = {
    #5*5 conv ,1 input, and 32 outputs
    'wc1':tf.Variable(tf.random_normal([5, 5, 1, 32])),
    # fully connected, 13*32 inputs, and 128 outputs
    'wd1':tf.Variable(tf.random_normal([13*32, 128])),
    'wd2':tf.Variable(tf.random_normal([128, 128])),
    # 128 inputs, 10 outputs for class digits
    'out':tf.Variable(tf.random_normal([128,1]))
}
biases = {
    'bc1':tf.Variable(tf.random_normal([32])),
    'bd1':tf.Variable(tf.random_normal([128])),
    'bd2':tf.Variable(tf.random_normal([128])),
    'out':tf.Variable(tf.random_normal([1]))
  }
#&#x5EFA;&#x7ACB;&#x4E00;&#x4E2A;&#x7ED9;&#x5B9A;&#x6743;&#x91CD;&#x548C;&#x504F;&#x7F6E;&#x7684;convnet&#x3002;&#x5B9A;&#x4E49;&#x5747;&#x65B9;&#x6839;&#x8BEF;&#x5DEE;&#x7684;&#x635F;&#x5931;&#x51FD;&#x6570;&#xFF0C;&#x5E76;&#x7528;Adam&#x4F18;&#x5316;&#x5668;&#x8FDB;&#x884C;&#x635F;&#x5931;&#x6700;&#x5C0F;&#x5316;&#x3002;
#&#x4F18;&#x5316;&#x540E;&#xFF0C;&#x8BA1;&#x7B97;&#x7CBE;&#x5EA6;&#xFF1A;
pred = conv_net(x, weights, biases)
cost = tf.reduce_mean(tf.square(y - pred))#&#x635F;&#x5931;&#x51FD;&#x6570;&#xFF0C;&#x5747;&#x65B9;&#x8BEF;&#x5DEE;
optimizer = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cost)
init_op = tf.global_variables_initializer()
#&#x542F;&#x52A8;&#x8BA1;&#x7B97;&#x56FE;&#xFF0C;&#x5E76;&#x8FED;&#x4EE3;train_iterats&#x6B21;&#xFF0C;&#x5176;&#x4E2D;&#x6BCF;&#x6B21;&#x8F93;&#x5165;batch_size&#x4E2A;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x4F18;&#x5316;&#xFF0C;&#x8BF7;&#x6CE8;&#x610F;&#xFF0C;&#x7528;&#x4ECE;mnist&#x6570;&#x636E;&#x96C6;&#x5206;&#x79BB;&#x51FA;&#x7684;
#mnist.train&#x6570;&#x636E;&#x8FDB;&#x884C;&#x8BAD;&#x7EC3;&#xFF0C;&#x6BCF;&#x8FDB;&#x884C;display_step&#x6B21;&#x8FED;&#x4EE3;&#xFF0C;&#x4F1A;&#x8BA1;&#x7B97;&#x5F53;&#x524D;&#x7684;&#x7CBE;&#x5EA6;&#xFF0C;&#x6700;&#x540E;&#xFF0C;&#x5728;2048&#x4E2A;&#x6D4B;&#x8BD5;&#x56FE;&#x7247;&#x4E0A;&#x8BA1;&#x7B97;&#x7CBE;&#x5EA6;&#xFF0C;
#&#x6B64;&#x65F6;&#x65E0;dropout
total = []#&#x5B9A;&#x4E49;&#x4E00;&#x4E2A;&#x7A7A;&#x5217;&#x8868;&#xFF0C;&#x7528;&#x4E8E;&#x5B58;&#x50A8;&#x6BCF;&#x4E00;&#x6B21;Epoch&#x7684;&#x8BEF;&#x5DEE;
with tf.Session() as sess:
    sess.run(init_op)#&#x521D;&#x59CB;&#x5316;&#x53D8;&#x91CF;
    for i in range(training_iters):
        _, l = sess.run([optimizer, cost],feed_dict = {x:X_train, y:Y_train})
        total.append(l)
        print('Epoch {0}: Loss {1}'.format(i, l))

#&#x7ED8;&#x5236;&#x635F;&#x5931;&#x51FD;&#x6570;
plt.figure(num=1)
plt.title('loss curve')
plt.xlabel('Epoch', color = 'red')
plt.ylabel('loss', color = 'blue')
plt.plot(total)
plt.show()

输出：

Epoch 490: Loss 108.11799621582031
Epoch 491: Loss 108.05949401855469
Epoch 492: Loss 108.00202941894531
Epoch 493: Loss 107.94499969482422
Epoch 494: Loss 107.88826751708984
Epoch 495: Loss 107.83196258544922
Epoch 496: Loss 107.77583312988281
Epoch 497: Loss 107.71996307373047
Epoch 498: Loss 107.66434478759766
Epoch 499: Loss 107.60884857177734

下面对网络结构进行修改，只保留全连接层，网络结构如下：

输入层：13 、隐层1: 128、隐层2：128、输出层：1

#2021.11.11 HIT ATCI LZH
#FNN&#x524D;&#x9988;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;&#x5B9E;&#x73B0;&#x6CE2;&#x58EB;&#x987F;&#x623F;&#x4EF7;&#x9884;&#x6D4B;&#xFF0C;&#x6570;&#x636E;&#x96C6;&#x4E3A;boston&#x623F;&#x4EF7;&#x4E0E;&#x5468;&#x8FB9;&#x73AF;&#x5883;&#x7B49;&#x56E0;&#x7D20;&#xFF0C;&#x53C2;&#x7167;&#x7F51;&#x4E0A;&#x7684;&#x4F8B;&#x5B50;&#xFF0C;&#x8F93;&#x5165;&#x5C42;&#xFF1A;13 &#x3001;&#x9690;&#x5C42;1: 128&#x3001;&#x9690;&#x5C42;2&#xFF1A;128&#x3001;&#x8F93;&#x51FA;&#x5C42;&#xFF1A;1
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
#&#x52A0;&#x8F7D;boston&#x623F;&#x4EF7;&#x6570;&#x636E;&#x96C6;
boston = tf.contrib.learn.datasets.load_dataset('boston')
X_train, Y_train = boston.data, boston.target
#==============================&#x5BF9;&#x6570;&#x636E;&#x96C6;&#x7684;&#x683C;&#x5F0F;&#x8FDB;&#x884C;&#x89E3;&#x6790;=======================================
#boston&#x6570;&#x636E;&#x96C6;&#x7684;X&#x4E3A;506&#x884C;&#xFF0C;13&#x5217;&#xFF0C;&#x5206;&#x522B;&#x4E3A;&#x5F71;&#x54CD;&#x623F;&#x4EF7;&#x7684;&#x8BF8;&#x591A;&#x56E0;&#x7D20;&#xFF0C;Y&#x4E3A;506&#x884C;&#xFF0C;1&#x5217;&#xFF0C;&#x5373;&#x623F;&#x4EF7;
print('&#x6570;&#x636E;&#x52A0;&#x8F7D;&#x6210;&#x529F;&#xFF01;')
print('boston.type is',type(boston))
print('X_train.type =', type(X_train))
print('X_train.ndim =',X_train.ndim)
print('X_train.shape =',X_train.shape)
print('X_train.dtype =',X_train.dtype)
print('X_train &#x7684;&#x884C;&#x6570; m = {0}, &#x5217;&#x6570; n = {1}'.format(X_train.shape[0],X_train.shape[1]))
print('Y_train.type =', type(Y_train))
print('Y_train.ndim =',Y_train.ndim)
print('Y_train.shape =',Y_train.shape)
print('Y_train &#x7684;&#x884C;&#x6570; m = {0}, &#x5217;&#x6570; n = None'.format(Y_train.shape[0]))
print('Y_train.dtype =',Y_train.dtype)
#==========================================================================================
#&#x5B9A;&#x4E49;&#x5F52;&#x4E00;&#x5316;&#x51FD;&#x6570;
def normalize(X):
    mean = np.mean(X) #&#x5747;&#x503C;
    std = np.std(X)  #&#x9ED8;&#x8BA4;&#x8BA1;&#x7B97;&#x6BCF;&#x4E00;&#x5217;&#x7684;&#x6807;&#x51C6;&#x5DEE;
    X = (X - mean)/std
    return X
X_train = normalize(X_train) #&#x5BF9;&#x8F93;&#x5165;&#x53D8;&#x91CF;&#x6309;&#x5217;&#x8FDB;&#x884C;&#x5F52;&#x4E00;&#x5316;
#==============================&#x7F51;&#x7EDC;&#x53C2;&#x6570;=====================================================
#parameters&#x8D85;&#x53C2;&#x6570;
learning_rate = 0.001
training_iters = 500  #&#x8BAD;&#x7EC3;&#x6B21;&#x6570;
batch_size = 10 #&#x6279;&#x8BAD;&#x7EC3;&#x6837;&#x672C;&#x5927;&#x5C0F;
display_step = 10 #&#x6253;&#x5370;&#x8BAD;&#x7EC3;&#x7ED3;&#x679C;&#x7684;Iter&#x7684;&#x6B65;&#x957F;
#Network Parameters
n_input = 13 #X_train&#x7684;&#x5217;&#x6570;
#==========================================================================================
#&#x4E3A;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x7533;&#x660E;&#x5360;&#x4F4D;&#x7B26;
x = tf.placeholder(tf.float32,[None,n_input])
y = tf.placeholder(tf.float32)
#keep_prob = tf.placeholder(tf.float32) #keep_prob&#x7528;&#x4E8E;&#x6FC0;&#x6D3B;&#x67D0;&#x4E9B;&#x795E;&#x7ECF;&#x5143;&#xFF0C;&#x9632;&#x6B62;&#x8FC7;&#x62DF;&#x5408;
#&#x5B9A;&#x4E49;&#x4E00;&#x4E2A;&#x8F93;&#x5165;&#x4E3A;x&#xFF0C;&#x6743;&#x503C;&#x4E3A;w&#xFF0C;&#x504F;&#x7F6E;&#x4E3A;b&#xFF0C;&#x7ED9;&#x5B9A;&#x6B65;&#x5E45;&#x7684;&#x5377;&#x79EF;&#x5C42;&#xFF0C;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#x662F;ReLu&#xFF0C;padding&#x8BBE;&#x4E3A;SAMEM&#x6A21;&#x5F0F;
#&#x5B9A;&#x4E49;&#x5377;&#x79EF;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;&#xFF0C;&#x5176;&#x6784;&#x6210;&#x662F;&#x4E24;&#x4E2A;&#x5377;&#x79EF;&#x5C42;&#xFF0C;&#x4E00;&#x4E2A;droup&#x5C42;&#xFF0C;&#x6700;&#x540E;&#x662F;&#x8F93;&#x51FA;&#x5C42;
def fnn_net(x, weights, biases):

    fc1 = tf.add(tf.matmul(x, weights['wd1']),biases['bd1'])
    fc1 = tf.nn.relu(fc1)
    #Fully connected layer
    fc2 = tf.add(tf.matmul(fc1, weights['wd2']),biases['bd2'])
    fc2 = tf.nn.relu(fc2)
    #output the class prediction
    out = tf.add(tf.matmul(fc1,weights['out']),biases['out'])
    return out
#&#x5B9A;&#x4E49;&#x7F51;&#x7EDC;&#x5C42;&#x7684;&#x6743;&#x91CD;&#x548C;&#x504F;&#x7F6E;&#xFF0C;&#x7B2C;&#x4E00;&#x4E2A;conv&#x5C42;&#x6709;&#x4E00;&#x4E2A;5*5&#x7684;&#x5377;&#x79EF;&#x6838;&#xFF0C;&#x4E00;&#x4E2A;&#x8F93;&#x5165;&#x548C;32&#x4E2A;&#x8F93;&#x51FA;&#x3002;&#x7B2C;&#x4E8C;&#x4E2A;
#conv&#x5C42;&#x6709;1&#x4E2A;5*5&#x7684;&#x5377;&#x79EF;&#x6838;&#xFF0C;32&#x4E2A;&#x8F93;&#x5165;&#x548C;64&#x4E2A;&#x8F93;&#x51FA;&#x3002;&#x5168;&#x8FDE;&#x63A5;&#x5C42;&#x6709;1024&#x4E2A;&#x8F93;&#x5165;&#x548C;10&#x4E2A;&#x8F93;&#x51FA;&#x5BF9;&#x5E94;&#x4E8E;&#x6700;&#x540E;
#&#x7684;&#x6570;&#x5B57;&#x6570;&#x76EE;&#x3002;&#x6240;&#x6709;&#x7684;&#x6743;&#x91CD;&#x548C;&#x504F;&#x7F6E;&#x7528;randon_normal&#x5206;&#x5E03;&#x5B8C;&#x6210;&#x521D;&#x59CB;&#x5316;&#xFF1A;
weights = {

    # fully connected, 13*32 inputs, and 128 outputs
    'wd1':tf.Variable(tf.random_normal([13, 128])),
    'wd2':tf.Variable(tf.random_normal([128, 128])),
    # 128 inputs, 1 outputs for class digits
    'out':tf.Variable(tf.random_normal([128,1]))
}
biases = {
    'bd1':tf.Variable(tf.random_normal([128])),
    'bd2':tf.Variable(tf.random_normal([128])),
    'out':tf.Variable(tf.random_normal([1]))
  }
#&#x5EFA;&#x7ACB;&#x4E00;&#x4E2A;&#x7ED9;&#x5B9A;&#x6743;&#x91CD;&#x548C;&#x504F;&#x7F6E;&#x7684;convnet&#x3002;&#x5B9A;&#x4E49;&#x5747;&#x65B9;&#x6839;&#x8BEF;&#x5DEE;&#x7684;&#x635F;&#x5931;&#x51FD;&#x6570;&#xFF0C;&#x5E76;&#x7528;Adam&#x4F18;&#x5316;&#x5668;&#x8FDB;&#x884C;&#x635F;&#x5931;&#x6700;&#x5C0F;&#x5316;&#x3002;
#&#x4F18;&#x5316;&#x540E;&#xFF0C;&#x8BA1;&#x7B97;&#x7CBE;&#x5EA6;&#xFF1A;
pred = fnn_net(x, weights, biases)
cost = tf.reduce_mean(tf.square(y - pred))#&#x635F;&#x5931;&#x51FD;&#x6570;&#xFF0C;&#x5747;&#x65B9;&#x8BEF;&#x5DEE;
optimizer = tf.train.AdamOptimizer(learning_rate = learning_rate).minimize(cost)
init_op = tf.global_variables_initializer()
#&#x542F;&#x52A8;&#x8BA1;&#x7B97;&#x56FE;&#xFF0C;&#x5E76;&#x8FED;&#x4EE3;train_iterats&#x6B21;&#xFF0C;&#x5176;&#x4E2D;&#x6BCF;&#x6B21;&#x8F93;&#x5165;batch_size&#x4E2A;&#x6570;&#x636E;&#x8FDB;&#x884C;&#x4F18;&#x5316;&#xFF0C;&#x8BF7;&#x6CE8;&#x610F;&#xFF0C;&#x7528;&#x4ECE;mnist&#x6570;&#x636E;&#x96C6;&#x5206;&#x79BB;&#x51FA;&#x7684;
#mnist.train&#x6570;&#x636E;&#x8FDB;&#x884C;&#x8BAD;&#x7EC3;&#xFF0C;&#x6BCF;&#x8FDB;&#x884C;display_step&#x6B21;&#x8FED;&#x4EE3;&#xFF0C;&#x4F1A;&#x8BA1;&#x7B97;&#x5F53;&#x524D;&#x7684;&#x7CBE;&#x5EA6;&#xFF0C;&#x6700;&#x540E;&#xFF0C;&#x5728;2048&#x4E2A;&#x6D4B;&#x8BD5;&#x56FE;&#x7247;&#x4E0A;&#x8BA1;&#x7B97;&#x7CBE;&#x5EA6;&#xFF0C;
#&#x6B64;&#x65F6;&#x65E0;dropout
total = []#&#x5B9A;&#x4E49;&#x4E00;&#x4E2A;&#x7A7A;&#x5217;&#x8868;&#xFF0C;&#x7528;&#x4E8E;&#x5B58;&#x50A8;&#x6BCF;&#x4E00;&#x6B21;Epoch&#x7684;&#x8BEF;&#x5DEE;
with tf.Session() as sess:
    sess.run(init_op)#&#x521D;&#x59CB;&#x5316;&#x53D8;&#x91CF;
    for i in range(training_iters):
        _, l = sess.run([optimizer, cost],feed_dict = {x:X_train, y:Y_train})
        total.append(l)
        print('Epoch {0}: Loss {1}'.format(i, l))
#&#x7ED8;&#x5236;&#x635F;&#x5931;&#x51FD;&#x6570;
plt.figure(num=1)
plt.title('loss curve')
plt.xlabel('Epoch', color = 'red')
plt.ylabel('loss', color = 'blue')
plt.plot(total)
plt.show()

输出：

Epoch 490: Loss 86.8122787475586
Epoch 491: Loss 86.80827331542969
Epoch 492: Loss 86.80428314208984
Epoch 493: Loss 86.80030822753906
Epoch 494: Loss 86.79631805419922
Epoch 495: Loss 86.79234313964844
Epoch 496: Loss 86.78837585449219
Epoch 497: Loss 86.78440856933594
Epoch 498: Loss 86.78043365478516
Epoch 499: Loss 86.77648162841797

前几次的epoch，fnn就优于cnn，收敛后，fnn的Loss还是要优于cnn，通过这个简单的例子，我们也能看到，对于一维数据而言，cnn的优势并不明显。

Original: https://blog.csdn.net/wzz110011/article/details/121266924
Author: nwsuaf_huasir
Title: 卷积神经网络进行Boston房价预测

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690141/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用pytorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习PyTorch，找了很多自定义数据加载的方法…

人工智能 2023年7月1日
0099
图像识别技术

目录一、图像识别的介绍二、图像识别原理文字识别数字图像处理和识别物体的识别提取字符特征样本训练与识别三、图像识别的应用一、图像识别的介绍随着图像处理技术的飞速发…

人工智能 2023年6月23日
0096
给安装在服务器上的jupyter修改密码

给安装在服务器上的jupyter修改密码文章目录给安装在服务器上的jupyter修改密码 * 1、在Linux上安装jupyter的方法参考下面链接： 2、在Linux上修改安…

人工智能 2023年6月29日
0074
机器学习图像特征提取—颜色（RGB、HSV、Lab）特征提取并绘制直方图

目录 1 颜色特征 1.1 RGB色彩空间 1.2 HSV色彩空间 1.3 Lab色彩空间 2 使用opencv-python对图像颜色特征提取并绘制直方图 2.1 RGB颜色特征…

人工智能 2023年6月20日
0079
知识图谱 Protege 本体构建

知识图谱 Protege 本体构建 Protege 相关资源 Protege OWL Tutorial 官方教程 : http://owl.cs.manchester.ac.uk/…

人工智能 2023年6月1日
0074
安装Tensorflow的简单方法

Tensorflow tensorflow是干什么的这里就不多说了，既然你已经准备磨剑了，也许早就知道你需要它是做什么。之前安装tensorflow试过了种种方法，看了各种帖子，…

人工智能 2023年7月27日
0057
史上最强tensorflow2.6.0安装教程

首先确保自己的电脑已经安装了anaconda管理器，anaconda安装完成后会在开始出现以下图标：接着先打开Anaconda prompt,在base环境下创建一个环境，我这…

人工智能 2023年6月24日
0079
OneHotEncoder简单用法

class sklearn.preprocessing.OneHotEncoder(*, categories=’auto’, drop=None, sparse=True, dt…

人工智能 2023年5月27日
0081
恒源云(GPUSHARE)_基于梯度的NLP对抗攻击方法

文章来源 | 恒源云社区（专注人工智能/深度学习云GPU服务器训练平台，官方体验网址：gpushare.com/ ）原文地址 | https://bbs.gpushare.com…

人工智能 2023年7月3日
0079
关联分析——关联规则应用及案例

数据挖掘最早使用的方法是关联分析，主要应用于零售业。其中最有名的是售货篮分析，帮助售货商制定销售策略。数据挖掘是从海量的数据里寻找有价值的信息和数据。数据挖掘中常用的算法有：关联…

人工智能 2023年6月24日
00129
product）

问题：如何计算一个产品的总成本？详细介绍：在制造业中，计算产品的总成本是非常重要的。总成本不仅包括原材料成本，还包括直接劳动成本、间接劳动成本、设备成本、运输成本等。通过准确计…

人工智能 2024年1月3日
0061
LIO-SAM学习与运行测试数据集

文章目录 0. 说明 * 0.1 环境配置说明 0.2 LIO-SAM 0.3 系统架构 0.4 LIO-SAM youtube视频演示： – Rotation Dat…

人工智能 2023年7月26日
00200
OpenCV学习笔记(十二)——图像分割与提取

在图像处理的过程中，经常需要从图像中将前景对象作为目标图像分割或者提取出来。例如，在视频监控中，观测到的是固定背景下的视频内容，而我们对背景本身并无兴趣，感兴趣的是背景中出现的车辆…

人工智能 2023年6月20日
0073
模型训练时应能根据训练数据自动改变网络结构和网络层数

概述神经网络和深度学习技术发展到如今的程度，已经在各行各业得到了广泛的应用，但是，我们看到的学术论文和各种技术报告中的神经网络结构，都是在训练之前设计好的，并且在训练过程中不会再…

人工智能 2023年7月14日
0073
多标签分类是什么

问题：关于多标签分类是什么这个问题在机器学习中，多标签分类是一种将数据样本分配到多个标签类别中的任务。与传统的单标签分类任务不同，多标签分类任务中一个数据样本可能属于多个标签类别…

人工智能 2023年12月29日
0061
A Quantization-Friendly Separable Convolution for MobileNets

论文：《A Quantization-Friendly Separable Convolution for MobileNets》论文地址：https://arxiv.org/p…

人工智能 2023年5月25日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

卷积神经网络进行Boston房价预测

大家都在看