基于keras实现resNet-50残差网络

2023年5月26日下午7:04 • 人工智能 • 阅读 107

看了Andrew Ng的deeplearning课程，这是其中的一个作业：实现restnet
coursea速度好慢，只能在大佬的博客里找quiz和作业
参考吴恩达《深度学习》课后作业

一、resNet简介

二、

ResNet主要使用了两种块，这取决输入输出的尺寸是否相同

标识块（identity_block）
卷积块（convolutional_block）

两者的区别，就是identity_block在shortcut上添加了一个卷积层，因为此时输入输出尺寸不相同

; 三、resNet-50的构建

identity_block实现

def identity_block(X, f, filters, stage, block):
"""
    :param X: input tensor
    :param f: shape for conv2 filter
    :param filters: List, the number of filters in the CONV layers of the main path
    :param stage: integer,used to name the layers, depending on their position in the network
    :param block: name
    :return:
"""
    conv_name_base = 'res' + str(stage) + block + '_branch'
    bn_name_base = 'bn' + str(stage) + block + '_branch'

    F1, F2, F3 = filters

    X_shortcut = X

    X = Conv2D(filters=F1, kernel_size=(1, 1), strides=(1, 1), padding='valid',
               name=conv_name_base + '2a', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name=bn_name_base + '2a')(X)
    X = Activation('relu')(X)

    X = Conv2D(filters=F2, kernel_size=(f, f), strides=(1, 1), padding='same',
               name=conv_name_base + '2b', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name=bn_name_base + '2b')(X)
    X = Activation('relu')(X)

    X = Conv2D(filters=F3, kernel_size=(1, 1), strides=(1, 1), padding='valid',
               name=conv_name_base + '2c', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name=bn_name_base + '2c')(X)

    X = layers.add([X, X_shortcut])
    X = Activation('relu')(X)

    return X

convolutional_block实现

def convolutional_block(X, f, filters, stage, block, s=2):
"""
    :param X: input tensor
    :param f: shape of the second conv
    :param filters: list, the number of filters in the CONV layers of the main path
    :param stage: Integer, used to name the layers, depending on their position in the network
    :param block: same to the parameter stage
    :param s: Integer, stride
    :return:
"""
    conv_name_base = 'res' + str(stage) + block + '_branch'
    bn_name_base = 'bn' + str(stage) + block + '_branch'

    F1, F2, F3 = filters

    X_shortcut = X

    X = Conv2D(filters=F1, kernel_size=(1, 1), strides=(s, s), padding='valid',
               name=conv_name_base + '2a', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name=bn_name_base + '2a')(X)
    X = Activation('relu')(X)

    X = Conv2D(filters=F2, kernel_size=(f, f), strides=(1, 1), padding='same',
               name=conv_name_base + '2b', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name=bn_name_base + '2b')(X)
    X = Activation('relu')(X)

    X = Conv2D(filters=F3, kernel_size=(1, 1), strides=(1, 1), padding='valid',
               name=conv_name_base + '2c', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name=bn_name_base + '2c')(X)

    X_shortcut = Conv2D(filters=F3, kernel_size=(1, 1), strides=(s, s), padding='valid',
                        name=conv_name_base + '1', kernel_initializer=glorot_uniform(seed=0))(X_shortcut)
    X_shortcut = BatchNormalization(axis=3, name=bn_name_base + '1')(X_shortcut)

    X = layers.add([X, X_shortcut])
    X = Activation('relu')(X)
    return X

resNet实现

def ResNet50(input_shape=(64, 64, 3), classes=6):
    X_input = Input(input_shape)
    X = ZeroPadding2D((3, 3))(X_input)
"""
    阶段1：
    2D卷积具有64个形状为（7,7）的滤波器，并使用（2,2）步幅，名称是"conv1"。
    BatchNorm应用于输入的通道轴。
    MaxPooling使用（3,3）窗口和（2,2）步幅。
"""
    X = Conv2D(filters=64, kernel_size=(7, 7), strides=(2, 2), name='conv1', kernel_initializer=glorot_uniform(seed=0))(X)
    X = BatchNormalization(axis=3, name='bn_conv1')(X)
    X = Activation('relu')(X)
    X = MaxPooling2D((3, 3), strides=(2, 2))(X)
"""
    阶段2：
    卷积块使用三组大小为[64,64,256]的滤波器，"f"为3，"s"为1，块为"a"。
    2个标识块使用三组大小为[64,64,256]的滤波器，"f"为3，块为"b"和"c"。
"""
    X = convolutional_block(X, f=3, filters=[64, 64, 256], stage=2, block='a', s=1)
    X = identity_block(X, f=3, filters=[64, 64, 256], stage=2, block='b')
    X = identity_block(X, f=3, filters=[64, 64, 256], stage=2, block='c')
"""
    阶段3：
    卷积块使用三组大小为[128,128,512]的滤波器，"f"为3，"s"为2，块为"a"。
    3个标识块使用三组大小为[128,128,512]的滤波器，"f"为3，块为"b"，"c"和"d"。
"""
    X = convolutional_block(X, f=3, filters=[128, 128, 512], stage=3, block='a', s=2)
    X = identity_block(X, f=3, filters=[128, 128, 512], stage=3, block='b')
    X = identity_block(X, f=3, filters=[128, 128, 512], stage=3, block='c')
    X = identity_block(X, f=3, filters=[128, 128, 512], stage=3, block='d')
"""
    阶段4：
    卷积块使用三组大小为[256、256、1024]的滤波器，"f"为3，"s"为2，块为"a"。
    5个标识块使用三组大小为[256、256、1024]的滤波器，"f"为3，块为"b"，"c"，"d"，"e"和"f"。
"""
    X = convolutional_block(X, f=3, filters=[256, 256, 1024], stage=4, block='a', s=2)
    X = identity_block(X, f=3, filters=[256, 256, 1024], stage=4, block='b')
    X = identity_block(X, f=3, filters=[256, 256, 1024], stage=4, block='c')
    X = identity_block(X, f=3, filters=[256, 256, 1024], stage=4, block='d')
    X = identity_block(X, f=3, filters=[256, 256, 1024], stage=4, block='e')
    X = identity_block(X, f=3, filters=[256, 256, 1024], stage=4, block='f')
"""
    阶段5：
    卷积块使用三组大小为[512、512、2048]的滤波器，"f"为3，"s"为2，块为"a"。
    2个标识块使用三组大小为[256、256、2048]的滤波器，"f"为3，块为"b"和"c"。
"""
    X = convolutional_block(X, f=3, filters=[512, 512, 2048], stage=5, block='a', s=2)
    X = identity_block(X, f=3, filters=[256, 256, 2048], stage=5, block='b')
    X = identity_block(X, f=3, filters=[256, 256, 2048], stage=5, block='c')

    X = AveragePooling2D(pool_size=(2, 2))(X)

    X = Flatten()(X)
    X = Dense(classes, activation='softmax', name='fc' + str(classes), kernel_initializer=glorot_uniform(seed=0))(X)

    model = Model(inputs=X_input, outputs=X, name='ResNet50')
    return model

工具类 resnets_utils.py（包括数据读取，mini-batch划分以及onehot向量转换）


import os
import numpy as np
import tensorflow as tf
import h5py
import math

def load_dataset():
    train_dataset = h5py.File('train_signs.h5', "r")
    train_set_x_orig = np.array(train_dataset["train_set_x"][:])
    train_set_y_orig = np.array(train_dataset["train_set_y"][:])

    test_dataset = h5py.File('test_signs.h5', "r")
    test_set_x_orig = np.array(test_dataset["test_set_x"][:])
    test_set_y_orig = np.array(test_dataset["test_set_y"][:])

    classes = np.array(test_dataset["list_classes"][:])

    train_set_y_orig = train_set_y_orig.reshape((1, train_set_y_orig.shape[0]))
    test_set_y_orig = test_set_y_orig.reshape((1, test_set_y_orig.shape[0]))

    return train_set_x_orig, train_set_y_orig, test_set_x_orig, test_set_y_orig, classes

def random_mini_batches(X, Y, mini_batch_size=64, seed=0):
"""
    Creates a list of random minibatches from (X, Y)

    Arguments:
    X -- input data, of shape (input size, number of examples) (m, Hi, Wi, Ci)
    Y -- true "label" vector (containing 0 if cat, 1 if non-cat), of shape (1, number of examples) (m, n_y)
    mini_batch_size - size of the mini-batches, integer
    seed -- this is only for the purpose of grading, so that you're "random minibatches are the same as ours.

    Returns:
    mini_batches -- list of synchronous (mini_batch_X, mini_batch_Y)
"""

    m = X.shape[0]
    mini_batches = []
    np.random.seed(seed)

    permutation = list(np.random.permutation(m))
    shuffled_X = X[permutation, :, :, :]
    shuffled_Y = Y[permutation, :]

    num_complete_minibatches = math.floor(
        m / mini_batch_size)
    for k in range(0, num_complete_minibatches):
        mini_batch_X = shuffled_X[k * mini_batch_size: k * mini_batch_size + mini_batch_size, :, :, :]
        mini_batch_Y = shuffled_Y[k * mini_batch_size: k * mini_batch_size + mini_batch_size, :]
        mini_batch = (mini_batch_X, mini_batch_Y)
        mini_batches.append(mini_batch)

    if m % mini_batch_size != 0:
        mini_batch_X = shuffled_X[num_complete_minibatches * mini_batch_size: m, :, :, :]
        mini_batch_Y = shuffled_Y[num_complete_minibatches * mini_batch_size: m, :]
        mini_batch = (mini_batch_X, mini_batch_Y)
        mini_batches.append(mini_batch)

    return mini_batches

def convert_to_one_hot(Y, C):
    Y = np.eye(C)[Y.reshape(-1)].T
    return Y

def forward_propagation_for_predict(X, parameters):
"""
    Implements the forward propagation for the model: LINEAR -> RELU -> LINEAR -> RELU -> LINEAR -> SOFTMAX

    Arguments:
    X -- input dataset placeholder, of shape (input size, number of examples)
    parameters -- python dictionary containing your parameters "W1", "b1", "W2", "b2", "W3", "b3"
                  the shapes are given in initialize_parameters
    Returns:
    Z3 -- the output of the last LINEAR unit
"""

    W1 = parameters['W1']
    b1 = parameters['b1']
    W2 = parameters['W2']
    b2 = parameters['b2']
    W3 = parameters['W3']
    b3 = parameters['b3']

    Z1 = tf.add(tf.matmul(W1, X), b1)
    A1 = tf.nn.relu(Z1)
    Z2 = tf.add(tf.matmul(W2, A1), b2)
    A2 = tf.nn.relu(Z2)
    Z3 = tf.add(tf.matmul(W3, A2), b3)

    return Z3

def predict(X, parameters):
    W1 = tf.convert_to_tensor(parameters["W1"])
    b1 = tf.convert_to_tensor(parameters["b1"])
    W2 = tf.convert_to_tensor(parameters["W2"])
    b2 = tf.convert_to_tensor(parameters["b2"])
    W3 = tf.convert_to_tensor(parameters["W3"])
    b3 = tf.convert_to_tensor(parameters["b3"])

    params = {"W1": W1,
              "b1": b1,
              "W2": W2,
              "b2": b2,
              "W3": W3,
              "b3": b3}

    x = tf.placeholder("float", [12288, 1])

    z3 = forward_propagation_for_predict(x, params)
    p = tf.argmax(z3)

    sess = tf.Session()
    prediction = sess.run(p, feed_dict={x: X})

    return prediction

模型训练及保存

if __name__ == '__main__':
    model = ResNet50(input_shape=(64, 64, 3), classes=6)
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

    X_train_orig, Y_train_orig, X_test_orig, Y_test_orig, classes = load_dataset()

    X_train = X_train_orig / 255.

    X_test = X_test_orig / 255.

    Y_train = convert_to_one_hot(Y_train_orig, 6).T
    Y_test = convert_to_one_hot(Y_test_orig, 6).T

    print("number of training examples = " + str(X_train.shape[0]))
    print("number of test examples = " + str(X_test.shape[0]))
    print("X_train shape: " + str(X_train.shape))
    print("Y_train shape: " + str(Y_train.shape))
    print("X_test shape: " + str(X_test.shape))
    print("Y_test shape: " + str(Y_test.shape))

    model.fit(X_train, Y_train, epochs=20, batch_size=32)
    preds = model.evaluate(X_test, Y_test)
    print("Loss = " + str(preds[0]))
    print("Test Accuracy = " + str(preds[1]))

    print("Saving model to disk \n")
    mp = "./signs_model.h5"
    model.save(mp)

Original: https://blog.csdn.net/qq_43598179/article/details/117604632
Author: Aurevior
Title: 基于keras实现resNet-50残差网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/521301/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用云端的GPU进行yolov5的训练

前言本文介绍了使用云端GPU进行yolov5训练环境配置的过程一、创建实例这里使用的是恒源云的GPU服务器，官方网址为恒源云_GPUSHARE-恒源智享云他的用户文档为Tm…

人工智能 2023年6月15日
00101
100天精通Python（数据分析篇）——第53天：初始pandas模块

### 回答1：这个问题的意思是询问一个学习 Python 数据分析_的 _100 天_计划，我的回答如下： _Python 数据分析_是非常重要的技能之一，学习它需要长时间的实…

人工智能 2023年7月4日
0071
基于MATLAB的车牌识别实现

摘要车牌识别系统作为智能交通管理必不可缺的一子系统，它的系统主要分为四个重要部分：图像的预处理、车牌定位、字符分割和字符识别。在本次设计中，我们所采用的是一套基于MATLAB的…

人工智能 2023年6月25日
0082
Windows 下安装CUDA和CUDNN以及验证是否安装成功

一、CUDA和CUDNN安装参见下面一篇博客：深度学习之CUDA+CUDNN详细安装教程二、验证是否安装成功首先验证CUDA，win+R进入CMD，在命令行输入nvcc -V…

人工智能 2023年5月23日
00103
Django用RSA实现Web登录加密传输，预防抓包泄漏密码，解决ModelForm无法实现传输加密问题

在使用Django学习制作网站时候，以为后端钩子处理使用了md5加密，数据库中也同样以md5的方式存储，这样就解决了密码泄漏问题，因为对前端没有足够的了解所以枉下次定论。在测试爬…

人工智能 2023年6月27日
00119
R数据分析：潜在转化分析LTA的做法和解释（一）

之前给大家写了很多潜在类别分析的教程Mplus教程：如何做潜在类别分析LCA R数据分析：用R语言做潜类别分析LCA Mplus数据分析：潜在类别分析（LCA）流程（详细版） R数…

人工智能 2023年6月11日
00102
头歌平台-机器学习-4.朴素贝叶斯分类器

EduCoder：机器学习—朴素贝叶斯分类器第1关：条件概率 ; 第2关：贝叶斯公式第3关：朴素贝叶斯分类算法流程编程要求：根据提示，完成fit与predict函数，分别实现…

人工智能 2023年7月3日
00476
回归预测 | MATLAB实现SSA-BP多输入单输出回归预测

回归预测 | MATLAB实现SSA-BP多输入单输出回归预测目录 * – 回归预测 | MATLAB实现SSA-BP多输入单输出回归预测 – + 基本介…

人工智能 2023年6月17日
0075
OpenCV-Python教程：霍夫变换~圆形(HoughCircles)

原文链接：http://www.juzicode.com/opencv-python-houghcircles 返回OpenCV-Python教程在OpenCV中HoughCir…

人工智能 2023年6月22日
00108
Python使用numpy和Pandas来做数据分析

目录 Numpy、Pandas模块包简介数据操作分析实例操作：环境准备写代码实操部分总结体会 Python语言自然不用多说了，专门做数据分析和数据挖掘、数据解刨的语言，模块…

人工智能 2023年7月16日
0076
什么是合成数据 (Synthetic Data)？

企业在部署人工智能时，往往会遇到数据获取困难、成本高昂，或采集的数据根本不可用等挑战。研究人员在2018年曾发现，顶尖的面部识别软件在识别肤色较深的人时，错误率高达34%。原因就在…

人工智能 2023年6月19日
0089
目标检测到目标跟踪 — Faster R-CNN 观测器

https://blog.paperspace.com/目标跟踪在在某些程度上可以说是目标检测的一个维度拓展。目标检测类似于贝叶斯 Filtering 和 Smoothing 中的…

人工智能 2023年7月10日
0069
【NLP】注意力机制在神经网络中的应用

注意力机制在神经网络中的应用 0. 前言这篇是我在一门专业选修课上的结课论文，当时的认识还是太过浅薄。最近开始系统学习NLP相关知识，先将这篇小论文发出来，之后会写关于2017年…

人工智能 2023年5月30日
00100
使用HanLP进行分词和实体抽取

使用HanLP进行分词和实体抽取 HanLP Github地址：https://github.com/hankcs/HanLP HanLP文档地址：https://hanlp.ha…

人工智能 2023年6月25日
0093
语音转文本中如何解决多人交谈引起的干扰问题

问题介绍语音转文本是将语音信号转换为文本形式的技术。在多人交谈场景中，会出现多个人同时说话的情况，这会导致语音转文本系统在处理时出现干扰。本文将详细介绍如何解决多人交谈引起的干扰…

人工智能 2024年1月3日
0044
Jetson Xavier NX重装Jetpack5.0.2系统、安装CUDA11.4、Cudnn8.4.1、Tensorrt8.4.

1 准备工作硬件：开发板、跳线帽、microUSB数据线、电源线软件：Ubuntu host主机、NVIDIA SDK MANAGER（下载地址：NVIDIA SDK Mana…

人工智能 2023年6月23日
0087

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于keras实现resNet-50残差网络

一、resNet简介

二、

; 三、resNet-50的构建

大家都在看