七、BatchNormalization使用技巧

2023年6月3日上午7:08 • Python • 阅读 101

前文
BatchNormalization的核心思想
数据生成器+数据部分展示
带有BN的逻辑回归
带有BN的宽模型
带有BN的深度模型
GitHub下载地址：

前文

BatchNormalization的核心思想

BN的基本思想其实相当直观：因为深层神经网络在做非线性变换前的 激活输入值（就是那个x=WU+B，U是输入）随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近（对于Sigmoid函数来说，意味着激活输入值WU+B是大的负值或正值），所以这 导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的 本质原因， 而BN就是通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，意思是 这样让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。

数据生成器+数据部分展示

#数据生成训练集与测试集
#猫狗数据
from keras.preprocessing.image import ImageDataGenerator

IMSIZE = 224
train_generator = ImageDataGenerator(rescale=1. / 255).flow_from_directory(
    '../../data/dogs-vs-cats/smallData/train',
    target_size=(IMSIZE, IMSIZE),
    batch_size=10,
    class_mode='categorical'
)

validation_generator = ImageDataGenerator(rescale=1. / 255).flow_from_directory(
    '../../data/dogs-vs-cats/smallData/validation',
    target_size=(IMSIZE, IMSIZE),
    batch_size=10,
    class_mode='categorical'
)

数据来源kaggle的猫狗数据

#展示X（图像）与Y（因变量）
import numpy as np

X, Y = next(validation_generator)
print(X.shape)
print(Y.shape)
Y[:, 0]

#展示图像
from matplotlib import pyplot as plt

plt.figure()
fig, ax = plt.subplots(2, 5)
fig.set_figheight(6)
fig.set_figwidth(15)
ax = ax.flatten()
X, Y = next(validation_generator)
for i in range(10): ax[i].imshow(X[i, :, :, ])

带有BN的逻辑回归

#带有BN的逻辑回归模型
from keras.layers import Flatten, Input, BatchNormalization, Dense
from keras import Model

input_layer = Input([IMSIZE, IMSIZE, 3])
x = input_layer
x = BatchNormalization()(x)
x = Flatten()(x)
x = Dense(2, activation='softmax')(x)
output_layer = x
model1 = Model(input_layer, output_layer)
model1.summary()

#带有BN的逻辑回归模型与拟合
from keras.optimizers import Adam

model1.compile(loss='categorical_crossentropy',
               optimizer=Adam(lr=0.01),
               metrics=['accuracy'])
model1.fit_generator(train_generator,
                     epochs=200,
                     validation_data=validation_generator)

Batch Normalization 在特定的模型、特定的数据集是有帮助的

带有BN的宽模型

#扩展，带有BN的宽模型
from keras.layers import Conv2D, MaxPooling2D

n_channel = 100
input_layer = Input([IMSIZE, IMSIZE, 3])
x = input_layer
x = BatchNormalization()(x)
x = Conv2D(n_channel, [2, 2], activation='relu')(x)
x = MaxPooling2D([16, 16])(x)
x = Flatten()(x)
x = Dense(2, activation='softmax')(x)
output_layer = x
model2 = Model(input_layer, output_layer)
model2.summary()

带有BN的宽模型的编译与拟合
model2.compile(loss='categorical_crossentropy',
               optimizer=Adam(lr=0.001),
               metrics=['accuracy'])
model2.fit_generator(train_generator,
                     epochs=200,
                     validation_data=validation_generator)

会比逻辑回归带BN的结果好得多

带有BN的深度模型

#带有BN的深度模型
n_channel = 20
input_layer = Input([IMSIZE, IMSIZE, 3])
x = input_layer
x = BatchNormalization()(x)

for _ in range(7):
    x = Conv2D(n_channel, [2, 2], padding='same', activation='relu')(x)
    x = MaxPooling2D([2, 2])(x)
x = Flatten()(x)
x = Dense(2, activation='softmax')(x)
output_layer = x
model3 = Model(input_layer, output_layer)
model3.summary()

#带有BN的深度模型编译与拟合
from keras.optimizers import Adam

model3.compile(loss='categorical_crossentropy',
               optimizer=Adam(lr=0.01),
               metrics=['accuracy'])
model3.fit_generator(train_generator,
                     epochs=200,
                     validation_data=validation_generator)

深度模型会更好一点

BatchNormalization在很多情况下确实有帮助巨大的，但并不是所有情况都有帮助。

GitHub下载地址：

Tensorflow1.15深度学习

Original: https://www.cnblogs.com/lehoso/p/15643945.html
Author: 李好秀
Title: 七、BatchNormalization使用技巧

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/563743/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

备战数学建模26 & 科研必备-Python数据可视化之matplotlib

一、绘制折线图二、绘制散点图三、绘制条形图一、绘制折线图 matplotlib:最流行的python底层绘图库，主要做数据可视化图表，名字取材于MATLAB，模仿MATLAB…

Python 2023年9月2日
0064
Pygame学习笔记2：文件I/O以及一个简易的问答游戏——Trivia

使用pygame制作一个Trivia小游戏，即问答小游戏源代码： import sys import pygame from pygame.locals import * def…

Python 2023年9月22日
0054
项目开源：scrapy + mongodb + smtplib + 百度翻译 + schedule = CNS订阅器

背景与问题分析实验室背景的原因，经常需要浏览 CNS(Cell\Nature\Science)的文章，有时候因为网站加载比较慢，并且懒所以不想点开网站去读，为了push自己更加勤…

Python 2023年10月5日
0034
python测试框架–＞pytest结合数据驱动-excel（六）

1、数据驱动的含义数据驱动就是数据的改变从而驱动自动化测试的执行，最终引起测试结果的改变。简单来说，就是参数化的应用。数据量小的测试用例可以使用代码的参数化来实现数据驱动，数据量…

Python 2023年9月9日
0054
uni-simple-router

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。入…

Python 2023年8月11日
0042
成为华尔街金融巨鳄第四课：Matplotlib从入门到放弃

成为华尔街金融巨鳄第四课：Matplotlib从入门到放弃 import matplotlib as mpl import matplotlib.pyplot as plt imp…

Python 2023年9月1日
0076
chatGPT与世界杯的故事：人工智能的双重面对

1. 引言（本文是 CSDN 的世界杯征文）在本文中，我们将借助chatGPT的智慧，一起探究世界杯与人工智能之间的关系，并展望人工智能在体育领域的应用。同时，我们也将思考人工智…

Python 2023年11月3日
0047
LeetCode – 数组的旋转总结

数组的旋转总结数组的旋转指的是将数组的最后若干个数提前到数组前面，数组的翻转指的是将数组的顺序颠倒。旋转可以通过多次翻转实现。数组的翻转很简单，通过双指针来实现：交换数组的第…

Python 2023年10月20日
0028
django.db.utils.OperationalError (1045, “Access denied for user ‘root‘@‘localhost‘

错误全部： django.db.utils.OperationalError: (1045, “Access denied for user ‘root&#…

Python 2023年8月3日
0068
【lwip】06-网络接口层分析

前言 6.1 概念引入 6.2 网络接口层数据概念流图 6.3 网卡收包程序流图 6.4 网卡数据结构 6.4.1 struct netif源码 6.4.2 字段分析 6.4.2….

Python 2023年10月23日
0039
三维重建（知识点详细解读、主要流程）

基于本人大创项目所学习三维建模过程的笔记。 1.概念：三维重建是指对三维物体建立适合计算机表示和处理的数学模型,是在计算机环境下对其进行处理、操作和分析其性质的基础,也是在计算机中…

Python 2023年9月30日
0052
【小程序项目开发– 京东商城】uni-app之首页商品楼层

Python 2023年5月24日
0060
flask+redis+Mysql的简易聊天室（一）

Simple_chat 介绍 Redis+ Python3 + flask实现简易聊天室源码 https://github.com/zh19990906/Simple_chats…

Python 2023年8月11日
0057
基于SqlSugar的开发框架循序渐进介绍（15）– 整合代码生成工具进行前端界面的生成

在前面随笔《基于SqlSugar的开发框架循序渐进介绍（12）– 拆分页面模块内容为组件，实现分而治之的处理》中我们已经介绍过，对于相关的业务表的界面代码，我们已经尽可…

Python 2023年10月19日
0030
jupyter notebook中使用python的matplotlib模块常见图形种类及意义，绘制散点图，柱状图，直方图，饼图

目录标题常见图形种类及意义 * 常见方法散点图(scatter) * 散点图绘制柱状图(bar) * 柱状图绘制 – 需求1-对比每部电影的票房收入需求2-如何…

Python 2023年8月31日
0067
10.模型层与ORM

模型层是与数据库交互信息的，我们先搞个mysql 附录一 windows上安装mysql_potato123232的博客-CSDN博客安装之后，我们在环境中中安装 mysqlcl…

Python 2023年8月6日
0050

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30