keras中model.compile()基本用法

2023年6月16日下午3:26 • 人工智能 • 阅读 84

compile参数介绍

model.compile(
   optimizer,
   loss = None,
   metrics = None,
   loss_weights = None,
   sample_weight_mode = None,
   weighted_metrics = None,
   target_tensors = None
)

optimizer：优化器，用于控制梯度裁剪。必选项
loss：损失函数（或称目标函数、优化评分函数）。必选项
metrics：评价函数用于评估当前训练模型的性能。当模型编译后（compile），评价函数应该作为 metrics 的参数来输入。评价函数和损失函数相似，只不过评价函数的结果不会用于训练过程中。

在使用过程中常用的就是这三个参数。

optimizer

optimizer中文文档

可以先实例化一个优化器对象，然后将它传入 model.compile()；

from keras import optimizers
model = Sequential()
model.add(Dense(64, kernel_initializer='uniform', input_shape=(10,)))
model.add(Activation('softmax'))
sgd = optimizers.SGD(lr=0.01, clipvalue=0.5)
model.compile(optimizer=sgd,loss='mse')

可以通过名称来调用优化器。但是使用优化器的默认参数。


model.compile(loss='mean_squared_error', optimizer='sgd')

1.1 optimizer可用参数-SGD

SGD：随机梯度下降优化器 \color{blue}随机梯度下降优化器随机梯度下降优化器。包含扩展功能的支持：

学习率learning rate (lr)
动量（momentum）优化,
学习率衰减（每次参数更新后）
Nestrov 动量 (NAG) 优化。

lr: float >= 0. 学习率。
momentum : float>= 0. 参数，用于加速 SGD 在相关方向上前进，并抑制震荡。
decay: float >= 0. 每次参数更新后学习率衰减值。
nesterov: boolean. 是否使用 Nesterov 动量。

例如：
python keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)

1.2 optimizer可用参数-RMSprop

RMSprop：RMSProp 优化器是AdaGrad算法的一种改进。将梯度除以最近幅度的移动平均值 \color{blue}将梯度除以最近幅度的移动平均值将梯度除以最近幅度的移动平均值。
lr: float >= 0. 学习率。
rho: float >= 0. RMSProp梯度平方的移动均值的衰减率.
epsilon: float >= 0. 模糊因子. 若为 None, 默认为 K.epsilon()。
decay: float >= 0. 每次参数更新后学习率衰减值。例如： keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=None, decay=0.0)
这个优化器通常是训练循环神经网络R N N 的不错选择 \color{blue}RNN的不错选择R N N 的不错选择。参考文献

1.3 optimizer可用参数 – Adagrad

Adagrad 是一种具有特定参数学习率的优化器，根据参数在训练期间的更新频率进行自适应调整 \color{blue}根据参数在训练期间的更新频率进行自适应调整根据参数在训练期间的更新频率进行自适应调整。参数接收的更新越多，更新越小。
lr: float >= 0. 学习率。
epsilon: float >= 0. 模糊因子.若为 None, 默认为 K.epsilon()。
decay: float >= 0. 每次参数更新后学习率衰减值。例如： keras.optimizers.Adagrad(lr=0.01, epsilon=None, decay=0.0)
建议使用优化器的默认参数。参考文献

1.4 optimizer可用参数 – Adadelta

Adadelta 是 Adagrad 的一个具有更强鲁棒性的的扩展版本，它是根据渐变更新的移动窗口调整学习速率 \color{blue}根据渐变更新的移动窗口调整学习速率根据渐变更新的移动窗口调整学习速率。
lr: float >= 0. 学习率，建议保留默认值。
rho: float >= 0. Adadelta梯度平方移动均值的衰减率。
epsilon: float >= 0. 模糊因子. 若为 None, 默认为 K.epsilon()。
decay: float >= 0. 每次参数更新后学习率衰减值。
详细阅读：参考文献

1.5 optimizer可用参数 – Adam/Adamax/Nadam

Adam参数
lr: float >= 0. 学习率。
beta_1: float, 0 < beta < 1. 通常接近于 1。
beta_2: float, 0 < beta < 1. 通常接近于 1。
epsilon: float >= 0. 模糊因子. 若为 None, 默认为 K.epsilon()。
decay: float >= 0. 每次参数更新后学习率衰减值。
amsgrad: boolean. 是否应用此算法的 AMSGrad 变种，来自论文 “On the Convergence of Adam and Beyond”。例如：其默认为：
python keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=None, decay=0.0, amsgrad=False)
参考：Adam – A Method for Stochastic Optimization
Adamax参数
Adamax 优化器，来自 Adam 论文的第七小节.它是 Adam算法基于无穷范数（infinity norm）的变种。默认参数遵循论文中提供的值。
参数
lr: float >= 0. 学习率。
beta_1/beta_2: floats, 0 < beta < 1. 通常接近于 1。
epsilon: float >= 0. 模糊因子. 若为 None, 默认为 K.epsilon()。
decay: float >= 0. 每次参数更新后学习率衰减值。例如：其默认为：
keras.optimizers.Adamax(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=None, decay=0.0)
Nadam
Nesterov 版本 Adam 优化器。
正像 Adam 本质上是 RMSProp 与动量 momentum 的结合， Nadam 是采用 Nesterov momentum 版本的 Adam 优化器。
参数
lr: float >= 0. 学习率。
beta_1/beta_2: floats, 0 < beta < 1. 通常接近于 1。
epsilon: float >= 0. 模糊因子. 若为 None, 默认为 K.epsilon()。例如：其默认为：
keras.optimizers.Nadam(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=None, schedule_decay=0.004)
loss

损失函数的目的是计算模型在训练期间应寻求最小化的数量 \color{red}计算模型在训练期间应寻求最小化的数量计算模型在训练期间应寻求最小化的数量。loss可用参数

简写：

mse = MSE = mean_squared_error
mae = MAE = mean_absolute_error
mape = MAPE = mean_absolute_percentage_error
msle = MSLE = mean_squared_logarithmic_error
kld = KLD = kullback_leibler_divergence
cosine = cosine_proximity

2.1 mean_squared_error：均方误差

def mean_squared_error(y_true, y_pred):
    return K.mean(K.square(y_pred - y_true), axis=-1)

2.2 mean_absolute_error：平均绝对误差

def mean_absolute_error(y_true, y_pred):
    return K.mean(K.abs(y_pred - y_true), axis=-1)

2.3 mean_absolute_percentage_error：平均绝对百分比误差

def mean_absolute_percentage_error(y_true, y_pred):
    diff = K.abs((y_true - y_pred) / K.clip(K.abs(y_true),
                                            K.epsilon(),
                                            None))
    return 100. * K.mean(diff, axis=-1)

2.4 mean_squared_logarithmic_error：均方对数误差

def mean_squared_logarithmic_error(y_true, y_pred):
    first_log = K.log(K.clip(y_pred, K.epsilon(), None) + 1.)
    second_log = K.log(K.clip(y_true, K.epsilon(), None) + 1.)
    return K.mean(K.square(first_log - second_log), axis=-1)

2.5 squared_hinge

def squared_hinge(y_true, y_pred):
    return K.mean(K.square(K.maximum(1. - y_true * y_pred, 0.)), axis=-1)

2.6 hinge

def hinge(y_true, y_pred):
    return K.mean(K.maximum(1. - y_true * y_pred, 0.), axis=-1)

2.7 categorical_hinge

def categorical_hinge(y_true, y_pred):
    pos = K.sum(y_true * y_pred, axis=-1)
    neg = K.max((1. - y_true) * y_pred, axis=-1)
    return K.maximum(0., neg - pos + 1.)

2.8 logcosh

logcosh：预测误差的双曲余弦的对数。

def logcosh(y_true, y_pred):
    '''Logarithm of the hyperbolic cosine of the prediction error.

    log(cosh(x)) is approximately equal to (x ** 2) / 2 for small x and
    to abs(x) - log(2) for large x. This means that 'logcosh' works mostly
    like the mean squared error, but will not be so strongly affected by the
    occasional wildly incorrect prediction.

    # Arguments
        y_true: tensor of true targets.

        y_pred: tensor of predicted targets.

    # Returns
        Tensor with one scalar loss entry per sample.

    '''
    def _logcosh(x):
        return x + K.softplus(-2. * x) - K.log(2.)
    return K.mean(_logcosh(y_pred - y_true), axis=-1)

2.9 categorical_crossentropy

categorical_crossentropy：分类交叉熵。

def categorical_crossentropy(y_true, y_pred):
    return K.categorical_crossentropy(y_true, y_pred)

2.10 sparse_categorical_crossentropy

sparse_categorical_crossentropy：稀疏的分类交叉熵。

def sparse_categorical_crossentropy(y_true, y_pred):
    return K.sparse_categorical_crossentropy(y_true, y_pred)

2.11 binary_crossentropy

binary_crossentropy：二元交叉熵。

def binary_crossentropy(y_true, y_pred):
    return K.mean(K.binary_crossentropy(y_true, y_pred), axis=-1)

2.12 kullback_leibler_divergence

def kullback_leibler_divergence(y_true, y_pred):
    y_true = K.clip(y_true, K.epsilon(), 1)
    y_pred = K.clip(y_pred, K.epsilon(), 1)
    return K.sum(y_true * K.log(y_true / y_pred), axis=-1)

2.13 poisson

poisson：泊松。

def poisson(y_true, y_pred):
    return K.mean(y_pred - y_true * K.log(y_pred + K.epsilon()), axis=-1)

2.14 cosine_proximity

cosine_proximity：余弦值。

def cosine_proximity(y_true, y_pred):
    y_true = K.l2_normalize(y_true, axis=-1)
    y_pred = K.l2_normalize(y_pred, axis=-1)
    return -K.sum(y_true * y_pred, axis=-1)

Matrics
评价函数用于评估当前训练模型的性能 \color{blue}评估当前训练模型的性能评估当前训练模型的性能。当模型编译后（compile），评价函数应该作为 metrics的参数来输入。
评价函数和损失函数相似，只不过评价函数的结果不会用于训练过程中 \color{blue}评价函数的结果不会用于训练过程中评价函数的结果不会用于训练过程中。我们可以传递已有的评价函数名称，或者传递一个自定义的 Theano/TensorFlow 函数来使用。可用Matrics

; 3.1 keras内置的评价函数

binary_accuracy

binary_accuracy(y_true, y_pred)

categorical_accuracy

categorical_accuracy(y_true, y_pred)

sparse_categorical_accuracy

sparse_categorical_accuracy(y_true, y_pred)

top_k_categorical_accuracy

top_k_categorical_accuracy(y_true, y_pred, k=5)

sparse_top_k_categorical_accuracy

sparse_top_k_categorical_accuracy(y_true, y_pred, k=5)

3.2 自定义评价函数

自定义评价函数应该在编译的时候（ compile）传递进去。该函数需要以 (y_true, y_pred) 作为输入参数，并返回一个张量作为输出结果。

import keras.backend as K

def mean_pred(y_true, y_pred):
    return K.mean(y_pred)

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy', mean_pred])

参考：

Original: https://blog.csdn.net/huang1024rui/article/details/120055487
Author: Paul-Huang
Title: keras中model.compile()基本用法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625032/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

bert中文分类模型训练+推理+部署

文章预览： * – 0. bert简介 – 1. bert结构 – 1. bert中文分类模型训练 – + 1 下载bert项目代码…

人工智能 2023年7月1日
00106
数组排序算组之归并排序

归并排序（Merge Sort）是数组排序算法中一种常见的算法，其主要思想为经典的”分治思想”。本文将介绍数组排序算法中的归并排序，并介绍其相关应用。本文的…

人工智能 2023年6月27日
0098
【Matlab数学建模】灰色预测模型

一、灰色预测的概念 1982年我国学者邓聚龙教授发表第一篇中文论文《灰色控制系统》标志着灰色系统这一学科诞生。白色系统是指一个系统的内部特征已知的，即系统的信息是完全充分的。黑…

人工智能 2023年6月15日
0069
Generative Model – 李宏毅笔记

最近如火如荼AI绘画，原理上使用了一种新的算法Diffusion，叫扩散算法，它比起之前的对抗神经网络GAN，在做图像生成应用上，强的太多了。以图像直方图为例，我们将图像中所有的…

人工智能 2023年6月26日
0082
从零开始安装pytorch，并在pycharm中使用

pytorch安装与使用从零开始安装pytorch，并在pycharm中使用 * – 步骤简述 – anaconda下载与安装 – anacon…

人工智能 2023年7月23日
0066
C++ 中 const 成员函数的本质

const 成员函数形如： class Test { public: void fun() const; }; 先看一段非常好的英文解释： A “const funct…

人工智能 2023年6月30日
0086
重复测量资料纵向研究的数据分析-1

重复测量资料纵向研究的数据分析-1 单变量组内设计在纵向研究中，如果对同一个体的测量次数超过两次，情况会变得比较复杂。配对t检验就不再适用。先来理解什么是”单变量组…

人工智能 2023年7月17日
0088
神经网络的三种训练方法,神经网络训练过程图解

如何训练神经网络 1、先别着急写代码训练神经网络前，别管代码，先从预处理数据集开始。我们先花几个小时的时间，了解数据的分布并找出其中的规律。 Andrej有一次在整理数据时发现了重…

人工智能 2023年6月15日
0086
PySpark数据分析基础：pyspark.mllib.regression机器学习回归核心类详解(一)+代码详解

目录前言一、Spark MLlib 二、回归类 1.LabeledPoint 2.LinearModel 3.LinearRegressionModel load方法 pred…

人工智能 2023年6月17日
00164
联邦学习–论文汇总（十一）

回归老本行，Non-iid !!! 【1】SEPARATE BUT TOGETHER: UNSUPERVISED FEDERATED LEARNING FOR SPEECH ENH…

人工智能 2023年5月27日
0072
WebRTC中音频能量计算

1.WebRTC中音频能量计算 WebRTC中实现获取音频能量计算的方法是：获取音频数据最大的振幅(即绝对值最大)（范围是0-32767），然后再除以1000，得到0-32之间的数…

人工智能 2023年5月27日
00152
MATLAB 简单神经网络案例

加粗样式 MATLAB 简单神经网络案例学习目标:从学习第一个最简单的神经网络案例开启神经网络学习之路。本神经网络为感知器网络，常用于点的分类。 clear all; close…

人工智能 2023年7月13日
0077
TensorFlow各个GPU版本CUDA和cuDNN对应版本整理

CUDA Toolkit and Minimum Compatible Driver Versions CUDA Toolkit Toolkit Driver VersionLin…

人工智能 2023年5月24日
0099
数据集 TPC-H、TPC-DS、IMDB的导入使用

一. TPC-H 数据集数据集下载 TPC-H数据集可采用gcc下载或者直接下载zip包，然后解压即可。具体使用方法可以查看 dbgen文件目录下的：README文件数据表…

人工智能 2023年7月17日
00145
智能车图像处理去畸变+逆透视教程

逆透视请参考：智能车逆透视教程(含上位机、源码)_LoseHu的博客-CSDN博客去畸变请参考：智能车去畸变教程(含上位机、源码)_LoseHu的博客-CSDN博客逆透视+…

人工智能 2023年6月17日
0094
基于天鹰算法优化的lssvm回归预测-附代码

基于天鹰算法优化的lssvm回归预测 – 附代码文章目录基于天鹰算法优化的lssvm回归预测 – 附代码 * 1.数据集 2.lssvm模型 3.基于天…

人工智能 2023年7月31日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31