TF2-Tips：自定义model.fit

2023年5月25日下午2:06 • 人工智能 • 阅读 76

官方示例

keras官方代码给的例子很详细：Customizing what happens in fit()

基础

class CustomModel(keras.Model):
    def train_step(self, data):

        x, y = data

        with tf.GradientTape() as tape:
            y_pred = self(x, training=True)

            loss = self.compiled_loss(y, y_pred, regularization_losses=self.losses)

        trainable_vars = self.trainable_variables
        gradients = tape.gradient(loss, trainable_vars)

        self.optimizer.apply_gradients(zip(gradients, trainable_vars))

        self.compiled_metrics.update_state(y, y_pred)

        return {m.name: m.result() for m in self.metrics}

import numpy as np

inputs = keras.Input(shape=(32,))
outputs = keras.layers.Dense(1)(inputs)
model = CustomModel(inputs, outputs)
model.compile(optimizer="adam", loss="mse", metrics=["mae"])

x = np.random.random((1000, 32))
y = np.random.random((1000, 1))
model.fit(x, y, epochs=3)

CustomModel继承keras.Model，重写了train_step方法
self.compiled_loss就是model.compile中的loss方法
self.compiled_metrics就是model.compile中的metrics方法

在train_step方法中自定义loss：

loss_tracker = keras.metrics.Mean(name="loss")
mae_metric = keras.metrics.MeanAbsoluteError(name="mae")

class CustomModel(keras.Model):
    def train_step(self, data):
        x, y = data

        with tf.GradientTape() as tape:
            y_pred = self(x, training=True)

            loss = keras.losses.mean_squared_error(y, y_pred)

        trainable_vars = self.trainable_variables
        gradients = tape.gradient(loss, trainable_vars)

        self.optimizer.apply_gradients(zip(gradients, trainable_vars))

        loss_tracker.update_state(loss)
        mae_metric.update_state(y, y_pred)
        return {"loss": loss_tracker.result(), "mae": mae_metric.result()}

    @property
    def metrics(self):

        return [loss_tracker, mae_metric]

inputs = keras.Input(shape=(32,))
outputs = keras.layers.Dense(1)(inputs)
model = CustomModel(inputs, outputs)

model.compile(optimizer="adam")

x = np.random.random((1000, 32))
y = np.random.random((1000, 1))
model.fit(x, y, epochs=5)

loss_tracker有两个方法：
update_state：传loss
result：当前平均loss
property修饰的metrics方法：
在每个epoch开始前调用reset_states方法
如果去掉metrics，则训练中体现的loss不是每个epoch的累积平均loss，而是从训练开始时的累积平均loss
注意：这种情况下，model.compile中不需要再写loss了
踩坑：对于tf2.0和tf2.1，在fit时会报错：”ValueError: The model cannot be compiled because it has no loss to optimize.” TF2.2及以上没问题。
参考文章：AI学习笔记–Tensorflow自定义

class weight&sample weight

class CustomModel(keras.Model):
    def train_step(self, data):

        if len(data) == 3:
            x, y, sample_weight = data
        else:
            sample_weight = None
            x, y = data

        with tf.GradientTape() as tape:
            y_pred = self(x, training=True)

            loss = self.compiled_loss(
                y,
                y_pred,
                sample_weight=sample_weight,
                regularization_losses=self.losses,
            )

        trainable_vars = self.trainable_variables
        gradients = tape.gradient(loss, trainable_vars)

        self.optimizer.apply_gradients(zip(gradients, trainable_vars))

        self.compiled_metrics.update_state(y, y_pred, sample_weight=sample_weight)

        return {m.name: m.result() for m in self.metrics}

inputs = keras.Input(shape=(32,))
outputs = keras.layers.Dense(1)(inputs)
model = CustomModel(inputs, outputs)
model.compile(optimizer="adam", loss="mse", metrics=["mae"])

x = np.random.random((1000, 32))
y = np.random.random((1000, 1))
sw = np.random.random((1000, 1))
model.fit(x, y, sample_weight=sw, epochs=3)

Idea

自监督任务没有label，loss需要自行设计，此场景适合自定义train_step方法。以对比学习为例：

首先model.fit(x,y)中的x可以是一对正例，y可置None，此时train_step函数的输入为tuple:(x, )
对一个batch设计compute_loss函数
call函数也需要自己设计，接受token id和seg id，返回embeding
在train_step方法中调用call和compute_loss，使用loss_tracker.update_state传递loss

keras官方有一个关于clip算法的jupyter：Natural language image search with a Dual Encoder，其DualEncoder类的设计值得一读。
有空时我会仿照上面的思路写一个simcse的keras实现，欢迎follow~

Original: https://blog.csdn.net/weixin_44597588/article/details/123894936
Author: 一只用R的浣熊
Title: TF2-Tips：自定义model.fit

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/514508/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python在振动信号处理中的应用（四）：振动信号时域滤波处理（IIR、FIR）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月23日
0090
机器学习笔记（17）使用XGBoost完成高维数据的分类任务

摘要： XGBoost作为一种高性能集成算法在Higgs机器学习挑战赛中大放异彩后，被业界所熟知，之后便在数据科学实际工程中被广泛应用。本文首先试从原理解析XGBoost分类器的具…

人工智能 2023年7月2日
0072
ResNet18、50模型结构

论文地址： https://arxiv.org/pdf/1512.03385.pdf pytorch官方预训练模型地址： ‘resnet18’: ‘https://downloa…

人工智能 2023年5月26日
0068
基于循环神经网络lstm构建一个商品评论分类模型

一、项目背景及意义 AI人工智能一直是近年来热度一直热度不减的话题，我们常在各种科幻电影和小说都能看到它的身影，甚至在现实生活中看见它，对于AI的研究也一直源源不断。这个项目是基于…

人工智能 2023年7月3日
0057
R 语言DataFrame 排序

<span class="pln">Sort:<br>dd </span><span class="pun&…

人工智能 2023年6月2日
0042
聊聊投机性的macd算法，对投资拐点的预测

有没有什么方法，能在炒股、炒汇时用上呢？当然有，比如几乎众所周知的macd方法。一种时间序列、移动平均的方法。投机，是一种聚散有时的人性数学。做尿不湿生意，那不是投机。那是…

人工智能 2023年7月17日
0035
超详细neo4j安装教程

一、neo4j简介最近开始学习知识图谱，所以首先想先学习一下neo4j的使用。Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。由于知识图谱…

人工智能 2023年5月27日
0087
华为AI计算框架昇思MindSpore零基础快速入门 (上)

一、基础介绍门槛最低的深度学习引导 – 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/463019160 ; MindSpor…

人工智能 2023年6月25日
0055
Filterin

问题描述如何使用滤波器（Filtering）处理信号数据？介绍滤波器是一种用于对信号进行处理的技术。在信号处理领域常常需要对信号进行去噪、降低信号频率、滤除不需要的频率成分等…

人工智能 2024年1月2日
0016
python数据分析03—Pandas

1. Pandas的基本概念 1.1 Series方法： 1.2 DataFrame类似于二维数组，有行列之分 2.选择：从Series和DataFrame实例中选择部分数据 2….

人工智能 2023年7月7日
0051
计算机视觉教程2-6：八大图像特效算法制作你的专属滤镜(附Python代码)

目录 0 写在前面 1 毛玻璃特效 2 浮雕特效 3 油画特效 4 马赛克特效 5 素描特效 6 怀旧特效 7 流年特效 8 卡通特效 0 写在前面图像特效处理是基于图像像素数据…

人工智能 2023年5月26日
0077
音频放大电路_音频输入变压器电路的识读方法

音频输入和输出变压器用于带有分立组件的无线电和其他低功率音频放大器。 [En] Audio input and output transformers are used in ra…

人工智能 2023年5月27日
0060
BP神经网络学习总结

目录 0前言 1 神经网络 2 BP神经网络 3正向传播 4 反向传播 4.1损失函数和代价函数 4.2 梯度下降法 4.3 反向传播 5 编程思路 6 应用 6.1 应用1-是猫…

人工智能 2023年7月13日
0059
Opencv图像分割 — GMM（高斯混合模型）方法

一、高斯混合模型高斯混合模型（Gaussian Mixture Model）通常简称GMM，是一种业界广泛使用的聚类法，该方法使用了高斯分布作为参数模型，并使用了期望最大（Ex…

人工智能 2023年6月19日
0096
realsense D455深度相机+YOLO V5结合实现目标检测（二）

realsense D455深度相机+YOLO V5结合实现目标检测（二） 1.代码来源 2.环境配置 3.代码分析： * 3.1 主要展示在将detect.py转换为realse…

人工智能 2023年6月2日
0081
tensorflow学习笔记 (五) (卷积神经网络)

文章目录卷积神经网络 * 一、卷积计算过程 – 1.单通道的卷积计算 2.三通道的卷积计算 3. 卷积计算过程动图二、卷积相关 – 2.1 两种卷积核的…

人工智能 2023年5月23日
0065

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

TF2-Tips：自定义model.fit

基础

在train_step方法中自定义loss：

class weight&sample weight

大家都在看