TensorFlow2 实现神经风格迁移，DIY数字油画定制照片

2023年7月13日上午9:06 • 人工智能 • 阅读 64

TensorFlow2 实现神经风格迁移，DIY数字油画定制照片

*
– 前言
– 神经风格迁移
– 使用VGG提取特征
–
+ 图像加载
+ VGG预处理
+ 重建内容
+ 用Gram矩阵重建风格
– 实现神经风格转换
– 效果展示
– 系列链接

前言

神经风格迁移一经提出，便引起了业界的巨大兴趣，一些网站允许用户上传照片以进行风格迁移，甚至有一些网站将其用于商品销售（例如某宝的”DIY数字油画定制照片”等等）。但是作为技术宅，能用技术完成的，怎么能用钱买呢？当然是学会神经风格迁移，免费获取价值百元DIY数字油画定制照片。

; 神经风格迁移

图像可以分解为内容和风格，内容描述了图像中的构成，例如图像中的花草树木，风格是指图片的细节，例如湖面的纹理和树木的颜色。在一天的不同时间同一建筑的照片具有不同的色调和亮度，可以被视为具有相同的内容但风格不同。
在Gatys等人发表的论文中，使用CNN将一幅图像的艺术风格转移到另一幅图像：

与大多数需要大量训练数据的深度学习模型不同，神经风格迁移仅需要两个图像——内容图像和样式图像。可以使用经过训练的CNN（例如VGG）将风格从风格图像迁移到内容图像上。
如上图所示，(A)是内容图像，(B)–(D)展示了是风格图像和风格化后的内容图像，结果令人惊异！有些人甚至使用该算法来创作和出售艺术品。有些网站和应用程序可以上传照片来进行风格迁移，而无需了解底层的原理，但作为技术人员，我们当然希望自己实现此模型。

使用VGG提取特征

分类器CNN可以分为两部分：第一部分称为特征提取器 (feature extractor)，主要由卷积层组成；后一部分由几个全连接层组成，输出类概率得分，称为分类器头 (classifier head)。在ImageNet上为分类任务预先训练的CNN也可以用于其他任务，这就是所谓的迁移学习 (transfer learning)，我们可以转移或重用一些学到的知识到新的网络或应用中。
在CNN中，图像重建的两个步骤如下：

通过CNN向前计算图像以提取特征。
使用随机初始化的输入，并进行训练，以便其重建与步骤1中的参考特征最匹配的特征。

在正常的网络训练中，输入图像是固定的，并且使用反向传播的梯度来更新网络权重。在神经风格迁移中，所有网络层都被冻结，而我们使用梯度来修改输入。在原始的论文使用的是 VGG19， Keras 有一个可以使用的预训练模型。VGG的特征提取器由五个块组成，每个块的末尾都有一个下采样。每个块都有2～4个卷积层，整个VGG19具有16个卷积层和3个全连接层。
在下文中，我们将实现内容重构，同时将其扩展以执行风格迁移。以下是使用预训练的VGG提取block4_conv2的输出层的代码：


vgg = tf.keras.applications.VGG19(include_top=False, weights='imagenet')
content_layers = ['block4_conv2']
content_outputs = [vgg.get_layer(x).output for x in content_layers]
model = Model(vgg.input, content_outputs)

预训练的 Keras CNN 模型分为两部分。底部由卷积层组成，通常称为特征提取器，而顶部是由全连接层组成的分类器头。因为我们只想提取特征而不关心分类器，所以在实例化VGG模型时将设置 include_top = False 。

图像加载

首先需要加载内容图像和风格图像：

def scale_image(image):
    MAX_DIM = 512
    scale = np.max(image.shape)/MAX_DIM
    print(image.shape)
    new_shape = tf.cast(image.shape[:2]/scale, tf.int32)
    image = tf.image.resize(image, new_shape)
    return image
content_image = scale_image(np.asarray(Image.open('7.jpg')))
style_image = scale_image(np.asarray(Image.open('starry-night.jpg')))

VGG预处理

Keras 预训练模型期望输入图像的BGR范围为 [0, 255] 。因此，第一步是反转颜色通道，以将 RGB 转换为 BGR 。 VGG 对不同的颜色通道使用不同的平均值，可以使用 tf.keras.applications.vgg19.preprocess_input() 进行预处理，在 preprocess_input() 内部，分别为B，G和R通道的像素值减去 103.939 、 116.779 和 123.68 。
以下是前向计算代码，在对图像进行前向计算之前先对其进行预处理，然后再将其输入模型以返回内容特征。然后，我们提取内容特征并将其用作我们的目标：

def extract_features(image):
    image = tf.keras.applications.vgg19。preprocess_input(image *255.)
    content_ref = model(image)
    return content_ref
content_image = tf.reverse(content_image, axis=[-1])
content_ref = extract_features(content_image)

在代码中，由于图像已标准化为 [0., 1.]，因此我们需要通过将其乘以255将其恢复为 [0.，255.]。然后创建一个随机初始化的输入，该输入也将成为风格化的图像：

image = tf.Variable(tf.random.normal( shape=content_image.shape))

接下来，我们将使用反向传播从内容特征中重建图像。

重建内容

在训练步骤中，我们将图像馈送到冻结的 VGG 中以提取内容特征，然后使用L 2 L_2 L 2 损失针对目标内容特征进行度量，用于计算每个特征层的L2损失：

def calc_loss(y_true, y_pred):
    loss = [tf.reduce_sum((x-y)**2) for x, y in zip(y_pred, y_true)]
    return tf.reduce_mean(loss)

使用 tf.GradientTape() 计算梯度。在正常的神经网络训练中，将梯度更新应用于可训练变量，即神经网络的权重。但是，在神经风格迁移中，将梯度应用于图像。之后，将图像值剪裁在 [0., 1.] 之间，如下所示：

for i in range(1,steps+1):
    with tf.GradientTape() as tape:
        content_features = self.extract_features(image)
        loss = calc_loss(content_features, content_ref)
    grad = tape.gradient(loss, image)
    optimizer.apply_gradients([(grad, image)])
    image.assign(tf.clip_by_value(image, 0., 1.))

使用block1_1重建图像，训练了2000步后，得到重构后的内容图像：

使用block4_1重建图像，训练了2000步后，得到重构后的内容图像：

可以看到使用层block4_1时，开始丢失细节，例如树叶的形状。当我们使用block5_1时，我们看到几乎所有细节都消失了，并充满了一些随机噪声：

如果我们仔细观察，树叶的结构和边缘仍然得到保留，并在其应有的位置。现在，我们已经提取了内容，提取内容特征后，下一步是提取样式特征。

用Gram矩阵重建风格

在内容重建中可以看出，特征图（尤其是前几层）既包含风格又包含内容。那么我们如何从图像中提取风格特征呢？方法是使用 Gram 矩阵，该矩阵可计算不同滤波器响应之间的相关性。假设卷积层1的激活形状为 (H, W, C) ，其中 H 和 W 是空间尺寸， C 是通道数，等于滤波器的数量，每个滤波器检测不同的图像特征。
当具有一些共同的特征(例如颜色和边缘)时，则认为它们具有相同的纹理。例如，如果我们将草地的图像输入到卷积层中，则检测垂直线和绿色的滤波器将在其特征图中产生更大的响应。因此，我们可以使用特征图之间的相关性来表示图像中的纹理。
要通过形状为 (H, W, C) 的激活来创建Gram矩阵，我们首先将其重塑为 C 个向量。每个向量都是大小为 H×W 的一维特征图。对 C 个向量执行点积运算，以获得对称的 C×C Gram 矩阵。在 TensorFlow 中计算 Gram 矩阵的详细步骤如下：

使用 tf.squeeze() 将批尺寸 (1, H, W, C) 修改为 (H, W, C) ；
转置张量以将形状从 (H, W, C) 转换为 (C, H, W) ；
将最后两个维度展平为 (C, H×W)；
执行特征的点积以创建形状为 (C, C) 的 Gram 矩阵；
通过将矩阵除以每个展平的特征图中的元素数 (H×W) 进行归一化。

计算 Gram 矩阵的代码如下：

def gram_matrix(x):
    x = tf.transpose(tf.squeeze(x), (2,0,1));
    x = tf.keras.backend.batch_flatten(x)
    num_points = x.shape[-1]
    gram = tf.linalg.matmul(x, tf.transpose(x))/num_points
    return gram

可以使用此函数为指定的样式层的每个 VGG 层获取 Gram 矩阵。然后，我们对来自目标图像和参考图像的 Gram 矩阵使用L 2 L_2 L 2 损失。损失函数与内容重建相同。创建 Gram 矩阵列表的代码如下：

def extract_features(image):
    image = tf.keras.applications.vgg19.preprocess_input(image *255.)
    styles = self.model(image)
    styles = [self.gram_matrix(s) for s in styles]
    return styles

以下图像是从不同VGG图层的风格特征中重构得到的：

在从block1_1重建的风格图像中，内容信息完全消失，仅显示高频纹理细节。较高的层block3_1，显示了一些卷曲的形状：

这些形状捕获了输入图像中风格的较高层次。 Gram矩阵的损失函数是平方误差之和而不是均方误差。因此，层次风格较高的层具有较高的固有权重。这允许传输更高级的风格表示形式，例如笔触。如果使用均方误差，则低层次的风格特征(例如纹理)将在视觉上更加突出，并且可能看起来像高频噪声。

实现神经风格转换

现在，我们可以合并内容和风格重构中的代码，以执行神经样式转移。
我们首先创建一个模型，该模型提取两个特征块，一个用于内容，另一个用于样式。内容重建使用block5_conv1层，从block1_conv1到block5_conv1的五层用于捕获来自不同层次结构的风格，如下所示：

vgg = tf.keras.applications.VGG19(include_top=False,   weights='imagenet')
default_content_layers = ['block5_conv1']
default_style_layers = ['block1_conv1',
                        'block2_conv1',
                        'block3_conv1',
                        'block4_conv1',
                        'block5_conv1']
content_layers = content_layers if content_layers else default_content_layers
style_layers = style_layers if style_layers else default_style_layers
self.content_outputs = [vgg.get_layer(x).output for x in content_layers]
self.style_outputs = [vgg.get_layer(x).output for x in style_layers]
self.model = Model(vgg.input, [self.content_outputs, self.style_outputs])

在训练循环开始之前，我们从各自的图像中提取内容和风格特征以用作目标。虽然我们可以使用随机初始化的输入来进行内容和风格重建，但从内容图像开始进行训练会更快：

content_ref, _ = self.extract_features(content_image)
_, style_ref = self.extract_features(style_image)

然后，我们计算并添加内容和风格损失：

def train_step(self, image, content_ref, style_ref):
    with tf.GradientTape() as tape:
        content_features, style_features = self.extract_features(image)
        content_loss = self.content_weight * self.calc_loss(content_ref, content_features)
        style_loss = self.style_weight*self.calc_loss( style_ref, style_features)
        loss = content_loss + style_loss
    grad = tape.gradient(loss, image)
    self.optimizer.apply_gradients([(grad, image)])
    image.assign(tf.clip_by_value(image, 0., 1.))
    return content_loss, style_loss

效果展示

以下是使用不同权重和内容层生成的4个风格化图像：

可以通过更改权重和层以创建所需的样式。
当然此模型也存在产生一张图片需要几分钟的时间的缺点，不能做到实时迁移，对于相关改进模型将在之后进行探讨。

; 系列链接

改进神经风格迁移
 学会CycleGAN进行风格迁移，实现自定义滤镜

Original: https://blog.csdn.net/LOVEmy134611/article/details/118156878
Author: 盼小辉丶
Title: TensorFlow2 实现神经风格迁移，DIY数字油画定制照片

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689491/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

RANSAC点云多平面拟合分割

回答1： pcl是Point Cloud Library的缩写，是一个功能强大的库，提供了多种处理算法。其中，是pcl中比较基础的一个算法。的目的是根据给定的一组出一个 …

人工智能 2023年6月16日
0067
OpenMV：14巡线小车

文章目录 * – + * 追小球的小车 * 巡线小车这个例子展示了在OpenMV Cam上使用get_regression（）方法获得ROI的线性回归。使用这种方法，…

人工智能 2023年7月5日
0089
多元线性回归超详细详解(一步一步手推公式)

上一篇我们详细的讲解了一元一次线性回归算法，今天我们接着上一篇，为大家讲解多元线性回归是怎么一回事。何为多元？当我们的输入x只有一维属性时，我们称之为一元。就像我们判断人胖瘦，只…

人工智能 2023年6月24日
00106
MacOS安装miniconda，并且配置虚拟环境

大家都知道anaconda太大，有时候我们只需要使用到anaconda去创建虚拟环境，因此可以使用miniconda作为替换，今天带来安装教程一、miniconda下载和安装二…

人工智能 2023年5月26日
0062
公众号推送早安问候以及天气预报(JAVA)

① 概述功能点每天早上可以给指定的微信用户推送消息，经过公众号可以使用第三方接口丰富推送的消息内容百度天气api：添加天气信息推送天行数据api：添加美句、彩虹屁等语句推…

人工智能 2023年5月30日
00171
Mediapipe三维实时人体关键点检测与追踪（一）

Mediapipe三维实时人体关键点检测与追踪 1.Mediapipe简介 2.Mediapipe姿态检测器 3.Mediapipe图像姿态检测 4.Mediapipe摄像头实时姿…

人工智能 2023年6月15日
00134
个人总结的三种Python读取txt文件（高效快捷）

不管什么时候，读取txt文件，并生成一个完美的DataFrame数据结构，对我来说都是一项较为艰难的工作。接下来我分享三种比较简单实用的方法，是我自己长期揣摩的方法： read_…

人工智能 2023年7月14日
0097
【足式机器人控制算法】（5.1）分解式虚拟模型VMC解耦思想 +反馈控制的方法规划反作用力 +运动学雅可比+虚功原理规划关节扭矩方法

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加TODO:写完再整理文章目录系列文章目录前言一、分解式VMC 的实现原理 * 1.虚拟力的定义…

人工智能 2023年6月10日
0077
pandas数据分析

1、series数据的生成和访问2、DataFrame数据生成的几种方法3、时间序列的生成和处理4、DataFrame数据的全方位访问5、DataFrame数据的规整化处理6、Da…

人工智能 2023年7月16日
0062
Maven工程开发

目录一、Maven工程开发_构建Maven工程二、Maven工程开发_pom文件配置三、Maven工程开发_编写代码四、Maven工程开发_依赖范围一、 Maven工程开…

人工智能 2023年7月31日
0068
分类问题的评价指标：多分类【Precision、 micro-P、macro-P】、【Recall、micro-R、macro-R】、【F1、 micro-F1、macro-F1】

一、混淆矩阵对于二分类的模型，预测结果与实际结果分别可以取0和1。我们用N和P代替0和1，T和F表示预测正确和错误。将他们两两组合，就形成了下图所示的混淆矩阵（注意：组合结果都是…

人工智能 2023年6月23日
0081
Pytorch实战 | 第4天：猴痘病识别

### 回答1：好的，第4关的任务是使用 _pytorch_搭建卷积神经网络来 _识别_手写数字。这个任务需要掌握 _pytorch_的基本操作和卷积神经网络的原理，同时需要对手…

人工智能 2023年7月20日
0056
CLIP论文详解

CLIP论文详解 – 潘登同学的深度学习笔记文章目录 * – CLIP论文详解 — 潘登同学的深度学习笔记* 前言* 整体架构* – Pre-…

人工智能 2023年6月23日
0075
FCN全卷积网络理解及代码实现（来自pytorch官方实现）

视频链接：https://www.bilibili.com/video/BV1J3411C7zd?vd_source=a0d4f7000e77468aec70dc618794d26…

人工智能 2023年7月27日
0084
金融数据分析之PDF年报中词频率统计

目录一、前言二、词频统计概述三、词频率统计技术路线四、具体实现 >>>环境搭建 >>>代码实现五、分词测试结果六、致谢一、前言近…

人工智能 2023年7月16日
0079
银行数据挖掘应用

随着科技的发展，大数据逐渐的在各行业间进行运用，大数据可以在一定程度上帮助行业对客户的信息进行挖掘，文章编号：2096—3157(2019)18-0169—02并对这些数据进行分析…

人工智能 2023年7月17日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

TensorFlow2 实现神经风格迁移，DIY数字油画定制照片

TensorFlow2 实现神经风格迁移，DIY数字油画定制照片

前言

; 神经风格迁移

使用VGG提取特征

图像加载

VGG预处理

重建内容

用Gram矩阵重建风格

实现神经风格转换

效果展示

; 系列链接

大家都在看