深度学习之自编码器（5）VAE图片生成实战

2023年7月14日上午7:06 • 人工智能 • 阅读 45

深度学习之自编码器（5）VAE图片生成实战

1. VAE模型
2. Reparameterization技巧
3. 网络训练
4. 图片生成
VAE图片生成实战完整代码

本节我们基于VAE模型实战Fashion MNIST图片的重建与生成。如下图所示，输入为Fashion MNIST图片向量，经过3个全连接层后得到隐向量
z \boldsymbol z z

的均值与方差，分别用两个输出节点数为20的全连接层表示，FC2的20个输出节点表示20个特征分布的均值向量
μ \boldsymbol μμ

，FC3的20个输出节点表示20个特征分布的取
log \text{log}log

后的方差向量。通过
Reparameterization Trick采样

获得长度为20的隐向量
z \boldsymbol z z

，并通过FC4和FC5重建出样本图片。

VAE模型结构

VAE作为生成模型，除了可以重建输入样本，还可以单独使用解码器生成样本。通过从先验分布p ( z ) p(\boldsymbol z)p (z )中直接采样获得隐向量z \boldsymbol z z，经过解码后可以产生生成的样本。

; 1. VAE模型

我们将Encoder和Decoder子网络实现在VAE大类中，在初始化函数中，分别创建Encoder和Decoder需要的网络层。代码如下：

class VAE(keras.Model):
    # &#x53D8;&#x5206;&#x81EA;&#x7F16;&#x7801;&#x5668;
    def __init__(self):
        super(VAE, self).__init__()

        # Encoder&#x7F51;&#x7EDC;
        self.fc1 = layers.Dense(128)
        self.fc2 = layers.Dense(z_dim) # get mean prediction
        self.fc3 = layers.Dense(z_dim)

        # Decoder&#x7F51;&#x7EDC;
        self.fc4 = layers.Dense(128)
        self.fc5 = layers.Dense(784)

Encoder的输入先通过共享层FC1，然后分别通过FC2与FC3网络，获得隐向量分布的均值向量与方差的log \text{log}log向量值。代码如下：

def encoder(self, x):
    # &#x83B7;&#x5F97;&#x7F16;&#x7801;&#x5668;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;
    h = tf.nn.relu(self.fc1(x))
    # &#x83B7;&#x5F97;&#x5747;&#x503C;&#x5411;&#x91CF;
    mu = self.fc2(h)
    # &#x83B7;&#x5F97;&#x65B9;&#x5DEE;&#x7684;log&#x5411;&#x91CF;
    log_var = self.fc3(h)

    return mu, log_var

Decoder接受采样后的隐向量z \boldsymbol z z，并解码为图片输出。代码如下：

def decoder(self, z):
    # &#x6839;&#x636E;&#x9690;&#x85CF;&#x53D8;&#x91CF;z&#x751F;&#x6210;&#x56FE;&#x7247;&#x6570;&#x636E;
    out = tf.nn.relu(self.fc4(z))
    out = self.fc5(out)
    # &#x8FD4;&#x56DE;&#x56FE;&#x7247;&#x6570;&#x636E;&#xFF0C;784&#x5411;&#x91CF;
    return out

在VAE的前向计算过程中，首先通过编码器获得输入的隐向量z \boldsymbol z z的分布，然后利用Reparameterization Trick实现的reparameterize函数采样获得隐向量z \boldsymbol z z，最后通过解码器即可恢复重建的图片向量。实现如下：

def call(self, inputs, training=None):
    # &#x524D;&#x5411;&#x8BA1;&#x7B97;
    # &#x7F16;&#x7801;&#x5668;[b, 784] => [b, z_dim], [b, z_dim]
    mu, log_var = self.encoder(inputs)
    # &#x91C7;&#x6837;reparameterization trick
    z = self.reparameterize(mu, log_var)
    # &#x901A;&#x8FC7;&#x89E3;&#x7801;&#x5668;&#x751F;&#x6210;
    x_hat = self.decoder(z)
    # &#x8FD4;&#x56DE;&#x751F;&#x6210;&#x6837;&#x672C;&#xFF0C;&#x53CA;&#x5176;&#x5747;&#x503C;&#x4E0E;&#x65B9;&#x5DEE;
    return x_hat, mu, log_var

Reparameterization技巧

Reparameterize函数接受均值与方差参数，并从正态分布N ( 0 , 1 ) \mathcal N(0,1)N (0 ,1 )中采样获得ε εε，通过z = μ + σ ⊙ ε z=μ+σ \odot εz =μ+σ⊙ε方式返回采样隐向量。代码如下：

def reparameterize(self, mu, log_var):
    # reparameterize&#x6280;&#x5DE7;&#xFF0C;&#x4ECE;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x91C7;&#x6837;epsilon
    eps = tf.random.normal(log_var.shape)
    # &#x8BA1;&#x7B97;&#x6807;&#x51C6;&#x5DEE;
    std = tf.exp(log_var*0.5)
    # reparameterize&#x6280;&#x5DE7;
    z = mu + std * eps
    return z

网络训练

网络固定训练100个Epoch，每次从VAE模型中前向计算获得重建样本，通过交叉熵损失函数计算重建误差项E z ∼ q [ log ⁡ p θ ( x ∣ z ) ] \mathbb E_{\boldsymbol z\sim q} [\text{log}⁡p_θ (\boldsymbol x|\boldsymbol z)]E z ∼q [log ⁡p θ(x ∣z )]，根据公式
D K L ( q ϕ ( z ∣ x ) ∥ p ( z ) ) = − log⁡ σ 1 + 0.5 σ 1 2 + 0.5 μ 1 2 − 0.5 \mathbb D_{KL} (q_\phi (\boldsymbol z|\boldsymbol x)\|p(\boldsymbol z))=-\text{log⁡}σ_1 +0.5σ_1^2+0.5μ_1^2-0.5 D K L (q ϕ(z ∣x )∥p (z ))=−log⁡σ1 +0 .5 σ1 2 +0 .5 μ1 2 −0 .5
计算D K L ( q ϕ ( z ∣ x ) ∥ p ( z ) ) \mathbb D_{KL} (q_\phi (\boldsymbol z|\boldsymbol x)\|p(\boldsymbol z))D K L (q ϕ(z ∣x )∥p (z ))误差项，并自动求导和更新整个网络模型。代码如下：

&#x521B;&#x5EFA;&#x7F51;&#x7EDC;&#x5BF9;&#x8C61;
model = VAE()
model.build(input_shape=(4, 784))
&#x4F18;&#x5316;&#x5668;
optimizer = tf.optimizers.Adam(lr)

for epoch in range(1000):  # &#x8BAD;&#x7EC3;100&#x4E2A;Epoch

    for step, x in enumerate(train_db):  # &#x904D;&#x5386;&#x8BAD;&#x7EC3;&#x96C6;
        # &#x6253;&#x5E73;&#xFF0C;[b, 28, 28] => [b, 784]
        x = tf.reshape(x, [-1, 784])
        # &#x6784;&#x5EFA;&#x68AF;&#x5EA6;&#x8BB0;&#x5F55;&#x5668;
        with tf.GradientTape() as tape:
            # &#x524D;&#x5411;&#x8BA1;&#x7B97;
            x_rec_logits, mu, log_var = model(x)
            # &#x91CD;&#x5EFA;&#x635F;&#x5931;&#x503C;&#x8BA1;&#x7B97;
            rec_loss = tf.nn.sigmoid_cross_entropy_with_logits(labels=x, logits=x_rec_logits)
            rec_loss = tf.reduce_sum(rec_loss) / x.shape[0]

            # &#x8BA1;&#x7B97;KL&#x6563;&#x5EA6; (mu, var) ~ N (0, 1)
            # &#x516C;&#x5F0F;&#x53C2;&#x8003;&#xFF1A;https://stats.stackexchange.com/questions/7440/kl-divergence-between-two-univariate-gaussians
            kl_div = -0.5 * (log_var + 1 - mu**2 - tf.exp(log_var))
            kl_div = tf.reduce_sum(kl_div) / x.shape[0]
            # &#x5408;&#x5E76;&#x8BEF;&#x5DEE;&#x9879;
            loss = rec_loss + 1. * kl_div
        # &#x81EA;&#x52A8;&#x6C42;&#x5BFC;
        grads = tape.gradient(loss, model.trainable_variables)
        # &#x81EA;&#x52A8;&#x66F4;&#x65B0;
        optimizer.apply_gradients(zip(grads, model.trainable_variables))

        if step % 100 == 0:
            # &#x6253;&#x5370;&#x8BAD;&#x7EC3;&#x8BEF;&#x5DEE;
            print(epoch, step, 'kl div:', float(kl_div), 'rec loss:', float(rec_loss))

图片生成

图片生成只利用到解码器网络，首先从先验分布N ( 0 , 1 ) \mathcal N(0,1)N (0 ,1 )中采样获得隐向量，再通过解码器获得图片向量，最后Reshape为图片矩阵。例如：

&#x6D4B;&#x8BD5;&#x751F;&#x6210;&#x6548;&#x679C;&#xFF0C;&#x4ECE;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x968F;&#x673A;&#x91C7;&#x6837;z
z = tf.random.normal((batchsz, z_dim))
logits = model.decoder(z)  # &#x4EC5;&#x901A;&#x8FC7;&#x89E3;&#x7801;&#x5668;&#x751F;&#x6210;&#x56FE;&#x7247;
x_hat = tf.sigmoid(logits)  # &#x8F6C;&#x6362;&#x4E3A;&#x50CF;&#x7D20;&#x8303;&#x56F4;
x_hat = tf.reshape(x_hat, [-1, 28, 28]).numpy() *255.

x_hat = x_hat.astype(np.uint8)
save_images(x_hat, 'vae_images/sampled_epoch%d.png' % epoch)  # &#x4FDD;&#x5B58;&#x751F;&#x6210;&#x56FE;&#x7247;

&#x91CD;&#x5EFA;&#x56FE;&#x7247;&#xFF0C;&#x4ECE;&#x6D4B;&#x8BD5;&#x673A;&#x91C7;&#x6837;&#x56FE;&#x7247;
x = next(iter(test_db))
x = tf.reshape(x, [-1, 784])  # &#x6253;&#x5E73;
x_hat_logits, _, _ = model(x)  # &#x9001;&#x5165;&#x81EA;&#x7F16;&#x7801;&#x5668;
x_hat = tf.sigmoid(x_hat_logits)  # &#x5C06;&#x8F93;&#x51FA;&#x8F6C;&#x6362;&#x4E3A;&#x50CF;&#x7D20;&#x503C;
&#x8F93;&#x5165;&#x7684;&#x524D;50&#x5F20;+&#x91CD;&#x5EFA;&#x7684;&#x524D;50&#x5F20;&#x56FE;&#x7247;&#x5408;&#x5E76;&#xFF0C;[b, 28, 28] => [2b, 28, 28]
x_hat = tf.reshape(x_hat, [-1, 28, 28]).numpy() * 255.  # &#x6062;&#x590D;&#x4E3A;0~255&#x8303;&#x56F4;
x_hat = x_hat.astype(np.uint8)
save_images(x_hat, 'vae_images/rec_epoch%d.png' % epoch)  # &#x4FDD;&#x5B58;&#x91CD;&#x5EFA;&#x56FE;&#x7247;

图片重建的效果如下图所示。分别显示了在第1、10、100个Epoch时，输入测试集的图片，获得的重建效果，每张图片的左5列为真实图片，右5列为对应的重建效果。

图片重建：epoch=0

图片重建：epoch=49

图片重建：epoch=99

图片生成：epoch=0

图片生成：epoch=49

图片生成：epoch=99

可以看到，图片重建的效果是要略好于图片生成的，这也说明了图片生成是更为复杂的任务，VAE模型虽然具有图片生成的能力，但是生成的效果仍然不够优秀，人眼还是能够轻松地分辨出及其生成的和真实的图片样本。下一章将要介绍的生成对抗网络在图片生成方面表现更为优秀。

VAE图片生成实战完整代码

import os
import tensorflow as tf
import numpy as np
from tensorflow import keras
from tensorflow.keras import Sequential, layers
from PIL import Image
from matplotlib import pyplot as plt
import ssl

from Chapter12.Fashion_MNIST_dataload import get_data

ssl._create_default_https_context = ssl._create_unverified_context

tf.random.set_seed(22)
np.random.seed(22)
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
assert tf.__version__.startswith('2.')

def save_images(imgs, name):
    new_im = Image.new('L', (280, 280))

    index = 0
    for i in range(0, 280, 28):
        for j in range(0, 280, 28):
            im = imgs[index]
            im = Image.fromarray(im, mode='L')
            new_im.paste(im, (i, j))
            index += 1

    new_im.save(name)

h_dim = 20
batchsz = 512
lr = 1e-3

(x_train, y_train), (x_test, y_test) = get_data()
x_train, x_test = x_train.astype(np.float32) / 255., x_test.astype(np.float32) / 255.

we do not need label
train_db = tf.data.Dataset.from_tensor_slices(x_train)
train_db = train_db.shuffle(batchsz * 5).batch(batchsz)
test_db = tf.data.Dataset.from_tensor_slices(x_test)
test_db = test_db.batch(batchsz)

print(x_train.shape, y_train.shape)
print(x_test.shape, y_test.shape)

z_dim = 10

class VAE(keras.Model):
    # &#x53D8;&#x5206;&#x81EA;&#x7F16;&#x7801;&#x5668;
    def __init__(self):
        super(VAE, self).__init__()

        # Encoder&#x7F51;&#x7EDC;
        self.fc1 = layers.Dense(128)
        self.fc2 = layers.Dense(z_dim)  # get mean prediction
        self.fc3 = layers.Dense(z_dim)

        # Decoder&#x7F51;&#x7EDC;
        self.fc4 = layers.Dense(128)
        self.fc5 = layers.Dense(784)

    def encoder(self, x):
        # &#x83B7;&#x5F97;&#x7F16;&#x7801;&#x5668;&#x7684;&#x5747;&#x503C;&#x548C;&#x65B9;&#x5DEE;
        h = tf.nn.relu(self.fc1(x))
        # &#x83B7;&#x5F97;&#x5747;&#x503C;&#x5411;&#x91CF;
        mu = self.fc2(h)
        # &#x83B7;&#x5F97;&#x65B9;&#x5DEE;&#x7684;log&#x5411;&#x91CF;
        log_var = self.fc3(h)

        return mu, log_var

    def decoder(self, z):
        # &#x6839;&#x636E;&#x9690;&#x85CF;&#x53D8;&#x91CF;z&#x751F;&#x6210;&#x56FE;&#x7247;&#x6570;&#x636E;
        out = tf.nn.relu(self.fc4(z))
        out = self.fc5(out)
        # &#x8FD4;&#x56DE;&#x56FE;&#x7247;&#x6570;&#x636E;&#xFF0C;784&#x5411;&#x91CF;
        return out

    def reparameterize(self, mu, log_var):
        # reparameterize&#x6280;&#x5DE7;&#xFF0C;&#x4ECE;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x91C7;&#x6837;epsilon
        eps = tf.random.normal(log_var.shape)
        # &#x8BA1;&#x7B97;&#x6807;&#x51C6;&#x5DEE;
        std = tf.exp(log_var*0.5)
        # reparameterize&#x6280;&#x5DE7;
        z = mu + std * eps
        return z

    def call(self, inputs, training=None):
        # &#x524D;&#x5411;&#x8BA1;&#x7B97;
        # &#x7F16;&#x7801;&#x5668;[b, 784] => [b, z_dim], [b, z_dim]
        mu, log_var = self.encoder(inputs)
        # &#x91C7;&#x6837;reparameterization trick
        z = self.reparameterize(mu, log_var)
        # &#x901A;&#x8FC7;&#x89E3;&#x7801;&#x5668;&#x751F;&#x6210;
        x_hat = self.decoder(z)
        # &#x8FD4;&#x56DE;&#x751F;&#x6210;&#x6837;&#x672C;&#xFF0C;&#x53CA;&#x5176;&#x5747;&#x503C;&#x4E0E;&#x65B9;&#x5DEE;
        return x_hat, mu, log_var

&#x521B;&#x5EFA;&#x7F51;&#x7EDC;&#x5BF9;&#x8C61;
model = VAE()
model.build(input_shape=(4, 784))
&#x4F18;&#x5316;&#x5668;
optimizer = tf.optimizers.Adam(lr)

for epoch in range(100):  # &#x8BAD;&#x7EC3;100&#x4E2A;Epoch

    for step, x in enumerate(train_db):  # &#x904D;&#x5386;&#x8BAD;&#x7EC3;&#x96C6;
        # &#x6253;&#x5E73;&#xFF0C;[b, 28, 28] => [b, 784]
        x = tf.reshape(x, [-1, 784])
        # &#x6784;&#x5EFA;&#x68AF;&#x5EA6;&#x8BB0;&#x5F55;&#x5668;
        with tf.GradientTape() as tape:
            # &#x524D;&#x5411;&#x8BA1;&#x7B97;
            x_rec_logits, mu, log_var = model(x)
            # &#x91CD;&#x5EFA;&#x635F;&#x5931;&#x503C;&#x8BA1;&#x7B97;
            rec_loss = tf.nn.sigmoid_cross_entropy_with_logits(labels=x, logits=x_rec_logits)
            rec_loss = tf.reduce_sum(rec_loss) / x.shape[0]

            # &#x8BA1;&#x7B97;KL&#x6563;&#x5EA6; (mu, var) ~ N (0, 1)
            # &#x516C;&#x5F0F;&#x53C2;&#x8003;&#xFF1A;https://stats.stackexchange.com/questions/7440/kl-divergence-between-two-univariate-gaussians
            kl_div = -0.5 * (log_var + 1 - mu**2 - tf.exp(log_var))
            kl_div = tf.reduce_sum(kl_div) / x.shape[0]
            # &#x5408;&#x5E76;&#x8BEF;&#x5DEE;&#x9879;
            loss = rec_loss + 1. * kl_div
        # &#x81EA;&#x52A8;&#x6C42;&#x5BFC;
        grads = tape.gradient(loss, model.trainable_variables)
        # &#x81EA;&#x52A8;&#x66F4;&#x65B0;
        optimizer.apply_gradients(zip(grads, model.trainable_variables))

        if step % 100 == 0:
            # &#x6253;&#x5370;&#x8BAD;&#x7EC3;&#x8BEF;&#x5DEE;
            print(epoch, step, 'kl div:', float(kl_div), 'rec loss:', float(rec_loss))

    # evaluation
    # &#x6D4B;&#x8BD5;&#x751F;&#x6210;&#x6548;&#x679C;&#xFF0C;&#x4ECE;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x968F;&#x673A;&#x91C7;&#x6837;z
    z = tf.random.normal((batchsz, z_dim))
    logits = model.decoder(z)  # &#x4EC5;&#x901A;&#x8FC7;&#x89E3;&#x7801;&#x5668;&#x751F;&#x6210;&#x56FE;&#x7247;
    x_hat = tf.sigmoid(logits)  # &#x8F6C;&#x6362;&#x4E3A;&#x50CF;&#x7D20;&#x8303;&#x56F4;
    x_hat = tf.reshape(x_hat, [-1, 28, 28]).numpy() *255.

    x_hat = x_hat.astype(np.uint8)
    save_images(x_hat, 'Vae_images_sampled02/sampled_epoch%d.png' % epoch)  # &#x4FDD;&#x5B58;&#x751F;&#x6210;&#x56FE;&#x7247;

    # &#x91CD;&#x5EFA;&#x56FE;&#x7247;&#xFF0C;&#x4ECE;&#x6D4B;&#x8BD5;&#x673A;&#x91C7;&#x6837;&#x56FE;&#x7247;
    x = next(iter(test_db))
    logits, _, _ = model(tf.reshape(x, [-1, 784]))  # &#x6253;&#x5E73;&#x5E76;&#x9001;&#x5165;&#x81EA;&#x7F16;&#x7801;&#x5668;
    x_hat = tf.sigmoid(logits)  # &#x5C06;&#x8F93;&#x51FA;&#x8F6C;&#x6362;&#x4E3A;&#x50CF;&#x7D20;&#x503C;
    # &#x6062;&#x590D;&#x4E3A;28&#xD7;28&#xFF0C;[b, 784] => [b, 28, 28]
    x_hat = tf.reshape(x_hat, [-1, 28, 28])
    # &#x8F93;&#x5165;&#x7684;&#x524D;50&#x5F20;+&#x91CD;&#x5EFA;&#x7684;&#x524D;50&#x5F20;&#x56FE;&#x7247;&#x5408;&#x5E76;&#xFF0C;[b, 28, 28] => [2b, 28, 28]
    x_concat = tf.concat([x[:50], x_hat[:50]], axis=0)
    x_concat = x_concat.numpy() * 255.  # &#x6062;&#x590D;&#x4E3A;0~255&#x8303;&#x56F4;
    x_concat = x_concat.astype(np.uint8)
    save_images(x_concat, 'Vae_images_rec02/rec_epoch%d.png' % epoch)  # &#x4FDD;&#x5B58;&#x91CD;&#x5EFA;&#x56FE;&#x7247;

Original: https://blog.csdn.net/weixin_43360025/article/details/120679466
Author: 炎武丶航
Title: 深度学习之自编码器（5）VAE图片生成实战

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691545/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

点云语义分割大合集

一、PointNet 二、PointNet++ 三、KPConv 四、RandLA-Net 五、BAAF-Net Original: https://blog.csdn.net/u…

人工智能 2023年5月26日
0070
DataFrame 数据框与Numpy ndarray 的转换

在处理的数据的时候，最常遇到的就是使用 Pandas 的 Dataframe 与 Numpy 的 ndarray。以下以 mtcars 为例，该数据集包含 32 笔汽车模型的数据,…

人工智能 2023年7月7日
00101
java计算机毕业设计web家教管理系统源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月26日
0091
轻量型目标检测算法一次看个够

序言不知道大家有没有发现，近两年目标检测算法发展非常的快，恍惚一看，单阶段算法几乎统一了目标检测，各种高性能的目标检测算法层出不穷，印象中是在YOLOv4出来后，基于YOLO的改…

人工智能 2023年6月17日
0095
mmcv急速上手

官方学习文档地址：https://mmcv.readthedocs.io/zh_CN/latest/understand_mmcv/registry.html注意args是mmcv…

人工智能 2023年7月9日
0051
ECA 注意力模块原理分析与代码实现

前言本文介绍ECA注意力模块，它是在ECA-Net中提出的，ECA-Net是2020 CVPR中的论文；ECA模块可以被用于CV模型中，能提取模型精度，所以给大家介绍一下它的原…

人工智能 2023年7月28日
0066
R语言单因素方差分析（One-Way ANOVA）实战：探索性数据分析（EDA）、单因素方差分析模型结果解读（检查模型假设）、分析不同分组的差异TukeyHSD、单因素方差分析的结果总结

R语言单因素方差分析（One-Way ANOVA）实战：探索性数据分析（EDA）、单因素方差分析模型结果解读（检查模型假设）、分析不同分组的差异TukeyHSD、单因素方差分析的结…

人工智能 2023年7月15日
0044
NeurIPS2019 BBTP-Weakly Supervised Instance Segmentation using the Bounding Box Tightness Prior

https://proceedings.neurips.cc/paper/2019/file/e6e713296627dff6475085cc6a224464-Paper.pdf参…

人工智能 2023年7月14日
0057
智能窗帘控制(语音、时间、光、红外)

设计简介：本设计是一款智能窗帘控制(光、红外、时间、语音)，主要实现以下功能： [En] This design is an intelligent curtain contro…

人工智能 2023年5月25日
0070
LINUX系统下：Cuda+Cudnn+Tensorflow-GPU环境配置学习总结

1.cuda+cudnn安装 1.1下载cuda 1.1.1查看系统支持的cuda版本（可以安装低于该版本的，不能超过该版本） nvidia-smi 1.1.2下载cuda cud…

人工智能 2023年5月23日
00103
最小二乘法(Least square method)&RANSAC【学习笔记】

一、最小二乘法(Least Square Method) 1.1 线性回归概念【转自百度百科】线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种…

人工智能 2023年6月4日
00123
【YOLOv5实战5】基于YOLOv5的交通标志识别系统-YOLOv5整合PyQt5

实战博客指引：实战环境搭建自定义数据集模型训练模型测试与评估 YOLOv5整合PyQt5 经过前四步已经成功地搭建YOLOv5环境并完成了交通标志识别系统。但是由于YOLO…

人工智能 2023年7月21日
0072
机器学习算法——贝叶斯分类器4（半朴素贝叶斯分类器）

为了降低贝叶斯公式中估计后验概率的困难，朴素贝叶斯分类器采用了属性条件独立性假设，但在现实任务中这个假设往往很难成立。于是，人们尝试对属性条件独立性假设进行一定程度的放松，由此产生…

人工智能 2023年7月2日
0086
矩池云上安装caffe gpu教程

选用CUDA10.0镜像添加nvidia-cuda和修改apt源 curl -fsSL https://mirrors.aliyun.com/nvidia-cuda/ubuntu…

人工智能 2023年6月4日
0083
Jetson Xavier NX Yolov5的搭建及配合Intel Realsense D435i的使用

该实验需分为三步来完成1.在Jetson Xavier NX上搭建Yolov5。2.安装Intel Realsense D435i的SDK。3.配合YOLOV5实现实时目标检测。 …

人工智能 2023年7月9日
00172
割草机器人芯片选型及各厂家产品对比

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习之自编码器（5）VAE图片生成实战

深度学习之自编码器（5）VAE图片生成实战

大家都在看