pytorch基础（十）-自编码器AutoEncoder

2023年6月17日上午4:31 • 人工智能 • 阅读 53

无监督学习
AutoEncoder
*
PCA和Auto-Encoder
denoising AutoEncoders 去噪自编码器
Dropout AutoEncoder
Adversarial AutoEncoder 对抗自编码器
Variational AutoEncoder 变分自编码器
–
- Reparameterization VAE的隐变量的重参数化
- VAE生成模型
AutoEncoder实战
Variational AutoEncoder实战

前面学习的：CNN便于处理位置相关性，对于时间维度的信号序列，使用RNN处理，在时间维度上共享权值；

无监督学习

监督学习，采用有标注的数据进行模型的训练；

实际情况下，存在许多未标注的数据；
pytorch基础（十）-自编码器AutoEncoder

无监督学习的需求；

数据降维；
重建自己，中间的更低维变量就是降维后的数据；
可视化；将高维数据投影到二维三维以可视化；
利用无监督数据；
压缩、去噪、超分辨率；

; AutoEncoder

AE的训练；
MNIST数据的输入就是0和1，适合CE损失，也适合MSE损失；

PCA和Auto-Encoder

PCA是线性变换，可操作空间比较少；

左图：利用PCA和AE将图像数据MNIST降到二维，可视化，左边降维后的数据区分不是特别好，而AE就区分得比较清晰；
右图：文本数据降维可视化；

; denoising AutoEncoders 去噪自编码器

去噪自动编码器；
在输入数据上添加一个高斯噪声，使模型重构原始的数据，学习数据真正的分布；

Dropout AutoEncoder

dropout=0，容易过拟合，所以acc可能不是最高的，dropout=1，欠拟合，acc比较低；

; Adversarial AutoEncoder 对抗自编码器

Variational AutoEncoder 变分自编码器

变分自动编码器；学习隐变量的空间分布(N i N_i N i ,σ i 2 \sigma_i^2 σi 2 )；中间有一个从分布(N i N_i N i ,σ i 2 \sigma_i^2 σi 2 )采样的过程，根据采样出的具体隐变量重构输入。（如果控制n个分布的采样值，那么则可以重构自己想要的数据？）
x->(N i N_i N i ,σ i 2 \sigma_i^2 σi 2 )->sample(i)->reconstruction(i)

编码器计算每个输入数据的低维均值μ和方差，然后从隐变量空间采样，得到Z={Z1,Z …,Zn}，通过解码器生成新数据Y ={Y1,Y2…,Yn}。

损失函数包含两部分，一个是autoencoder的重建误差，一个是

AE重建误差：

KL散度：

假如z和目标分布都是正态分布，KL散度计算如下：
pytorch基础（十）-自编码器AutoEncoder

; Reparameterization VAE的隐变量的重参数化

AE 编码器生成每个输入数据的一一对应的确定的隐变量；而VAE生成每个输入数据对应的隐变量是一个均值和方差（代表了一个分布），它代表了一个分布（隐变量空间），因此从这个分布重建输入数据的时候，需要采样数；这个采样过程是不可微的，因此需要reparameterization这个技巧，将采样数据重新参数化，使得这个采样样本可以参与网络的梯度计算中来。具体过程如下：

VAE生成模型

假设encoder中间生成两个隐变量的空间分布（N 0 N_0 N 0 ,σ 0 2 \sigma_0^2 σ0 2 )和（N 1 N_1 N 1 ,σ 1 2 \sigma_1^2 σ1 2 )，即encoder输出N 0 N_0 N 0 ,σ 0 \sigma_0 σ0 和N 1 N_1 N 1 ,σ 1 \sigma_1 σ1 四个数值，从这两个分布中随机采样得到h 0 h_0 h 0 和h 1 h_1 h 1 ，根据不同h 0 h_0 h 0 和h 1 h_1 h 1 可以得到不同的生成数据；
同理可以生成n个空间分布（N i N_i N i ,σ i 2 \sigma_i^2 σi 2 )，从n个空间分布中随机采样n个隐变量，生成不同的数据；

; AutoEncoder实战

ae.py:

import torch
import torch.nn as nn

class AutoEncoder(nn.Module):
    def __init__(self) -> None:
        super().__init__()

        self.encoder = nn.Sequential(
            nn.Linear(784,256),
            nn.ReLU(inplace=True),
            nn.Linear(256,64),
            nn.ReLU(inplace=True),
            nn.Linear(64,20),
            nn.ReLU(inplace=True)
        )
        self.decoder = nn.Sequential(
            nn.Linear(20,64),
            nn.ReLU(inplace=True),
            nn.Linear(64,256),
            nn.ReLU(inplace=True),
            nn.Linear(256,784),
            nn.Sigmoid(),
        )

    def forward(self, x):
        x = x.flatten(1)
        x = self.encoder(x)
        x = self.decoder(x)
        x = x.view(-1,1,28,28)
        return x

mian.py

from random import shuffle
import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torchvision import datasets,transforms
from ae import AutoEncoder
import visdom

def main():
    mnist_train = datasets.MNIST('data/',train=True, download=True, transform=transforms.Compose([
        transforms.ToTensor()]
    ))
    mnist_test = datasets.MNIST('data/',train=False, download=True, transform=transforms.Compose([
        transforms.ToTensor()]
    ))

    train_loader = DataLoader(mnist_train, batch_size = 32, shuffle=True)
    test_loader = DataLoader(mnist_test, batch_size = 32, shuffle=False)

    x,y = iter(train_loader).next()
    print(x.shape)

    device = torch.device('cpu')
    model = AutoEncoder().to(device)
    criteon = nn.MSELoss()
    optimizer = torch.optim.Adam(model.parameters(), lr = 1e-3)

    vis = visdom.Visdom()
    for epoch in range(1000):
        for batch_idx, (x,y) in enumerate(train_loader):
            x,y = x.to(device), y.to(device)
            x_hat = model(x)
            loss = criteon(x_hat, x)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

        print(epoch, 'loss:', loss.item())
        x,y = iter(test_loader).next()
        with torch.no_grad():
            x_hat = model(x)
        vis.images(x, nrow = 8, win = 'x-ae', opts = dict(title = 'x'))
        vis.images(x_hat, nrow = 8, win = 'x-hat', opts = dict(title = 'x_hat'))

if __name__ == '__main__':
    main()

visdom可视化结果：

Variational AutoEncoder实战

vae. 使中间变量逼近0-1正态分布；

import torch
import torch.nn as nn
import numpy as np

class VarAutoEncoder(nn.Module):
    def __init__(self) -> None:
        super().__init__()

        self.encoder = nn.Sequential(
            nn.Linear(784,256),
            nn.ReLU(inplace=True),
            nn.Linear(256,64),
            nn.ReLU(inplace=True),
            nn.Linear(64,20),
            nn.ReLU(inplace=True)
        )

        self.decoder = nn.Sequential(
            nn.Linear(10,64),
            nn.ReLU(inplace=True),
            nn.Linear(64,256),
            nn.ReLU(inplace=True),
            nn.Linear(256,784),
            nn.Sigmoid(),
        )

    def forward(self, x):
        batchsz = x.size(0)
        x = x.flatten(1)
        h_mu_sigma = self.encoder(x)
        mu, sigma = h_mu_sigma.chunk(2, dim = 1)

        h = mu + sigma * torch.rand_like(sigma)
        kld = 0.5 * torch.sum(
            torch.pow(mu, 2) +
            torch.pow(sigma,2) -
            torch.log(1e-8 + torch.pow(sigma, 2)) -1
        ) / batchsz

        x_hat = self.decoder(h)
        x_hat = x_hat.view(-1,1,28,28)
        return x_hat, kld

main.py

import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torchvision import datasets,transforms
from ae import AutoEncoder
from vae import VarAutoEncoder
import visdom

def main():
    mnist_train = datasets.MNIST('data/',train=True, download=True, transform=transforms.Compose([
        transforms.ToTensor()]
    ))
    mnist_test = datasets.MNIST('data/',train=False, download=True, transform=transforms.Compose([
        transforms.ToTensor()]
    ))

    train_loader = DataLoader(mnist_train, batch_size = 32, shuffle=True)
    test_loader = DataLoader(mnist_test, batch_size = 32, shuffle=False)

    x,y = iter(train_loader).next()
    print(x.shape)

    device = torch.device('cpu')
    model = VarAutoEncoder().to(device)
    criteon = nn.MSELoss()
    optimizer = torch.optim.Adam(model.parameters(), lr = 1e-3)

    vis = visdom.Visdom()
    for epoch in range(1000):
        for batch_idx, (x,y) in enumerate(train_loader):
            x,y = x.to(device), y.to(device)
            x_hat, kld = model(x)
            loss = criteon(x_hat, x)
            if kld is not None:
                elbo = - loss - 1.0 * kld
                loss = -elbo

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

        print(epoch, 'loss:', loss.item())
        x,y = iter(test_loader).next()
        with torch.no_grad():
            x_hat = model(x)
        vis.images(x, nrow = 8, win = 'x-ae', opts = dict(title = 'x'))
        vis.images(x, nrow = 8, win = 'x-hat', opts = dict(title = 'x_hat'))
from random import shuffle
import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torchvision import datasets,transforms
from ae import AutoEncoder
from vae import VarAutoEncoder
import visdom

def main():
    mnist_train = datasets.MNIST('data/',train=True, download=True, transform=transforms.Compose([
        transforms.ToTensor()]
    ))
    mnist_test = datasets.MNIST('data/',train=False, download=True, transform=transforms.Compose([
        transforms.ToTensor()]
    ))

    train_loader = DataLoader(mnist_train, batch_size = 32, shuffle=True)
    test_loader = DataLoader(mnist_test, batch_size = 32, shuffle=False)

    x,y = iter(train_loader).next()
    print(x.shape)

    device = torch.device('cpu')
    model = VarAutoEncoder().to(device)
    criteon = nn.MSELoss()
    optimizer = torch.optim.Adam(model.parameters(), lr = 1e-3)

    vis = visdom.Visdom()
    for epoch in range(1000):
        for batch_idx, (x,y) in enumerate(train_loader):
            x,y = x.to(device), y.to(device)
            x_hat, kld = model(x)
            loss = criteon(x_hat, x)
            if kld is not None:
                elbo = - loss - 0.01 * kld
                loss = -elbo

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

        print(epoch, 'loss:', loss.item(), 'kld loss:', 0.01*kld.item())
        x,y = iter(test_loader).next()
        with torch.no_grad():
            x_hat, kld = model(x)
        vis.images(x, nrow = 8, win = 'x-ae', opts = dict(title = 'x'))
        vis.images(x_hat, nrow = 8, win = 'x-hat', opts = dict(title = 'x_hat'))

if __name__ == '__main__':
    main()

VAE需要更多时间去训练。
visdom可视化：

Original: https://blog.csdn.net/sherryhwang/article/details/124664589
Author: sherryhwang
Title: pytorch基础（十）-自编码器AutoEncoder

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628514/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python实现kmeans聚类

目录一、先上手撸代码！ 1、导库、导数据 2、核心算法 3、可视化部分二、调库代码！（sklearn）一、先上手撸代码！ 1、首先是导入所需要的库和数据 import pan…

人工智能 2023年6月13日
0069
基于OpenCV实现对图片及视频中感兴趣区域颜色识别

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位🧡 Python实战微信订餐小程序 🧡 进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯…

人工智能 2023年7月18日
0061
8.4 帕德逼近

文章目录简介例子通解 python代码测试简介帕德逼近 Padé approximant_是一种对任意函数的有理函数逼近。这个是高中数学内容，经常在高考题中出现，但是呢…

人工智能 2023年6月16日
00108
综述：计算机视觉中的通道注意力机制

综述：计算机视觉中的通道注意力机制 * – 1. INTRODUCTION: – 2. 计算机视觉中的注意力机制 – + 2.1. 通用形式 +…

人工智能 2023年7月29日
00124
【pyecharts | 颜色配置】关于pyecharts中自定义颜色问题详解

前言最近微信上经常有小伙伴问到 pyecharts颜色配置的问题，其实 pyecharts颜色配置很简单，不过由于可以配置的方式有点多，经常让人混淆，所以本文汇总一下在pyech…

人工智能 2023年7月15日
0082
Docker 部署深度学习运行deeplabV3

文章目录前言一、Docker简介二、帮助命令三、镜像常用命令四、容器常用命令五、配置深度学习环境六、运行deeplabV3代码七、提交容器，保存镜像总结前言本…

人工智能 2023年6月17日
0052
基于遗传算法的无人机监视覆盖航路规划算法研究

基于遗传算法的无人机监视覆盖航路规划算法研究人工智能技术与咨询点击蓝字 · 关注我们来源：《计算机科学与应用》，作者李御驰等关键词: 人工势场法；无人机；监视覆盖航路…

人工智能 2023年6月1日
0068
python库之pandas（2022/7/18）

一.引言写作文章的目的，记录一下自己的学习过程和安排一下自己研究生的生活。（上午时间来写作，下午去写论文）二.pandas 1.引入pandas库 import numpy a…

人工智能 2023年7月7日
0051
MongoDB是什么？非关系型数据库的优点？安装使用教程

哈喽！大家好，我是小奇，一位热爱分享的程序员小奇打算以轻松幽默的对话方式来分享一些技术，如果你觉得通过小奇的文章学到了东西，那就给小奇一个赞吧文章持续更新，可以微信搜索【小奇JAV…

人工智能 2023年7月29日
0062
Python Apex Legends 武器自动识别与压枪全过程记录

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年5月30日
00116
非常全面的数字人解决方案

github TheRamU/Fay: 语音互动，直播自动带货虚拟数字人 (github.com) gitee fay: 这是一个数字人项目，包含python内核及ue数字人模型…

人工智能 2023年5月27日
00101
深度学习笔记(十三):IOU、GIOU、DIOU、CIOU、EIOU、Focal EIOU、alpha IOU损失函数分析及Pytorch实现

文章目录 IOU-loss GIOU-loss DIOU-loss CIOU-loss EIOU-loss和Focal EIOU-loss alpha IOU SIOU-loss …

人工智能 2023年7月20日
00435
torch.nn.parallel.DistributedDataParallel

Node: 一个节点, 可以理解为一台电脑. Device: 工作设备, 可以简单理解为一张卡, 即一个GPU. Process: 一个进程, 可以简单理解为一个Python程序….

人工智能 2023年7月21日
0047
100天精通Python（数据分析篇）——第53天：初始pandas模块

### 回答1：这个问题的意思是询问一个学习 Python 数据分析_的 _100 天_计划，我的回答如下： _Python 数据分析_是非常重要的技能之一，学习它需要长时间的实…

人工智能 2023年7月14日
0071
Label Matching Semi-Supervised Object Detection

https://github.com/hikvision-research/SSOD Motivation label mismatching导致 confirmation bia…

人工智能 2023年7月9日
0063
神经网络常见评价指标超详细介绍（ROC曲线、AUC指标、AUROC）

目录 * – 一、基本概念 – 二、ROC曲线 – 三、AUROC（AUC指标） – 四、实例介绍 – + 4.1 公式…

人工智能 2023年7月3日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31