【Pytorch深度学习实战】（4）前馈神经网络（FNN）

2023年7月13日上午5:44 • 人工智能 • 阅读 48

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎
📝个人主页－Sonhhxg_柒的博客_CSDN博客📃
🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝
📣系列专栏 – 机器学习【ML】自然语言处理【NLP】深度学习【DL】

🖍foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。
如果你对这个系列感兴趣的话，可以关注订阅哟👋

FNN模型是2016提出来的，当时各大公司都还在探索如何将深度学习技术应用于推荐系统，一些头部公司开始了初步的尝试，比如Google应用并发表了Wide&Deep模型，微软在Bing的搜索广告场景尝试了Deep Crossing模型，都是那个时代的代表模型，对业界发展起到了重要作用。不过即使是号称完全自动化特征工程的Deep Crossing模型，也没有做显式特征交叉。那深度学习时代，能否让模型既有像FM那样做显式特征交叉，又具备DNN的隐式高阶交叉和泛化能力呢？FNN就是这样的尝试，试图将FM和DNN结合起来，模型结构如图所示。

模型的核心思想是采用FM训练得到的隐向量作为神经网络第一层权重的初始值，之后是隐藏层，最后是点击率预估的输出。其实是一个Embedding + MLP结构，特殊的是Embedding的初始值是FM模型已经预训练好的结果。FM与Embedding的初始化对应关系如图所示。

由于Embedding的初始值得到了FM的预训练，因此在训练DNN的时候，模型收敛速度更快；并且Embedding包含了组合特征的信息，可以不用做额外的特征工程；DNN在FM的基础上对特征组合做了进一步的高阶特征组合，模型能得到更好的效果。不过由于整个训练过程分成了两阶段，其实不是一个端到端的训练过程，而是一种基于参数的迁移学习。

FNN存在的问题有：

Embedding参数受FM的影响，模型能力受限于FM表征能力的上限；
训练过程分两阶段进行，过程较复杂，效率不高；
FNN只能学习高阶特征组合，没有对低阶特征建模，但很多特征的高阶交叉是无意义的。

前馈神经网络Pytorch的实现

import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms

&#x8BBE;&#x5907;&#x914D;&#x7F6E;
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

&#x8D85;&#x53C2;&#x6570;
input_size = 784
hidden_size = 500
num_classes = 10
num_epochs = 5
batch_size = 100
learning_rate = 0.001

MNIST &#x6570;&#x636E;&#x96C6;
train_dataset = torchvision.datasets.MNIST(root='../../data',
                                           train=True,
                                           transform=transforms.ToTensor(),
                                           download=True)

test_dataset = torchvision.datasets.MNIST(root='../../data',
                                          train=False,
                                          transform=transforms.ToTensor())

&#x6570;&#x636E;&#x52A0;&#x8F7D;&#x5668;
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                           batch_size=batch_size,
                                           shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                          batch_size=batch_size,
                                          shuffle=False)

&#x5177;&#x6709;&#x4E00;&#x4E2A;&#x9690;&#x85CF;&#x5C42;&#x7684;&#x5168;&#x8FDE;&#x63A5;&#x795E;&#x7ECF;&#x7F51;&#x7EDC;
class NeuralNet(nn.Module):
    def __init__(self, input_size, hidden_size, num_classes):
        super(NeuralNet, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        out = self.fc1(x)
        out = self.relu(out)
        out = self.fc2(out)
        return out

model = NeuralNet(input_size, hidden_size, num_classes).to(device)

&#x635F;&#x5931;&#x548C;&#x4F18;&#x5316;&#x5668;
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

&#x8BAD;&#x7EC3;&#x6A21;&#x578B;
total_step = len(train_loader)
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        # Move tensors to the configured device
        images = images.reshape(-1, 28*28).to(device)
        labels = labels.to(device)

        # &#x524D;&#x5411;&#x4F20;&#x64AD;
        outputs = model(images)
        loss = criterion(outputs, labels)

        # &#x5411;&#x540E;&#x4F18;&#x5316;
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'
                   .format(epoch+1, num_epochs, i+1, total_step, loss.item()))

&#x6D4B;&#x8BD5;&#x6A21;&#x578B;
In test phase, we don't need to compute gradients (for memory efficiency)
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        images = images.reshape(-1, 28*28).to(device)
        labels = labels.to(device)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total))

&#x4FDD;&#x5B58;&#x6A21;&#x578B;
torch.save(model.state_dict(), 'model.ckpt')

Original: https://blog.csdn.net/sikh_0529/article/details/126922583
Author: Sonhhxg_柒
Title: 【Pytorch深度学习实战】（4）前馈神经网络（FNN）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689198/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【机器学习】阿里云天池竞赛——工业蒸汽量预测（3）

机器学习经典赛题：工业蒸汽量预测（3）机器学习经典赛题：工业蒸汽量预测（3） * 4.模型训练 – 4.1 回归及相关模型 + 4.1.1 回归的概念 4.1.2 回…

人工智能 2023年6月12日
0088
关于修Bug的一些想法

0. 前言八月份快要结束了，这个月也没有啥输出，今天下班较早，赶一篇学了一年多C++后的一些思考，关于修Bug的一些想法和思路。平时工作中，如果写代码花费一天时间，那调试解决Bu…

人工智能 2023年6月4日
0098
yolov5的anchor详解

以yolov5s v3为例： *anchor长啥样及怎么得到的？以下是yolov5 v3.0中的anchor anchors: 1. [10,13, 16,30, 33,23] …

人工智能 2023年7月5日
00121
提高Tesseract-OCR验证码识别率

Tesseract-OCR训练自己需要的语言在正常使用Tesseract-OCR的默认eng去识别复杂的验证码失败率很高，这时候就需要自己训练出自己需要的语言来提高识别成功率。如…

人工智能 2023年5月23日
00107
CNN中的底层、高层特征、上下文信息、多尺度

一、CNN中的底层、高层特征: 简短总结：分类要求特征有较多的高级信息，回归（定位）要求特征包含更多的细节信息 1）图像的低层特征（对定位任务帮助大，我们可以想想比如轮廓信息都不…

人工智能 2023年7月29日
0062
A9.玻璃制品的成分分析与鉴别-分析与讨论

2022年数学建模国赛（A题/B题/C题）评阅要点文章目录 * – 1. 更新讨论 – + 1.1 题目读几遍都不多 + * 1. “空白处表…

人工智能 2023年5月31日
00107
YOLOV7详细解读（二）论文解读

YOLOV7详细解读（二）论文解读论文解读 YOLOV7详细解读（二）论文解读前言一、YOLOV7是什么？二、论文解读 * 0.摘要 1.引言 2.相关工作 –…

人工智能 2023年6月16日
0050
python中列表数据保留2位小数（一维，二维）

直接转： import numpy as np list_2d =[[0.23222,0.331212,0.21398331],[0.345222,0.391212,0.81398…

人工智能 2023年6月16日
0085
自动驾驶系列（七）——聊聊人机交互中的DMS驾驶员监控系统

DMS驾驶员监控系统，是自动驾驶人机交互的一部分，即通过在汽车上安装光学摄像头和红外摄像头对驾驶员的眼部状态（眼球追踪、实现追踪等）进行实时获取，通过深度学习算法对获取的信息进行分…

人工智能 2023年6月10日
0083
三十二.智能驾驶之多传感器融合技术: MV3D融合方法

MV3D(Muti-view 3D Object Detection)是将3D点云和相机RGB图像在数据级进行前融合的技术,其输入的传感器数据包括: 点云鸟瞰图(Bird eye …

人工智能 2023年6月10日
0068
【技术分享】什么是K折交叉验证？

训练集，即：训练的集合，是用来训练模型的数据集合。通过这部分数据， 学习得到一个模型。训练集可以当做高中刷题的题库，训练的过程可以比作高…

人工智能 2023年6月15日
0071
PyTorch训练模型添加L1/L2正则化的两种实现方式

L1/L2正则化的作用 L1正则化作用到参数会产生更稀疏的解，既能使参数在训练过程中尽量靠近最优解的同时，一些参数为0。L1正则化的稀疏性质被广泛应用于特征选择，可从特征集合中选出…

人工智能 2023年7月23日
0055
算法笔记：ARIMA

1 平稳性平稳性要求经由样本时间序列所得到的拟合曲线，在未来的一段时间内，仍然能按照现在的特征，顺着现在的惯性继续延续下去平稳性要求时间序列的均值和方差不能发生明显的变化（可…

人工智能 2023年6月17日
0060
【数据分析】认识Pandas：DataFrame和Series结构、属性

数据分析工具——Pandas 认识Pandas * Dataframe 结构 – DataFrame 构造方法 dtype参数 Series 结构 – Se…

人工智能 2023年6月11日
0087
基于SOM的数据分类原理及MATLAB实现

目录 * – 一、SOM原理分析 – 二、MATLAB代码分析 – + 2.1 案例描述 + 2.2 样本介绍 + 2.3 网络设计 + 2.4…

人工智能 2023年7月2日
0079
【自动驾驶】单目3D检测M3D-RPN解析与paddle复现

简介作者提出了一种单个的端到端区域建议网络用于多类别3D目标检测。2D和3D检测任务各自的目标是最终对一个对象的所有实例进行分类，而它们在定位目标的维数上是不同的。直观地说，我们…

人工智能 2023年6月2日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch深度学习实战】（4）前馈神经网络（FNN）

🖍foreword

前馈神经网络Pytorch的实现

大家都在看