Datawhale九月组队学习–情感分析–Task04

2023年5月30日下午7:47 • 人工智能 • 阅读 83

往期指路：

本篇主要是将卷积神经网络应用到了情感分类任务当中，本篇所用的模型来自论文Convolutional Neural Networks for Sentence Classification，了解细节的小伙伴们可以查看原文。
在上一个教程中，我们研究了FastText模型，该模型通过将bi-gram显式添加到文本末尾来使用bi-gram，在这个CNN模型中，我们将使用多个不同大小的filter，这些filter将查看文本中的bi-grams（a 1×2 filter）、tri-grams（a 1×3 filter）and/or n-grams（a 1x n n n filter）

一、模型搭建流程

1、数据预处理
2、构建模型
3、训练模型
4、模型验证

二、数据预处理要点记录

与 task3 使用FastText模型的方法不同，本节不再需要刻意地创建bi-gram将它们附加到句子末尾。

这里的处理方法依然是：

加载IMDB数据集
构建词典，加载预训练词向量
创建迭代器

三、模型搭建要点记录

问题：如何将CNN用于文本处理？

1、图像一般是二维的，而文本是一维的。所以我们可以将一段文本中的每个单词沿着一个轴展开，向量中的元素沿着另一个维度展开。

2、然后我们可以使用一个 [n x emb_dim] 的filter。这将完全覆盖 n n n 个words，因为它们的宽度为emb_dim 尺寸。这里有4个词和5维嵌入，创建了一个[4×5] “image” 张量。一次覆盖两个词（即bi-grams)）的filter 将是 [2×5] filter，filter 的每个元素都有一个与之相关的 weight。此filter 的输出将是一个实数，它是filter覆盖的所有元素的加权和。

3、filter “down” 移动图像（或穿过句子）以覆盖下一个bi-gram，并计算另一个输出（weighted sum）。

4、最后，filter 再次向下移动，并计算此 filter 的最终输出。

实现细节

1、in_channels参数是图像中进入卷积层的”通道”数，但是当使用文本时，我们只有一个通道，即文本本身。
2、out_channels是 filters 的数量，kernel_size是 filters 的大小。我们的每个”卷积核大小”都将是 [n x emb_dim] 其中 n n n 是n-grams的大小。

注：如果句子的长度小于实验设置的最大filter，那么必须将句子填充到最大filter的长度。

四、模型训练要点记录

训练和前面task一样，我们初始化优化器、损失函数（标准），并将模型和标准放置在GPU上。

以上就是Task04的全部内容了，接下来的学习继续坚持呀~。

Original: https://blog.csdn.net/weixin_44186785/article/details/120464839
Author: 二进制研究员
Title: Datawhale九月组队学习–情感分析–Task04

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/544785/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

微信语音技术原理_微信语音电话是如何实现的？

贴出我之前的答案，一个原则。 [En] Post my previous answer, a principle. 微信电话本上线了！对运营商的冲击有多大？这个问题先放一放。作为一…

人工智能 2023年5月27日
0083
#保姆级教学「图像评价指标」（MSE、LPIPS）——理论+代码

*均方误差MSE 给定一个大小为 m n的原图I和生成图K，计算均方误（ MSE*）定义为：的干净图像和噪声图像，均方误差定义为： #原图为I，生成图为K #pytorch ——直…

人工智能 2023年7月28日
00203
Pytorch基础 softmax回归的实现

和之前的逻辑回归类似，针对上篇的Fashion Mnist数据集进行处理；详细的数学推导这里不给出，直接给出代码；如果采用自定义方式搭建网络方式： import torch i…

人工智能 2023年6月17日
0069
【leetcode】两数之和

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
0088
ResNet与Densenet之间的关系以及区别

一、ResNet和DenseNet的之间的关系以及区别，如参数量和训练速度。简单介绍下ResNet以及DenseNet ResNet的最大的贡献是缓解深层的神经网络训练中的梯度消…

人工智能 2023年5月26日
0099
【计算机视觉】图像增强—-直方图均衡化

个人简介： 📦个人主页：赵四司机🏆学习方向：JAVA后端开发📣种一棵树最好的时间是十年前，其次是现在！🧡喜欢的话麻烦点点关注喔，你们的支持是我的最大动力。文章目录一.什么是图像…

人工智能 2023年6月18日
0097
Opencv图像边缘检测——Roberts算子（手写）、Sobel算子（手写和调包）、Scharr算子、Laplacian算子

一、Roberts算子 Roberts算子即交叉微分算子，是基于交叉差分的梯度算子。此算法通过局部差分来计算检测图像的边缘线条，对噪声敏感。 Roberts 交叉微分算子分别为主对…

人工智能 2023年6月18日
0081
【深度学习入门项目】使用tensorflow训练CNN实现口罩识别

目录 1. 导入所需要的python包 2. 准备数据集 3. 训练模型 3.1 定义参数变量 3.2 数据读取与预处理 3.3 搭建神经网络框架 3.4 结果可视化函数 3.5 …

人工智能 2023年7月4日
0060
【Spring学习笔记】

文章目录笔记简记 1 SPring框架概述 * 1) Spring5 框架概述 2）Spring5 入门案例 2 IOC * 1) IOC概念和原理 2）IOC（BeanFact…

人工智能 2023年6月27日
0071
矩阵的数组存储

矩阵在图像学中运用非常广，同时，矩阵在计算机中的存储其实都可以转为一维数组进行存储，对于某些特殊矩阵可以采用特别的压缩存储方式。（1）对称矩阵。即aij=aji，对称位置的元素相…

人工智能 2023年6月26日
0051
opencv训练自己的模型，实现特定物体的识别

1.说明 opencv安装包中有训练好的分类器文件，可以实现人脸的识别。当然，我们也可以训练自己的分类器文件，实现对特定物体的识别。本文章就详细介绍下如何训练自己的分类器文件。 2…

人工智能 2023年6月19日
00100
DNS图解（秒懂 + 史上最全）

文章很长，而且持续更新，建议收藏起来，慢慢读！ Java 高并发发烧友社群：疯狂创客圈（总入口）奉上以下珍贵的学习资源：免费赠送经典图书：极致经典 + 社群大片好评《 …

人工智能 2023年7月29日
0060
一、RNN模型与 NLP应用 —— 数据预处理

一、RNN模型与 NLP应用 —— 数据预处理前言数据处理简介: * 文本处理的步骤(1.-5.): 使用逻辑回归(LR)训练情感分类: – 效果不好 Simpl…

人工智能 2023年5月28日
00125
天池学习赛：保险反欺诈预测（附代码）

前言一、赛题介绍二、数据描述性统计 1.查看缺失值、重复值、统计目标变量比例 2.查看异常值 3.查看训练集与测试集数据分布 3.1 查看数值变量 3.2 查看部分分类变量 4…

人工智能 2023年7月4日
0073
文本识别CRNN模型介绍以及pytorch代码实现

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、CRNN模型介绍 * 1.模型结构 2.CTCLoss beam search 二、使用pyt…

人工智能 2023年7月23日
0056
python调用Gige网口工业相机 opencv

目录原理色彩空间 Bayer 与 deBayer 图像数据处理代码实现前期准备完整代码原理色彩空间图片信息的表示不止只有我们熟知的RGB,还有HLS、HSV、YUV…

人工智能 2023年7月20日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Datawhale九月组队学习–情感分析–Task04

一、 模型搭建流程

二、 数据预处理要点记录

三、 模型搭建要点记录

四、模型训练要点记录

大家都在看

一、模型搭建流程

二、数据预处理要点记录

三、模型搭建要点记录