在NLP领域,自然语言通常是指以文本的形式存在,但是计算无法对这些文本数据进行计算,通常需要将这些文本数据转换为一系列的数值进行计算。那么具体怎么做的呢?这里就用到词向量的概念。
一般情况下,当我们拿到文本数据的时候,会先对文本进行分词,然后将每个单词映射为相应的词向量,最后基于这些词向量进行计算,达到预设任务的效果,下边我们分如下几节展开介绍词向量相关的知识。
内容组织如下:
- One-Hot编码: 一种简单的单词表示方式
- Word Embedding: 一种分布式单词表示方式
- Word2Vec: 一种词向量的训练方法
-
- Word2Vec概述
-
- Skip-gram训练词向量原理
-
- Skip-gram网络结构
-
- 负采样解决大规模分类问题
- 关于词向量的一些有趣应用
-
- 相似度计算
-
- 词聚类
-
- 词关系推理
Original: https://www.cnblogs.com/beyoncewxm/p/16628522.html
Author: xiaomin_beyonce
Title: 词表示
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/566421/
转载文章受原作者版权保护。转载请注明原作者出处!