词表示

在NLP领域,自然语言通常是指以文本的形式存在,但是计算无法对这些文本数据进行计算,通常需要将这些文本数据转换为一系列的数值进行计算。那么具体怎么做的呢?这里就用到词向量的概念。

一般情况下,当我们拿到文本数据的时候,会先对文本进行分词,然后将每个单词映射为相应的词向量,最后基于这些词向量进行计算,达到预设任务的效果,下边我们分如下几节展开介绍词向量相关的知识。

内容组织如下:

  • One-Hot编码: 一种简单的单词表示方式
  • Word Embedding: 一种分布式单词表示方式
  • Word2Vec: 一种词向量的训练方法
    1. Word2Vec概述
    1. Skip-gram训练词向量原理
    1. Skip-gram网络结构
    1. 负采样解决大规模分类问题
  • 关于词向量的一些有趣应用
    1. 相似度计算
    1. 词聚类
    1. 词关系推理

Original: https://www.cnblogs.com/beyoncewxm/p/16628522.html
Author: xiaomin_beyonce
Title: 词表示

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/566421/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球