Keras深度学习实战（24）——从零开始构建单词向量

Keras深度学习实战（24）——从零开始构建单词向量
Keras深度学习实战（24）——从零开始构建单词向量
- 0. 前言
  
  1. 单词向量
  
  1.1 Word2Vec 原理
  
  1.2 构建单词向量
  
  1.3 神经网络架构
  
  2. 使用 Keras 从零开始构建单词向量
  
  3. 测量单词向量之间的相似度
  
  小结
  
  系列链接
0. 前言

在解决文本相关问题时，传统方法通常需要对单词进行独热编码。但是，如果数据集中具有数千个不同的单词，则生成的独热编码矢量将具有数千个维度，这会导致计算代价十分高昂。此外，在这种情况下，相似的单词并不具备相似的向量。因此，我们需要研究如何对文本数据进行编码，以使相似的数据具有相似的编码向量。

1. 单词向量

 1.1 Word2Vec 原理

Word2Vec 是一种可以将相似单词编码为相似向量的方法。在了解 Word2Vec 原理之前，我们首先考虑以下问题，假设我们有以下输入句子：
```
I love watching movie
I like watching movie
```
传统方法中，对单词进行独热编码，输出结果如下所示：

单词独热编码

I 1 0 0 0 0

love 0 1
相关阅读:
【图像去噪】基于边缘增强扩散 (cEED) 和 Coherence Enhancing Diffusion (cCED) 滤波器实现图像去噪附matlab代码
 【14】c++设计模式——＞工厂模式
 SpringColud——Eureka注册中心
 CSS3------盒模型
 Python-算法编程100例-滑动窗口（入门级）
常见的Java上机面试题
 写给Java程序员的Solidity合约快速入门
 javascript二维数组(20)JSON对象
 数组、单链表和双链表介绍以及双向链表的C/C++实现
 powershell安装权限问题/linux安装powershell
原文地址：https://blog.csdn.net/LOVEmy134611/article/details/125453305

单词	独热编码
I	1	0	0	0	0
love	0	1

Keras深度学习实战（24）——从零开始构建单词向量

0. 前言

1. 单词向量

1.1 Word2Vec 原理