码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 连续词袋模型(Continous bag of words, CBOW)


    将高维度的词表示转换为低纬度的词表示方法我们称之为词嵌入(word embedding)。

    CBOW是通过周围词去预测中心词的模型。(Skip-gram是用中心词预测周围词)

    CBOW模型的结构

     

     最左边为上下文词,这些词用One-hot编码表示,维度为1*V(上图容易让人理解错误)

    每个上下文的词向量都需要乘以一个共享的矩阵W,由于整个模型是一个神经网络结构,我们将这个存入输入层和隐藏层之间的矩阵定义为W,矩阵的维度为V*N(N是我们自己定义的一个维度)。

    One-hot编码矩阵乘以矩阵W得到的是一个1*N的向量。

    因为一个中心词会有多个上下文词,而且每个上下文词都会计算得到一个1*N向量,将这些1*N的向量相加取平均,得到中间层(隐藏层)的向量,这个向量也是1*N,之后这个向量需要乘以一个N*V的矩阵W2,最终得到的输出层维度为1*V。

    然后将1*V的向量softmax处理得到新的1*V向量,在V个取值中概率值最大的数字对应的位置所表示的词就是预测结果。

    上述就是CBOW模型的前向计算过程。

    那个这个模型的训练过程如下:

    1.当前词的上下文词语的独热编码输入到输入层;

    2.这些词分别乘以同一个矩阵W1后分别得到各自的1*N向量

    3.将这些1*N向量相加取平均得到一个1*N向量

    4.将这个1*N向量乘以矩阵W2,称为一个1*V向量

    5.将1*V向量softmax归一化后输出取每个词的概率向量1*V

    6.将概率值最大的数对应的词作为预测词。

    7.将预测的结果1*V向量和真实标签1*V向量计算误差,一般是交叉熵

    8.在每次前向传播之后反向传播误差,不断调整w1和w2的值。

    预测的时候,做一次前向传播即可得到预测的中心词结果。

    其实,我们在做CBOW时,最终要的是W1这个V*N矩阵。

  • 相关阅读:
    Python技法:浮点数取整、格式化和NaN处理
    S/4HANA(本地部署或云版)跟 SAP 家族系统以及非SAP系统的集成,到底什么是推荐的方式?
    面试必备:HashMap底层源码原来是这么简单(分析)
    关于羊了个羊,我真的是娘了个娘。
    【JAVA UI】【HarmonyOS】 鸿蒙setBindStateChangedListener的基本使用
    R语言和医学统计学(6):重复测量方差分析
    求你了,别在高并发场景中使用悲观锁了!
    LeetCode 刷题系列 -- 47. 全排列 II
    计算机网络 - NAT技术
    以太网协议介绍(ARP、UDP、ICMP、IP)
  • 原文地址:https://blog.csdn.net/Vicky_xiduoduo/article/details/128007751
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号