码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 经典论文《Efficient Estimation of Word Representations in Vector Space》学习笔记


    阅读论文必备知识

    论文
    ● 统计语言模型中的平滑操作
    有一些词或词组在语料中没有出现过,但是这不能代表它不可能存在
    平滑操作就是给那些没有出现过的词或者词组也给一个比较小的概率
    ● 平滑操作的问题
    参数空间过大
    数据稀疏严重
    ● 马尔科夫假设
    下一个词的出现仅依赖于前面的一个词或几个词语言模型评价指标:困惑度语言模型是无监督的任务
    在这里插入图片描述

    ● softmax函数,指数操作,让数为正数,使它成为0到1之间
    ● batch问题,批次,补pad位,rnn可变长输入
    ● 语言模型评价指标
    在这里插入图片描述

    1.论文核心部分研读

    在这里插入图片描述

    1.1 word2vec的基本思想

    在这里插入图片描述

    1.2 skip-gram原理

    在这里插入图片描述
    首先映射成一个one-hot向量,与词向量矩阵相乘,得到1*D的词向量,再与周围词向量矩阵相乘,得到1*V向量,再经过softmax函数得到每个词的概率,通过索引知该词的概率,目标是要使该词的概率越大越好,再经过梯度反向传播,将w和w训练,一般取w或者w和w的平均值
    输出层表达式: p ( w i − 1 ∣ w i ) = p(w_{i-1}|w_i)= p(wi−1​∣wi​)=
    e x p ( u w i − 1 T v w i ) ∑ j = 1 V e x p ( u w T v w i ) \frac{exp(u_{w_{i-1}}^{T} v_{wi})}{\sum_{j=1}^{V} exp(u_{w}^{T}v_{wi} )} ∑j=1V​exp(uwT​vwi​)exp(uwi−1​T​vwi​)​

    1.3 cbow原理(忽略词的顺序)

    在这里插入图片描述

    和上面过程类似,得到v个概率,再通过反向传播,进行梯度下降,得到词向量矩阵,设e1,e2,e3,e4为上下文词,窗口为2 , v c , v j v_c,v_j vc​,vj​ 为中心词向量,则 u 0 = s u m ( e 1 , e 2 , e 3 , e 4 ) u_0=sum(e_1,e_2,e_3,e_4) u0​=sum(e1​,e2​,e3​,e4​)表示窗口内上下文词向量之和: p ( c ∣ o ) = p(c|o)= p(c∣o)=
    e x p ( u 0 T v c ) ∑ j = 1 V e x p ( u 0 T v j ) \frac{exp(u_{0}^{T} v_c)}{\sum_{j=1}^{V} exp(u_{0}^{T}v_j )} ∑j=1V​exp(u0T​vj​)exp(u0T​vc​)​

    1.4 word2vec关键技术:层次softmax和负采样

    层次softmax:
    在这里插入图片描述
    在这里插入图片描述

    2.previous model

    2.1NNLM

    在这里插入图片描述

    2.2RNNLM

    在这里插入图片描述
    在这里插入图片描述
    参考博客
    论文笔记
    论文解读

  • 相关阅读:
    一文了解 Go fmt 标准库的常用占位符及其简单使用
    算法金 | 再见,PCA 主成分分析!
    智能测量设备校准的重要性
    服务器数据恢复—raid5上层NTFS分区误删除/格式化的数据恢复案例
    【Java八股文之进阶篇(五)】多线程编程核心之并发容器
    已更新 联通 电信 tiny模式
    Java简历与面试
    LeetCode - 76 最小覆盖子串
    Ant Design Pro of Vue 构建打包后使用 Nginx 发布,API 请求报 404 错
    石油石化物资采购杂志社石油石化物资采购编辑部2023年第18期部分目录
  • 原文地址:https://blog.csdn.net/weixin_45768308/article/details/127453540
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号