码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • YouTubeDNN排序模型为什么预测的是观看时长?


    引言

    YouTubeDNN的排序模型在训练和推理阶段的目标是存在差异的,一个是输出加权LR,一个是输出幂,哪一个和宣称的用于预期观看时长都是不一致的,理论而言应该直接输出标量预测值比较合适。本文将尽量简单的介绍为什么这样做是合理的。

    推导

    推理阶段的输出是?

     首先我们知道LR的输出是:
    p = 1 1 + e w x + b p=\frac{1}{1+e^{wx+b}} p=1+ewx+b1​
    代指了我们要预测的概率输出值,而根据数学推导有:
    e w x + b = p 1 − p e^{wx+b}=\frac{p}{1-p} ewx+b=1−pp​
    那么如果模型训练的足够好的话,那么推理阶段的输出应当为 p 1 − p \frac{p}{1-p} 1−pp​(标准称呼为 O d d s Odds Odds),也就是两个概率的比值,那么接下来只需要证明这两个概率的比值有观看时长的意义即可。

    加权LR

     实际YouTubeDNN使用的weighted LR, 加权的意义是说当模型接收了正点击样本的输入时,输出 p p p是加权点击率而非普通的点击率。普通点击率计算公式为所有展示样本中,用户点击的频次:
    p ′ = k N p'=\frac{k}{N} p′=Nk​
    而加权点击率计算公式,总的观看时长除以分母,为:
    p = ∑ i ∈ 点击 T i ∑ i ∈ 点击 T i + ( N − k ) p=\frac{\sum_{i\in 点击}T_i}{\sum_{i\in 点击}T_i+(N-k)} p=∑i∈点击​Ti​+(N−k)∑i∈点击​Ti​​
    令总观看时长为 T T T,那么化简可以得到:
    p 1 − p = T N − k = T N ∗ 1 1 − k N = E ( T i ) 1 − p ′ \frac{p}{1-p}=\frac{T}{N-k}=\frac{T}{N}*\frac{1}{1-\frac{k}{N}}=\frac{E(T_i)}{1-p'} 1−pp​=N−kT​=NT​∗1−Nk​1​=1−p′E(Ti​)​
    又用户点击的频次非常少,分母约等于0,所以 p 1 − p ≈ E ( T i ) \frac{p}{1-p}\approx E(T_i) 1−pp​≈E(Ti​)。
    那么 e w x + b = E ( T i ) e^{wx+b}=E(T_i) ewx+b=E(Ti​)

    参考

    经典推荐算法学习(十)| Youtube DNN serving目标解析 | 从odds到Logit 、Logistic Regression
    揭开YouTube深度推荐系统模型Serving之谜

  • 相关阅读:
    【LeetCode热题100】--121.买卖股票的最佳时机
    基于SVD的图像压缩,PCA特征降维
    一文带你搞定抖音最近最火的情侣微信早报信息推送
    java实现解数独的算法
    c++ 条件变量使用详解 wait_for wait_unitl 虚假唤醒
    无锡设计培训:PLC控制的基本原则
    有效的括号(LeetCode 020)
    ModStartCMS v7.3.0 富文本MP3支持,后台组件优化
    解决idea运行maven项目报错Unresolved plugin ‘org.apache.maven.pluginsxxxx
    Vue.js项目中使用vue-i18n
  • 原文地址:https://blog.csdn.net/Dr_maker/article/details/136431824
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号