码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • WWW2022|京东提出变分embedding学习框架VELF解决CTR预估冷启动问题


    Alleviating Cold-start Problem in CTR Prediction with A Variational Embedding Learning Framework

    Xiaoxiao Xu, Chen Yang, Qian Yu, Zhiwei Fang, Jiaxing Wang, Chaosheng Fan, Yang He, Changping Peng, Zhangang Lin, Jingping Shao 

    JD.com

    https://arxiv.org/pdf/2201.10980v1.pdf

    这篇文章提出一种通用变分embedding学习框架,VELF,用来缓解CTR预估中严重的冷启动问题。

    VELF通过缓解由数据稀疏引起的过拟合,进而解决冷启动问题,主要借助两种方法来实现,一是学习概率embedding,二是融入可训练和正则的先验知识,充分利用冷启动用户和广告的丰富side 信息。这两种方法可以自然融入变分推理框架,形成一种端到端的训练流程。

    大量实验表明作者们所提VELF的优势。此外,拓展实验表明,参数化和正则化先验相对传统固定先验具有更多的泛化能力。

    冷启动主要原因有两个,广告和用户的长尾分布,新用户以及新广告。

    54a41b866411e67a514383d2ce7d5b5c.png

    CTR预估中基于embedding和神经网络的范式结构图示如下

    ab191df3e18f472854aa9a1d6395acc3.png

    这篇文章的主要贡献如下

    1dd654bee40c1317a3359abd39bb1ccb.png

    现有的解决冷启动问题的方法有基于内容的方法和元学习方法

    f6ad04782d1575b5ec373972337f28ce.png

    但容易过拟合。

    符号约定如下

    bb89e94386be1a1935f43f4113a1ce87.png

    变分推理简介如下

    0b5d604b1ac5d3a040032d44ba2321e1.png

    点估计相对分布估计处理冷启动的能力较弱

    3df92cdb3b384c6ea9b1f115f7b458d3.png

    整体框架图示如下

    847ea4a80822f06ef61b3380dcda8a61.png

    作者们在以下数据集上进行了实验

    b3d0dc12c273894a00d66a454b81204a.png

    训练集及测试集划分方式如下

    d5774c3d9d5c29f24f7f662255e51521.png

    特征及测试集构建方式如下

    d23d997052b507e3e790c43bd7790a1d.png

    数据集信息统计如下

    8a736ef121f7c0831060a5a250d06730.png

    参数设置如下

    aac06cd5c585fda5a379d24078531583.png

    71814c1cf0e9f945438f14098af98f19.png

    作者们采用了以下指标

    a4fe7caf9d0a45ea23a039479fe32c42.png

    几种方法的效果对比如下

    669876dedc9e478cf406c4bb51c942bd.png

    a83a2af1a33cfbb4721e13128a390b92.png

    VELF作为一个模块对几种主流算法的影响如下

    93be501b421f78e883a42666bf20ba18.png

    消融实验结果如下

    a49ff86514603041a5681ea7ff29a955.png

    2661dc34b88b23ebabc88759a1ababeb.png

    实验环境如下

    f54f9707dc40f2362b3d0a55e3a213ed.png


                  126a4f21d418dbe0ead164d1265d05e8.png我是分割线1678f9a3423dfc8984d7a67cc195f921.png


    您可能感兴趣

    KDD2021|因果模型在实时竞价重复曝光次数中的应用

    雅虎联合阿里提出转化率预估实用框架并用于在线展示广告

    IJCAI2020|京东联合香港理工提出基于点击校准的注意力模型用于时延归因转化率预估

    WSDM2022|阿里联合中科院提出特征协同作用网络CAN用于点击率预估(已开源)

    WSDM2022|阿里提出合约广告自适应统一分配框架AUAF(已开源)

    ICDM2019|阿里提出大规模个性化分发实时平滑算法并用于合约展示广告

    微软提出实时竞价算法并用于效果展示广告分配

    淘宝展示广告中的优化点击成本算法

    在线定向广告中的预算控制算法

    KDD2021|清华联合雅虎|斯坦福大学|纽约大学提出竞价隐藏算法MEOW

    在线广告中的平滑预算控制实时竞价优化算法

    KDD2021|雅虎提出高效深层分布网络竞价策略用于一阶广告拍卖竞价隐藏

    KDD2021|华为联合上交提出CTR预估数值特征embedding学习框架AutoDis(已开源)

    KDD2021|腾讯联合中科院北航提出人群扩展算法MetaHeac并用于推荐和广告领域(已开源)

    KDD2020|阿里提出多目标优化保量算法并用于优酷视频服务平台

    KDD2020|腾讯联合中科大提出请求级别保量广告计划RAP

  • 相关阅读:
    Spring Security OAuth Client配置加载源码分析
    自然堂品牌焕新升级,携手代言人王一博彰显美妆年轻新态度
    红海云荣膺「2023智享会人力资源技术供应商价值大奖」
    [4G/5G/6G专题基础-160]: BLER与MCS的关系
    如何寻找适合协作的产品设计公司?
    黑马程序员2023新版JavaWeb企业开发全流程学习笔记(涵盖Spring+MyBatis+SpringMVC+SpringBoot等)
    AVR单片机开发2——流水灯及仿真
    kalman滤波与目标跟踪2: kalman滤波代码讲解
    EEG-fNIRS跨模态迁移学习优化BCI系统分类精度
    皕杰报表的Linux部署
  • 原文地址:https://blog.csdn.net/hestendelin/article/details/126844415
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号