码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 多任务多场景


    1.召回

    兴趣召回

    多兴趣如何解决?
    爱奇艺短视频推荐:多兴趣召回篇
    双塔模型最后一层为什么都进行L2 Norm?

    2.排序

    多目标

    20220922推荐小记——推荐系统中如何对时长、完播等目标做多目标建模
    多目标排序模型在腾讯QQ看点推荐中的应用实践
    Weighted LR YouTube 的时长预估模型
    大厂技术实现 | 多目标优化及应用(含代码实现)
    知乎:深度学习的多个loss如何平衡?
    推荐系统多目标优化专题(2)—融合公式设计思路
    大厂技术实现 | 多目标优化及应用

    多场景

    多场景建模
    多场景融合模型

    排序优化实践

    推荐系统系列之排序模型的调优实践
    推荐系统排序优化迭代的一些经验
    微信「看一看」 推荐排序技术揭秘
    汽车之家推荐系统
    大厂技术实现 | 爱奇艺短视频推荐业务中的多目标优化实践 @推荐与计算广告系列
    王冬月:京东推荐算法精排技术实践
    陈胜:美团搜索排序实践
    深度排序模型在淘宝直播的演进与应用
    推荐系统(十一) 2021-2022年工业界推荐算法实践经验汇总
    推荐系统(十五) 大厂实践经验学习:排序模型
    演讲:知乎如何使用 DNN 优化首页排序
    微博推荐实时大模型的技术演进

    3.特征

    3.1特征工程

    推荐系统(十) 「知识梳理」CTR模型中连续特征加入方法

    3.2特征冗余

    SENet

    FiBiNet(FiBiNet解读)模型引入的SENet网络,学习每个特征权重,然后特征权重与embedding作Vector-Wise赋权,参与后续交叉计算,起到一个门控作用,会弱化不重要特征,强化重要特征。其核心逻辑是Squeeze&Excitation&Re-weight。FiBiNet还包含Bilinear交叉层,特征交叉那里再介绍。

    Embedding层Gate

    对于某个特征field,embedding向量作为输入,通过一层FC,得到该特征fields权重,计算方式分为两种:

    • Vector-Wise:embeding向量通过一层FC,输出节点为1,得到特征field权重值,权重值与原始embedding向量进行相乘。
    • Bit-Wise:embeding向量通过一层FC,输出节点为个数与embedding维度相同,得到特征field权重向量,权重向量与原始embedding向量进行Hadamard积。

    3.3特征交叉

    人工交叉统计特征

    FM

    FM(因子分解机),用于解决稀疏场景下特征组合的问题。FM原理简单,计算高效,是首个在特征交叉中引入隐向量的模型,并为后续针对特征交叉的模型结构优化提供了一个强基础。
    在FM之前,LR通过人工交叉特征,而如果要将所有特征两两交叉,即如下公式:
    y ( x ) = w 0 + ∑ i = 1 n w i x i + ∑ i = 1 n ∑ j = 1 n w i j x i x j y(x)=w_0+\sum_{i=1}^nw_ix_i+\sum_{i=1}^n\sum_{j=1}^nw_{ij}x_ix_j y(x)=w0​+i=1∑n​wi​xi​+i=1∑n​j=1∑n​wij​xi​xj​

    • 输入特征x的维度n非常大,稀疏性强。对所有特征组合进行建模,极大地增加了LR模型的参数量。
    • 另一方面,特征组合加强了稀疏性,在数据中原本不常出现的特征,经过组合后,组合特征项的出现频率则更少。对于在训练数据中不常见甚至未出现过的特征组合,模型将无法学好对应的参数 w i j w_{ij} wij​ ,容易导致模型学习不充分效果差。

    模型学习所有二阶交叉特征的核心是学习对应的参数 w i j w_{ij} wij​ ,而FM提出另一种思路,对特征的每个维度引入一个向量来表示,特征交叉项的参数 w i j w_{ij} wij​ 则由两个对应特征的向量计算内积得到。
    y ( x ) = w 0 + ∑ i = 1 n w i x i + ∑ i = 1 n ∑ j = i + 1 n < v i , v j > x i x j y(x)=w_0+\sum_{i=1}^nw_ix_i+\sum_{i=1}^n\sum_{j=i+1}^nx_ix_j y(x)=w0​+i=1∑n​wi​xi​+i=1∑n​j=i+1∑n​<vi​,vj​>xi​xj​

    • 解决了特征交叉的稀疏问题
    • 解决了参数量问题 O ( n 2 ) O(n^2) O(n2)-> O ( k n ) O(kn) O(kn),n是x的维度,k是向量的维度。
    • 提高了模型的泛化性

    计算优化,将计算量由 O ( k n 2 ) O(kn^2) O(kn2)-> O ( k n ) O(kn) O(kn)
    y ( x ) = ∑ i = 1 n ∑ j = i + 1 n v i T v j x i x j = 1 2 ∑ i = 1 n ∑ j = 1 n v i T v j x i x j − 1 2 ∑ i = 1 n v i T v i x i x i = 1 2 ( ∑ i = 1 n ∑ j = 1 n ∑ f = 1 k v i , f v j , f x i x j − ∑ j = 1 n ∑ f = 1 k v i , f v i , f x i x i ) = 1 2 ∑ f = 1 k ( ( ∑ i = 1 n v i , f x i ) ( ∑ i = 1 n v i , f x i ) − ∑ i = 1 n v i , f 2 x i 2 ) = 1 2 ∑ f = 1 k ( ( ∑ i = 1 n v i , f x i ) 2 − ∑ i = 1 n v i , f 2 x i 2 ) ) y(x)=\sum_{i=1}^n\sum_{j=i+1}^nv_i^Tv_jx_ix_j \\=\frac{1}{2}\sum_{i=1}^n\sum_{j=1}^nv_i^Tv_jx_ix_j-\frac{1}{2}\sum_{i=1}^nv_i^Tv_ix_ix_i\\ =\frac{1}{2}(\sum_{i=1}^n\sum_{j=1}^n\sum_{f=1}^kv_{i,f}v_{j,f}x_ix_j-\sum_{j=1}^n\sum_{f=1}^kv_{i,f}v_{i,f}x_ix_i)\\ =\frac{1}{2}\sum_{f=1}^k((\sum_{i=1}^nv_{i,f}x_i)(\sum_{i=1}^nv_{i,f}x_i)-\sum_{i=1}^nv_{i,f}^2x_i^2)\\ =\frac{1}{2}\sum_{f=1}^k((\sum_{i=1}^nv_{i,f}x_i)^2-\sum_{i=1}^nv_{i,f}^2x_i^2)) y(x)=i=1∑n​j=i+1∑n​viT​vj​xi​xj​=21​i=1∑n​j=1∑n​viT​vj​xi​xj​−21​i=1∑n​viT​vi​xi​xi​=21​(i=1∑n​j=1∑n​f=1∑k​vi,f​vj,f​xi​xj​−j=1∑n​f=1∑k​vi,f​vi,f​xi​xi​)=21​f=1∑k​((i=1∑n​vi,f​xi​)(i=1∑n​vi,f​xi​)−i=1∑n​vi,f2​xi2​)=21​f=1∑k​((i=1∑n​vi,f​xi​)2−i=1∑n​vi,f2​xi2​))

    FFM(Field Factorization Machine)是在FM的基础上引入了“场(Field)”的概念而形成的新模型

    DCN Cross网络

    DCN使用Cross网络替代了原来简单的LR网络,增加了特征之间的交互力度,使用多层交叉层对输入特征进行交叉。第 l l l层和第l + 1 +1 +1层之间的关系如下所示。
    x l + 1 = x 0 x l T w l + b l + x l x_{l+1}=x_0x_l^Tw_l+b_l+x_l xl+1​=x0​xlT​wl​+bl​+xl​
    在这里插入图片描述

    DCNv2则是将向量 w w w换为矩阵 W W W,考虑计算量将 W W W矩阵低秩性,将其分解通过两个小矩阵代替,同时也可以利用MoE建模低维空间的交叉特征。
    【总结】推荐系统——精排篇【2】WDL/DCN/DCN-v2

    AutoInt

    AutoInt(Automatic Feature Interaction Learning viaSelf-Attentive Neural Networks)将transformer中的multi-head self attention和resnet引入CTR预估模型。实现了自动特征交叉学习以提升CTR预测任务的精度。

    4.偏差

    如何在工业界优化点击率预估:(八)Debias&Loss&校准
    推荐系统中的偏差问题

    5.在线学习

    阿里在线学习分享

    6.关键问题

    推荐系统,离线 AUC 涨了,线上 CTR 等效果没涨,可能有哪些原因?

    7.参考

    LR+FTRL算法原理以及工程化实现

  • 相关阅读:
    一个高频问题:异步操作会创建线程吗?
    蚂蚁金服开源的这份SpringBoot笔记,两周时间在GitHub星标43.5k
    ad18学习笔记十二:如何把同属性的元器件全部高亮?
    vscode快捷键设置
    Java - Gson和Fastjson如何选择?
    听大佬讲:学习 AXI从哪里开始?
    双指针法 | 算法题整理
    第三章 :Spring Boot开发RESTful API
    最新咸鱼签名JS逆向分析教程
    javaweb-SpringBoot基础
  • 原文地址:https://blog.csdn.net/weixin_40548136/article/details/132983035
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号