码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 目前工业界常用的推荐系统模型有哪些?


    目前工业界常用的推荐系统模型有哪些? - 知乎前言众所周知,推荐可分为以下四个流程,分别是召回、粗排、精排以及重排。其中,召回是源头,在某种意义…https://www.zhihu.com/question/314773668/answer/2479450276

     目前工业界常用的推荐系统模型有哪些? - 知乎DIN(Deep Interest Network)模型是阿里妈妈团队在2018年发表的文章,基于阿里广告业务场景(电商业…https://www.zhihu.com/question/314773668/answer/2422958180

    • 召回策略:
    1. 统计类,热度,LBS;
    2. 协同过滤类,UserCF、ItemCF;
    3. U2T2I,如基于user tag召回;
    4. I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);
    5. U2I类,如DSSM、YouTube DNN、Sentence Bert;
    • 排序策略,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;
    1. 常见的特征挖掘(user、item、context,以及相互交叉);
    2. CTR预估,如LR、GBDT、FM、FFM、DNN、Wide&Deep、DCN、DeepFM、DIN、DFN;
    • 探索与发现(bandit、Q-Learning、DQN);
    • 推荐理由:
    1. 统计式,如:全城热搜、区域热搜;
    2. 行为,如:看过、买过、看了又看、搜了又搜;
    3. 推荐语生成(抽取式,生成式);

    作者:tracholar

    • 召回层:召回解决的是从海量候选item中召回千级别的item问题
    1. 策略规则类:热度召回、LBS、历史行为重定向(买了又买、点了没买)、基于标签召回、业务特有的其他规则
    • 模型类:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回
    • 粗排层:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排
    • 精排层:精排解决的是从千级别item到几十这个级别的问题
    1. 预估:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN
    2. 多目标:MOE,MMOE,MTL(多任务学习)
    3. 打分公式融合: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化等
    • 重排层:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)
    • 展示层:
    1. 推荐理由:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等
    2. 首图优选:CNN抽特征,汤普森采样
    • 探索与利用:随机策略(简单有效),汤普森采样,bandit,强化等
    • 产品层:交互式推荐、分tab、多种类型物料融合
  • 相关阅读:
    【软考 系统架构设计师】计算机组成与体系结构③ 存储管理
    Excel VLOOKUP实用教程之 05 vlookup如何从列表中获取最后一个值?(教程含数据excel)
    c++day4
    C语言之双向链表
    初出茅庐的小李博客之根据编译时间生成软件版本号
    JAVA多线程同步队列SynchronousQueue
    Unsafe类的使用
    【校招VIP】网络基础之cookie、session和storage
    ESP8266_01S+刷入AT固件+保姆级教学+USB验证AT指令
    利用pybind11在python中使用C++
  • 原文地址:https://blog.csdn.net/m0_37870649/article/details/126320151
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号