• 长尾预测效果不好怎么办?试试这两种思路


    微信公众号“ 圆圆的算法笔记”,持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~
    后台回复“ 交流”加入“ 圆圆的算法笔记”交流群;回复“ 时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~

    推荐阅读历史相关文章:

    Meta-learning核心思想及近年顶会3个优化方向

    推荐系统大杀器——基于图学习的协同过滤

    1.什么是长尾问题

    长尾问题一直是很多场景中最难优化的问题,特别是在推荐系统领域,长尾问题十分常见,却很难优化。在推荐系统中,长尾问题指的是,某些实体在训练数据中出现次数非常少,导致模型对这部分样本打分效果很差。典型的场景包括,新用户没有几条浏览行为,如何准确推荐用户感兴趣的内容;一些商品非常小众,用户反馈很少,如何对这些商品进行推荐等等。长尾在一个成熟的系统中往往服从二八定律,即20%的头部实体贡献了80%的数据,而剩余80%的实体只有20%的数据,实际场景中甚至比二八还要长尾。

    长尾问题的难点主要体现在以下2点。首先,长尾实体的样本量太少,模型很难学习这部分样本的规律,例如用户的embedding、商品的embedding等,都是需要大量数据学习的。其次,头部样本在数量上占绝对优势,导致模型偏向拟合头部样本的规律,而尾部样本的规律和头部样本可能有较大差异,导致模型在尾部样本效果不好

    2.如何解决长尾问题

    那么,如何解决长尾问题呢?业内工作主要包括两种核心优化方法。第一种方法是基于meta-learning解决长尾问题。刚才我们说到,长尾用户或商品的数据量少,模型难学习,那么我们就让模型具备在少量样本上能学的比较好的能力就可以了。而meta-learning正是让模型实现上述能力的方法。我在之前的文章

  • 相关阅读:
    基于ssm的教师贴心宝管理系统的设计与实现-计算机毕业设计源码
    keras.metrics解析
    3D全景:为各行业提供更真实的交互体验
    K-最近邻算法
    JVM中的堆和栈
    【Spring MVC】统一功能处理
    EN 14509自支撑双层金属面保温绝热夹芯板—CE认证
    各个大学的校训
    第 2 章 线性表(学生健康登记表实现)
    接口自动化测试完整版(文档+视频)
  • 原文地址:https://blog.csdn.net/fareise/article/details/126715260