码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 语义召回进阶之路:从传统到深度学习的搜索革新


    语义召回进阶之路:从传统到深度学习的搜索革新

    0.简介

    召回技术是搜索方向的重要组成部分,大体上搜索架构都是以金字塔结构的形式组成,一般包括: 召回 -> 粗排 -> 精排 -> 重排序。召回位于整个金字塔的最底端,因此,召回效果的好坏直接决定整个搜索系统的天花板。传统的召回技术基于倒排索引的方式进行召回,这样的召回架构已经延续了很多年。传统召回技术具有召回效率高、召回结果匹配精准等优点,但传统召回在面对语义相似但字面不匹配等问题时却表现不佳,为了解决这类问题,业界已经在传统召回的路线上进行了很多优化,比如同义词替换或扩展、query 改写以及语义算分等,但是这些方式从本质上讲都是缓解该问题,并不能从根本上解决该问题。举个例子: Query: ”比喻说多了会露馅的句子 “,满足 Query 需求的结果:” 有句话的意思是话说多了就会漏出破绽“,我们通过上述的方法很难解决该类问题。近年来随着深度学习的发展,语义召回方向开始逐渐发展起来,这也让我们看到了彻底解决该类问题的希望,因此,我们在搜索中进行了语义召回的实践,经过一段时间的发展,语义召回已经在整个搜索中得到大规模的使用,并且对召回效果的提升起到了重要作用。

    在本文中,我们将对搜索在语义召回的进阶之路进行展开介绍,详细阐述我们在通用搜索上如何进行召回模型的优化、当前语义召回仍然面临的问题以及我们对未来召回应该是什么样的等开放性问题抛出我们的想法,后续我们还会继续产出对语义召回上层排序模型进行优化和适配的文章。
    整篇文章的组织结构如下:
    1.召回模型的发展
    2.语义召回面临的问题
    3.未来召回架构畅想

    1.召回模型的发展

  • 相关阅读:
    MindSpore手写数字识别体验
    数商云:从规划到落地,五矿集团如何快速构建数字化发展新格局?
    【PCIE709-F】基于复旦微JFM7VX690T80 FPGA的全国产化8通道光纤双FMC接口数据处理平台
    【scikit-learn基础】--『数据加载』之外部数据集
    字节新鲜面经
    在 CentOS 6.4上安装rabbitmq
    批量查找文件夹移动复制保存,文件夹批量筛选查找,多个文件夹筛选,看完就知道怎么弄了
    6.6 Elasticsearch(六)京淘项目改造
    新际遇?不看必后悔,成都市人民政府培育大企业大集团的实施意见
    DCDC: 环路稳定性的测量方法-穿越频率和相位裕度
  • 原文地址:https://blog.csdn.net/sinat_39620217/article/details/133887757
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号