• 2024.2.25 -ElasticSearch 进阶


    倒排索引

    Elasticsearch的倒排索引机制是通过将文档中出现的词汇与它们所在的文档ID关联起来,实现快速查找包含特定词汇的文档。下面是一个具体的例子来说明倒排索引的工作原理:

    假设我们有一个简单的文章集合,包含以下三篇文章:

    1. 文章A:标题为“新冠病毒疫情最新动态”,内容为“关于全球COVID-19疫情的最新进展报告”
    2. 文章B:标题为“春季流感预防措施”,内容为“如何在春季有效预防流感病毒传播”
    3. 文章C:标题为“疫苗接种的重要性”,内容为“讨论不同类型的疫苗及其在防疫中的关键作用”

    **构建倒排索引过程:**

    对于每个文档,Elasticsearch会执行以下步骤:
    - 分词(Tokenization):对文档的内容进行分词处理。例如,文章A的标题和内容分别会被分成如下的关键词:
      - 标题:“新冠”、“病毒”、“疫情”、“最新”、“动态”
      - 内容:“全球”、“COVID-19”、“疫情”、“最新”、“进展”、“报告”

    - 创建倒排索引条目:
      - 对于每个唯一词汇,记录它出现在哪些文档以及在文档中的位置信息:
        - “新冠” -> [文档A, 标题]
        - “病毒” -> [文档A, 标题], [文档A, 内容]
        - “疫情” -> [文档A, 标题], [文档A, 内容]
        - ...
        - “预防” -> [文档B, 标题]
        - “疫苗” -> [文档C, 标题]

    **查询使用倒排索引:**

    现在,如果我们想要搜索包含关键词“疫情”的所有文章,Elasticsearch可以直接查看倒排索引,找到关键词“疫情”对应的文档列表,即:

    - “疫情” -> [文档A, 标题], [文档A, 内容]

    因此,搜索引擎立即知道文档A包含了这个词,并且可以在毫秒级的时间内返回搜索结果。

    总结来说,Elasticsearch的倒排索引使得无需扫描整个文档集合就能迅速定位到含有特定词汇的文档,极大地提高了全文检索的速度和效率。

    ES的架构

    角色:client Esmaster 

     

  • 相关阅读:
    【Vue】父子组件间如何通过事件进行通信(2)
    Lua语法讲解
    SringBoot 如何使用HTTPS请求及Nginx配置Https
    vue3 +element-plus中避免一打开表单的下拉选择的change事件自动校验问题
    阿里国际站(直通车)
    链路追踪--Sleuth和日志聚合---Zipkin
    哈夫曼树(理论)
    Shell 实现文件基本操作(切割、排序、去重)
    注塑行业MES系统解决方案,打造数字化智能工厂 先达智控
    96.qt qml-http之XMLHttpRequest介绍详解使用
  • 原文地址:https://blog.csdn.net/m0_49956154/article/details/136282423