• es滚动查询分析和使用步骤


    ES在进行普通的查询时,默认只会查询出来10条数据。我们通过设置es中的size可以将最终的查询结果从10增加到10000。如果需要查询数据量大于es的翻页限制或者需要将es的数据进行导出又当如何?
    Elasticsearch提供了一种称为"滚动查询"(Scrolling)的机制,用于处理大型数据集的分页查询。滚动查询允许在持续的时间段内保持一个活动的搜索上下文,然后使用滚动ID进行迭代检索结果。滚动查询和关系型数据库中的游标有点类似,因此也叫游标查询。

    滚动查询的一般步骤

    1、发起初始搜索请求,返回命中结果和滚动ID

    scroll=5m表示每个滚动查询的有效时间为5分钟

    下面例子:

    POST /your_index/_search?scroll=5m
    {
      "size": 100,       // 每次返回的结果数量
      "query": { ... }   // 查询条件
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    命中结果:

    {
      "_scroll_id": "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ==",
      "hits": {
        "total": {
          "value": 10000,
          "relation": "eq"
        },
        "hits": [ ... ]  // 检索到的文档
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    示例:
    在这里插入图片描述

    2、使用滚动查询下一页的结果:

    例子:

    POST /_search/scroll
    {
      "scroll": "5m",
      "scroll_id": "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ=="
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    命中结果:
    在这里插入图片描述

    3、重复执行直到没有检索结果返回

    Elasticsearch将返回下一页结果。可以根据需要重复这个步骤,直到没有更多结果为止,即无数据返回为止。

    4、清除滚动上下文释放资源

    滚动查询结束后,可以通过发送一个清除滚动上下文的请求来释放资源:

    DELETE /_search/scroll
    {
      "scroll_id": [
        "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ=="
      ]
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
  • 相关阅读:
    【数组】非递增的最小子序列 计数排序
    Linux高级应用——web网站服务
    WPF 截图工具
    gtsummary绘制三线表/基线资料表/表格
    第二十章 JSP,JSTL和EL
    git的基础操作
    MySql密码增强策略
    听我一句劝,业务代码中,别用多线程。
    【2024秋招】2023-9-20 度小满信贷系统平台部二面
    安装GPT 学术优化 (GPT Academic)@FreeBSD
  • 原文地址:https://blog.csdn.net/MyHeaven7/article/details/132765877