• es滚动查询分析和使用步骤


    ES在进行普通的查询时,默认只会查询出来10条数据。我们通过设置es中的size可以将最终的查询结果从10增加到10000。如果需要查询数据量大于es的翻页限制或者需要将es的数据进行导出又当如何?
    Elasticsearch提供了一种称为"滚动查询"(Scrolling)的机制,用于处理大型数据集的分页查询。滚动查询允许在持续的时间段内保持一个活动的搜索上下文,然后使用滚动ID进行迭代检索结果。滚动查询和关系型数据库中的游标有点类似,因此也叫游标查询。

    滚动查询的一般步骤

    1、发起初始搜索请求,返回命中结果和滚动ID

    scroll=5m表示每个滚动查询的有效时间为5分钟

    下面例子:

    POST /your_index/_search?scroll=5m
    {
      "size": 100,       // 每次返回的结果数量
      "query": { ... }   // 查询条件
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    命中结果:

    {
      "_scroll_id": "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ==",
      "hits": {
        "total": {
          "value": 10000,
          "relation": "eq"
        },
        "hits": [ ... ]  // 检索到的文档
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    示例:
    在这里插入图片描述

    2、使用滚动查询下一页的结果:

    例子:

    POST /_search/scroll
    {
      "scroll": "5m",
      "scroll_id": "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ=="
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    命中结果:
    在这里插入图片描述

    3、重复执行直到没有检索结果返回

    Elasticsearch将返回下一页结果。可以根据需要重复这个步骤,直到没有更多结果为止,即无数据返回为止。

    4、清除滚动上下文释放资源

    滚动查询结束后,可以通过发送一个清除滚动上下文的请求来释放资源:

    DELETE /_search/scroll
    {
      "scroll_id": [
        "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ=="
      ]
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
  • 相关阅读:
    opencv c++ 高斯模糊,高斯双边模糊(28)
    C++程序设计——类和对象(上)
    8-13外部排序-置换选择排序
    【uni-app】路由
    汇编-外中断
    基于微信小程序的房屋租赁管理系统
    SAPRouter Certificate即将过期更新证书
    WebStorm 2023年下载、安装教程、亲测有效
    【自然语言处理】Python基于逻辑回归模型进行电影评论情感分析项目实战
    debian12 允许远程ssh登录
  • 原文地址:https://blog.csdn.net/MyHeaven7/article/details/132765877