• Java ES 滚动查询


    滚动查询(Scroll Query)是 Elasticsearch 提供的一种机制,用于处理大量数据的查询。它允许你在多个请求之间保持“游标”,以便在后续请求中获取更多的结果。

    以下是滚动查询的基本工作原理:

    1 初始查询:
    客户端发送一个查询请求给 Elasticsearch,并指定一个滚动时间(scroll time)。

    2 首次返回结果:
    Elasticsearch会处理这个查询请求,并将结果返回给客户端。
    除了返回查询结果之外,还会返回一个特殊的“滚动ID”(scroll ID)。

    3 保持连接:
    客户端将这个滚动ID保存下来,以便在后续请求中使用。

    4 后续查询:
    在滚动时间内,客户端可以使用保存的滚动ID来获取更多的结果,而不需要重新发送完整的查询请求。
    客户端发送一个滚动请求,并提供之前收到的滚动ID。

    5 返回后续结果:
    Elasticsearch会使用之前的滚动ID来获取接下来的结果,并将其返回给客户端。
    如果有更多的结果可用,它也会返回一个新的滚动ID,以便在下一次请求中使用。

    6 重复步骤4和步骤5:
    客户端可以在滚动时间内多次使用滚动ID来获取更多的结果,直到没有更多的结果可用为止。

    7 滚动ID的失效:
    一旦滚动时间过期(在初始查询时指定的时间),或者客户端主动关闭滚动查询,相应的滚动ID将失效,不再能用于获取结果。
    滚动查询的优点在于,它允许你在多个请求之间保持连接状态,从而能够处理大量数据而不会因为单次请求的数据量过大而出现问题。

    需要注意的是,滚动查询并不适用于实时查询,因为它会保持资源开销,直到滚动时间过期或者显式关闭滚动查询为止。因此,滚动查询通常用于离线批量处理或需要处理大量数据的情况。

    @Test
    public void searchScroll() {
    	long gte = 0;
    	long lt = 100000000;
    
    	BoolQueryBuilder query = new BoolQueryBuilder();
    	query.must(QueryBuilders.rangeQuery("createTime").gte(gte).lt(lt));
    
    	NativeSearchQueryBuilder builder = new NativeSearchQueryBuilder();
    	builder.withPageable(PageRequest.of(0, 500)); // 每次只处理500条数据
    	builder.withQuery(query);
    
    	// 查询
    	IndexCoordinates index = "student";
    	SearchScrollHits<Student> hits = template.searchScrollStart(
    			60000L,
    			builder.build(),
    			Student.class,
    			index);
    
    	String scrollId = hits.getScrollId();
    	List<String> scrollIdList = new LinkedList<>();
    	scrollIdList.add(scrollId);
    
    	List<CheckItemCount> list = new LinkedList<>();
    	while (hits.hasSearchHits()) {
    
    		// 处理数据
    		List<SearchHit<Student>> hitList = hits.getSearchHits();
    		for (SearchHit<Student> hit : hitList) {
    			// 处理数据
    		}
    		
    		// 滚动查询下一页
    		hits = template.searchScrollContinue(scrollId, 60000L, Student.class, index);
    		scrollId = hits.getScrollId();
    		scrollIdList.add(scrollId);
    		
    	}
    	// 清空滚动查询
    	template.searchScrollClear(scrollIdList);
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
  • 相关阅读:
    数据结构之栈
    代码应该怎么写?
    【K8S系列】Weave Net 故障排除的常见问题和解决方案
    jQuery 树型菜单完整代码
    Linux ARM平台开发系列讲解(IPCF异核通信) 2.11.3 IPCF异核通信驱动编译及其测试
    因为有了它,我用舍友玩王者的时间拿到了华为offer
    软件测试面试题常见一百道【含答案】
    一篇文章带你搞定所有二叉树题型的递归思维(思路超详细)
    使用QtService实现Qt后台服务程序
    Java:线程状态及线程状态转换方法
  • 原文地址:https://blog.csdn.net/qq_34814092/article/details/133642614