最近在做业务监控日志的展示, 公司用的es存储日志 ,所以也顺道学习了一波用java 的 RestHighLevelClient 查询es
(1)普通查询
sql : where id = xxx -> es : termQuery("id" , "xxxx")
where id =XXXX and name = xxxx -> es : 这里要用到 BoolQueryBuilder , 也就是要用连接多个查询条件 ,
boolQueryBuilder.must(QueryBuilders.boolQuery().must(QueryBuilders.termsQuery("id ", xxx)).must(QueryBuilders.boolQuery().must(QueryBuilders.termsQuery("name ", xxx)))
(2) 聚合查询 es中用桶的概念去做聚合查询, 首先将一堆数据根据什么条件分成一个一个的桶 , 也就是sql中的 group By 。每个桶中又有什么操作 , 比如 count , sum ,等。
sql : group by id -> es : AggregationBuilders.terms("idCount").field("id") , 先给你的桶起一个叫 idCount 的名字,以便于在后边获取数据的时候根据这个桶id 拿到自己的桶分组结果 ,filed(id") 就是按照id分组了。
分享一个聚合查询最常用的操作: topHits ,比方说 ,我现在 sql 想这样查 , select count(id) , name , age from person group by age , 按照 age 分组之后 , 我还想知道 name等其他字段 , 这个时候你就可以用tophits ,
桶内查询:TermsAggregationBuilder aggregationBuilder = AggregationBuilders.terms("active_user_count").field(field).size(10000) .subAggregation(AggregationBuilders.topHits("time").fetchSource({“age” , "name"}, null).size(1) );
最后的size(1) 就是最后分组里面 ,我就要一条数据, 当然你还可以根据其他条件进行桶内排序, 比方 ,找出 18岁的人中, 最小的前三位 , 这个时候 ,tophits 可以这个样写,
- TermsAggregationBuilder aggregationBuilder =
-
- // 桶名字叫 max_age , 按照age 分组 , 每个桶里面又按照出生日期倒序排列, 并且每个桶只取前三个值
- AggregationBuilders.terms("max_age").field("age").size(10000)
- .subAggregation(AggregationBuilders.topHits("time").fetchSource(new String[]{"age", "name" , "id" }, null).size(3).sort("borb_date", SortOrder.DESC)
- );
-
-
- // 在 桶外, 我又想根据 年龄倒序排列 ,
- MaxAggregationBuilder serverTime = AggregationBuilders.max("maxAge111111").field("age");
- BucketOrder absTimeOrder = BucketOrder.aggregation("maxAge111111", true);
- aggregationBuilder.order(absTimeOrder);
- aggregationBuilder.subAggregation(serverTime);
- sourceBuilder.aggregation(aggregationBuilder);
注意 maxAge111111 这个名字哦 ,大家在调试代码的时候 , 如果没有出结果 ,一定要把 SearchRequest 对象中的 source 拷贝出来运行一下哦,本质上java 代码还是在构建 查询语句的过程 ,所以你也可以先用kibana写es 查询,成功后再跟根据语句去写java代码。
还有一个需要注意的地方 ,分桶查询结果默认只返回十条, 所以如果你图省事儿, 直接设置10000 ,sourceBuilder.size(10000) , 但是当查询结果超过一万就没办法了 ,安全做法是用es 游标去循环取值。