码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 黑马es学习


    es

    • 0. 基础概念
      • 0.1 倒排索引
      • 0.2 文档、索引
      • 0.3 与mysql对比
    • 1 基本操作
      • 1.1 mapping 索引库操作
      • 1.2 单个文档CRUD
    • 3. DSL查询
      • 3.1 查询所有
      • 3.2 全文检索
      • 3.3 精确查询
      • 3.4 复合查询-相关性得分
      • 3.5 分页
      • 3.6 高亮
      • 3.7 总结
    • 2. RestClient
    • 4. aggs聚合
      • 4.1 bucket(分桶)聚合
      • 4.2 metrics聚合
    • 5. mysql与es数据同步
    • 6. es集群
    • extra:es集群数据去重

    黑马视频

    官方使用手册

    java client


    0. 基础概念

    es本质:一个基于Lucence开发出来的分布式搜索引擎

    在这里插入图片描述

    0.1 倒排索引

    在这里插入图片描述

    创建倒排索引后给词条创建索引,总计进行了两次查询

    0.2 文档、索引

    文档:一条数据记录
    索引:类型相同的文档的集合

    在这里插入图片描述

    0.3 与mysql对比

    交易等一致性要求高的mysql做
    大范围搜索es做

    1 基本操作

    1.1 mapping 索引库操作

    在这里插入图片描述
    举例:注意object嵌套关系

    在这里插入图片描述

    禁止修改索引库,但是可以添加新字段

    1.2 单个文档CRUD

    文档查询:

    在这里插入图片描述
    _source字段下是查询到的原始文档

    文档修改:
    全量修改:旧的直接删除,新增改后的文档
    增量修改:在旧的上面修改

    在这里插入图片描述

    3. DSL查询

    dsl常见查询分类:

    在这里插入图片描述

    3.1 查询所有

    在这里插入图片描述

    3.2 全文检索

    在这里插入图片描述
    muti_match的方式能够额外指定针对哪些字段进行查询(任意一个字段包含即可)

    3.3 精确查询

    值是确定的,不可分割,不可分词,完全匹配

    在这里插入图片描述

    3.4 复合查询-相关性得分

    相关性得分算法:(第三种 default)

    es 自带的 query score:
    在这里插入图片描述

    自定义function score函数:

    在这里插入图片描述

    自定义score函数时主要确定三个部分:

    1. 哪些文档将进行加权
    2. 算分函数function score如何定义
    3. function score怎么与原始得分query score(BM25)进行加权

    demo:

    在这里插入图片描述

    3.5 分页

    深度分页问题:

    在这里插入图片描述
    from+size超过1w会直接报错,如果非要查一万条,不太现实,实际生产应用中会从业务层面避免查询1w条(从业务上拒绝),比如百度就是默认最多查70页,每页显示10条数据

    在这里插入图片描述

    3.6 高亮

    高亮的结果解析是与_source同级的,需要额外注意:

    在这里插入图片描述

    3.7 总结

    在这里插入图片描述

    2. RestClient

    将dsl语句对应到Java

    在这里插入图片描述
    在这里插入图片描述
    上图中涉及了两个核心api:
    source.query()/source()等:
    在这里插入图片描述

    QueryBuilders.各种查询query:
    在这里插入图片描述

    解析查询响应结果:

    在这里插入图片描述

    在这里插入图片描述

    常见查询:

    全文检索查询:
    在这里插入图片描述
    精确查询:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    聚合:

    在这里插入图片描述

    4. aggs聚合

    聚合操作与query同级,用于对文档进行统计、分析、计算(min/max/avg…)

    常见聚合方式:

    在这里插入图片描述

    4.1 bucket(分桶)聚合

    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    默认按照doc_count降序排序,如若修改排序方式:

    在这里插入图片描述

    在这里插入图片描述

    4.2 metrics聚合

    在这里插入图片描述
    红框:

    聚合名称:scoreAgg
    聚合类型:stats
    聚合字段:score

    5. mysql与es数据同步

    在这里插入图片描述

    方案一缺点:业务之间耦合度强,调用耗时

    在这里插入图片描述
    方案二缺点:依赖mq的可靠性

    在这里插入图片描述
    在这里插入图片描述

    demo:基于mq的实现方式

    mq的消息模式:其中交换机用于将消息路由

    在这里插入图片描述

    定义模式:
    在这里插入图片描述
    然后定义绑定关系:将某个队列绑定到指定交换机、用哪个routingKey:

    在这里插入图片描述

    消息发送(两种消息:增改(公用一个key)和删(另一个key)):

    在这里插入图片描述
    在这里插入图片描述

    消息监听与消费:

    定义监听:
    在这里插入图片描述

    具体实现:

    在这里插入图片描述
    在这里插入图片描述

    6. es集群

    extra:es集群数据去重

  • 相关阅读:
    Go 多版本管理工具
    c++最小步数模型(魔板)
    培美曲塞肌白蛋白纳米粒|磺胺地索辛豆清白蛋白纳米粒|茴香酰胺蓖麻蛋白纳米粒(化学品)
    3. Caller 服务调用 - dapr
    windows安装mysql-8.0.35
    linux systemd start stop enable disable命令区别
    todolist案例——vue脚手架(1)
    【基础篇】Redis深入理解与实践指南(一)之Redis的前世今生
    数据采集代码示例
    PB对象命名规范
  • 原文地址:https://blog.csdn.net/kc7w91/article/details/139392174
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号