码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 数据库面试题-ElasticSearch


    数据库面试题-ElasticSearch

    • 1、ElasticSearch是什么?
    • 2、谈谈ElasticSearch分词与倒排索引的原理?
    • 3、说说ElasticSearch分段存储的思想?
    • 4、说说你对ElasticSearch段合并的策略思想的认识?
    • 5、知道什么是文本相似度TF-IDF吗?
    • 6、说说ElasticSearch写索引的逻辑?
    • 7、说说ElasticSearch集群中搜索数据的过程?
    • 8、说说ElasticSearch深翻页的问题及解决?
    • 9、ElasticSearch如何进行性能优化?
    • 10、ElasticSearch查询优化手段有哪些?
    • 11、ElasticSearch是如何实现master选举的?
    • 12、ElasticSearch索引数据量大增时如何调优和部署?
    • 13、集群、节点、索引、文档、类型是什么?
    • 14、ElasticSearch中的分片是什么?
    • 15、ElasticSearch中的副本是什么?
    • 16、ElasticSearch中的分析器是什么?
    • 17、ElasticSearch中的过滤器是什么?
    • 18、索引和存储的用途是什么?

    1、ElasticSearch是什么?

    ElasticSearch是一个开源的、RESTful的、分布式搜索和数据分析引擎,能够处理大规模数据的搜索、分析和存储。

    2、谈谈ElasticSearch分词与倒排索引的原理?

    ElasticSearch通过分词(Tokenization)将文本拆分成一系列易于搜索的关键词(Token),这个过程涉及文本预处理、分割和规范化。接着利用倒排索引(Inverted Index)来存储每个关键词对应的文档列表,实现快速、高效的搜索。倒排索引记录了关键词出现在哪些文档中,以及它们在文档中的位置,从而在搜索时能迅速找到包含特定关键词的所有文档。

    3、说说ElasticSearch分段存储的思想?

    ElasticSearch采用分段(Segment)存储的思想,将倒排索引分为多个较小的、不可变的分段,每个分段独立存储一部分数据。新索引的数据首先被写入内存,然后定期刷新到磁盘上形成新的分段。这些分段可以被单独压缩和优化,并且在搜索时并行处理,提高了搜索效率。随着时间的推移,后台进程会合并这些分段来优化存储结构和搜索性能。

    4、说说你对ElasticSearch段合并的策略思想的认识?

    ElasticSearch的段合并策略旨在通过定期合并小的分段来优化搜索效率和减少存储空间的使用。这个过程涉及将多个小分段合井成一个较大的分段,同时清理已删除或更新的文档的空间。合并策略既考虑了合并操作对即时搜索性能的影响&#

  • 相关阅读:
    微服务和 Kubernetes 的三大服务网格技术
    【SimpleFunction系列二.2】SpringBoot注解整合Redisson分布式锁
    NLP:如何计算两个句子的相似度
    MySQL MHA
    【毕业设计】花卉识别 - 深度学习 机器视觉 卷积神经网络 python OpenCV
    驱动开发:内核枚举ShadowSSDT基址
    vscode启动不了,折腾了半天发现已经不支持win7
    基于SSM的“大学生艺术节”管理系统的设计与实现
    【体验有奖】用 AI 画春天,函数计算搭建 Stable Diffusion WebUI
    百乐钢笔维修(官方售后,全流程)
  • 原文地址:https://blog.csdn.net/weixin_46990523/article/details/139783353
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号