Elasticsearch 面试题

Elasticsearch 面试题
文章目录
- Elasticsearch 读取数据
  您能解释一下 X-Pack for Elasticsearch 的功能和重要性吗？
  Elasticsearch 中的节点（比如共 20 个），其中的 10 个选了一个master，另外 10 个选了另一个 master，怎么办？
  解释一下 Elasticsearch 集群中的索引的概念？
  你可以列出 Elasticsearch 各种类型的分析器吗？
  解释一下 Elasticsearch Node？
  在安装 Elasticsearch 时，请说明不同的软件包及其重要性？
  Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？
  请解释有关 Elasticsearch 的 NRT？
  elasticsearch 的 document 设计
Elasticsearch 读取数据

使用 RestFul API 向对应的 node 发送查询请求，根据 did 来判断在哪个 shard 上，返回的是 primary 和 replica的 node 节点集合。这样会负载均衡地把查询发送到对应节点，之后对应节点接收到请求，将document 数据返回协调节点，协调节点把 document 返回给客户端。

您能解释一下 X-Pack for Elasticsearch 的功能和重要性吗？

X-Pack 是与 Elasticsearch 一起安装的扩展程序。
X-Pack 的各种功能包括安全性（基于⻆色的访问，特权/权限，⻆色和用户安全性），监视，报告，警报等。

Elasticsearch 中的节点（比如共 20 个），其中的 10 个选了一个master，另外 10 个选了另一个 master，怎么办？
- 当集群 master 候选数量不小于 3 个时，可以通过设置最少投票通过数量（discovery.zen.minimum_master_nodes）超过所有候选节点一半以上来解决脑裂问题；
- 当候选数量为两个时，只能修改为唯一的一个 master 候选，其他作为data 节点，避免脑裂问题。
解释一下 Elasticsearch 集群中的索引的概念？

Elasticsearch 集群可以包含多个索引，与关系数据库相比，它们相当于数据库表。

你可以列出 Elasticsearch 各种类型的分析器吗？

Elasticsearch Analyzer 的类型为内置分析器和自定义分析器。
Standard Analyzer
标准分析器是默认分词器，如果未指定，则使用该分词器。它基于 Unicode 文本分割算法，适用于大多数语言。
Whitespace Analyzer
基于空格字符切词。
Stop Analyzer
在 simple Analyzer 的基础上，移除停用词。
Keyword Analyzer
不切词，将输入的整个串一起返回。
自定义分词器的模板
自定义分词器的在 Mapping 的 Setting 部分设置：
```
PUT my\_custom\_index
{
	"settings":{
		"analysis":{
			"char\_filter":{
			},
			"tokenizer":{
			},
			"filter":{
			},
			"analyzer":{
			}
		}
	}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
```
其中： “char_filter”:{},——对应字符过滤部分； “tokenizer”:{},——对应文本切分为分词部分；
“filter”:{},——对应分词后再过滤部分； “analyzer”:{}——对应分词器组成部分，其中会包含：1. 2. 3。

解释一下 Elasticsearch Node？

节点是 Elasticsearch 的实例。实际业务中，我们会说：ES 集群包含 3 个节点、7 个节点。
这里节点实际就是：一个独立的 Elasticsearch 进程，一般将一个节点部署到一台独立的服务器或者虚拟机、容器中。不同节点根据⻆色不同，可以划分为：
主节点
帮助配置和管理在整个集群中添加和删除节点。
数据节点
存储数据并执行诸如 CRUD（创建/读取/更新/删除）操作，对数据进行搜索和聚合的操作。
客户端节点（或者说：协调节点）
将集群请求转发到主节点，将与数据相关的请求转发到数据节点。
摄取节点
用于在索引之前对文档进行预处理。

在安装 Elasticsearch 时，请说明不同的软件包及其重要性？

这个貌似没什么好说的，去官方文档下载对应操作系统安装包即可。部分功能是收费的，如机器学习、高级别kerberos 认证安全等选型要知悉。

Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？

关闭缓存 swap;
堆内存设置为：Min（节点内存/2, 32GB）;
设置最大文件句柄数；
线程池+队列大小根据业务需要做调整；
磁盘存储 raid 方式——存储有条件使用 RAID10，增加单节点性能以及避免单节点存储故障。

请解释有关 Elasticsearch 的 NRT？

从文档索引（写入）到可搜索到之间的延迟默认一秒钟，因此 Elasticsearch 是近实时（NRT）搜索平台。
也就是说：文档写入，最快一秒钟被索引到，不能再快了。写入调优的时候，我们通常会动态调整：refresh_interval = 30s 或者更达值，以使得写入数据更晚一点时间被搜索到。

elasticsearch 的 document 设计

在使用 es 时避免使用复杂的查询语句（Join 、聚合），就是在建立索引时，就根据查询语句建立好对应的元数据。
相关阅读:
零基础也能制作电子期刊，这个网站你一定不能错过
 【Vue】插件的定义和使用
 常用的设计模式
 JAVA开发中常用RDMS
监测难？误差大？北斗突破铁路监测预警难题，24小时全方位守护
 【C++】不是用new生成的对象调用析构函数
 深究数据库E-R模型设计
 关于Linux性能调优之内存负载调优
 Vue学习——组件（22）
【GIS】地理坐标系与投影坐标系的区别
原文地址：https://blog.csdn.net/u011305680/article/details/134409514

文章目录

Elasticsearch 读取数据

您能解释一下 X-Pack for Elasticsearch 的功能和重要性吗？

Elasticsearch 中的节点（比如共 20 个），其中的 10 个选了 一个master，另外 10 个选了另一个 master，怎么办？

解释一下 Elasticsearch 集群中的索引的概念 ？

你可以列出 Elasticsearch 各种类型的分析器吗？

解释一下 Elasticsearch Node？

在安装 Elasticsearch 时，请说明不同的软件包及其重要性？

Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？

请解释有关 Elasticsearch 的 NRT？

elasticsearch 的 document 设计

Elasticsearch 中的节点（比如共 20 个），其中的 10 个选了一个master，另外 10 个选了另一个 master，怎么办？

解释一下 Elasticsearch 集群中的索引的概念？