本文看下es分布式模型相关内容。
支持水平扩展,可以存储PB级别数据,每个就能都有自己唯一的名称,默认名称时elasticsearch,可以通过配置文件,如cluster.name: my-application
,修改,或者时在启动命令中指定,如-E cluster.name=xxxx
。
一个es集群的节点可以同时拥有多个类型。
这种类型的节点可以负责处理请求,并将请求路由的正确的节点,例如创建index的请求,就会路由到master节点。节点默认就是该类型的节点,
负责保存分片数据的节点,节点启动默认就是该类型节点,通过设置node.data: false
禁止。通过增加data node可以解决数据的水平扩展和数据单点的问题。
需要注意:数据的分片如何在data node上分布式,是由master node决定的。
集群的主节点,职责如下:
1:创建,删除索引
2:决定索引的数据分片分配到哪个节点
最佳实践:为一个集群设置多个maser 节点,每个master 节点只承担单一角色???
有资格在master节点故障时,通过选举成为新master node的节点,一个集群中可配置多个该类型的节点。
启动时,默认就是就是master eligible node,通过node.master: false
来禁止。
当集群中第一个master eligible节点启动的时候会将自己选举成为master节点。
参考:
脑裂一般是因为网络故障导致一个集群因为网络隔离,成为2个独立的集群,并各自选举产生自己的master node,
从而出现这种情况会造成数据的不可恢复的问题。想要避免脑裂问题,在7之前可通过如下设置控制不会产生两个master node:
在7后版本不需要做任何设置,es已提供必要检测来避免脑裂。
./cerebro
即可:[root@localhost bin]# ./cerebro
[info] play.api.Play - Application started (Prod) (no global state)
[info] p.c.s.AkkaHttpServer - Listening for HTTP on /0:0:0:0:0:0:0:0:9000
我们首先来启动第一个es实例:
bin/elasticsearch -E node.name=xiaohengnode1 -E cluster.name=xiaoheng -E path.data=xiaoheng0_data -E http.port=9200 -E transport.port=9300
在cerebro查看:
接着创建索引,指定3个分片,一个副本:
创建后:
想要黄变绿
,只需要让没有分配的副本得到分配就行了,所以需要再来启动一个新节点,如下:
bin/elasticsearch -E node.name=xiaohengnode2 -E cluster.name=xiaoheng -E path.data=xiaoheng1_data -E http.port=9201
然后就变绿了: