该处理方法适用于 Apache Doris 0.14.7 及之后所有版本
常见问题
出现类似下面的错误
解决方案:
metadata_failure_recovery=true- ALTER SYSTEM DROP OBSERVER "OBSERVER_IP:PORT";
-
- 这里将所有的Observer从集群中删除掉
- OBSERVER_IP:你要删除的Observer 节点IP
- PORT:fe.conf 中的 edit_log_port,默认9010
- sh bin/start_fe.sh --helper master_fe_ip:port --daemon
-
- master_fe_ip:你要Master FE 节点IP,如果是单个Follower就是你的这个Follower节点IP
- port:fe.conf 中的 edit_log_port,默认9010
- ALTER SYSTEM ADD OBSERVER "OBSERVER_IP:PORT";
-
- 这里是你刚才启动Observer节点加入到集群中那个
- OBSERVER_IP:你要加入的Observer 节点IP
- PORT:fe.conf 中的 edit_log_port,默认9010
- show fontends;
-
- 查看FE(Follower 和你刚才添加的 Observer 运行状态是否正常)
- 你也可以通过查看你刚才添加的Observer 的日志log/fe.log 观察是否启动正常
FE在启动的时候报类似下面的错误
java.io.IOException: the self host 172.31.26.7 does not equal to the host in ROLE file 172.17.0.1. You need to set 'priority_networks' config in fe.conf to match the host 172.17.0.1 at org.apache.doris.catalog.Catalog.getClusterIdAndRole(Catalog.java:903) at org.apache.doris.catalog.Catalog.initialize(Catalog.java:805) at org.apache.doris.PaloFe.start(PaloFe.java:125) at org.apache.doris.PaloFe.main(PaloFe.java:63)
解决方案:
删除 doris-meta目录下的所有目录及文件,修改 fe.conf 里面的 priority_networks,重启即可解决
针对 Doris 0.14.7 之前版本,出现元数据错误,将其他节点从集群中删除,在作为新的节点加入,可能会存在错误,加入不成功,同时会导致其他 FE 挂掉的情况,针对之前版本正确的做法请参考下面链接