主节点切换gpadmin用户输入gpstate查看状态
如果红色框内有指向左边的箭头则说明存在部分segment实例丢失。
首先查看主节点日志,重点关注发生segment丢失那段时间的日志;
主节点日志目录一般为 /usr/local/godb/data/master/gpseg-1/pg_log/
已知可能造成segment丢失的原因:频繁的内存溢出。
在主节点gpadmin用户下执行:
如果执行失败或存在部分失败,执行步骤二,否则直接执行步骤三
等待执行结束再次使用gpstate检查gp状态。
主节点切换gpadmin用户输入gpstart启动数据库
如果未出现红框内字样,说明启动失败。
使用 gpstart -v 查看启动日志明细;
进入主节点日志目录/usr/local/godb/data/master/gpseg-1/pg_log/查看 startup.log 和最新的 gpdb-2022-11-25_xxxxxx.csv 日志;
根据这些日志锁定出问题的segment实例是哪个,然后查看对应实例的日志 startup.log 和最新的 gpdb-2022-11-25_xxxxxx.csv;
重点关注日志级别为ERROR、FATAL的内容,逐个解决即可;
可能存在的问题:数据目录存在目录或文件权限不足、损坏文件等。
按照排查思路对存在的问题逐个解决,直至至少半数的segment启动成功,此时大概率是场景一的现象,按照场景一流程解决。