转载请注明出处:
服务器中断,重启服务器在重启kafka服务时,遇到如下报错:
2024-06-05 13:52:56,251 [myid:] - ERROR [main:ZooKeeperServerMain@64] - Unexpected exception, exiting abnormally java.io.EOFException at java.io.DataInputStream.readInt(DataInputStream.java:392) at org.apache.jute.BinaryInputArchive.readInt(BinaryInputArchive.java:63) at org.apache.zookeeper.server.persistence.FileHeader.deserialize(FileHeader.java:64) at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.inStreamCreated(FileTxnLog.java:585) at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.createInputArchive(FileTxnLog.java:604) at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.goToNextLog(FileTxnLog.java:570) at org.apache.zookeeper.server.persistence.FileTxnLog$FileTxnIterator.next(FileTxnLog.java:652) at org.apache.zookeeper.server.persistence.FileTxnSnapLog.restore(FileTxnSnapLog.java:158) at org.apache.zookeeper.server.ZKDatabase.loadDataBase(ZKDatabase.java:223) at org.apache.zookeeper.server.ZooKeeperServer.loadData(ZooKeeperServer.java:283) at org.apache.zookeeper.server.ZooKeeperServer.startdata(ZooKeeperServer.java:410) at org.apache.zookeeper.server.NIOServerCnxnFactory.startup(NIOServerCnxnFactory.java:118) at org.apache.zookeeper.server.ZooKeeperServerMain.runFromConfig(ZooKeeperServerMain.java:119) at org.apache.zookeeper.server.ZooKeeperServerMain.initializeAndRun(ZooKeeperServerMain.java:87) at org.apache.zookeeper.server.ZooKeeperServerMain.main(ZooKeeperServerMain.java:53) at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:116) at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:78) ZooKeeper JMX enabled by default
解决方案
- 从备份恢复:如果您有最近的ZooKeeper数据目录的备份,从这个备份恢复将是解决问题最快的方式。确保备份是在ZooKeeper服务器正常运行时的状态。
- 手动恢复日志:
- 如果ZooKeeper服务器仍在运行,请先停止它。
- 定位包含
data
和datalog
目录的ZooKeeper数据目录。 - 导航到
datalog
目录并识别出问题的日志文件(例如,log.0
,snap.0000000000
)。 - 您可能需要手动编辑或删除这些文件以清除损坏。请谨慎操作,并在进行之前确保您有备份。
- 清除损坏文件后,重新启动ZooKeeper服务器。
- 检查磁盘空间:确保磁盘有足够的空间,不是满的或几乎满的。磁盘空间不足有时可以表现为文件操作期间出现EOFException。
- 检查ZooKeeper版本兼容性:如果您最近升级了ZooKeeper,请确保集群中的所有节点都运行的是兼容版本。版本不匹配可能导致序列化/反序列化问题。
- 启用调试日志:为了获得更多关于问题的洞察,考虑为ZooKeeper启用调试日志。这可以提供更详细的故障机制信息。在ZooKeeper配置文件(
zoo.cfg
)中设置日志级别为DEBUG,并查看日志以获取更多线索。
解决方式:
将zookeeper 存放 data和datalog的目录进行重命名之后,再重启kafka,服务得以正常启动。