记一次客户生产环境报错。
环境为windows server 2008,oracle监听突然失效外部无法连接,查看日志,alert_orcl.log报错ORA-00600,listener.log报错TNS-12531: TNS: 无法分配内存。
一开始以为是程序异常占用大量内存导致,重启观察一段时间监听再次报错,但是内存使用率仅50%,且cpu和文件句柄数其他都正常。
最后发现是windows共享内存不足导致的,windows没法查看共享内存的使用情况(这点很坑)。导致的原因为,人工误删了一个批处理文件,有一个程序会定期执行"start ***.bat"调用此脚本,当文件不存在时start命令会无限制循环重试,最后导致共享内存不足引起oracle监听异常。
总结:
windows环境下利用start 启动某个程序或脚本时一定要确保路径存在(call 命令没有验证过),不然资源管理器叶无法发现异常,不像linux能看到/dev/shm共享内存的使用情况。