• linux入门6—日志分析与故障排除


    一、日志文件分析

    日志的功能:

    • 用于记录系统、程序运行中发生的各个实践
    • 通过审计日志,有助于诊断和解决故障

    日志文件的分类:

    • 内核及系统日志:有系统syslog统一管理,日志格式基本一致
    • 用户日志:记录用户登录与退出系统的相关信息
    • 程序日志:由各种应用程序独立管理,记录格式不一

    1、主要日志文件

    默认保存在/var/log文件夹下:

    • messagees:记录Linux内核消息及各种应用程序的公共日志信息,包括启动、IO错误、网络错误、程序故障等。对于未使用独立日志文件的应用程序或服务,一般都可以从该日志文件中获得相关的事件记录信息。
    • cron:记录crontab计划任务产生的各种事件
    • dmesg:记录系统在启动过程中的各种事件信息
    • mailog:邮件相关日志,记录邮件发出和接受的相关活动
    • lastlog:系统中每个用户的最近登录时间
    • rpmopakgs:记录系统中安装rpm的相关信息
    • 用户登录日志:
      • secure:系统安全日志,记录系统用户认证事件
      • wtmp:系统用户登录成功的、注销、重启、停机事件。
      • btmp:系统用户登录失败、错误的登录尝试与验证事件。

    2、日志文件分析

    用户登录相关日志分析:

    • users :输出当前登录的用户名称
    • who:登录到系统的用户信息,包括终端类型、登录日期以及远程主机
    • w:比who显示的信息更加详细,主机运行时间、登录用户数量、平均负载等
    • last:查询用户最近登录情况。
    • lastb:查询登录失败的用户记录,如用户名、密码错误等

    程序日志分析:

    • web服务:/var/log/httpd/
      • accesss_log
      • error_log
    • 代理服务:/var/log/squid
      • access_log
      • cache_log
    • FTP服务:/car/log/xferlog

    3、 日志管理策略

    • 及时做备份和归档
    • 延长日志保存期限
    • 控制日志访问权限,日志中可能会包含一些敏感信息,如账户口令等。
    • 集中管理日志
      • 将日志文件发送到统一的日志管理服务器
      • 便于日志信息的统一收集、整理和分析
      • 杜绝日志信息的意外丢失、恶意篡改和删除。

    二、系统启动类故障排查

    1、MRB扇区故障

    故障原因:

    • 病毒木马等造成破坏或者不正确的分区操作、磁盘读写操作

    故障现象:

    • 找不到硬盘,系统中断
    • 无法加载操作系统,开机后黑屏

    解决思路:

    • 提前做好异地备份文件
    • 进入急救模式
    • 从备份文件中恢复

    2、GURB引导故障

    故障原因

    • MRB中的GRUB引导程序遭到破坏
    • grub.conf文件丢失,导致引导配置错误

    故障现象:系统引导停滞,显示"grub>"提示符

    解决思路:

    • 尝试手动输入引导命令
    • 进入急救模式,重写或者从备份文件恢复
    • 向MRB扇区中重建grub程序

    3、遗忘root用户秘密

    解决思路:进入急救模式,重设密码

    三、文件系统类故障排查

    1、修复文件系统

    故障原因:

    • 非正常关机、突然断电、设备读写失误等
    • 文件系统的超级块(super-block)信息被破坏

    故障现象:

    • 无法向分区中读取或写入数据
    • 启动后提示“Give root password for maintenance”

    解决思路:

    • 根据提示输入 root 口令,进入修复状态
    • 使用xfs_repair命令进行修复

    2、磁盘资源耗尽

    解决思路:

    • 清理磁盘空间,删除无用、冗余的文件
    • 转移或删除占用大量 i 节点的琐碎文件
    • 为用户设置磁盘配额
    • 添加磁盘空间

    3、检测磁盘坏道

    故障原因:磁盘设备中存在坏道(逻辑的或物理的)

    故障现象:

    • 读取磁盘中的数据时,磁盘设备发出异常声响。
    • 访问磁盘中的某个文件时,反复读取且出错,提示文件损坏
    • 对于新建立的分区无法完成格式化
    • 系统使用该磁盘时频繁死机

    解决方案:

    • 检测硬盘中是否存在坏道
    • 修复硬盘,或更换新的硬盘

  • 相关阅读:
    go test用法(获取单元测试覆盖率)
    【深度学习】05-02-自注意力机制多种变形-李宏毅老师21&22深度学习课程笔记
    Java学习--多线程
    Anaconda配置pip源
    接口测试基本知识点
    js实现链式调用,查询和处理数据
    【JavaSe笔记】——final关键字,常量,抽象类的定义使用和特征
    简单!这可能是最快速的个人博客搭建姿势!|原创
    【C语言】深度剖析数据在内存中的存储
    海康威视二次开发适配安卓电视盒子
  • 原文地址:https://blog.csdn.net/qq_45590334/article/details/126246237