码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • oracle:记一次磁盘头故障处理


    背景:集群宕机以后,重启报错,DATADG1磁盘组无法启动
    1.手动挂起DATADG1磁盘组 报错

    alter diskgroup datadg1 mount
    
    • 1

    在这里插入图片描述
    后台ASM报错
    根据报错 found 0 disks 怀疑 是磁盘组里的磁盘有问题,没有启动
    在这里插入图片描述

    2.查询磁盘状态

    select name,path,STATE,MODE_STATUS from v$asm_disk;
    
    • 1

    在这里插入图片描述

    发现磁盘都在,但是磁盘组没法跟磁盘对应起来
    3.硬件工程师检查硬盘、以及存储网关都正常,磁盘权限也正常
    4.怀疑是磁盘头损坏了,导致磁盘组跟磁盘无法对应

    select group_Number,disk_number,mount_status ,header_status from v$asm_disk;
    
    • 1

    在这里插入图片描述

    发现2,3磁盘头状态为CANDIDATE
    5.使用kfed查看磁盘头

    kfed read /dev/rhdiskpower2
    
    • 1

    在这里插入图片描述

    kfbh.type显示异常 正常情况下应该是KFBTYP_DISKHEAD
    6.修复2,3磁盘头
    从版本10.2.0.5开始ASM 会对disk header做一个额外的备份。即第二AU 的倒数第二个block中备份了一份KFBTYP_DISKHEAD。这个ASM Disk header的作用是当真的KFBTYP_DISKHEAD被意外覆盖或损坏时可以使用Oracle 工具 KFED使用repair选项来修复Disk header
    kfed repair //dev/rhdiskpower2
    此时检查 磁盘头状态正常,显示为KFBTYP_DISKHEAD
    7.一节点的数据库反复重启
    修复磁盘头以后,磁盘能够正常挂起,并且数据库能够拉起
    但是数据库在运行一段时间后 ,出现宕机
    在这里插入图片描述

    数据库日志显示 IO错误
    由于操作系统为AIX,排查两个节点的磁盘参数

    lsattr -El hdisk20 | grep reserve
    
    • 1

    发现二节点并没有设置no_reserve
    这个参数的作用:这个参数其实是表示操作系统是否持有存储卷的共享锁方式
    设置

    chdev -l hdisk21 -a reserve_policy=no_reserve
    
    • 1

    设置完成后,一节点能够正常运行
    8.二节点gpnpd服务无法启动
    在这里插入图片描述

    根据gipcd 日志信息

    匹配到官方文档Doc ID 2034669.1

    删除以上三个目录的缓存,重启rac,二节点启动成功

  • 相关阅读:
    mac安装redis及springboot整合redis,简单快速
    【PyTorch实战演练】AlexNet网络模型构建并使用Cifar10数据集进行批量训练(附代码)
    师德师风演讲稿写作格式:如何用三句话吸引听众的注意力
    第11章 虚拟实验室概述
    golang单元测试:testing包的基本使用
    Spring-AOP底层原理
    文件定时自动备份方法
    快速上手Linux核心命令(九):文件备份与压缩
    <SQL>《SQL命令(含例句)精心整理版(3)》
    黑猫带你学Makefile第10篇:如何将未被编译的代码/自己写的驱动编译进uboot
  • 原文地址:https://blog.csdn.net/weixin_42575078/article/details/136595691
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号