首页 游戏 软件 资讯 排行榜 专题
首页
数据库
Oracle RAC数据库实例无法拉起?检查OCR与Voting Disk健康

Oracle RAC数据库实例无法拉起?检查OCR与Voting Disk健康

热心网友
87
转载
2026-04-25

OCR与Voting Disk故障排查:当集群的“心脏”与“大脑”停摆时

OCR磁盘组无法挂载会导致CRS启动失败,表现为CRS-4535错误;常见原因包括ASM未启动、磁盘组未识别、路径权限异常或OCR文件头损坏,应优先检查ASM状态、磁盘发现结果及手动挂载尝试,并从备份恢复OCR而非直接dd清零。

OCR磁盘组无法挂载导致CRS无法启动

如果把RAC集群比作一个生命体,那么OCR(Oracle Cluster Registry)就是它的“大脑”和“配置中心”。一旦存放OCR的ASM磁盘组无法挂载,crsd.bin进程就会直接罢工退出。这时候,你运行crsctl check crs,通常会看到一种“割裂”的状态:底层服务在线(CRS-4638: Oracle High A vailability Services is online),但集群就绪服务却失联了(CRS-4535: Cannot communicate with Cluster Ready Services)。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

问题根源往往集中在几个方面:ASM实例没起来、OCR所在的磁盘组ASM认不到、磁盘路径权限不对,或者最麻烦的——磁盘组里的OCR文件头本身损坏了。

  • 第一步,确认ASM是否在运行:执行ps -ef | grep asm_pmon看看有没有进程。如果没有,别慌,先尝试手动启动:srvctl start asm -n
  • 第二步,检查ASM的“视野”:用asmcmd lsdsk -k命令,看看OCR磁盘(比如/dev/oracleasm/disks/OCR_VOTE)的状态。关键是要显示为PROVISIONED(已配置),而不是UNKNOWN(未知)。
  • 第三步,尝试手动挂载:如果磁盘能看见,但磁盘组就是挂不上,可以登录sqlplus / as sysasm,执行ALTER DISKGROUP OCR_VOTE MOUNT。这时要特别留意是否报ORA-15032ORA-15017错误,这通常指向磁盘路径不可达或者UDEV规则失效了。
  • 最重要的一点:切忌病急乱投医:千万别一看到OCR可能损坏就直接用dd命令清零磁盘,这是毁灭性的操作。正确的姿势是优先从备份恢复:先用ocrconfig -showbackup找到备份文件,然后用ocrconfig -restore 进行恢复。

Voting Disk离线引发节点驱逐(Node Eviction)

Voting Disk可不是什么“可选组件”,它是RAC集群心跳仲裁的“心脏”。规则很简单:只要集群中任何一个节点无法访问多数(Quorum)的Voting Disk,这个节点就会在60秒内被强制重启,以避免“脑裂”。日志里通常会留下这样的证据:cssd(9819)ERROR: clssnmvDRLUpdate: Aborting local node to a void split-brain.

这里有个关键认知:Voting Disk可以放在ASM磁盘组里(这也是官方推荐的做法),也可以放在裸设备或NFS上。但无论放在哪里,都必须确保所有节点对同一份Voting Disk有一致、低延迟且无中断的读写能力

  • 查看状态:运行crsctl query css votedisk,重点看输出结果中的STATE列,必须全部是ONLINE才行。
  • 诊断离线:如果状态显示OFFLINEls -l 看文件是否存在,再用dd if= of=/dev/null bs=4k count=1简单测试一下I/O通路是否畅通。
  • 注意ASM依赖:如果Voting Disk存放在ASM中,那么它的在线状态完全依赖于底层ASM磁盘组的挂载情况。如果执行crsctl query css votedisk报错CLSU-00100: Operating System function: ioctl() failed with error data: 25,十有八九是ASM没能加载到那块磁盘,或者udev绑定出了错。
  • 操作规范:添加或替换Voting Disk,必须使用crsctl replace votedisk 这个专用命令。千万不要手动去底层复制或修改文件内容,因为Voting Disk的内容是由CSS守护进程独占管理的。

OCR/Voting Disk共存于同一ASM磁盘组的风险

Oracle确实允许把OCR和Voting Disk放在同一个ASM磁盘组里(比如常见的+OCR_VOTE)。但这就像把鸡蛋放在同一个篮子里,是一把双刃剑:部署是简化了,但也把集群的“大脑”(配置)和“心脏”(仲裁)这两个最关键的路径耦合在了一起。一旦这个唯一的磁盘组因为磁盘故障、路径抖动或者ASM本身的Bug而无法挂载,整个集群会在瞬间同时失去配置管理和节点仲裁能力,后果是灾难性的。

所以,对于生产环境,强烈建议将两者分离:OCR单独放一个磁盘组(如+OCR),Voting Disk放在另一个磁盘组(如+VOTE)。更理想的情况是,这两个磁盘组后端的物理磁盘,不要共享同一个存储控制器或光纤链路,实现真正的物理隔离。

  • 检查是否共存:对比ocrcheck -detail命令输出中的Location,和crsctl query css votedisk命令输出的路径,看看它们是否属于同一个ASM磁盘组名。
  • 分离操作步骤:这是一个需要停集群的操作:crsctl stop crs -f → 在各个节点分别执行ocrconfig -repair -add +VOTE(添加新位置)→ crsctl replace votedisk +VOTE(替换投票盘)→ 清理旧路径 → 最后重启集群。
  • 特别注意ocrconfig -repair命令仅仅修复的是OCR在集群注册表中的位置信息,它不会移动物理文件。真正的物理文件迁移,需要结合dd命令或者asmcmd cp命令(使用后者要求目标磁盘组已经存在且可写)来完成。

诊断时最容易忽略的底层细节

很多DBA排查时会卡在一个尴尬的境地:磁盘路径存在、权限也对、ASM也能识别到磁盘,但实例就是拉不起来。这时候,问题往往藏在更底层:不是配置错了,而是通路“断”了。

  • 多路径映射陷阱:在多路径(multipath)环境下,ocrconfig -showbackup显示的路径可能是/dev/mapper/mpathb,而crsctl query css votedisk输出的却是/dev/oracleasm/disks/VOTE1。如果这两者之间没有通过udev规则正确映射,CSS进程根本就找不到真正的Voting Disk。
  • 检查udev规则:务必确认/etc/udev/rules.d/99-oracle-asmdevices.rules这个文件里包含了对应WWID(全球唯一标识符)的绑定规则。并且在执行start_udev重新加载规则后,通过ls -l /dev/oracleasm/disks/能看到持久化的设备链接。
  • 私网的间接影响:集群私网(Cluster Interconnect)不通,也会间接影响OCR的同步。CSS守护进程依赖UDP多播来维持集群节点视图。如果使用ping -I 测试发现丢包,或者延迟持续大于20ms,可能会触发节点的误驱逐,进而破坏OCR的一致性。
  • 时间同步的蝴蝶效应:时间不同步虽然不会直接导致实例拉不起来,但它会让OCR备份的时间戳陷入混乱。你可能会在ocrconfig -showbackup的输出中,看到未来时间的备份文件,这会在恢复时严重误导你的判断。
来源:https://www.php.cn/faq/2305636.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

台铃电车如何锁车不耗电?
电脑教程
台铃电车如何锁车不耗电?

台铃电动车锁车,真的不耗电吗? 关于电动车锁车后是否还在“偷偷”用电,很多用户心里都有个问号。答案很明确:台铃电动车的锁车状态本身,几乎不产生额外电量消耗。其核心在于一套精心设计的电子防盗系统,在锁止后,整车的主供电电路会被立刻切断,只留下防盗模块、钥匙信号接收器等核心安防单元,以极低的功耗维持待命

热心网友
04.25
老年助听器怎么安装后能用吗?
电脑教程
老年助听器怎么安装后能用吗?

老年助听器怎么安装后能用吗? 开门见山地说,给长辈选配助听器,可千万别把它当成“即插即用”的普通电子产品。这本质上是一套严谨的医疗康复流程,核心在于“专业验配”与“科学适应”。没有这两步,再好的设备也可能沦为抽屉里的闲置品。 真正的效能发挥,始于一份精准的听力“地图”——通过纯音测听、声导抗等医学检

热心网友
04.25
高考前冲刺口号
礼仪与书信
高考前冲刺口号

高考前冲刺口号 话说回来,每年到了这个时节,教室里、走廊上、甚至学生的课桌一角,总能看到一些凝聚着决心与期盼的句子。它们不仅仅是口号,更像是一股无声的力量,在最后关头为学子们注入信念。下面这份汇集了多年备考智慧的清单,或许能为你带来一些启发。 信念与心态篇 1 Everything is poss

热心网友
04.25
高中励志口号
礼仪与书信
高中励志口号

班风口号:胜不骄,败不馁,有志不在年高,但求力争上游 “胜不骄,败不馁”这六个字,分量可不轻。它源自《商君书·战法》,原话是“王者之兵,胜而不骄,败而不怨。”这提醒我们,成功时别让骄傲蒙了眼,失败时也别被沮丧拖垮了脚。保持清醒与韧性,才是长久之道。 紧接着的“有志不在年高”,出自《封神演义》。这话说

热心网友
04.25
下学期中班孩子评语
礼仪与书信
下学期中班孩子评语

下学期中班孩子评语1 1、 这孩子聪明又活泼,课堂上总能看到他高高举起的小手,思维活跃得很,发言特别踊跃。做数学题又快又准,小脑袋转得飞快,语言表达能力也强,还经常主动上来给大家讲故事。要是以后能加强小手的锻炼,让它变得更灵巧,那就更棒了,咱们一起朝着心灵手巧的目标加油吧! 2、 小家伙的口才真不错

热心网友
04.25

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

智能文本处理引擎在文本分类中有哪些优点呢
业界动态
智能文本处理引擎在文本分类中有哪些优点呢

智能文本处理引擎在文本分类中的优点 提到文本分类,很多人首先想到的是海量数据和繁琐的人工标注。但智能文本处理引擎的出现,正在彻底改变这一局面。那么,它究竟带来了哪些实实在在的优势呢?以下几个方面,或许能给你清晰的答案。 高效性 面对成山堆的文本数据,人工逐篇审阅分类的效率瓶颈显而易见。智能文本处理引

热心网友
04.26
快递面单识别应用了哪些OCR技术
业界动态
快递面单识别应用了哪些OCR技术

快递面单OCR识别:让物流信息“开口说话”的技术 在现代物流体系中,让一纸面单上的信息快速、准确地“活”起来,是提升效率的关键。这背后,倚赖的正是光学字符识别技术,也就是我们常说的OCR。这项技术的核心任务很明确:把快递面单上印刷或手写的文字信息,通过图像扫描转化为计算机能直接理解和处理的数字格式,

热心网友
04.26
什么是半监督信息抽取?
业界动态
什么是半监督信息抽取?

半监督信息抽取 信息抽取这事儿,如果纯靠人工标注,耗时费力;如果全无监督,效果又难以保证。于是,一种折中且高效的策略应运而生——半监督信息抽取。它巧妙地将监督学习与无监督学习的优势结合了起来。 那么,它具体是如何运作的呢?简单说,就是先由人工“播种”。研究者会预先定义好需要抽取的关系类型,并手动添加

热心网友
04.26
超级自动化平台是什么?
业界动态
超级自动化平台是什么?

超级自动化平台:企业效率革命的核心引擎 如果说单一的工具是解决特定问题的“螺丝刀”,那么超级自动化平台,就是为企业提供的一整套“智能工具箱”。它并非某项孤立的技术,而是集机器人流程自动化、人工智能、机器学习等多种能力于一身的综合性解决方案。更关键的是,它还集成了低代码开发、智能流程编排与数据分析等功

热心网友
04.26
多个平台店铺的财务账单核对
业界动态
多个平台店铺的财务账单核对

多平台电商店铺财务账单核对指南 在多个电商平台同时运营店铺,财务账单的核对工作是一项不小的挑战。这事儿有多重要,想必各位掌柜都深有体会。今天,咱们就来系统地聊聊,怎么把这份复杂的工作变得清晰、高效。 一、统一数据格式:打好基础第一步 想象一下,面对来自不同平台、格式各异的报表,光是“对齐口径”就能让

热心网友
04.26