首页 游戏 软件 资讯 排行榜 专题
首页
数据库
Oracle RAC如何执行集群健康检查?运行cluvfy脚本验证

Oracle RAC如何执行集群健康检查?运行cluvfy脚本验证

热心网友
54
转载
2026-04-16

cluvfy.sh 能检查什么,不能检查什么

首先需要明确:cluvfy.sh 是 Oracle 官方提供的集群验证工具,但其本质是一个“静态环境”检查器,而非实时监控系统。它的核心价值在于,在执行关键操作(如 Oracle RAC 安装、升级、添加节点)之前,对系统环境进行一次全面的“合规性快照”。这份快照能够验证 OCR、表决磁盘的配置路径是否正确,网络设置(包括私网、公网、SCAN)是否符合规范,以及时间同步、用户权限、内核参数等基础配置是否满足当前 Oracle 版本的官方要求。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

然而,该工具也存在明确的局限性。对于集群运行时的动态状态,cluvfy.sh 无能为力。例如,它无法检测 crsd 进程是否已僵死但未崩溃,无法验证 ASM 磁盘组在高负载下的实际可写性,也无法发现因网络瞬时中断导致的节点“静默”脱离(这类问题需依赖 crsctl check cluster -allolsnodes -n 等实时命令进行判断)。

一个常见的误解是将其作为日常“健康检查”工具反复运行。实际上,它最适合在打补丁前、升级前或扩容节点后等“关键变更前”执行一次。请重点关注输出结果中的 Verification Summary 部分,其中的 PASSFAILWARNING 状态是决策的核心依据。

运行 cluvfy.sh 的最小必要参数组合

直接运行 ./cluvfy.sh 通常会报错或仅显示帮助文档。要使其正常工作,必须携带合适的参数。以下几组命令组合,基本覆盖了最核心的检查场景:

  • ./cluvfy.sh comp nodecon -n all -verbose:这是验证所有节点间网络连通性的“全集”检查,涵盖私网、公网、SCAN 名称解析及 UDP 端口连通性。
  • ./cluvfy.sh stage -pre crsinst -n all -verbose:模拟安装集群就绪服务(CRS)前的全量预检查,从磁盘空间、用户权限到操作系统配置,进行彻底验证。
  • ./cluvfy.sh comp peer -refnode rac01 -n “rac01 rac02” -verbose:此命令非常实用,它以 rac01 节点为参考基准,比对 rac01rac02 节点的环境一致性,如内核参数、ulimit 设置、grid 用户目录权限等,确保集群环境标准化。

重要提示:使用 -n all 参数时,要求集群所有节点均在线且已配置 SSH 互信免密登录。若某个节点宕机,cluvfy 将跳过对该节点的检查并报告 Node is not reachable 信息——这并非脚本执行失败,而是符合预期的正常行为,其余检查仍会继续。

常见 FAIL 和 WARNING 的真实含义与处理

cluvfy 的输出中常出现大量 WARNING,但无需过度紧张,许多警告并不阻碍安装进程。例如:

  • WARNING: NTP time synchronization is not configured:此警告表示未检测到标准 NTP 服务配置。但若你已使用 chronyd 或通过 ntpd -q 完成时间同步,且所有节点间时间差在可接受范围内(通常要求小于1秒),则可安全忽略。
  • FAIL: Package ‘cvuqdisk’ is missing:此项失败为“硬性阻碍”,必须解决。缺少 cvuqdisk 包将导致 OCR 无法正常读写。在 RHEL 或 CentOS 系统上,运行 yum install cvuqdisk-*.rpm 安装即可,该 RPM 包位于 Grid 安装介质的 /rpm 目录下。
  • FAIL: User “grid” is not a member of group “asmadmin”:这表明 grid 用户的组权限不完整。需执行 usermod -a -G asmadmin,asmdba,asmoper grid 命令将其加入必要的管理组。

真正需要高度警惕并立即处理的,是涉及核心组件的 FAIL 项。例如:OCR 或表决磁盘的配置路径无法访问、ASM 磁盘的兼容性属性不一致(如一个磁盘设为 COMPATIBLE.ASM=‘12.1.0’,另一个为 ‘19.0.0’),或私网网卡的 MTU 值不统一导致集群心跳 UDP 包被丢弃。此类问题若不解决,后续的安装或运行必然会出现严重故障。

高效查看 cluvfy 输出日志的技巧

默认情况下,cluvfy 的结果会滚动输出至终端,但最详尽的信息隐藏在其自动生成的 HTML 报告中。每次运行后,注意查看当前目录下生成的 cvu_*.html 文件(例如 cvu_2024-04-15_10-22-33.html)。用浏览器打开该文件,并逐一点击每个检查项旁的 Details 链接,即可查看背后具体执行的命令及其返回值。

对于追求效率的运维人员,更高效的方法是:通过 -o 参数将文本日志重定向至文件,再利用 grep 快速提取关键信息。

./cluvfy.sh stage -pre crsinst -n all -verbose -o /tmp/cluvfy.log
grep -E “(FAIL|WARNING|Verification Summary)” /tmp/cluvfy.log

请记住,无需逐行阅读数千行的完整日志——cluvfy 的设计初衷是帮助运维快速定位标红(FAIL)和标黄(WARNING)的问题项,而非理解每条检查背后复杂的 Shell 命令逻辑。

最后,必须再次强调:cluvfy.sh 检查全部通过,仅代表“在检查时刻,系统环境满足了 Oracle 官方认可的安装最低要求”,并不等同于集群未来高枕无忧、永远稳定。真实生产环境中的许多故障,源于资源突发争用、存储后端延迟骤增,或心跳包因交换机 ACL 策略被意外限速——这些动态的、深层次的隐患,恰恰是 cluvfy.sh 无法探测的盲区。

来源:https://www.php.cn/faq/2315632.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

.NET 6应用如何优化Oracle数据库访问性能
数据库
.NET 6应用如何优化Oracle数据库访问性能

NET 6访问Oracle性能差的主因是ODP NET默认启用StatementCache引发的元数据查询开销,需配置Statement Cache Size、Metadata Performance和Connection Timeout三项参数,并预热连接。 开门见山,先说核心结论:如果你的

热心网友
05.05
为什么Oracle 12c AWR报告中没有ADDM建议_检查统计信息完整性
数据库
为什么Oracle 12c AWR报告中没有ADDM建议_检查统计信息完整性

ADDM报告为空的三大主因:一是STATISTICS_LEVEL非TYPICAL ALL导致关键统计缺失;二是指定快照区间DB Time<5秒,ADDM主动跳过分析;三是DBA_HIST_*视图(如ASH)数据不完整,使ADDM无法构建资源链路。 ADDM报告为空或无建议,根本不是AWR报告“没生成

热心网友
05.05
数据库(DB)和数据仓库(DW)的区别
数据库
数据库(DB)和数据仓库(DW)的区别

文章主标题(保留原文) 今天,我们就来深入探讨一个核心问题。许多人在执行过程中常常感到困惑:为何付出同等努力,结果却大相径庭?这背后,一个至关重要的环节往往被大多数人忽略了。 第一个核心概念:理解底层运行逻辑 事实可能出乎你的意料。绝大多数人在起步阶段就陷入了误区,他们热衷于追逐复杂的技巧,却忽视了

热心网友
04.30
Oracle RAC如何监控高负载节点?利用AWR报告定位性能瓶颈
数据库
Oracle RAC如何监控高负载节点?利用AWR报告定位性能瓶颈

角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是:在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。 特

热心网友
04.30
Oracle如何通过表空间管理优化高并发写入_合理设置PCTFREE
数据库
Oracle如何通过表空间管理优化高并发写入_合理设置PCTFREE

Oracle存储参数调优:ASSM时代PCTFREE与PCTUSED的真相与实战 在Oracle数据库的存储管理中,PCTFREE和PCTUSED是两个历史悠久的基础参数。但随着自动段空间管理(ASSM)成为默认选项,很多DBA对它们的理解还停留在手动段管理时代,导致在实际高并发或数据更新频繁的场景

热心网友
04.30

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

POE交换机连接设备后频繁重启原因解析
电脑教程
POE交换机连接设备后频繁重启原因解析

Poe交换机带载后重启:是故障,还是系统在“自救”? 不少朋友遇到过这个头疼的问题:PoE交换机一接上设备就重启。其实,这本质上不是设备坏了,而是供电系统一套精密的自我保护机制在起作用。当负载接入的瞬间,如果系统检测到功耗超标、供电不稳等情况,就会主动触发复位,防止硬件受损。这正是IEEE 802

热心网友
05.06
电饼铛选购指南哪款型号性价比最高
电脑教程
电饼铛选购指南哪款型号性价比最高

高性价比电饼铛:精准匹配、扎实可靠、真正省心 挑选一款高性价比的电饼铛,核心其实很明确:功能要精准匹配你的真实需求,材质工艺必须扎实可靠,细节设计能让你每天用着都省心。它追求的绝不是单纯的便宜或者参数漂亮,而是每一分钱都花在刀刃上。比如,2100W级的稳定火力保证了煎烤效率不打折;0氟不粘涂层配合蜂

热心网友
05.06
红米K30 5G动态壁纸不联网可以使用吗
电脑教程
红米K30 5G动态壁纸不联网可以使用吗

红米K30 5G动态壁纸联网机制全解析 关于红米K30 5G的动态壁纸是否需要一直联网,答案是:完全没必要。这玩意儿用起来其实很“懂事”,它只在你第一次上手和偶尔想换新的时候,才需要网络搭把手。 其背后的逻辑很清晰:手机搭载的MIUI系统,把所有酷炫的动态壁纸资源都放在了小米官方的“云端仓库”里。所

热心网友
05.06
vivo Y35手机桌面时间不显示修复方法
电脑教程
vivo Y35手机桌面时间不显示修复方法

vivo Y35桌面时间不显示?别急,这事儿有解 不少vivo Y35用户可能都遇到过这个情况:一觉醒来,或者换个主题之后,主屏幕上那个熟悉的“时间”不见了。先别急着怀疑手机坏了,事实是,超过八成的类似问题,根源其实很简单——时间组件压根没被“请”上桌面,或者相关的自动设置被无意中关闭了。作为一台搭

热心网友
05.06
英雄联盟手游杰斯新皮肤获取方法与实战评测
游戏攻略
英雄联盟手游杰斯新皮肤获取方法与实战评测

英雄联盟手游杰斯新皮肤外观设计酷炫,充满科技感。技能特效以蓝色能量为主,视觉效果震撼且辨识度高。实战中技能清晰、手感流畅,能提升操作自信与战场表现。整体而言,该皮肤在视觉、特效与实战体验上均表现优异,值得玩家入手。

热心网友
05.06