Oracle Grid Infrastructure IPv6 配置全指南:版本兼容性、SCAN/VIP设置、防火墙规则与OCR路径优化
IPv6地址格式与GI安装程序兼容性问题
在Oracle Grid Infrastructure中部署IPv6网络,首要任务是确认版本兼容性。官方完整支持始于19c版本,12.2版本仅为实验性功能,而12.1及更早版本则完全不支持IPv6地址。若安装过程中gridsetup.sh脚本报错prvg-11405 : ip address is not valid或自动跳过网卡配置,通常源于版本过低或地址格式不规范。
- 遵循标准地址格式:必须采用RFC规范的全压缩或双冒号压缩格式,例如
2001:db8:abcd:0001::1或2001:db8:abcd:1::1。需特别注意,避免使用::ffff:192.168.1.1这类IPv4映射地址,GI安装程序无法正确识别。 - 规范hosts文件配置:在
/etc/hosts中,每个IPv6地址需独立成行对应一个主机名,禁止在同一行配置多个别名。配置的主机名必须与hostname -s输出完全匹配,且严格区分大小写。 - 验证地址有效性:通过
ifconfig或ip -6 addr show命令确认网卡已启用全局范围(global scope)的IPv6地址。GI安装程序会忽略链路本地地址(fe80::/64),仅识别可路由的全局地址。
SCAN与VIP必须显式配置IPv6地址
仅配置网络层IPv6地址并不足以确保GI集群正常使用IPv6协议。默认情况下,GI会优先读取/etc/hosts中的IPv4条目,导致SCAN和VIP可能自动回退至IPv4模式。若未显式配置,集群启动后执行crsctl stat res -t常会显示SCAN VIP处于OFFLINE状态。
- 安装响应文件预配置:在GI安装响应文件中,需明确设置
oracle.install.crs.config.scanType=STATIC,并指定IPv6格式的SCAN地址,例如:oracle.install.crs.config.scanAddress=2001:db8:abcd:1::100。 - 手动添加VIP资源:VIP资源无法自动发现,必须通过
srvctl add vip命令手动创建。正确命令格式为:srvctl add vip -node node1 -address “2001:db8:abcd:1::101/128”。关键点在于子网掩码必须设置为/128,而非常见的/64。 - 切换SCAN监听器协议:默认的SCAN监听器(
LISTENER_SCAN1)绑定于IPv4地址。需先通过srvctl config scan_listener查看当前配置,再使用srvctl modify scan_listener -u命令将其更新至IPv6模式。
防火墙与路由规则导致的节点间IPv6通信故障
基础连通性测试(如ping6)通过并不代表集群内部通信正常。OCR和CSSD等核心进程依赖UDP端口(如47155、51000)进行通信。常见问题是系统防火墙(iptables/nftables)默认仅过滤IPv4流量,而ip6tables链规则可能为空或被禁用。
- 放行关键UDP端口:执行
ip6tables -L -n检查并确保放行必要的UDP端口范围,包括CSSD使用的47150-47160、CRSD使用的51000-51100以及SCAN监听器端口1521。 - 正确设置内核参数:确认内核参数
net.ipv6.conf.all.disable_ipv6 = 0及针对具体网卡的net.ipv6.conf.已设置为0。在systemd管理环境中,需特别注意启动脚本是否会覆盖这些参数。.disable_ipv6 = 0 - 管理地址自动配置:在多网段部署时,需关闭路由器的地址自动配置(autoconf)功能,防止节点获取临时IPv6地址。服务器重启后地址若发生变化,将导致OCR无法定位投票盘,引发集群故障。
OCR设备路径在IPv6环境下的配置要点
OCR存储路径配置是IPv6部署中的关键环节。若OCR位于ASM磁盘组(如+DATA),其底层通信仍依赖GIMR网络。但若OCR存放于裸设备或NFS,且路径中包含主机名(如nfs-server.example.com:/ocrvol),GI启动时会尝试通过IPv6解析该域名。多数DNS服务器未配置AAAA记录,将导致OCR初始化超时与启动失败。
- 采用字面量地址路径:最可靠的方案是直接使用IPv6字面量地址作为OCR路径,格式为:
[2001:db8:abcd:1::200]:/ocrvol(IPv6地址需用方括号包裹)。 - 避免使用域名引用:执行
ocrconfig -add命令时,应避免使用含域名的路径。即使在单节点测试环境中,也建议启用ocrconfig -manual模式,以跳过GI的自动网络探测。 - 启动前集群验证:在启动GI前,可运行
cluvfy comp ocr -n all -verbose命令进行预检。该集群验证工具会通过IPv6路径执行真实连通性测试,有助于提前发现配置问题。
综上所述,为Oracle GI启用IPv6双栈是一项系统性工程,远非简单配置网络地址即可完成。GI对IPv6的支持涉及CSSD、CRSD、OHASD等底层组件及SCAN Listener等上层服务,每个组件均有独立的地址绑定逻辑。任一环节疏漏均可能导致集群静默回退至IPv4或服务挂起。故障排查时,需重点关注$GRID_HOME/log/日志中的“binding to”与“failed to resolve”关键字,尽管错误信息中可能不会直接提及“IPv6”。
