首页 游戏 软件 资讯 排行榜 专题
首页
数据库
Redis集群部署如何优化系统参数_调整透明大页(THP)设置提升性能

Redis集群部署如何优化系统参数_调整透明大页(THP)设置提升性能

热心网友
97
转载
2026-04-27

Redis集群部署如何优化系统参数:调整透明大页(THP)设置提升性能

Redis集群部署如何优化系统参数_调整透明大页(THP)设置提升性能

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

为什么 Redis 集群必须禁用透明大页(THP)

说到Redis集群的性能,内存分配的延迟是绝对的“命门”。而Linux系统默认开启的透明大页(THP)功能,恰恰会在这里埋下隐患。THP的本意是好的,它会在运行时动态地将多个4KB的小内存页面合并成2MB的大页,以期提升某些应用的性能。但问题来了:这种动态合并的过程,会导致fork()系统调用的耗时急剧增加。

对于Redis来说,这意味着什么?意味着执行RDB快照生成和AOF重写(rewrite)这类后台操作时,会变得异常缓慢。实测数据表明,开启THP时,一次bgsa ve的耗时可能增长3到10倍。这直接带来的后果就是操作超时、主从连接中断,甚至在集群模式下导致槽位迁移失败。更糟的是,在高内存负载下,这种延迟还可能触发系统的OOM killer,直接把redis-server进程给“干掉”。

所以,这绝不是一个可做可不做的“优化项”,而是Redis官方白纸黑字强调的生产环境硬性前提。任何想要稳定运行的Redis集群,都必须跨过这道坎。

如何永久禁用 THP(适用于所有 Redis 节点)

临时关闭THP很简单,但重启就失效,对于生产环境毫无意义。要确保集群长期稳定,必须将禁用设置固化到系统级配置中。这里有几种主流方法:

  • 传统方法(编辑rc.local):对于仍在使用/etc/rc.local的系统(如RHEL/CentOS 7或Ubuntu 16.04+),可以在exit 0这行之前添加以下两行命令:
echo never > /sys/kernel/mm/transparent_hugepage/enabled
echo never > /sys/kernel/mm/transparent_hugepage/defrag
  • 现代方法(推荐,使用systemd):通过创建systemd的drop-in服务文件来管理,这样更清晰,也避免了直接修改系统脚本。首先创建一个服务文件/etc/systemd/system/disable-thp.service,内容如下:
[Unit]
Description=Disable Transparent Huge Pages (THP)
DefaultDependencies=no
Before=sysinit.target

[Service]
Type=oneshot
ExecStart=/bin/sh -c 'echo never > /sys/kernel/mm/transparent_hugepage/enabled && echo never > /sys/kernel/mm/transparent_hugepage/defrag'
RemainAfterExit=yes

[Install]
WantedBy=basic.target

然后执行命令启用它:sudo systemctl daemon-reload && sudo systemctl enable disable-thp.service && sudo systemctl start disable-thp.service

  • 验证与注意事项:执行cat /sys/kernel/mm/transparent_hugepage/enabled,如果输出显示[never](注意中括号是落在never上的),就表示禁用成功了。另外需要警惕,部分云服务商(例如AWS EC2)提供的镜像可能预装了tuned工具,它会覆盖你的设置。务必检查并禁用tuned中与THP相关的性能优化方案(profile)。

Redis 集群节点还需同步调整的关联参数

禁用了THP,只能说完成了第一步。如果不配套调整其他几个关键的内核和Redis参数,性能提升的效果可能会大打折扣。以下几个配置需要同步跟进:

  • vm.overcommit_memory = 1:将这个参数写入/etc/sysctl.conf并执行sysctl -p生效。它的作用是让系统在内存分配上采取更“宽松”的策略,确保Redis执行fork()创建子进程时,不会因为严格的内存检查而失败。
  • net.core.somaxconn = 511:同样在/etc/sysctl.conf中设置,建议值至少为511,在高连接场景下可以设置为65535。这个参数决定了系统允许的未完成连接队列的最大长度,对于集群节点间频繁的gossip通信至关重要,能有效防止连接队列溢出。
  • Redis自身配置:在Redis配置文件(如redis.conf)中,需要确保tcp-backlog 511(这个值必须小于等于上面somaxconn的设置),同时根据业务对主从延迟的容忍度,合理调大repl-backlog-size,例如设置为1024mb
  • 禁用Swap:执行sudo swapoff -a临时关闭,并注释掉/etc/fstab中关于swap分区的行以永久生效。一旦Redis的数据被换出(swap out)到磁盘,访问延迟将变得完全不可控,必须杜绝。

验证 THP 禁用后的真实影响

配置做完,不能只看系统状态,关键还得看Redis自己的“体检报告”。以下是一些有效的验证手段:

  • 监控持久化指标:使用INFO persistence命令,重点关注rdb_last_bgsa ve_time_sec(上次RDB保存耗时)和aof_last_rewrite_time_sec(上次AOF重写耗时)。对比禁用THP前后的数值,如果耗时下降超过50%,才算真正见效。
  • 检查错误日志:留意Redis日志中是否还会出现类似Failed to open the temp file for AOF rewritingCan‘t sa ve in background: fork: Cannot allocate memory的错误。这类错误往往是THP与vm.overcommit_memory设置不当共同导致的。
  • 观察性能波动:运行redis-cli --stat来观察instantaneous_ops_per_sec(每秒操作数)的波动情况。THP禁用后,这个指标的峰值稳定性通常会有显著提升。
  • 容器化部署特别提醒:在Kubernetes中部署Redis集群时,需要在Pod的securityContext.sysctls中显式设置vm.overcommit_memory等参数。同时,必须确保容器运行时(如containerd)允许修改这些内核参数(可能需要配置unmask)。

最后必须强调,THP就像一个“静默杀手”,它本身不会抛出异常,只会让集群性能在不知不觉中持续劣化,稳定性变得越来越脆弱。在集群环境中,只要有一台节点漏配了这个设置,就等于为整个集群埋下了一颗不定时冲击波。因此,这项配置的检查和落实,必须做到百分百覆盖,不留死角。

来源:https://www.php.cn/faq/2314374.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

别信大众智慧?研究称预测市场真正依赖的是“知情少数派”
web3.0
别信大众智慧?研究称预测市场真正依赖的是“知情少数派”

预测市场的真相:是群体智慧,还是少数人的游戏? 说起预测市场,很多人脑海里会立刻浮现出“群体智慧”这个词。成千上万的用户对事件反赌,最终价格似乎总能精准反映现实概率——这听起来像是民主化预测的完美典范。但最近一项来自伦敦商学院和耶鲁大学的研究,却给这个浪漫的想象泼了一盆冷水。 研究团队发现,像Pol

热心网友
04.27
伊朗警告波斯湾安全形势严峻,霍尔木兹海峡紧张局势加剧
web3.0
伊朗警告波斯湾安全形势严峻,霍尔木兹海峡紧张局势加剧

伊朗议员警告:若安全受威胁,波斯湾航道或陷动荡 伊朗议员法达侯赛因·马利基近日发出警告,称如果伊朗的沿海安全受到威胁,波斯湾和阿曼海将出现不安全局势。这无疑给该地区的航运前景蒙上了一层阴影。与此同时,市场对于霍尔木兹海峡交通将于5月15日恢复正常的预期,也出现了微妙变化,目前概率为14 5%。是的,

热心网友
04.27
Oracle RAC如何检查归档模式?跨节点确认归档归属
数据库
Oracle RAC如何检查归档模式?跨节点确认归档归属

Oracle RAC归档日志全面检查指南:节点级验证与线程归属深度解析 在Oracle RAC集群环境中,归档日志的配置与状态检查是一项需要精细化操作的关键任务。它要求数据库管理员必须对每个节点逐一进行归档模式、路径设置、日志生成状态的审查,并深刻理解日志线程归属的核心逻辑。检查的核心流程是:首先通

热心网友
04.27
Oracle RMAN恢复时如何重命名日志文件_配置日志路径参数
数据库
Oracle RMAN恢复时如何重命名日志文件_配置日志路径参数

解决RMAN恢复时日志文件名冲突引发的 ORA-01157 错误 在使用RMAN执行数据库恢复操作时,若目标磁盘上已存在同名的在线重做日志文件(例如 redo01 log),恢复进程常会中断并抛出 ORA-01157: cannot identify lock data file 错误。值得注意的是

热心网友
04.27
SQL如何查询用户连续达标的天数_窗口函数状态机模型
数据库
SQL如何查询用户连续达标的天数_窗口函数状态机模型

SQL如何查询用户连续达标的天数:窗口函数状态机模型 说起查询“连续达标”天数,很多人的第一反应可能是用日期相减。但这里有个本质问题需要先想清楚:我们到底在识别什么? “连续达标”的本质是识别不间断的满足条件时间序列,需用LAG()判断状态延续性并用SUM() OVER构造段ID,而非依赖日期相减。

热心网友
04.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

卡达诺2030蓝图发布:莱奥斯升级引领网络进化
web3.0
卡达诺2030蓝图发布:莱奥斯升级引领网络进化

卡达诺生态的下一站:从研发深水区驶向规模化蓝海 区块链世界从不缺少雄心,但能将蓝图一步步变为现实的玩家却不多。近期,卡达诺核心开发团队Input Output Global(IOG)发布了一份面向2030年的网络可扩展性战略,目标明确:将网络每月交易处理能力从当前的80万笔,大幅提升至2700万笔。

热心网友
04.27
企业加密货币wallet是什么?热wallet与冷wallet如何选择?
web3.0
企业加密货币wallet是什么?热wallet与冷wallet如何选择?

企业加密货币钱&包:在便捷与安全之间找到你的平衡点 数字化浪潮下,企业如何安全、高效地管理数字资产,成了一个绕不开的核心议题。企业加密货币钱&包,正是为此而生的专业工具。它远不止一个存储地址那么简单,更是集成了多用户权限、交易审批、财务系统对接等企业级功能的管理中枢。简单来说,它的核心任务就两个:安

热心网友
04.27
PhpStorm配置GitHub Copilot_AI辅助编程插件安装与使用
编程语言
PhpStorm配置GitHub Copilot_AI辅助编程插件安装与使用

PhpStorm配置GitHub Copilot:AI辅助编程插件安装与使用 PhpStorm里装不上GitHub Copilot?先确认IDE版本和插件源 如果你在PhpStorm里死活装不上GitHub Copilot,问题大概率出在版本上。一个关键前提是:PhpStorm 2023 3及之后的

热心网友
04.27
Notepad++宏功能怎么录制_Notepad++自动执行重复操作技巧
编程语言
Notepad++宏功能怎么录制_Notepad++自动执行重复操作技巧

Notepad++宏录制需先打开文档(如Ctrl+N新建标签),否则按钮灰色禁用;仅捕获键盘操作与部分菜单命令,不支持鼠标、对话框交互;录制后须手动导出XML保存,否则重启丢失。 怎么开始录制宏却没反应? 很多朋友第一次用Notepad++的宏功能,都会遇到一个经典问题:那个“开始录制”的按钮,怎么

热心网友
04.27
ORDI价格预测2026-2030:是否会实现百倍增长?
web3.0
ORDI价格预测2026-2030:是否会实现百倍增长?

Ordinals (ORDI) 深度展望:2026-2030,百倍增长是神话还是可期的未来? 加密货币市场从不缺少惊喜,而Ordinals协议及其原生代币ORDI的异军突起,无疑是近年来最引人注目的叙事之一。这项技术巧妙地将数据“铭刻”在比特币的最小单位——“聪”上,硬生生在价值存储的基石上,开辟出

热心网友
04.27