首页 游戏 软件 资讯 排行榜 专题
首页
AI
腾讯混元SRPO技术:优化大模型生图效果,告别油腻画风

腾讯混元SRPO技术:优化大模型生图效果,告别油腻画风

热心网友
45
转载
2025-09-18

9月17日最新消息,腾讯混元团队通过官方公众号宣布,其图像生成研究小组在9月10日推出了一项突破性技术SRPO。这项研究成果针对开源文生图模型Flux常见的"油脂感过重"问题,提出了一套创新性的强化学习算法,成功将人像生成的逼真度提升了300%。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

数据显示,该研究成果一经发布便迅速登上Hugging Face热门榜单第一名,社区量化版本下载量突破2.5万次,Github收藏数超过700颗星。

目前Flux是开源文生图领域应用最广泛的基础模型。针对Flux.dev.1版本产生的"皮肤质感失真"问题,SRPO(全称语义相对偏好优化)通过在线奖励偏好调节和生成轨迹优化两大核心技术实现了突破性进展。

腾讯混元图像优化研究SRPO技术细节

据介绍,这项由腾讯混元携手香港中文大学(深圳)和清华大学联合开发的技术,创新性地采用了语义偏好驱动的奖励模型在线调节机制。具体而言,研究人员通过在奖励模型中添加"真实感"等特定调控提示词,实现了对优化目标的精准引导。实验证明这些控制词能显著增强模型在特定维度的表现。

语义偏好优化技术

研究发现,单纯的语义引导容易产生奖励诱导偏颇现象。为此团队开创性地提出"语义相对偏好优化"策略:同时采用正负向引导词作为信号输入,利用负梯度抵消奖励模型的通用性偏差,同时保留特定维度上的准确优化能力。

值得注意的是,传统方法如ReFL和DRaFT通常仅优化生成过程的后半段,这会导致奖励模型过度拟合高频信息。具体表现为:HPSv2偏好红色调图像,PickScore倾向紫色,而ImageReward则会给过曝光区域过高评分。

针对这一痛点,研究团队开发了Direct-Align技术,通过对输入图像进行可控噪声注入,再利用单步推理以预置噪声为"参考锚点"实现图像重建。这一创新方法大幅降低了重建误差,使得奖励信号传导更加精确,从而实现对全生成过程的优化。

Direct-Align技术示意图

实验数据表明,SRPO展现出惊人的训练效率,仅需10分钟训练就能全面超越DanceGRPO的表现。

SRPO性能对比
▲ 与主流方法DanceGRPO相比,SRPO有效避免了诱导偏颇现象,显著提升了图像真实度
色彩优化效果
▲ 在各种主流奖励模型上都未出现色彩偏差或过饱和等问题

定量评估显示,SRPO多项指标达到业界顶尖水平,人类评估的真实感和美学评分提升超过300%,训练时间较DanceGRPO缩短98.7%。

性能指标对比训练效率对比

相关资源:

论文题目: 基于精细人类偏好的全扩散轨迹直接对齐

论文链接:https://arxiv.org/abs/2509.06942

项目主页:https://tencent.github.io/srpo-project-page/

GitHub:https://github.com/Tencent-Hunyuan/SRPO

来源:https://www.ithome.com/0/883/754.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智谱年报后大涨32%:市值4079亿港元 张鹏称不惧大厂竞争
科技数码
智谱年报后大涨32%:市值4079亿港元 张鹏称不惧大厂竞争

雷递网 雷建平 4月1日在公布了上市后首次年报后,智谱(股票代码:02513 HK)今日大涨31 94%;收盘价为915港元,市值为4079亿港元。智谱昨日发布财报。财报显示,智谱2025年营收7

热心网友
04.07
靖因药业冲刺港股:2025年营收2.3亿 亏2.6亿 腾讯是股东
科技数码
靖因药业冲刺港股:2025年营收2.3亿 亏2.6亿 腾讯是股东

雷递网 雷建平 4月1日靖因药业(Sirius Therapeutics)日前更新招股书,准备在港交所上市。靖因药业2025年4月刚获4750万美元的融资,投后估值为2 53亿美元。年营收2 3亿

热心网友
04.07
虎嗅【作·嗅之星】周榜第307~308期
科技数码
虎嗅【作·嗅之星】周榜第307~308期

作·嗅之星榜单,以周榜的形式,呈现每周新鲜出炉的优秀作品。一、2026年3月20日~2026年3月26日,虎嗅第307期,作·嗅之星的获奖文章分别是:TOP 1:《上海开始鼓励老年人就业了,这意味着

热心网友
04.07
腾讯开发AI产品「探梦DreamNow」,布局AI互动平台
科技数码
腾讯开发AI产品「探梦DreamNow」,布局AI互动平台

4月7日消息,据读佳获悉,腾讯在开发一款名为“探梦DreamNow”的AI产品,这是一个AIGC内容创作内容展示互动平台,用户可以看到其他人创作的AI视频和图片,包含互动影游的创作和展示,不过,目前

热心网友
04.07
消息称腾讯正研发AIGC创作互动平台“探梦DreamNow”
科技数码
消息称腾讯正研发AIGC创作互动平台“探梦DreamNow”

4月7日消息,据《读佳》获悉,腾讯正在开发一款名为 “探梦DreamNow” 的人工智能创作与展示平台。该产品覆盖 AI视频、AI图片,同时支持 互动影游创作和展示,体现了腾讯对沉浸式AIGC内容的

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币重探7万美元,市场已全面消化美伊战争风险?
web3.0
比特币重探7万美元,市场已全面消化美伊战争风险?

清明节假期期间,A 股和港股休市,但比特币行情永不停歇。 4月6日,当多数市场还在假期中沉睡时,比特币已经悄然启动。价格从亚洲早盘的低点67400美元出发,一路向上试探,盘中最高涨破70300美元,不仅刷新了3月26日以来的高位,较日内低点的涨幅也超过了4%。以太坊的表现同样不俗,从2050美元附近

热心网友
04.07
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰
网络安全
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰

4月5日消息,日前,REDMI K90至尊版通过3C认证,预计将于本月发布。今日,小米中国区市场部总经理魏思琪用小米新机发布微博,不出意外,这正是即将登场的REDMI K90至尊版,这将是小米首款配

热心网友
04.07
WPS动态交互图表制作指南:让数据变化直观呈现
电脑教程
WPS动态交互图表制作指南:让数据变化直观呈现

WPS演示中图表不随数据更新时,可通过四种方法实现自动同步:一、用OFFSET+COUNTA定义动态名称绑定图表;二、用组合框控件联动VLOOKUP提取数据;三、用数据透视图配合切

热心网友
04.07
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
科技数码
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

热心网友
04.07
天上的马桶与地上的火药桶,都在让美国出糗
科技数码
天上的马桶与地上的火药桶,都在让美国出糗

太空中的马桶堵了,边飞边修还能勉强用。但中东被点燃的火药桶,美国怎么来扑灭?靠一再延期的“最后通牒”?还是靠无底线的轰炸?2300万美元的马桶美国航空航天局4名宇航员1日搭乘“猎户座”飞船升空,执行

热心网友
04.07