SALMONN音视频模型升级，推理提速支持高帧率运行_游乐游手机版

首页/科技数码/文章详情

SALMONN音视频模型升级，推理提速支持高帧率运行

时间：2025-09-29 20:49

SALMONN 家族在首个通用音频理解模型（ICLR 2024）和首个全要素音视频理解模型 video-SALMONN（ICML 2024）基础上再次迎来重磅扩容，霸榜各大音视频理解榜单！全新一

SALMONN家族迎来全面升级！继开创性推出首个通用音频理解模型(ICLR 2024)和全要素音视频理解模型video-SALMONN(ICML 2024)后，研发团队再次突破音视频理解的技术边界。全新一代video-SALMONN 2/2+、首推理增强型视频理解大模型video-SALMONN-o1(ICML 2025)、高帧率视频理解模型F-16(ICML 2025)及AVUT评测基准(EMNLP 2025)正式亮相。

SALMONN产品矩阵

旗舰型号video-SALMONN 2+

该模型在视频描述生成领域实现重大突破，通过原子事件级评估体系与MrDPO强化学习，显著提升描述完整性和准确性。其72B版本在Video-MME、WorldSense等多份权威榜单上超越GPT-4o和Gemini 1.5 Pro等商业产品。

video-SALMONN 2+性能对比

创新推理模型video-SALMONN-o1

该模型突破性地实现了音视频多步推理能力，通过process DPO(pDPO)训练方法，显著提升复杂场景下的理解深度。在脱口秀解析、学术演讲理解等任务中展现出类人的推理能力。

推理示例

高帧率王者F-16

专为高速视频理解设计的多帧联合对齐压缩技术，让模型在不增加算力负担的情况下，准确捕捉体育赛事、电子竞技等场景的关键瞬间，在高帧率视频理解任务中全面领先。

高帧率对比

严谨评测体系AVUT

针对业内普遍存在的"文本捷径"问题，开发团队创新性提出Cycled Accuracy评估方法，通过答案轮转排列有效排除人工标注偏好的干扰，建立起更公正的音视频理解评测标准。

评测体系对比

研究团队

清华大学电子工程系多媒体信号与智能信息处理实验室出品，相关成果已在GitHub开源(https://github.com/bytedance/SALMONN)。

来源：https://36kr.com/p/3487494318660489

上一篇骁龙8至尊版测评：CPU提升20%，安兔兔跑分超387万 下一篇魅族回应海报小字争议：内容调整系遵循法规要求备注：已控制在45字符内，包含核心关键词"魅族海报法规"，用语中性专业，揭示事件核心同时保持克制。

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容，方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

理想新车布局预测：L9L与i9上半年发布

科技数码 · 2026-07-04

理想新车布局预测：L9L与i9上半年发布

1月23日消息，综合权威公开信息与行业趋势研判，理想汽车2026年度新车布局规划正式曝光。此番产品线布局，不仅持续深耕SUV市场，同时加速补齐全场景覆盖的拼图。理想L9旗舰SUV 在增程动力领域，理想L系列将迎来一位新成员——L9L，预计2026年上半年正式上市，预估售价区间为45万至55万元。与

三星消息应用7月停用部分旧设备可继续使用

科技数码 · 2026-07-04

三星消息应用7月停用部分旧设备可继续使用

6月29日，多家海外媒体援引三星官方消息证实，三星消息（Samsung Messages）应用将于2026年7月正式终止服务。随着这个截止日期越来越近，依然在使用该应用的Galaxy用户需要尽快迁移到新的默认信息工具。其实过去两年里，三星一直在悄悄引导用户转向谷歌信息（Google Messages

吉利发布2030战略：年销650万辆全面迈向全球前五

科技数码 · 2026-07-04

吉利发布2030战略：年销650万辆全面迈向全球前五

1月22日，吉利控股集团在北京召开战略解析大会，正式发布“一个吉利，全面领先”的2030战略蓝图。战略目标清晰明确：到2030年，全球总销量（含乘用车与商用车）突破650万辆，稳居全球车企前五。其中，新能源车型占比预计达到75%左右，海外销量占比超过三分之一。尤为关键的是，依托全新全球化架构，单车型

OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部

科技数码 · 2026-07-04

OPPO Find X9系列旗舰手机累计销量突破250万部Ultra版超12万部

OPPO Find X9 Ultra 旗舰机型回顾产品发布背景：Find X9系列于2025年10月正式登场，作为OPPO年度旗舰产品线，涵盖标准版、Pro版与Ultra版三大版本。该系列的核心竞争力十分明确——影像系统与综合性能的双重显著提升。上市以来，凭借芯片算力、屏幕显示素质、续航表现以及影

IntelliJ IDEA 2025.3.2 版本正式发布

科技数码 · 2026-07-04

IntelliJ IDEA 2025.3.2 版本正式发布

IntelliJ IDEA 2025 3 2 版本现已正式发布。除了常规的漏洞修复与功能完善，本次更新有几个修复点值得格外关注——特别是如果你经常使用终端工具执行命令，或者正在采用远程开发工作流。终端工具窗口的闪烁问题终于得到彻底解决。此前在调用支持同步输出的命令行工具（例如 Claude Code