MiniMax海螺AI全球访问量第一 底层模型加速迭代解析
DeepSeek的迅速崛起,如同一次耀眼的超新星爆发,瞬间点亮了中国AI产业的广阔天空。而在上海这片人工智能创新高地,稀宇科技(MiniMax)无疑是其中一颗持续闪耀的明星。

如果说DeepSeek以强大的文本生成能力见长,那么MiniMax则是在文本、视频、语音多模态AI技术领域全面布局的领先者。今年1月,其推出的海螺AI视频平台在全球AI视频产品访问量排行榜中位列第一。截至2月初,该公司每日生成的AI视频数量已突破数百万条,稳居全球首位;其每日语音生成量在国内市场排名第二,文本处理能力同样处于国内第一梯队。一个关键问题值得深入探讨:在全球竞争最为激烈的人工智能赛道,这家上海本土AI公司是如何持续提升核心竞争力,并在视频生成等细分领域实现对国际顶尖同行的超越?
一张照片生成连贯电影:突破角色一致性难题
利用AI技术生成视频,已成为许多用户体验人工智能的热门方式。然而,技术的局限性也常常引发用户反馈:例如,上一段视频中的主角在下一段中突然“变脸”。无论用户如何调整提示词,都难以确保同一角色在不同场景中保持形象一致。这个“角色一致性”的技术瓶颈,长期制约着AI生成叙事连贯短片的能力,也限制了其商业应用的想象空间。
重大突破发生在今年1月。MiniMax发布了其新一代视频生成大模型,成功解决了这一行业难题。现在,用户仅需上传一张人物正面照片,此后生成的任何风格、任何剧情视频中的主角,都将稳定保持该面部特征。许多用户体验后感叹:用一张个人照片创作个性化电影,终于成为现实。
这背后,体现了MiniMax始终坚持的技术驱动发展路径。如何在动态视频中保持人物面部多角度的真实感与稳定性?如何确保同一角色在不同视频片段中高度一致?这些用户核心痛点,正是MiniMax技术团队重点攻关的方向。经过大量技术路线探索与方案对比,团队最终推出了创新的S2V模型。该模型的优势在于,仅需传统方案1%的输入数据与计算资源,通过“单张图片上传”即可实现卓越的生成效果。在过去三年多的持续迭代中,文生视频、图生视频、主体参考等核心功能不断优化。正是这些底层技术创新,助力海螺AI视频在激烈竞争中脱颖而出,其用户使用量已超越OpenAI的Sora,服务覆盖全球超过200个国家和地区。
不仅在视频领域,在文本转语音等赛道,MiniMax也探索出差异化发展路径。敏锐的用户发现,其语音合成功能内置了情感调节与音效控制器。这意味着,AI生成的语音可以自然地传达喜悦、悲伤、愤怒等多种情绪。这项创新技术,显著提升了有声读物和广播剧等内容的生产效率与表现力。
自主研发底层架构:构筑AI技术坚实根基
算力、算法与数据,被公认为人工智能发展的三大支柱。回顾创业初期,在算力与数据资源相对有限的情况下,MiniMax将核心突破点聚焦于算法创新。自2023年夏季起,公司做出了一个颇具前瞻性的战略决策:将超过80%的算力与研发资源,投入到底层模型架构的自主研发中。
“我们在工程化过程中面临的许多挑战,前方并无成熟经验可循。”公司技术负责人表示。在缺乏参考路径的领域,团队依靠持续的实验与探索积累经验。一年后,成果初步显现——国内首个基于MoE(混合专家)架构的大模型成功面世。但这仅是起点,研发团队随即向更核心的“注意力机制”优化发起攻关。今年1月,能够大规模实现线性注意力机制的MiniMax-01模型正式发布。这是中国AI企业首次在底层架构上突破传统的Transformer框架限制,这一技术路径正逐渐获得行业广泛认可。

“底层模型的能力,是决定大模型应用成败的关键因素。”MiniMax副总裁刘华阐释了公司的技术战略。依照现有技术蓝图发展固然更为便捷,但蓝图本身的局限性也决定了最终能达到的高度。选择自主研发技术架构构筑AI大厦,起步阶段或许更具挑战,但形成的技术根基将更为扎实,也能更从容地应对未来发展的不确定性。
这套自研的底层架构,如同为AI发展铺设了“新型基础设施”。以MiniMax-01模型为例,它有效突破了长文本处理的性能瓶颈,能够高效处理长达400万token的上下文信息。在工业应用场景中,这意味着可以快速解析百万字级别的设备运行日志,辅助工程师进行故障诊断与预测性维护;在医疗健康领域,则能连续分析患者长达数年的完整病历,为个性化诊疗方案的制定提供智能支持。在技术快速演进的时代,底层模型一次重大的架构升级,为产品带来的性能提升,往往远超在应用层面对功能进行的细节优化。这,正是MiniMax始终聚焦核心模型技术研发,并持续加速迭代的内在逻辑。
依托上海创新生态:加速AI产业化落地
作为上海人工智能产业高地培育的代表性企业,MiniMax的快速发展,深深扎根于这座城市独特的创新生态与开放文化。上海汇聚了全球顶尖的AI研发人才,大量富有创造力与实干精神的科技工作者,为产业创新提供了持续的人才支撑。走进MiniMax上海总部,研发团队的快速扩张便是最直接的体现:2023年中期,团队仅占据半个办公楼层,如今已迅速发展至整整两层办公空间。
从行业发展规律看,一个成功AI模型的诞生,从来不仅是技术突破的成果,更源于科学的研发方法论、数百人技术团队的高效协作,以及开放、务实的技术文化。近期,上海推出了“模塑申城”人工智能高质量发展实施方案,在算力统筹调度、应用场景开放、数据要素供给、高端人才集聚等方面推出一系列支持政策。同时,上海积极发挥产业“连接器”作用,促进大模型企业与丰富的应用场景方深度对接。例如,MiniMax与小红书合作开发生成式智能搜索功能,与阅文集团合作将数千部网络文学作品转化为高质量、富有表现力的有声内容。这种“前沿技术+真实场景”的深度融合与相互赋能,为企业创新发展按下了加速键。
真正具有长期价值的技术探索,不仅关注当前成果,更看重持续进化的能力与速度。如同多年前的移动互联网浪潮,在快速迭代的人工智能领域,民营科技企业正展现出其独特优势:以技术创新驱动跨越式发展,以灵活机制敏锐捕捉前沿趋势,以务实态度切实解决产业实际痛点。目前,上海人工智能产业规模已突破4000亿元,集聚相关重点企业超过350家。仅“模速空间”大模型创新生态区及周边区域,就已汇聚了255家大模型相关企业与34个完成备案的大模型产品。上海的AI创新生态正在蓬勃发展,更多令人期待的技术突破与商业故事,将在这里持续上演。
相关攻略
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
最近,AI圈里出了件挺有意思的事儿。不少网友发现,MiniMax的大模型,好像就是认不准“马嘉祺”这三个字。 一开始,大家还以为只是偶然的“小bug”,但经过多轮实测,情况变得有点耐人寻味了。无论是切换不同的接口,还是更换使用平台,这个问题都能稳定地复现出来。 翻看网友们的测试截图,再结合实际的调用
海外AI公司传播策略呈现体系化差异。Anthropic以80人团队专注“AI安全”的机构叙事,OpenAI依赖创始人驱动的领袖叙事,Perplexity则因CEO争议陷入被动应对。国内AI公司传播建设相对薄弱,多缺乏顶层设计或依赖现有体系。核心启示在于需明确对话对象、匹配发展阶段,并重视将技术“翻译”为公众故事的传播人才。
“AI界的拼多多”——这个标签近来频繁地与MiniMax联系在一起。市场解读呈现出两极分化:一边是将其渲染为碘伏互联网格局的洗牌者,另一边则是冷静地指出,这或许只是资本市场情绪被无限放大后的一场“AI幻觉”。然而,将MiniMax比作“拼多多”,并非贬义,恰恰是对其区别于传统AI大厂独特的商业模式、
MiniMax智能体产品升级为Mavis,新增多智能体团队协作功能。用户可在桌面端组建多角色智能体团队,通过所有者、工作者、验证者三层架构实现规划、执行与审核闭环,以应对复杂任务中单智能体易中断、逻辑偏差及专业分工不足等挑战。整合后的订阅体系允许用户一次订阅使用全部模型能力。
热门专题
热门推荐
近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十
科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,
SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。
NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。
OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。





