首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
智象未来推出200B全模态图像大模型 从内容生成迈向世界理解

智象未来推出200B全模态图像大模型 从内容生成迈向世界理解

热心网友
48
转载
2026-05-21

在近日于北京举行的首届开放日活动中,智象未来重磅推出了新一代图像大模型HiDream-O1-Image-Pro。该模型基于其创新的原生全模态架构——统一Transformer(UiT)构建,参数量突破两千亿,并在多项国际权威基准测试中刷新了最高性能(SOTA)记录。活动同期,公司宣布完成了半个月内的第二轮融资,深创投、金浦投资等顶级投资机构参与其中。资本市场的持续加码,彰显了业界对“原生全模态”这一前沿技术路线的坚定信心。

核心技术突破:从“模态拼接”到“原生统一”

当前,视觉生成领域的主流方案可被视为一种“拼接”范式:通常先利用VAE编码图像,再调用独立的语言模型解析文本指令。这种方式在处理复杂语义理解和精细细节控制时,常面临瓶颈。智象未来提出的UiT架构,则选择了一条截然不同的路径。它将原始的图像像素、文本标记以及任务指令,统一映射到一个连续的共享语义空间中。这相当于为不同模态的“语言”建立了一套共通的底层语法,实现了从根源上的深度融合与统一理解。

  • HiDream-O1-Image-Pro: 作为闭源旗舰版本,其超过2000亿的参数规模奠定了顶尖文生图能力的基础。其突破性不仅在于规模,更体现在对复杂文字渲染、精细化指令编辑以及多主体个性化生成等高难度任务的处理上,为行业树立了全新的性能标杆。

  • 开源标杆的验证: UiT架构的高效性已得到充分验证。采用同源架构、仅80亿参数的开源版本,此前已在全球知名评测平台Artificial Analysis的文生图榜单中位列第一,成为全球领先的开源图像生成模型。尤为关键的是,它是该榜单前20名中参数量最小的模型,这有力证明了UiT架构卓越的扩展效率——从轻量级到超大规模,性能均可实现线性提升。

战略重心:以“原生全模态”构建世界模型

智象未来创始人兼CEO梅涛博士深入阐释了其技术路线的核心逻辑。他指出,行业中许多“多模态”方案,本质仍是“单模态能力的后期拼接”。而智象未来致力于从架构设计源头实现“原生全模态”。这意味着,将世界的底层规则——如空间关系、物理定律与因果逻辑——直接编码进模型的“基因”里。唯有如此,模型才能从被动“生成内容”,进化为主动“理解世界、推理世界并重构世界”。在梅涛看来,这是迈向通用人工智能(AGI)不可或缺的关键一步。

业务落地:模型+智能体双轮驱动

前沿的技术架构需要坚实的商业应用来支撑。为此,智象未来构建了“1+1+3”的业务体系,即以底层大模型为基石,通过三大核心智能体应用推动商业化落地:

  • 商业营销智能体 (HiBurst): 已成为TikTok官方Top 5服务商,每年生成电商营销视频超百万条,服务商品交易总额(GMV)已突破亿元大关。

  • AI影视创作智能体 (“帧赞”): 该平台实现了从创意构思到最终成片的AI全流程赋能。截至目前,已累计制作短剧、漫画剧超5000分钟,吸引超千家专业创作团队入驻。

  • 社媒创作智能体 (vivago): 支持端到端的长序列推理,可在数分钟内生成完整的故事视频,目前其服务已覆盖全球超100个国家及地区的4000万用户。

生态共建:迈向AGI的产业路径

技术价值最终需通过产业赋能来体现。在开放日现场,智象未来宣布与上影新视野基金、蓝色光标、捷成世纪、倍尔健康等达成战略合作。通过深度融入影视创作、跨境电商、数字营销、医疗健康等具体产业场景,加速将先进的模型能力转化为可落地的行业解决方案。

从视觉生成出发,迈向对世界的深度理解与建模,智象未来正践行其“Imaging the World”的愿景。公司旨在通过统一的建模框架,使AI具备理解多模态环境状态并预测其演变的能力。随着多元资本的持续注入与商业生态的迅速拓展,这家公司正加速从视觉技术提供商,向通用世界模型构建者的战略角色演进。

来源:https://news.aibase.com/zh/news/28211
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智象未来推出200B全模态图像大模型 从内容生成迈向世界理解
AI资讯
智象未来推出200B全模态图像大模型 从内容生成迈向世界理解

在近日于北京举行的首届开放日活动中,智象未来重磅推出了新一代图像大模型HiDream-O1-Image-Pro。该模型基于其创新的原生全模态架构——统一Transformer(UiT)构建,参数量突破两千亿,并在多项国际权威基准测试中刷新了最高性能(SOTA)记录。活动同期,公司宣布完成了半个月内的

热心网友
05.21
AI生成内容的特点应用与常见问题解析
AI教程
AI生成内容的特点应用与常见问题解析

在信息爆炸的时代,内容需求持续攀升,人工智能(AI)已深度融入我们生活的各个领域。今天,我们将深入探讨一个既热门又充满思辨价值的议题——“ ai生成内容问题”。你是否注意到,越来越多的企业开始将AI技术引入内容创作流程?这背后,效率提升与成本控制固然是关键驱动力,但其中蕴含的深层逻辑、潜在挑战与应对

热心网友
05.20
Meta全新AI短视频应用Vibes上线,全由AI生成
AI资讯
Meta全新AI短视频应用Vibes上线,全由AI生成

9 月 27 日消息,Meta 宣布推出 Vibes 短视频平台,该平台最大的特点就是其中所有内容都是 AI 生成的,目前已在北美、澳大利亚、新西兰、英国及部分欧洲市场上线。据介绍,与其让现有的短

热心网友
09.29
微信:AI生成内容需主动标注,公众号/视频号发布新规
科技数码
微信:AI生成内容需主动标注,公众号/视频号发布新规

8 月 31 日消息,微信珊瑚安全公众号今日发布“关于进一步规范人工智能生成合成内容标识的公告”,称根据《人工智能生成合成内容标识办法》要求,平台应对 AI 生成合成内容添加显式标识和隐式标识。为

热心网友
09.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

以太坊基金会转移千枚ETH兑换稳定币 支持生态研发与项目资助
web3.0
以太坊基金会转移千枚ETH兑换稳定币 支持生态研发与项目资助

以太坊基金会通过CoWSwap将1000枚ETH兑换为稳定币,价值约450万美元,用于研发、生态拨款及DeFi投资。此举是其常规财管策略,体现对去中心化基础设施的支持。基金会近期调整治理并暂停新申请以聚焦优先方向,VitalikButerin强调低风险DeFi是生态稳定收益引擎,基金会持续在该领域布局。

热心网友
05.23
比特币ETF单周流入32亿美元创纪录 十月行情看涨原因解析
web3.0
比特币ETF单周流入32亿美元创纪录 十月行情看涨原因解析

在加密货币市场,资金流向往往比任何复杂的预测模型更能揭示趋势的真相。进入十月,一个被社区昵称为“上涨十月”(Uptober)的季节性窗口期,所有人的目光都聚焦在了美国比特币现货ETF的资金数据上。最新数据显示,一场强劲的资金回流正在发生,这或许正是新一轮行情启动的最明确信号。 一、创纪录的资金流入:

热心网友
05.23
欧易OKX交易所注册下载与身份认证全流程指南
web3.0
欧易OKX交易所注册下载与身份认证全流程指南

欧易OKX交易所注册需通过官方渠道下载APP,完成手机号或邮箱注册并设置密码。身份认证要求用户提交身份证件照片及人脸识别信息,以符合安全合规要求。整个过程旨在保障账户安全与交易合法性。

热心网友
05.23
币安官网注册教程:安全获取官方链接与账户创建指南
web3.0
币安官网注册教程:安全获取官方链接与账户创建指南

币安官方App下载与安装全指南 对于希望随时随地进入加密市场的朋友来说,一个安全可靠的交易平台App是必不可少的工具。币安,作为全球领先的加密货币交易平台,其官方应用程序集成了现货、合约等多种交易功能,是管理数字资产的得力助手。今天,我们就来详细拆解一下如何获取并安装这款官方App,确保您每一步都安

热心网友
05.23
2025年币安官网最新入口地址及安全访问指南
web3.0
2025年币安官网最新入口地址及安全访问指南

欢迎来到币安:2025年官方入口与安全使用全指南 在加密货币世界,选择一个可靠、功能全面的交易平台是第一步。币安,作为全球领先的数字资产交易平台,以其丰富的资产选择、强大的交易引擎和持续优化的用户体验,成为了众多投资者的首选。今天这份指南,将为你清晰呈现2025年币安官方网站的最新入口,并手把手带你

热心网友
05.23