首页 游戏 软件 资讯 排行榜 专题
首页
AI
智子引擎完成千万元天使轮融资 多模态大模型受关注

智子引擎完成千万元天使轮融资 多模态大模型受关注

热心网友
76
转载
2026-05-15

大模型赛道在四五月份可谓“百家争鸣”,战况愈发激烈,而新的玩家仍在不断涌入。

近日,一家专注于多模态大模型的初创公司“智子引擎”完成了千万元级的天使轮融资。这家公司的掌舵人是一位90后——中国人民大学的博士生高一钊。他的导师,卢志武教授,在公司担任顾问一职。值得一提的是,卢志武教授同时也是软通动力的首席AI科学家。

其实,在ChatGPT引爆全球之前,国内对大模型的探索早已开始。北京智源人工智能研究院率先发起的“悟道”大模型项目,当时汇聚了四支核心团队,分别由清华大学的唐杰、刘知远、黄民烈以及中国人民大学的文继荣领衔。

其中,文继荣教授带领的人大高瓴人工智能学院团队,主攻方向正是多模态大模型,其成果便是“文澜”系列。卢志武教授是该项目模型研发的主力,他的学生高一钊也深度参与了核心研究工作。“悟道”项目之后,唐杰、刘知远与黄民烈几位教授都相继基于大模型技术创立了公司。如今,随着高一钊的“智子引擎”浮出水面,当年智源“悟道”项目的四支核心团队,可以说都已完成了从学术研究到产业落地的布局。

需要指出的是,卢志武教授所在的团队,是国内最早投身多模态大模型研究并取得突出成果的团队之一。

卢志武和高一钊二人

卢志武与高一钊师徒二人对多模态大模型的探索,始于2020年。

2020年5月,OpenAI发布的GPT-3在AI界掀起了巨浪,也引发了国内研究者对预训练大模型的广泛关注,卢志武团队便是其中之一。

卢志武教授本人拥有扎实的学术背景,他本科就读于北京大学数学科学学院,后在香港城市大学取得计算机博士学位,研究方向长期聚焦于机器学习与计算机视觉。

卢志武

当时,国内的目光大多集中在纯文本(NLP)大模型上,而对于将文字与图像、视频结合的多模态大模型,关注者寥寥。就在这个阶段,中国人民大学高瓴人工智能学院组建了专门的多模态大模型研发团队,由文继荣教授牵头,核心成员包括宋睿华、卢志武等。这可以说是国内该领域的“先行者”。

同年,高一钊进入中国人民大学高瓴人工智能学院,成为卢志武教授的博士生。

高一钊

“智子引擎”将推出多模态大模型

事实上,早在ChatGPT问世的三年前,前文提到的“悟道·文澜”团队就已经在卢志武等科学家的带领下,开始了多模态大模型的研发。

2021年3月,基于3000万图文数据训练的第一代“文澜”模型(BriVL)正式发布。这是一个采用双塔结构的超大规模多模态预训练模型,能分别对图像和文本进行编码,并通过自监督学习来理解图文之间的关联。团队当时还基于此开发了一个有趣的“AI心情电台”应用,用户上传一张图片,模型就能为其匹配一段契合的音乐。

仅仅三个月后,团队又发布了升级版的“文澜2.0”。这一代模型提出了“图文弱相关”的假设,设计了更高效的跨模态对比学习策略,并采用了基于DeepSpeed的分布式训练框架。在6.5亿弱相关图文数据上训练后,“文澜2.0”参数量达到50亿,曾是最大的中文通用图文预训练模型,在图像检索、描述生成等多种任务上表现出色。高一钊在“文澜”1.0和2.0的研发中,深度参与了数据处理、模型训练与评估等工作。

ChatGPT的热潮,让卢志武和高一钊看到了多模态技术在大模型时代的全新机遇。于是,“智子引擎”应运而生。依托过往研发“文澜”的深厚经验,团队在今年3月8日正式推出了自研的多模态对话大模型,并发布了首款应用级产品“元乘象 ChatImg”。

“元乘象 ChatImg”是一个百亿参数级别的模型,主要使用图文对和视觉问答(VQA)数据进行训练,能同时处理图文匹配、检索、描述生成等多项任务。用户只需输入图片或文字,它就能进行智能对话、编故事、写广告文案等。

回看四五月份,大模型领域可谓喧嚣沸腾,大厂交锋激烈,创业公司也争先恐后。学术界顶尖力量下场创业已成为明显趋势。在这场贴近工程化与商业化的竞赛中,如何构建独特的竞争力并找准自身定位,是每一位新入局者必须回答的问题,而答案,或许就在与时间的赛跑之中。

来源:https://www.leiphone.com/category/ai/6WZWnIXfrj1Mohbh.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智子引擎完成千万元天使轮融资 多模态大模型受关注
AI
智子引擎完成千万元天使轮融资 多模态大模型受关注

大模型赛道在四五月份可谓“百家争鸣”,战况愈发激烈,而新的玩家仍在不断涌入。 近日,一家专注于多模态大模型的初创公司“智子引擎”完成了千万元级的天使轮融资。这家公司的掌舵人是一位90后——中国人民大学的博士生高一钊。他的导师,卢志武教授,在公司担任顾问一职。值得一提的是,卢志武教授同时也是软通动力的

热心网友
05.15
中科院软件所解析AI多模态大模型为何更擅长图像处理
AI
中科院软件所解析AI多模态大模型为何更擅长图像处理

这项由中国科学院大学与中国科学院软件研究所中文信息处理实验室联合开展的研究,以预印本形式发布于2026年4月,论文编号为arXiv:2604 16902。 想象一下,当你同时听到一种声音、看到一张图片、读到一段文字,而这三者讲述的却是完全不同的故事时,你会相信哪一个?这听起来像是一个哲学思辨,但实际

热心网友
05.15
多模态大模型推理对齐难题 动态约束化解多教师冲突
AI
多模态大模型推理对齐难题 动态约束化解多教师冲突

在多模态大模型知识蒸馏中,教师模型间的推理差异易导致学生模型产生偏见。本研究提出自主偏好优化框架(APO),通过动态约束冲突并提炼共识,实现稳健的概念对齐。实验显示,该方法在医疗诊断任务中使学生模型性能超越各教师模型,展现出优异的稳定性与泛化能力。

热心网友
05.14
面壁智能开源端侧多模态大模型MiniCPM-V4
科技数码
面壁智能开源端侧多模态大模型MiniCPM-V4

面壁智能联合清华大学及OpenBMB开源社区发布并开源新一代端侧多模态大模型MiniCPM-V4 6。该模型参数量仅1 3B,性能与效率显著提升,仅需6GB内存即可在终端设备流畅运行,大幅降低了多模态大模型在各类智能终端的应用门槛。

热心网友
05.14
MiniCPM-V 4.6开源端侧多模态大模型发布
业界动态
MiniCPM-V 4.6开源端侧多模态大模型发布

在人工智能模型性能持续升级的浪潮中,一股逆向趋势正成为焦点:将AI模型变得更小、更高效,使其能够直接在手机等移动设备上离线运行。今天我们要深入探讨的MiniCPM-V 4 6,正是这一“端侧AI”或“边缘AI”发展趋势下的一个代表性开源成果。 简而言之,它是由面壁智能(OpenBMB)团队推出的、专

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

银河麒麟系统SSH公钥登录配置与安全远程连接指南
系统平台
银河麒麟系统SSH公钥登录配置与安全远程连接指南

在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c

热心网友
05.15
银河麒麟系统登录循环故障解决方法与桌面修复指南
系统平台
银河麒麟系统登录循环故障解决方法与桌面修复指南

登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而

热心网友
05.15
GUSD稳定币详解:项目背景、核心用途与投资风险全解析
web3.0
GUSD稳定币详解:项目背景、核心用途与投资风险全解析

GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。

热心网友
05.15
Win11如何设置默认音频输出设备与调整音量
系统平台
Win11如何设置默认音频输出设备与调整音量

在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱

热心网友
05.15
宏胜集团高管变动与业务外包调整深度解析
AI
宏胜集团高管变动与业务外包调整深度解析

宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并

热心网友
05.15