游乐游手机版
首页/业界动态/文章详情

刚刚,DeepSeek大更新,终于「开眼」了

时间:2026-04-30 08:42
原以为这个疯狂的 AI 疯狂更新应该已经告一段落了,没想到上周才发完 V4 的 DeepSeek ,突然端出一个更大的惊喜。 就在刚刚,DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了! 目前 DeepSeek 网页版和 App 更新后

原以为这个疯狂的 AI 疯狂更新应该已经告一段落了,没想到上周才发完 V4 的 DeepSeek ,突然端出一个更大的惊喜。

就在刚刚,DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了!

目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式,我们第一时间进行了实测。

DeepSeek 负责多模态的研究员陈小康在 X 上发文:Now, we see you,并配上了一张图。我们就让 DeepSeek 来解读一下这张图究竟意味着什么。

结果显示,它能识别出这张图背后的隐喻。虽然图中没有任何关于 DeepSeek 的字眼,但它结合对发布者身份和图像的识别,推断出这是关于 DeepSeek 多模态能力的更新。

最后给出一句十分到位的总结:那个看不见世界的鲸鱼,现在终于睁开眼了。

思考过程,比答案更有趣

比起回答结果,我们发现 DeepSeek 识图模式的思考过程更有意思。

上下滑动查看完整思考过程

过去 AI 来看那张推特截图,大概率是老老实实描述:「两只蓝色鲸鱼,左边戴眼罩,右边没戴。」

但 DeepSeek 它上来就开始追问:这人是谁?他为什么发这个?鲸鱼 logo 代表什么?眼罩上的 XX 又在暗示什么?

这才是我们刷到一张梗图时脑子里真正发生的事。没人会先数鲸鱼有几只,我们关心的是谁在对谁说话,说的是什么潜台词。

而且它还会来来回回的自我纠正

比如它甚至一度把图中的眼罩联想到《天元突破》里卡米那的眼镜,然后自己打脸:「不,这太宅男向了。」「等等,仔细看……」 「再换个角度……」 。

一场自我发起的“小型答辩会”

前面那些推理、联想、自我纠正,都挺精彩。但整段思考过程里最反常识的部分,其实是它推理到快收尾时,突然自己喊了个暂停,给自己开了一场小型答辩会。

它列出三个问题自问自答,先确认客观事实,再推测事件性质,最后才做解读。 DeepSeek 把这个我们自己都没意识到的思维习惯,做成了识图的思考逻辑。

就像我们平时给结论之前,脑子里也会过一遍:「等等,这个前提对吗?那个假设站得住吗?万一我理解错了方向呢?」

经典测试:数手指与“爱心”

我们还把经典的 AI 测试题——数手指,抛给了 DeepSeek。

它思考了一通,还是回答错了,中间还吐槽了一句:「我真的是数晕了。」

不过如果我再引导一下,它还是可以回答正确。

另外一个数手指的测试中,第一次回答错误之后,我没给答案,只是让它再想想,也能给出正确的回答。

我们还试了试一个经典的「爱心」测试,这个图之前难倒了所有 AI , DeepSeek 同样没有能识别出来。

日常识图:准确率与局限性

抛开这些难度较高的极限测试,初步测试下来,DeepSeek 识图的准确率其实还是比较高,不开思考模式的话甚至半秒就能给出回答。

比如这个电影剧照的识别,应该是已经在数据库内了。

对于抽象图片的理解也十分到位。

优衣库这个商品图的理解也没有问题。

不过这个识图的过程应该是没有联网搜索,只能基于知识库回答,所以一些比较新的东西,就无法识别,比如苹果这个新的吉祥物 Finder 酱。

而且识图模式上传的文件格式也有限制,比如不支持 HEIF 格式。

结语:睁开眼,只是开始

DeepSeek 识图模式上线,意味着这只鲸鱼终于开眼了,但也许只是刚刚开始。

DeepSeek 多模态更多的能力可能很快也会陆续更新,补上这块短板后,整个国产模型的格局可能也会再次迎来微妙的变化。

我们将持续跟大家分享 DeepSeek 识图模式更多的体验,也欢迎大家体验后与我们分享有意思的小技巧和细节。

来源:https://36kr.com/p/3788474106715144
上一篇Sam Altman 和 AWS CEO 罕见同框:聊了智能体、harness、和云的下一仗 下一篇博主用网络表情包 11年后被索赔1万!最终赔偿300元
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
诺基亚TA-1619入网:1400mAh电池双卡双待新机
业界动态 · 2026-07-01

诺基亚TA-1619入网:1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息,一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可,不过证件照目前还没公布。 从入网信息来看,这是一款TD-LTE数字移动电话机,支持TD-LTE网络,属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持,终端款式为直板。核心配置方面,电池额定容

芯佰微CBMRF900系列国产射频芯片突破海外壁垒
业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片,采用直接变频架构,覆盖10MHz至7250MHz频段,支持最大450MHz带宽及JESD204B高速接口,性能对标国际,满足5G基站与卫星通信等高端需求,突破海外技术壁垒。

月起私人充电桩可卖电 每度净赚5毛
业界动态 · 2026-07-01

月起私人充电桩可卖电 每度净赚5毛

近期有一则重大利好消息,值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起,湖北武汉的新能源车主,可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言,就是借助峰谷电价差,实现低买高卖,每度电净收益约5毛钱。过去,车网互动(V2G)基本只局限于特定的公共充电站,受试点规模限制,

谷歌发布Nano Banana 2 Lite 4秒出图1元4张
业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3 1 Flash Lite Image,属于Gemini 3 1家族。最大的卖点就两个:快,便

技嘉专业电竞装备助力2025 CFS世界总决赛
业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行,来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴,以主板、显示器等专业硬件保障比赛稳定流畅,并通过赛事反哺研发的闭环模式支持电竞发展。