首页 游戏 软件 资讯 排行榜 专题
首页
AI
12000 tokens/s:Taalas集群跑DeepSeek R1创速度纪录

12000 tokens/s:Taalas集群跑DeepSeek R1创速度纪录

热心网友
56
转载
2026-02-21

2月21日,IT之家援引科技媒体Wccftech的最新报道称,AI芯片初创公司Taalas推出了一项名为“硬连线”的前沿技术,旨在直接化解大模型应用中的延迟与成本瓶颈——通过将AI模型直接固化在硅芯片内部来实现性能跃升。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在当前AI算力竞争日趋白热化的背景下,响应延迟已成为制约智能体大规模应用的核心障碍。与Cerebras或Groq等公司尝试通过集成SRAM来加速的路径不同,成立仅两年半的Taalas选择了一条更为激进的ASIC路线。

据IT之家引述的博文介绍,该公司研发出一套能够将任意AI模型转化为定制化硅片的平台。其底层核心逻辑在于“计算与存储的融合”,通过将特定大语言模型的神经网络直接映射至硅片电路之中,从而在DRAM级别的密度下完成所有计算操作。

这种设计方案彻底摒弃了传统的HBM内存、复杂封装以及昂贵的散热系统,从物理层面根除了数据传输中的“内存墙”障碍。

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

Taalas已展示了其首款产品HC1,该芯片专为Meta的Llama 3.1 8B模型量身打造。从技术规格来看,HC1采用台积电6纳米工艺制造,芯片面积高达815平方毫米,这一尺寸几乎与NVIDIA的H100相当。

Taalas的在线聊天机器人演示在EE Times试用时达到了每秒超过15,000 tokens的输出速度。但公司方面透露,在特定优化条件下,内部测试数据已接近每秒17000 tokens。

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

然而,巨大的芯片面积仅能容纳80亿参数的模型,这与当前动辄万亿参数的前沿大模型相比,显得“容量有限”。这表明,为了实现极致的硬连线速度,Taalas在单位面积的参数密度上做出了巨大妥协,这也是该技术路线面临的主要物理限制之一。

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

尽管参数密度不高,但HC1的性能表现极具颠覆性。最新数据显示,相比现有的高端算力基础设施,Taalas方案的每秒Token生成数量提升了10倍之多,同时生产成本降至二十分之一。

为了解决单芯片容量不足的问题,Taalas采用了集群化扩展策略。在针对DeepSeek R1模型的测试中,通过30片芯片的集群配置,实现了高达每秒12000 TPS/User的吞吐速度。这一数据意味着在实时交互和复杂推理任务中,用户将获得近乎零延迟的流畅体验。

TPS是衡量大语言模型生成速度的关键指标,代表了模型每秒能输出多少个文本单位。这好比打字员的打字速度,TPS越高,AI回复得就越快,用户等待的时间就越短。

该媒体指出,Taalas的技术路线虽然前景诱人,但其商业模式面临独特挑战。由于模型权重被“硬连线”固化在硅片之中,芯片一旦制造完成便无法更改模型参数。

这意味着客户必须为特定的模型版本购买专用硬件,一旦算法迭代更新,原有的硬件可能面临迅速淘汰的风险。

来源:https://tech.ifeng.com/c/8qv3vPg2hRs
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

谷歌推出Veo 3.1 Lite视频模型,每秒生成成本仅0.05美元
AI
谷歌推出Veo 3.1 Lite视频模型,每秒生成成本仅0.05美元

IT之家 4 月 1 日消息,谷歌 DeepMind 昨日推出 Veo 3 1 Lite 视频模型,是该公司迄今为止最实惠的视频生成工具。最新数据显示,Lite 版的生成速度和 Fast 版本保持一

热心网友
04.01
DeepSeek三天两发故障透露信号:V4版更新在即?
AI
DeepSeek三天两发故障透露信号:V4版更新在即?

今天傍晚,DeepSeek再度出现服务异常,社交平台上不少用户反馈,对话过程中频繁遭遇“请检查网络后重试”或“服务器繁忙”等提示。目前,服务已恢复正常。这是三天之内DeepSeek第二次发生服务故障

热心网友
04.01
DeepSeek编码风格巨变:连续“罢工”背后的大招是什么?
AI
DeepSeek编码风格巨变:连续“罢工”背后的大招是什么?

3月29日晚至30日上午,在经历长达12小时的宕机后,DeepSeek“崩”上热搜。大量用户反映网页端和App提示“服务器繁忙”或无法响应,据了解,这是DeepSeek有史以来最长的一次“罢工”。而

热心网友
04.01
雷军公布小米MiMo V2 Pro大模型Text Arena刷榜全球前五战绩
AI
雷军公布小米MiMo V2 Pro大模型Text Arena刷榜全球前五战绩

IT之家 3 月 31 日消息,小米创办人、董事长兼 CEO 雷军今日分享了 MiMo-V2-Pro 大模型最新“战绩”。在大模型权威评测榜单 Text Arena,MiMo-V2-Pro 凭借在复

热心网友
03.31
古尔曼披露:苹果Apple Intelligence在中国意外上线后下线
礼仪与书信
古尔曼披露:苹果Apple Intelligence在中国意外上线后下线

3月31日,苹果于今日凌晨开始分批推送国行Apple Intelligence Beta版,需升级至iOS 26 4及以上系统方可体验。彭博社记者马克·古尔曼今日发文称Apple Intellig

热心网友
03.31

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

告别网页套壳 微软宣布Win11应用全面原生重构
游戏资讯
告别网页套壳 微软宣布Win11应用全面原生重构

微软战略转向:Win11内置应用将全面重构,告别网页套壳以提升性能 你是否感觉Windows 11某些应用响应迟缓,或是内存占用异常偏高?最新消息或许值得关注。据官方透露,微软正调整其应用开发战略,将逐步减少对网页技术的依赖,转而启动大规模原生应用重构计划。这一重大决策,标志着此前推广的“网页化”开

热心网友
04.01
《红色沙漠》全支线任务攻略分享
游戏攻略
《红色沙漠》全支线任务攻略分享

《红色沙漠》全支线任务图文攻略与深度解析 在开放世界大作《红色沙漠》中,丰富多样的支线任务是游戏体验不可或缺的一环。许多玩家初次接触时,可能会对任务系统感到困惑。实际上,每个支线都有其独特的设计思路与完成技巧。例如任务“图尔纳里的请求”,其核心玩法侧重于资源收集与体力劳动,你需要按照指示完成特定的伐

热心网友
04.01
四重防护也白搭!《EA Sports FC 26》D加密被破解
游戏资讯
四重防护也白搭!《EA Sports FC 26》D加密被破解

知名破解组织宣布成功突破《EA Sports FC 26》四重防护系统 近日,游戏安全领域传来重磅消息:因屡次攻破高级加密而声名鹊起的破译团队DenuvOwO,正式对外宣告已成功放出针对《EA Sports FC 26》的最新破解方案。该方案直接破解了游戏核心的Denuvo虚拟机加密技术,一石激起千

热心网友
04.01
WSL2通过镜像还原方式快速部署Openclaw
AI
WSL2通过镜像还原方式快速部署Openclaw

快速部署指南:基于DeepSeek与飞书的Ubuntu虚拟机镜像,30分钟完成私有AI助手搭建 你是否希望在本地快速搭建一个集成DeepSeek大模型能力、并能通过飞书机器人便捷调用的AI开发环境?我们提供的基于WSL2的Ubuntu预配置虚拟机镜像,正是为你量身打造的“一站式AI应用解决方案”。本

热心网友
04.01
《绝地求生》躲猫猫靠是气势!千万不要慌!
游戏攻略
《绝地求生》躲猫猫靠是气势!千万不要慌!

《绝地求生》全新“物品狩猎”躲猫猫模式正式上线:玩法宣传片深度解析 《绝地求生》重磅更新,备受期待的趣味玩法“物品狩猎”模式现已正式推出。这一全新的躲猫猫玩法究竟有何独特之处?官方已发布完整版宣传视频,为玩家们详细揭秘核心规则与对战策略。想要抢先了解新模式的玩家,可以通过本文的介绍一探究竟。 最新发

热心网友
04.01