首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Taalas公司“邪修”AI芯片如何炼成?聚焦AGI技术

Taalas公司“邪修”AI芯片如何炼成?聚焦AGI技术

热心网友
50
转载
2026-02-24


图片来自Taalas正式

打着“颠覆英伟达”的旗号的公司,总是会接二连三涌现。

最近,一家来自加拿大多伦多的芯片“小厂”Taalas引起了AI圈关注。有声音认为,它很可能撬动英伟达主宰了多年的AI芯片市场。

当地时间2月20日,成立于2024年的初创公司Taalas发布了首款产品Taalas HC1芯片,专为Llama 3.1 8B模型优化,采用30芯片集群时实现每秒12000 tokens的推理速度,较传统GPU方案提升50倍能效。

Taalas称,公司通过结构化ASIC技术将芯片定制周期缩短至两个月,已累计融资2.19亿美元。24名敬业的员工的努力,投入3000万美元,打造出了这款拥有“极致的专业化、速度和能源效率”的产品。

Taalas创始人兼CEO是曾任AMD架构师的业界传奇人物柳比沙·巴伊奇(Ljubiša Bajić)。

在公司正式的介绍文章中,巴伊奇称,这款芯片选择了Meta公司2024年7月推出的开源大模型Llama 3.1 8B作为运行平台,峰值推理速度接近17000 tokens/秒,比目前市场中最先进的技术快近10倍,构建成本降低到原来的1/20,功耗降低至原来的1/10。


截图来自社交平台X

巴伊奇给出了一组测试数据,Taalas自己在Llama 3.1 8B上测试了英伟达的主力产品H200和B200,结果为230 tokens/秒和353 tokens/秒,而Taalas的HC1性能是它们的48倍。

此前这一数据,是由独立分析平台Artificial Analysis测出的最高值,来自刚刚完成H轮融资、估值230亿美元的Cerebras,为1981 tokens/秒,也仅为HC1的11%。

在实测演示中,大模型对用户问题的详细解答,达到甚至超越了“秒回”的水平。

不过,AI在大量回复的一瞬间,人类对话者也产生了扑面而来的压迫感。


图片来自Taalas正式

这一堪称“突破极限”的表现,果不其然引起了大量的讨论。大呼“颠覆将至”者有之,质疑其言过其实、过度营销者亦有之。

令我们好奇的是,在喧嚣背后,Taalas的技术和产品究竟有何特殊之处?又是否当得起其自称的“世界上速度最快、成本和功耗最低的推理平台”呢?

将模型直接“刻”在芯片上

在研究了其首款产品HC1的相关公开信息之后,我们发现,Taalas的技术路线,与目前市场主流的ASIC路线相比,极具颠覆性,堪称“邪修版”ASIC。

与英伟达和AMD代表的业界主流GPU通用计算技术路线不同,Taalas更接近ASIC(专用集成电路)路线。

这一技术路线通过为特定应用场景定制硬件设计,以追求极致能效和成本效益。虽然它的适用性、功能丰富度、可互换性,远低于能覆盖多场景的GPU,但自去年以来,以谷歌TPU为首,ASIC技术拥有成本(TCO)低、打造大模型能力毫不逊色等特点,得到了市场认可,出货量大幅提升。

野村证券预测,2026年,ASIC芯片的总出货量可能会首次超过GPU。而在GPU市场处于两巨头垄断的情况下,大多数芯片初创也都选择了ASIC路线,包括市场知名度较高的Cerebras、SambaNova,以及,此前刚刚被英伟达将核心团队纳入囊中的Groq。

巴伊奇在AMD和英伟达都有任职经历,之前还创立了一家专注于AI芯片研发的独角兽Tenstorrent公司。Tenstorrent通过开源RISC-V架构和软硬件协同设计,降低AI计算成本。

而“挑战英伟达垄断地位”,一直是巴伊奇所宣扬的核心理念,也是Tenstorrent公司备受关注的“招牌”标签。

不过,英伟达的发展,要远好于AMD及各类AI芯片初创公司,巴伊奇也在探索中有了更“极端”的设想。

2024年至2024年间,巴伊奇逐渐脱离了此前工作,开始筹划创办Taalas。他与他的妻子、曾在AMD任系统工程高级经理莱拉·巴伊奇(Lejla Bajic),以及,曾任AMD高级设计工程师并在Tenstorrent担任过ASIC设计总监的德拉贡·伊格纳托维奇(Drago Ignjatovic)成为了Taalas联合创始人。

Taalas公司20余人的核心工程师团队,多数来自AMD、苹果、谷歌、英伟达和TensorRent。

2024年,Taalas公司完成5000万美元的首轮融资,并正式出现在公众视野。

巴伊奇强调,Taalas致力于解决AI发展面临的两大障碍——“高延迟”和“天文数字般的算力成本”,并提出“单芯片性能超越小型GPU数据中心”这一极具野心,甚至显得有些“狂妄”的目标。

资本市场为巴伊奇的野心投票。截至目前,Taalas目前已完成三轮融资,总额超过2亿美元。

Taalas奉行“The Model is The Computer”(这句话也是公司的slogan),可以理解为,将传统“在计算设备上运行模型”的范式,转变为“模型本身成为计算设备”。

技术实现路径上,Taalas提出“无需软件,直接将模型刻在芯片上”,这与传统的ASIC芯片仍需使用软件,通过编译过程将软件代码转化为芯片指令不同。

Taalas通过EDA(电子设计自动化)流程,将特定大模型直接转化为定制芯片。

也就是说,每款使用Taalas的大模型,都会拥有专属于自身的定制芯片,实现巴伊奇所说的“完全专业化”(Total specialization)。

与此同时,算力也摆脱了软件束缚和编译过程,数据几乎不需要在内存和计算单元之间移动,“内存墙”由此消失,推理成本随之大幅降低,推理速度则显著提升。


截图来自社交平台X

目前来看,Taalas的主要业务操作流程也比较简单。大致是客户向Taalas提供自身所需的模型,Taalas在一周内将其转化为电路设计,通过台积电代工在两个月内交付专属芯片。

可想而知,如果Taalas能为每个主流模型,都提供出类似HC1在Llama 3.1 8B上那样的性能飞跃,那么,各大厂商很可能会对其产品趋之若鹜。

实际上,包括独立人工智能研究员本杰明·马里(Benjamin Marie)、Devtools创业顾问肖恩·王(swyx)等产业界人士和The Next Platform记者蒂莫西·普里克特·摩根(Timothy Prickett Morgan)等媒体人士,都已在积极介绍Taalas的新产品,看好其前景者不在少数。

Taalas的死穴在哪?

不过,在舆论热度落地到商用市场之前,Taalas还有很多问题需要被看到。

首先,Taalas需要面对的是,其产品能否适用更先进、大规模的模型。

2024年,Meta推出Llama 3.1时,发布了8B、70B和405B三种参数规模版本,Taalas选用的是最小的8B。

很显然,在目前大模型进化速度极快、规模越来越大的背景下,Taalas的产品能否匹配,是否面临明显“天花板”,都是必须解决的问题。

巴伊奇称,公司将在今年春季推出一款适用中等规模推理模型的产品,届时表现如何,值得关注。

与此相关的,目前测评体验中,不少质疑声音集中在,Taalas让本已不算聪明的Llama变得“更笨了”。

一些用户发帖称,HC1“幻觉严重”“答案明显错误,质量远低于同参数GPU版”,“回答速度快但错得也快”,其实用性不佳。


截图来自社交平台X

实际上,对于如何理解Taalas给出的测试数据,也有较多质疑声音。

一位关注芯片产业的爱好者对作者表示,Taalas相当于内置了问题的答案,所以,计算速度“秒杀”英伟达等一众业界翘楚,但是,将”1+1=2”的问题换为“2*2=?”,它的表现可能就会“掉链子”。

Taalas能在极其有限的特定场景下“秒杀英伟达”,但目前其他英伟达能做的事,对于Taalas来说可能更难。

更为关键的问题是,Taalas能否跟得上大模型的迭代周期。

一位半导体行业从业者对作者表示,Taalas的芯片“表现很牛,但目前可能没啥大的用处”,因为大模型还在不停迭代,而Taalas的迭代能力和速度成疑。

该行业人士认为,“要等以后大模型达到某个层级不再大规模、快速迭代了,这种芯片才能有更大舞台”。

而在社交平台上的讨论中,不少质疑集中在HC1“模型锁定”的“只读”模式导致的“过时”和“废弃”风险,并认为这是其商业化、规模化的重大阻碍。

目前,一款顶尖大模型能保持领先优势的时间窗口不过月余,而Taalas交付芯片(而非量产)即使已经很快,但也需要至少两个月。

改写AI芯片规则的未来已来

支持HC1进步性的声音也不在少数。

在知乎的相关讨论中,中国科学院计算技术研究所副研究员赵永威指出,虽然Taalas“目前的状况还没有应用价值”,但不妨碍它会成为“一颗有历史意义的芯片”。

他认为,这种“硬连线”的模式,是未来芯片发展的一大趋势,目前的质疑由Taalas来扛,后来者在推广相关概念时就会更加轻松。他也透露,自己所在单位也在研究类似技术路线,并提到,降低经济成本,既是相关路线的研究目标,也应该是宣传发力点所在。

知名科技记者蒂莫西·普里克特·摩根(Timothy Prickett Morgan)在文章中提到,Taalas确实需要模型的每一次更新中重新设计芯片,但其在推理引擎上蚀刻新模型,只需要更改设计中的两层金属,而不是完全废弃。考虑到训练模型的成本高达数十亿美元,Taalas芯片的更新成本微不足道。

摩根认为,在主要模型发布间隔时间延长,人们对成熟模型依赖度增加时,Taalas芯片有望赢得更广泛的市场认可。

也有一些分析称,得益于低延迟、低功耗的特性,Taalas真正的用武之地或在于边缘推理场景,比如,机器人、自动驾驶汽车,甚至高端智能手机等设备中。这些设备不需要运行所有模型,只需要稳定运行定制化的模型,而更快的速度和更低的消耗,显然更有利于产业普及AI大模型。

不过,即便是相关产品能真正规模化地进入市场并大展拳脚,新的状况和问题也会随之浮现。

比如,大模型的底层架构(Transformer)是否会遭遇另一场“革命”?这似乎决定着“模型即芯片”技术路线的命运。还有,生态系统建设的问题,英伟达虽然是硬件公司,但CUDA软件生态和开发者的重度依赖,才是其真正的护城河,而这也是Taalas看中且有意颠覆的。

但这些都是后话了,至少目前来看,Taalas距离英伟达还很遥远,更遑论“颠覆英伟达”了。然而,巴伊奇在这条路上依旧步履不停,Taalas宣布,计划在今年冬季推出第二代HC2产品,将具备更快的执行速度和更强的性能。

届时,一代产品的市场反馈和二代产品的迭代效果,将进一步验证今天各方对这股横空出世的新势力的判断。(作者|胡珈萌,编辑|李程程)

来源:https://www.163.com/dy/article/KMG0942M05118O92.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

不加GPU提升15%算力:大模型网络优化技术解析
AI资讯
不加GPU提升15%算力:大模型网络优化技术解析

智谱的ZCube组网架构通过优化网络拓扑,在不增加GPU和修改代码的情况下,使集群推理吞吐量提升15%,首Token响应延迟降低40 6%,并减少三分之一的交换机和光模块用量。行业正从堆硬件转向挖掘系统效率,类似OpenAI的MRC协议等技术也聚焦网络优化,推动高端交换机与高速光模块需求增长,帮助企业在现有算力中提。

热心网友
05.22
英伟达财报超预期股价却下跌 黄仁勋揭秘后GPU时代增长战略
科技数码
英伟达财报超预期股价却下跌 黄仁勋揭秘后GPU时代增长战略

英伟达最新财报显示营收与净利润同比大幅增长,但股价小幅下滑,市场对其高增长数字已显“审美疲劳”,更关注长期战略。黄仁勋阐述了“后GPU时代”的新增长点:将数据中心业务细分为超大规模市场和覆盖广泛经济规模的ACIE市场;同时积极进军CPU业务,下一代VeraRubin系统也将量产。公司还宣布大幅增加股票。

热心网友
05.22
英特尔陈立武谈AI推理趋势CPU与GPU配比可达四比一
科技数码
英特尔陈立武谈AI推理趋势CPU与GPU配比可达四比一

英特尔CEO陈立武透露,其18A制程已支持PantherLake量产,良率提升超预期;14A制程的PDK已发布,并向更先进的10A和7A节点规划。他着重指出,AI计算正从训练转向推理,CPU因通用性强、延迟低而愈发关键,未来CPU与GPU的配比可能达到4:1。为把握机遇,英特尔正积极拓展ASIC定制芯片业务。

热心网友
05.21
AMD AI开发者日中国站:从GPU堆叠到系统工程,打通AI部署全链路
业界动态
AMD AI开发者日中国站:从GPU堆叠到系统工程,打通AI部署全链路

AMD开发者大会指出AI正转向推理普及,面临算力与隐私挑战。AMD通过开放生态应对,强调系统协同与统一内存,推出锐龙AIMax系列处理器支持本地大模型运行,并展示ROCm软件栈实现高效部署。AMD深耕中国生态,推出开发者云等服务,与本地开发者共推AI创新。

热心网友
05.21
马斯克2700亿算力订单详情公开 54万张GPU与太空AI计算布局揭秘
AI资讯
马斯克2700亿算力订单详情公开 54万张GPU与太空AI计算布局揭秘

SpaceX提交的招股书披露了其构建AI算力帝国的计划。包括与Anthropic签订价值约400亿美元的算力协议,部署超54万张GPU的庞大集群,并规划自研芯片及轨道AI计算卫星。公司预计AI业务目标市场巨大,但同时也承认轨道计算等计划存在显著的技术与商业风险。

热心网友
05.21

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币现货持有者坚定持仓 BTC价格逼近115000美元关键阻力位
web3.0
比特币现货持有者坚定持仓 BTC价格逼近115000美元关键阻力位

现货持有者坚守仓位,比特币接近115,000水平 近期比特币(BTC)价格接近$115,000水平,市场整体情绪谨慎,但现货持有者依旧坚守仓位,显示出一定的多头信心。 市场现状与资金流动 那么,当前市场的资金究竟在如何流动?分析显示,一个有趣的现象正在上演:短线资金的流入其实相当有限,市场热度并未急

热心网友
05.23
瑞波币XRP现最强看涨形态目标6美元 近期回调后走势深度解析
web3.0
瑞波币XRP现最强看涨形态目标6美元 近期回调后走势深度解析

目录 要点介绍:分析师称XRP呈现“最强看涨结构”高位清算集中于2 90美元以上区域 周四,XRP价格稳稳站在了2 80美元上方。这个位置守住了,意味着什么?意味着市场向那个经典的“杯柄形态”目标价——6美元以上——又迈进了一步。 要点介绍: 先看几个核心数据:周四XRP报收2 82美元。技术分析显

热心网友
05.23
以太坊衍生品市场企稳 交易员聚焦4500美元关键阻力位突破
web3.0
以太坊衍生品市场企稳 交易员聚焦4500美元关键阻力位突破

近期,以太坊(ETH)衍生品市场经历了短暂的闪崩,但随后价格快速企稳,交易者开始关注关键突破点——$4,500水平。 ETH衍生品市场现状 市场情绪往往在剧烈波动后显露真容。从最新的链上数据和期权、永续合约的交易情况来看,那场短暂的闪崩更像是一次压力测试——结果是,市场波动率显著下降,多空力量似乎进

热心网友
05.23
狗狗币DOGE暴涨11%交易量激增四倍 市场反弹行情能否持续
web3.0
狗狗币DOGE暴涨11%交易量激增四倍 市场反弹行情能否持续

DOGE单日暴涨11%,交易量激增四倍,市场风向变了? 最近,加密货币市场又热闹起来了。DOGE(狗狗币)上演了一出“旱地拔葱”,价格单日暴涨11%,更关键的是,成交量直接翻了四倍。这种“价量齐升”的场面,无疑给整个迷因币板块打了一针强心剂,市场情绪肉眼可见地回暖了。 DOGE价格拉升原因分析 那么

热心网友
05.23
欧易OKX官方APP下载指南 安全交易入口与安装教程
web3.0
欧易OKX官方APP下载指南 安全交易入口与安装教程

如何安全获取欧易(OKX)官方APP?一份详尽的下载与使用指南 Binance币安 欧易OKX ️ Huobi火币️ 当人们谈论“欧易易欧”时,指的往往是那个全球顶尖的数字资产交易平台——欧易(OKX)。作为业务版图庞大的行业巨头,其官方APP无疑是用户进行交易、查看行情和管理资产的核心工具。不过,

热心网友
05.23