最新消息,国内一家专注于超快流式推理芯片的创业公司——“寒序科技”宣布完成数千万元融资,投资方包括启高资本、赛意产业基金,源合资本担任本轮独家财务顾问。
此前,寒序科技一直保持低调,其AI推理系列(SpinPU-E Series)产品在公开层面的进展,在过去两年间并未对外系统披露。
有知情人士透露,寒序科技首颗芯片样片回片测试结果“非常理想”,关键指标中,其“单位面积带宽”与Groq的LPU(语言处理单元)所披露数据一致,达到惊人的100 GB/s/mm²,这是衡量AI芯片推理性能的核心指标之一,也正是其直面2000 Tokens/s输出实力的底气所在。
在业内看来,这类能力决定了大模型(LLMs)推理时能否真正实现“流式输出”、“高Tokens/s”的关键效果。重要的是,这家公司的下一代芯片已经在流片中,凭借“片上MRAM+SRAM”的创新存储架构和“确定性流式乘加单元”等设计,其性能目标直指夸张的2000 Tokens/s以上,对比当前主流对话模型通常仅30-50 Tokens/s的推理速度,表现值得期待。
在当前推理芯片的激烈竞争中,这几乎是辨识度最高的硬指标之一。也因此,接近项目的人士将其评价为:国内少有的、真正沿着Groq技术路径深入攻关的团队。
值得注意的是,业内近期普遍传闻,英伟达(NVIDIA)已以约200亿美元估值级别的合作锁定Groq的推理技术,并计划在预计于2026年发布的NVIDIA GTC新一代AI推理系统中采用Groq的芯片设计。寒序科技的方案被业界认为是最贴近该方案路线的超大带宽流式处理芯片。
与追求全能的GPU路线不同,这家公司选择了更为聚焦、更极致的产品定义:不卷“大而全”,也不卷通用训练,而是将所有资源压强在推理速度上,其核心理念只有四个字——唯“快”不破。
寒序科技成立于2024年8月,技术源于国内磁学研究重镇“北京大学磁学中心”。其核心团队是国内首个有能力打通从物理、材料、器件到异构集成、芯片设计、算法全链条的交叉学科团队。
有接近本轮融资的人士表示,这家公司之所以近期开始对外释放信息,一个重要背景是:其关键技术验证与样片测试已经度过最危险的阶段。目前,该公司新一轮融资也已在推进中。
更多创业项目,可关注了解。
原创文章,未经授权禁止转载。转载须知。
