据IT之家2月27日引述路透社报道,两位知情人士透露,深度求索(DeepSeek)在即将进行重大模型更新之前,并未向美国芯片制造商展示其即将推出的旗舰模型,这一做法打破了行业惯例。
与此相反,DeepSeek V4 模型向包括华为技术有限公司在内的国内供应商提供了早期访问权限。
报道指出,人工智能开发者通常会将主要模型的预发布版本分享给英伟达和AMD等芯片制造商,以确保其软件能在广泛使用的硬件上高效运行。深度求索此前曾与英伟达的技术人员紧密合作。
对于其即将推出的模型,DeepSeek 没有向英伟达和AMD提供访问权限,而是给予了包括华为在内的中国厂商数周时间来适配其芯片。
英伟达和AMD拒绝对此事发表评论。深度求索和华为方面也未回应相关的评论请求。
消息源于2月26日在某社交平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,其代号为“Sealion-lite”。该模型的上下文窗口长度达到100万个令牌,并原生支持多模态推理。
IT之家注意到,本月初,DeepSeek 更新后已开始灰度测试最高100万令牌的上下文长度。与此同时,最新的DeepSeek知识库也已更新至2025年5月,在非联网状态下能够准确输出2025年4月的新闻信息。

