游乐游手机版
首页/科技数码/文章详情

英伟达已适配 DeepSeek-V4 AI 模型

时间:2026-04-25 20:24
英伟达宣布Blackwell平台适配DeepSeek-V4系列模型 就在今天,英伟达发布了一则重要消息:其最新的NVIDIA Blackwell平台,已经正式完成了对DeepSeek-V4-Pro和DeepSeek-V4-Flash两款模型的适配。这意味着,开发者现在可以通过NVIDIA NIM微服

英伟达宣布Blackwell平台适配DeepSeek-V4系列模型

就在今天,英伟达发布了一则重要消息:其最新的NVIDIA Blackwell平台,已经正式完成了对DeepSeek-V4-Pro和DeepSeek-V4-Flash两款模型的适配。这意味着,开发者现在可以通过NVIDIA NIM微服务直接下载部署,或者利用SGLang与vLLM框架进行更灵活的定制化推理。

那么,这两款模型究竟有何不同?从官方公布的信息来看,定位非常清晰。DeepSeek-V4-Pro拥有高达1.6T的总参数量,激活参数为49B,显然是瞄准了需要复杂逻辑和深度思考的高级推理任务。而它的“兄弟”DeepSeek-V4-Flash则走了另一条路,总参数量为284B,激活参数13B,主打的就是一个“快”字,专为那些对速度和效率有极致要求的场景设计。

当然,它们也有显著的共同优势。两款模型都支持长达100万Token的上下文窗口,并且最高能输出38.4万Token。这个能力意味着什么?简单来说,无论是处理超长的技术文档、进行深度的代码分析,还是完成复杂的多轮对话,它们都能轻松应对。值得一提的是,这两款模型都采用了MIT开源协议,对开发者社区相当友好。

光有理论参数还不够,实际表现才是硬道理。根据实测数据,DeepSeek-V4-Pro在NVIDIA顶级的GB200 NVL72系统上,开箱即用的性能就超过了每秒每用户150个Token。对于希望快速上手的开发者,借助vLLM框架提供的“Day 0”配方,可以在Blackwell B300上实现快速部署。这还不是终点,随着Dynamo、NVFP4以及CUDA内核的持续深度优化,模型的推理性能还有望进一步提升。

最后,来看看部署生态。英伟达为开发者提供了灵活的选择路径。既可以通过封装好的NVIDIA NIM微服务,像调用API一样简便地下载和部署;也可以选择更底层的SGLang或vLLM框架,进行深度定制。其中,SGLang提供了低延迟、均衡以及最大吞吐量三种预设“配方”,以适应不同场景的优先级。而vLLM框架则更加强大,它支持将推理任务扩展到100个以上的GPU节点,并且内置了工具调用和推测解码等高级能力,为构建大规模、高性能的AI服务提供了坚实的技术底座。

来源:https://www.techweb.com.cn/it/2026-04-25/2974765.shtml
上一篇《异环》显卡性能测试:新旧显卡等级森严! 下一篇英特尔告知中国云服务商:未来两季度 CPU 供应极度紧张,年底有望趋稳
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo