小身材大智慧:英伟达发布迷你 AI 电脑,桌面即可运行大型模型

英伟达推出全新桌面级 AI 工作站 DGX Spark,小巧机身内拥有 128GB 统一内存与 1 petaflop 算力,让大型人工智能模型首次真正走上桌面。

周二,英伟达(Nvidia) 宣布正式开放 DGX Spark 的预订——这是一款售价约 4,000 美元 的台式人工智能计算机,具备高达 1 petaflop 的算力128GB 统一内存,体积却足够小巧,可以直接摆在桌面上使用。
这款设备最大的亮点在于其庞大的集成内存,使得用户能够在本地运行比消费级 GPU 更大型的 AI 模型。

英伟达表示,DGX Spark 将于 10 月 15 日(星期三) 起在官方网站接受预订,同时也会通过部分制造合作伙伴和美国零售渠道发售。

事实上,早在今年 1 月份,英伟达就曾以“Project DIGITS”的代号展示过这款设备,并在 5 月份正式命名为 DGX Spark。这台电脑代表了英伟达希望打造的一个新类别——专为人工智能开发者设计的桌面级工作站


为 AI 开发者打造的“本地算力替代方案”

Spark 的设计初衷,是为了解决 AI 开发者普遍面临的一大难题:许多 AI 模型对计算性能和内存的要求,已经远超普通 PC 或工作站的承受范围,迫使开发者必须依赖云计算或数据中心资源。而 Spark 的出现,为他们提供了一个更灵活的“桌面级解决方案”。

不过,这一市场仍存在不确定性——毕竟,虽然云服务按需付费、门槛更低,但 DGX Spark 作为一次性投入的设备,前期成本相对较高。

据报道,DGX Spark 拥有足够的内存,能够本地运行多达 2000 亿参数 的大型 AI 模型,以及约 700 亿参数 的微调模型,而无需依赖远程服务器。
这意味着,它可以胜任运行开放权重语言模型或多媒体合成模型的任务,例如 AI 图像生成器等。

用户还可以利用 Spark 平台:

  • 调用 Flux.1 模型进行图像生成;
  • 使用 Cosmos Reason 视觉语言模型构建视觉搜索和摘要系统;
  • 或基于 Qwen3 模型开发聊天机器人。

这些模型都经过针对 DGX Spark 平台的优化,能够充分发挥其本地计算潜力。


小盒子,大能量

在仅 2.65 磅 的机身中,英伟达塞进了惊人的性能。DGX Spark 机身尺寸仅 5.91 × 5.91 × 1.99 英寸,功耗为 240 瓦
其核心是 GB10 Grace Blackwell 超级芯片,并配备 ConnectX-7 200Gb/s 网络,采用 NVLink-C2C 技术,带宽是 PCIe Gen 5 的五倍。
此外,128GB 统一内存 能够在系统与 GPU 之间动态共享,大幅提升模型运行效率。

操作系统方面,Spark 采用基于 Ubuntu LinuxDGX OS,预装英伟达完整的 AI 软件堆栈,包括 CUDA 库NIM 微服务,开箱即可用于 AI 开发。


性能与价格的平衡点

DGX Spark 的起售价为 3,999 美元
虽然价格看似不菲,但相比其他高端 GPU(如 RTX Pro 6000 约 9,000 美元)或 AI 服务器 GPU(如基础级 H25,000 高达数万美元),DGX Spark 显然是一个相对经济的选择。

据《The Register》报道,GB10 芯片的 GPU 性能大致相当于 RTX 5070,但 Spark 的 128GB 统一内存带来了巨大优势——
相比之下,RTX 5070 仅有 12GB 显存,RTX 5090 也仅配备 24GB RAM,而要运行像 OpenAI 的 gpt-oss(约 1200 亿参数)的模型,至少需要 80GB 内存。
因此,Spark 在中小规模 AI 模型开发场景中具有独特竞争力。


再现“人工智能起点”的致敬时刻

英伟达创始人兼 CEO 黄仁勋 亲自将首批 DGX Spark 设备交付至 SpaceX 德州 Starbase 工厂,赠予 埃隆·马斯克(Elon Musk),以纪念产品发布。
这一举动与他在 2016 年将首台 DGX-1 超级计算机亲手交付给当时的 OpenAI 如出一辙——而正是那台设备,见证了 ChatGPT 的诞生

黄仁勋在声明中表示:

“2016 年,我们打造了 DGX-1,为 AI 研究者提供了他们自己的超级计算机。如今,DGX Spark 将这一使命带回桌面,让人工智能再次进入创新者的手中。”

本文译自:arstechnica  ,由olaola编辑发布

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注