小身材大智慧：英伟达发布迷你 AI 电脑，桌面即可运行大型模型

英伟达推出全新桌面级 AI 工作站 DGX Spark，小巧机身内拥有 128GB 统一内存与 1 petaflop 算力，让大型人工智能模型首次真正走上桌面。

周二，英伟达（Nvidia） 宣布正式开放 DGX Spark 的预订——这是一款售价约 4,000 美元 的台式人工智能计算机，具备高达 1 petaflop 的算力 和 128GB 统一内存，体积却足够小巧，可以直接摆在桌面上使用。
这款设备最大的亮点在于其庞大的集成内存，使得用户能够在本地运行比消费级 GPU 更大型的 AI 模型。

英伟达表示，DGX Spark 将于 10 月 15 日（星期三） 起在官方网站接受预订，同时也会通过部分制造合作伙伴和美国零售渠道发售。

事实上，早在今年 1 月份，英伟达就曾以“Project DIGITS”的代号展示过这款设备，并在 5 月份正式命名为 DGX Spark。这台电脑代表了英伟达希望打造的一个新类别——专为人工智能开发者设计的桌面级工作站。

为 AI 开发者打造的“本地算力替代方案”

Spark 的设计初衷，是为了解决 AI 开发者普遍面临的一大难题：许多 AI 模型对计算性能和内存的要求，已经远超普通 PC 或工作站的承受范围，迫使开发者必须依赖云计算或数据中心资源。而 Spark 的出现，为他们提供了一个更灵活的“桌面级解决方案”。

不过，这一市场仍存在不确定性——毕竟，虽然云服务按需付费、门槛更低，但 DGX Spark 作为一次性投入的设备，前期成本相对较高。

据报道，DGX Spark 拥有足够的内存，能够本地运行多达 2000 亿参数 的大型 AI 模型，以及约 700 亿参数 的微调模型，而无需依赖远程服务器。
这意味着，它可以胜任运行开放权重语言模型或多媒体合成模型的任务，例如 AI 图像生成器等。

用户还可以利用 Spark 平台：

调用 Flux.1 模型进行图像生成；
使用 Cosmos Reason 视觉语言模型构建视觉搜索和摘要系统；
或基于 Qwen3 模型开发聊天机器人。

这些模型都经过针对 DGX Spark 平台的优化，能够充分发挥其本地计算潜力。

小盒子，大能量

在仅 2.65 磅 的机身中，英伟达塞进了惊人的性能。DGX Spark 机身尺寸仅 5.91 × 5.91 × 1.99 英寸，功耗为 240 瓦。
其核心是 GB10 Grace Blackwell 超级芯片，并配备 ConnectX-7 200Gb/s 网络，采用 NVLink-C2C 技术，带宽是 PCIe Gen 5 的五倍。
此外，128GB 统一内存 能够在系统与 GPU 之间动态共享，大幅提升模型运行效率。

操作系统方面，Spark 采用基于 Ubuntu Linux 的 DGX OS，预装英伟达完整的 AI 软件堆栈，包括 CUDA 库 及 NIM 微服务，开箱即可用于 AI 开发。

性能与价格的平衡点

DGX Spark 的起售价为 3,999 美元。
虽然价格看似不菲，但相比其他高端 GPU（如 RTX Pro 6000 约 9,000 美元）或 AI 服务器 GPU（如基础级 H25,000 高达数万美元），DGX Spark 显然是一个相对经济的选择。

据《The Register》报道，GB10 芯片的 GPU 性能大致相当于 RTX 5070，但 Spark 的 128GB 统一内存带来了巨大优势——
相比之下，RTX 5070 仅有 12GB 显存，RTX 5090 也仅配备 24GB RAM，而要运行像 OpenAI 的 gpt-oss（约 1200 亿参数）的模型，至少需要 80GB 内存。
因此，Spark 在中小规模 AI 模型开发场景中具有独特竞争力。

再现“人工智能起点”的致敬时刻

英伟达创始人兼 CEO 黄仁勋 亲自将首批 DGX Spark 设备交付至 SpaceX 德州 Starbase 工厂，赠予 埃隆·马斯克（Elon Musk），以纪念产品发布。
这一举动与他在 2016 年将首台 DGX-1 超级计算机亲手交付给当时的 OpenAI 如出一辙——而正是那台设备，见证了 ChatGPT 的诞生。

黄仁勋在声明中表示：

“2016 年，我们打造了 DGX-1，为 AI 研究者提供了他们自己的超级计算机。如今，DGX Spark 将这一使命带回桌面，让人工智能再次进入创新者的手中。”

本文译自：arstechnica ，由 olaola编辑发布

咕咕猫

小身材大智慧：英伟达发布迷你 AI 电脑，桌面即可运行大型模型

为 AI 开发者打造的“本地算力替代方案”

小盒子，大能量

性能与价格的平衡点

再现“人工智能起点”的致敬时刻

近期文章