
英伟达(Nvidia)近日披露了其全新面向 AI 数据中心的计算平台 Vera Rubin 的更多细节。鉴于整个行业对英伟达技术的高度依赖,这一发布可能对人工智能的未来产生深远影响。
英伟达此前已公布过 Vera Rubin 的部分信息,但在1月5日(周一)于拉斯维加斯举行的 CES 科技大会上,公司首次系统性地介绍了该平台的运行方式,并公布了发布时间表。英伟达表示,Vera Rubin 目前已进入量产阶段,首批基于该平台的产品预计将于 2026 年下半年 推出。
在 AI 浪潮中,英伟达已成为当之无愧的“代言人”。其 AI 芯片和平台的广泛应用,曾推动公司在去年一度成为全球首家市值突破 5 万亿美元 的企业。但与此同时,随着竞争加剧以及科技公司纷纷开发自研 AI 芯片、以降低对英伟达的依赖,市场对 AI 泡沫的担忧也在不断升温,英伟达正面临双重挑战。
身着标志性皮夹克的英伟达首席执行官黄仁勋在拉斯维加斯枫丹白露酒店剧院的开幕演讲中,正面回应了“AI 资金从何而来”这一泡沫争论的核心问题。他表示,企业正在将原本用于传统计算方式的研发预算,转向人工智能领域。“人们总在问,钱从哪里来?钱就是从那里来的,”黄仁勋说。
Vera Rubin 平台正是英伟达试图应对日益复杂的 AI 计算挑战的关键布局之一,例如:现有基础设施是否还能支撑愈发复杂的 AI 查询需求。英伟达在新闻稿中称,其即将推出的 AI 服务器机架 Vera Rubin NVL72 “所提供的带宽超过整个互联网”。
英伟达表示,Vera Rubin 采用了一种全新的存储系统,使 AI 模型能够更快、更高效地处理复杂、上下文密集型的请求。随着谷歌、OpenAI 和 Anthropic 等公司从简单聊天机器人转向功能完备的 AI 助手,传统计算机乃至数据中心 GPU 所依赖的存储与内存体系已难以满足需求。
黄仁勋在1月5日(周一)的演示中详细讲解了 AI 从“聊天机器人”向“智能体(agents)”演进的过程。在一段视频展示中,一名用户通过将一台外观友好的桌面机器人连接到运行在英伟达 DGX Spark 桌面计算机上的多个 AI 模型,构建了一个个人助理。该机器人不仅能够复述用户的待办事项清单,甚至还能“命令”家里的狗从沙发上下来。黄仁勋表示,几年前,打造这样的个人助理几乎是不可想象的事情;而如今,开发者只需依赖大语言模型,而非传统编程工具,就能构建应用和服务,这件事已经变得“极其简单”。
换言之,随着 AI 在多步骤任务中展现出更强的“推理”能力,旧有的计算方式已难以胜任,英伟达认为必须进行根本性转变。“瓶颈正在从计算能力转向上下文管理,”英伟达高性能计算与 AI 超大规模解决方案高级总监迪翁·哈里斯(Dion Harris)在发布会前与记者的电话会议中表示。“存储系统不再是可以事后再考虑的问题,”他补充道。
在 CES 前夕,英伟达还与专注于推理计算的公司 Groq 达成了一项许可协议,这进一步表明其正在加大对 AI 推理领域的投入。“推理已不再是一次性给出答案,而是一个‘思考’过程,”黄仁勋说,他指的是 AI 模型在完成任务和生成答案时所经历的推理与思考机制。英伟达在新闻稿中表示,微软、亚马逊云服务(AWS)、谷歌云以及 CoreWeave 等主要云服务商,都将成为首批部署 Vera Rubin 平台的客户。戴尔、思科等计算设备厂商预计也会在其数据中心中采用这些新芯片,而 OpenAI、Anthropic、Meta 和 xAI 等 AI 实验室,则有望利用该技术进行模型训练,并提供更复杂、更高质量的回答。
此外,英伟达还进一步推进了在自动驾驶领域的布局,推出了名为 Alpamayo 的新模型,并继续加码“物理 AI”——即驱动机器人及其他现实世界机械设备的人工智能。这一方向延续了公司在去年 10 月 GTC 大会上提出的长期愿景。然而,英伟达的迅猛发展与行业主导地位,也意味着其必须不断超越华尔街的高预期,并缓解市场对 AI 基础设施投资远超实际需求的担忧。
仅今年一年,Meta、微软和亚马逊等公司就已投入数百亿美元资本支出。咨询公司麦肯锡预计,到 2030 年,全球企业在数据中心基础设施上的投资将接近 7 万亿美元。而其中相当一部分 AI 投入,集中在少数几家公司之间相互流转资金与技术的“循环融资”模式中。
与此同时,谷歌和 OpenAI 也在加速开发自研芯片,以更好地匹配其模型的具体需求。英伟达还面临来自 AMD 的日益激烈竞争,芯片制造商高通也在近期宣布进军数据中心市场。“没有人愿意完全受制于英伟达,”投资公司 Quilter Cheviot 全球科技研究主管本·巴林杰(Ben Barringer)此前在接受 CNN 采访时表示,“他们正在努力分散自己的芯片布局风险。”
未经允许不得转载:城市新闻网icitynews » 英伟达亮出“未来算力”,AI 数据中心迎来下一代引擎













