英伟达计划推出全新AI推理芯片OpenAI将成为最大客户之一

英伟达计划推出全新AI推理芯片OpenAI将成为最大客户之一

英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,助力打造更快、更高效的工具。这是其业务的重大调整,或将重新定义AI竞赛格局。

据知情人士透露,该公司正在为AI推理计算设计全新系统——这类计算负责让AI模型响应用户请求。这款新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布,将整合初创公司Groq设计的芯片。

推理计算成竞争焦点

推理计算已成为行业激烈竞争的焦点。竞争对手谷歌和亚马逊均已推出芯片,与英伟达旗舰产品抗衡。同时,科技行业自主编码技术的爆发式增长,催生了对能更高效处理复杂AI任务的新型芯片的需求。

部分知情人士称,OpenAI已同意成为这款新处理器的最大客户之一,对英伟达而言是重大胜利。这家ChatGPT开发者本就是英伟达的核心客户,过去数月一直在寻找英伟达芯片的更高效替代方案,并于上月与一家芯片初创公司签约,新增了供应选择。

面临性能瓶颈

英伟达在设计与销售GPU领域占据主导地位,这类处理器可同时执行数十亿项简单任务。但自AI热潮兴起以来,英伟达首次面临其旗舰产品的性能瓶颈。随着市场向推理方向转移,部分客户正施压英伟达,要求推出能更高效支撑AI应用的芯片。

英伟达旗下高性能的Hopper、Blackwell及Rubin系列GPU,被业内公认为训练超大规模AI模型的顶级产品。多数分析师估计,英伟达掌控着90%以上的GPU市场份额。

AI智能体驱动需求

英伟达计划推出全新AI推理芯片 OpenAI将成为最大客户之一 新闻

随着企业纷纷部署AI智能体等工具,高端计算需求已从训练转向推理。智能体是可相对自主地代用户完成任务的AI系统。许多开发和运营AI智能体的企业发现,GPU成本过高、功耗过大,且并不完全适配模型实际运行需求。

上月,OpenAI与Cerebras达成数十亿美元的计算合作。Cerebras主打推理芯片,其首席执行官称,该芯片速度快于英伟达GPU。据报道,早在去年秋天,OpenAI工程师就提出需要更快的推理芯片用于智能体编码应用,公司随即展开谈判。

本月,英伟达宣布扩大与Meta的合作,其中包括史上首次大规模纯CPU部署,用于支撑Meta的广告定向AI智能体。这笔交易提前透露了英伟达的战略:跳出GPU范畴,抢占AI细分市场。