全球AI龙头财报发布前数小时，华为大模型技术重磅发布

来源：网络整理 时间：2025-05-29 作者：佚名 浏览量：

在全球AI领域的领军企业英伟达（NVIDIA）即将公布财务报告的前几个小时，华为再次以强硬的姿态进行了公开的正面交锋。

5月29日凌晨，华为的技术团队在Gitcode平台发布了关于Pangu Ultra MoE万亿规模大模型的技术报告。该模型结构庞大，拥有约7180亿个参数。这是首次在昇腾Ascend 910平台上进行全流程训练。此举显著提高了推理的吞吐量，并减少了延迟。同时，通过融合大算子和通信优化，NPU的利用率得到了有效提升，进而显著增强了训练过程的稳定性。

昨日，华为推出了基于分组混合专家模型（MoGE）架构的盘古Pro MoE大模型，该模型参数量高达720亿。此外，该模型依托昇腾300I Duo和800I A2芯片，实现了更高效的专家负载分布和计算速度，具体表现为每秒处理321个token和1528个token。

华为技术团队先前宣布，昇腾在MoE模型的推理部署方面已经全面胜过采用英伟达Hopper架构的方案。同时，DeepSeek依托国产芯片的部署策略，其性能亦已超过了英伟达H100系列芯片。此外，华为的“CloudMatrix 384超节点”技术，在算力规模及推理性能方面，也全面超越了英伟达的NVL72。

鉴于华为在AI算力领域的激烈竞争，拥有1173亿美元市值的黄仁勋似乎意识到了全球AI市场的迅猛变迁，因此他开始放慢新产品的更新节奏，并将关注点转向了网络架构领域。

5月29日凌晨，英伟达公布了2026财年第一季度的业绩报告，其中显示，公司的收入和利润持续增长。

财报揭示，英伟达本季度收入达到441亿美元，较上季度上升12%，与去年同期相比增长69%；净利润为187.75亿美元，而市场预估为207.67亿美元；经调整后的每股收益为0.96美元，高于市场预期的0.93美元。特别值得关注的是，数据中心业务板块的营收同比增长了73%，达到了391亿美元，这一数字略逊于市场预期的393亿美元。

值得注意的是，根据财报的披露，美国政府于4月宣布对H20产品实施禁售措施。受此影响，英伟达在2026财年第一季度因H20产品库存过剩及采购责任，产生了高达45亿美元的费用。此外，由于对H20产品的需求减少，该季度英伟达H20产品的销售额仅为46亿美元。在新的出口许可要求实施之前，这一数字已经显现。由于第一季度未能按时交货，英伟达遭受了25亿美元的H20收入损失。与此同时，预计第二季度英伟达将因此遭受高达80亿美元的额外亏损。

近期，有消息透露，英伟达计划从6月份开始向我国出口B20“定制版”芯片，此举旨在替代H20。

在谈及B20加入对中国人工智能算力结构的影响时，Gartner研究部门副总裁盛陵海（Roger Sheng）最近向笔者透露，AI芯片的适用性和受欢迎程度取决于其是否能够支撑最新的AI大型模型，并且运行效率必须出色。只有这样，才能获得市场的认可。反之，如果其竞争力不足，那么很可能无人问津。尽管英伟达的AI显卡展现出更卓越的性能，并且并未放弃对中国的市场布局，但我国仍需推动本土AI算力的成长。若美国选择中断供应，企业们很难对其产生信任。毕竟，我们不能将所有希望寄托于一点，必须寻求多元化的（发展）路径。

财报公布后，英伟达（纳斯达克：NVDA）的股价在盘后交易中大幅攀升，涨幅达到了4.89%，其市值也随之上升至3.29万亿美元。

数据中心收入持续暴涨，资本市场已不再“震惊”

实际上，自2025年伊始，在DeepSeek热潮席卷而来之际，最受关注的焦点无疑是英伟达。

华尔街对DeepSeek成为“现象级”的现象提出疑问，这一现象是否对美科技巨头投入的3000多亿美元算力有所贡献，是否影响了美国AI行业发展的预期。在今年的1月27日，美股市场见证了英伟达股价的剧烈下跌，跌幅高达17%，最终收盘价为118.58美元，导致其市值减少了近6000亿美元，相当于4.3万亿元人民币。

CNBC称，这是“美国公司有史以来的最大跌幅”。

五月来临，华为再次伸出援手。在5月中旬，该公司推出了CloudMatrix 384超节点技术，通过多通道高速网络与AI加速卡相连接，以网络规模的优势来弥补显卡性能的不足，从而支持更大规模AI模型的算力训练。

如今，英伟达已感受到了压力。

黄仁勋近期频繁强调，我国在人工智能领域的竞争态势相当激烈，涌现出众多初创企业。据悉，大约有五十多家专注于GPU算力的公司迅速崭露头角。在这些企业中，华为无疑是全球科技实力最为雄厚的公司之一。他特别提到了华为的昇腾CloudMatrix 384超节点和910C芯片，这些产品的部分性能甚至超越了英伟达的产品。

我们必须给予高度重视，并充分尊重这个对手，同时我们还需全力以赴，不断进行创新，以确保在竞争中维持领先。黄仁勋强调，华为致力于将5G技术与人工智能实现深度融合，这一战略方向既具有远见，又完全正确，而英伟达也在朝着同样的目标努力。

财务报告揭示，英伟达的收益主要来自于数据中心服务、游戏娱乐、专业级图形显示以及汽车行业等多个业务领域。

细致分析，在数据中心领域，英伟达本季度的收入达到了391亿美元，这一数字较去年同期增长了73%，较上一季度则增长了10%。在众多大型云服务平台中，微软和谷歌等成为了英伟达最主要的客户，其收入占比接近数据中心总收入的半壁江山。在该季度，Blackwell贡献了约70%的数据中心计算收入，而Hopper的迁移任务也即将圆满完成。

计算业务收入达到了342亿美元，这一数字较上年同期增长了76%；同时，网络收入为50亿美元，较去年同期增长了56%。

英伟达首席财务官克雷斯（Colette Kress）指出，人工智能的工作重点已明显转向推理领域。同时，AI工厂的建立正为公司带来显著的经济效益，公司对客户的承诺始终如一。GB200 NVL的推出代表着一次架构上的重大革新，其目的是为了适应数据中心级别的工作需求，并力求实现单位推理令牌成本的最小化。尽管这些系统的搭建过程颇为繁复，然而英伟达已观察到生产合格率的明显提高，同时机架的发货量也在持续稳定地增加，逐步向最终用户过渡。

本季度，游戏领域收入达到了38亿美元，这一数字较去年同期增长了42%，较上季度则增长了48%，增长动力主要来源于Blackwell架构GPU的强劲销售；在专业可视化领域，收入为5.1亿美元，同比增长了19%，与上季度相比保持稳定；而汽车业务方面，收入为5.8亿美元，同比增长了72%，但环比略有下降，减少了1%。

黄仁勋指出，他们研发的Blackwell NVL72 AI超级计算机，这是一款致力于推理的“思考工具”，目前已全面进入系统制造商和云服务提供商的生产环节。同时，全球对于NVIDIA AI基础设施的需求呈现出极其旺盛的态势。AI推理代币的产出在不到一年的时间里急剧上升了十倍，伴随AI代理的普及，对AI计算的需求亦将迅猛攀升。全球各国纷纷将AI视为与电力及互联网同等重要的基础设施，而英伟达正位于这场深刻变革的核心位置。

针对2026财年第二季度，即2025自然年的第三季度，英伟达预测，其营业收入将达到450亿美元，这一数字的波动范围在正负2%之间。这一预期显现了因近期出口管制限制而引发的约80亿美元H20收入损失；预计GAAP和Non-GAAP的毛利率将分别达到71.8%和72.0%，波动范围在50个基点之内，同时公司力争在今年下半年将毛利率提升至约70%；此外，预计GAAP和Non-GAAP的运营费用分别约为57亿美元和40亿美元。预计2026财年全年运营费用增长率将在30%左右。

对于英伟达来说，中国市场无疑是本季市场最为关注的事件。

_黄仁勋华为_黄仁勋扬言要炸掉北软总部

黄仁勋近期指出，美国对中国实施的人工智能芯片出口限制并未奏效。他强调，“实际情况已经证明，最初设立人工智能扩散控制规则时所依据的若干基本前提存在根本性的错误。”黄仁勋还提到，英伟达在中国市场的份额，自美国前总统拜登上台初期占据的95%已下降至当前的50%。

Emarketer的研究分析师雅各布·伯恩在一篇报告中指出，人们普遍担忧的是，随着贸易紧张局势的加剧和关税的实行，数据中心的发展可能会受到限制，这可能会在未来几个季度对人工智能芯片的需求产生负面影响。英伟达的领导地位并未因此走向终结，然而，这同时也揭示了，为了保持其领导地位，英伟达必须面对不断加剧中地缘政治、竞争以及经济方面的挑战。正如伯恩所言。

在5月29日的财报发布会上，黄仁勋指出，我国乃全球最重要的AI市场之一，同时也是迈向全球辉煌的桥梁。在我国的AI研究人员数量占据了全球一半，若能在我国市场取得成功，便有望在全球范围内占据领先地位。然而，目前价值高达500亿美元的我国市场实际上已经对美国企业紧闭了大门。

H20出口禁令导致我们在中国运营的Hopper数据中心业务被迫终止。由于无法继续减少Hopper的产量以满足出口管制的要求，我们不得不对那些无法销售或再利用的库存进行数十亿美元的减记。目前，我们正在尝试寻找一些有限的竞争途径，但Hopper已经不再是我们考虑的选项。不论美国芯片是否存在，中国的AI技术都将持续进步。训练和部署高端模型需经过计算过程，这并非难题。中国早已掌握AI技术，关键在于，作为全球最大的AI市场之一，中国是否会在美国的平台上展开运营。若能保护国内芯片制造商免受美国竞争的冲击，将有助于提升它们在国际市场的竞争力，从而削弱美国的地位。而出口限制则激发了中国的创新能力和规模化发展。AI竞赛不仅涉及芯片领域，更关乎未来世界将依赖何种技术体系运作。当这一技术体系延伸至6G通信和量子科技，美国的全球基础设施领先地位面临严峻挑战。美国的政策基于“中国无法生产AI芯片”的预设，而这个预设长期受到质疑，如今已被证明是错误的。中国具备强大的制造实力。最终，只有掌握了AI开发者青睐的平台，才能在AI领域取得决定性的胜利。强化出口管制需着眼于提升美国自身的技术优势，而非导致全球一半的AI精英投身于他国对手的怀抱。”黄仁勋如是说。

克雷斯指出，尽管新加坡在英伟达第一季度的账单收入中占据了近20%的份额，这主要是因为众多重要客户在新加坡集中开具发票，然而英伟达的产品却大多被运往其他地区。特别值得注意的是，在H100、H200和Blackwell数据中心计算收入中，超过99%的账单收入均源自美国客户的订单。

黄仁勋对DeepSeek和通义千问赞不绝口，将其誉为“最优秀的开源AI模型之一”。他比喻说，这就像GPT一样，一旦引入了推理AI，其思考的时间越长，所提供的答案就越精准。

DeepSeek和Qwen，这两款源自中国的开源AI模型，堪称业界翘楚。它们不仅免费向公众开放，而且在美洲、欧洲以及全球其他地区都受到了极大的关注。DeepSeek-R1这款模型与GPT有着相似之处，它融入了推理AI技术，随着思考时间的延长，其提供的答案质量也随之提升。这种推理AI能够逐步解决复杂问题、制定计划并运用工具，从而将模型转变为一个智能的代理体。推理过程对计算资源需求极大，单个任务所需的令牌量较以往的单次推理高出数千倍——实际上，每个任务所需的令牌量都远超以往单次推理的数千倍。当前，推理模型正促使推理需求实现显著增长。AI的扩展法则并未改变，这一规律不仅适用于训练阶段，现在推理阶段同样需要大规模的计算资源。”黄仁勋如是说。

克雷斯指出，英伟达在制造良率上取得了显著提升，机架的出货量正以迅猛的势头进行交付。此外，GB300预计在本季度末将开始大规模量产并发货。

我们致力于在一年内完成从芯片制造到超级计算机组装的整个流程。GB200 NVLink72机架中装有120万个部件，其重量接近两吨。截至目前，尚无任何企业能生产出如此庞大的超级计算机，而我们的合作伙伴正为其作出卓越贡献。黄仁勋如此表示。

黄仁勋着重指出，美国始终是英伟达最重要的市场，同时也是我们基础设施安装量最大的地区。目前，各个国家都将人工智能视为推动下一轮工业变革的关键，它是一个为各国经济提供智能化和必需基础设施的崭新产业。各国纷纷努力打造国家级的人工智能平台，旨在增强自身的数字化水平。就在上周，我有幸前往瑞典，参加了该国首个国家级人工智能基础设施的奠基仪式。日本、韩国、印度、加拿大、法国、英国、德国、意大利、西班牙等国家和地区正致力于打造AI制造基地，旨在为初创公司、各个行业以及整个社会注入活力。英伟达的自主AI技术已成为其新的发展动力。

华为完成中国AI大模型推理适配部署，H20作用大大减少

黄仁勋对华为中国AI市场的渴求，已经摆在了台面上。

DeepSeek彰显了开源人工智能的战略重要性。在此过程中，当那些备受瞩目的模型在美国的平台上接受训练与优化，它们的应用范围、性能反馈以及不断的优化升级将得到显著提升，进而进一步稳固美国在人工智能领域的领导地位。因此，美国平台必须持续保持在开源人工智能领域的首选地位。这表明我们需要推动与涵盖中国在内的全球一流开发者的协作，一旦诸如DeepSeek和阿里Qwen等模型在美国的硬件设施上展现出最佳性能，美国便能取得胜利。黄仁勋提出，中国的大型AI模型应当采用如英伟达这类的美国AI系统进行训练，而非华为。

事实上，自2017年起，美国便启动了对中国的贸易攻势；进入2018年，其在半导体及芯片等关键领域对中国实施封锁；到了2019年，更是切断了华为5G芯片的供应渠道。

在过去六年里，华为采取了“低调”的策略，陆续在消费电子和云服务器领域实现了芯片的布局。如今，凭借国产化率高达100%的昇腾芯片，华为的昇腾鲲鹏AI系统已成功攻克了大模型训练与推理难题。因此，这对黄仁勋而言，无疑构成了沉重的打击。

在5月29日的学术活动中，我们得知DeepSeek模型已在华为昇腾平台上实现了高效推理。通过采用Int4量化优化模型算子权重，成功减少了现有资源占用，并首次在单台华为8卡服务器上实现了DeepDeek-R1的推理。此外，DeepSeek V2的推理性能相较于vLLM昇腾版本，在各类请求下平均提升了88%以上。

上述是一套自主可控的推理优化方案。

根据Gartner的最新报告，截至目前，消费者市场在全球的份额已达到21%，而我国国产芯片的自给率则攀升至42%，此外，模拟芯片和无线通讯领域相关产业的芯片自给率也实现了27%。

盛陵海强调，随着自主研发芯片的潮流，国产芯片的自给自足比例将会逐步提高。以今年为例，由于AI领域投资不断加大，预计我国国产AI芯片的自给率将会有所上升。我国芯片企业不应仅仅满足于替代进口，更应致力于制定行业标准，并积极开拓国际市场，参与新的竞争。

不过，目前国产AI芯片依然存在很多不足。

胡事民院士，清华大学计算机系教授，指出我国国产芯片市场格局已大致清晰，但与高端芯片相比，与美国产品仍存在较大差距。通过算法和模型的优化，可以显著提升性能，弥补我国算力方面的不足。然而，原始创新能力的提升仍需加强。

华为最新推出的CloudMatrix 384超节点，凭借其全面性的架构革新，在算力、互联带宽以及内存带宽等多个关键领域均取得了显著优势。与此同时，华为的开发者群体已突破1200万大关，合作伙伴数量超过4.5万家，云商店中的应用数量也达到了1.2万款。

黄仁勋正在努力追赶华为的384超节点，并已部署了多个网络平台。在财报会议上，他透露，英伟达目前拥有NVLink、InfiniBand、Spectrum-X以及BlueField这四个网络扩展平台。

黄仁勋同样分享了公司对于全球人工智能基础设施建设的远大蓝图：“我们预见，在不久的将来，将会有数十吉瓦的英伟达AI基础设施项目出现。”

他强调，人工智能构成了一个基础架构。正如电力和互联网已经演变为基础设施一般，人工智能也将成为每一个国家、每一个行业不可或缺的基础架构。目前，我们正处在这一基础架构建设的初始阶段。

面向未来，英伟达依旧抱持积极态度。黄仁勋指出，"这标志着新一轮强劲增长的起点。Grace Blackwell项目已全面启动，我们投入了全部精力。目前，我们拥有多个关键的增长动力。"

AI时代已降临，NVIDIA在AI基础设施、大规模推理、自主AI、企业AI以及工业AI等领域均做好了充分准备。黄仁勋如此表示。（本文首发于钛媒体App，作者：林志佳。）

上一篇：三伏天广州高温持续，生食受追捧，生吃下一篇：驻印度使馆提醒在印中国公民雨季注意这

全球AI龙头财报发布前数小时，华为大模型技术重磅发布

用微信扫一扫