CES开幕演讲的第二天,英伟达创始人兼CEO黄仁勋接受了全球媒体的采访,持续1小时的采访中,黄仁勋回答了关于英伟达策略、全球投资、AI生态格局、AGI时刻、Agentic AI、自动驾驶、物理AI等26个问题。
在记者会的最后,黄仁勋在回答至顶科技关于AI时代的学习教育趋势时表示,“未来,每个学生都必须学会使用AI,就像现在这一代学生都必须学会使用计算机一样。”
黄仁勋强调,AI革命极其深远。他以计算机图形学举例,“这个领域的摩尔定律曲线,原本实际在放缓,但AI的加入让它获得了超级动力,现在帧率达到200、300、400帧每秒,图像完全是光线追踪且非常漂亮”,所以,我们已经看到了计算机图形学的指数增长曲线,实际上,所有领域都看到了类似的陡峭增势。
有趣的是,这次出现在记者会上的黄仁勋,换了一件皮衣,之所以没穿前一天在CES上的“闪亮亮”皮衣,他调侃说道“too much(有点过了)”。
以下是针对黄仁勋本次记者会采访的完整听译(为便于阅读和可读性,科技行者进行了文字和段落上的小幅修改):

【1】“英伟达只做两件事”
问:去年英伟达重新定义了数据中心,现在又完成了系统层面的所有工作,特别是这次发布了NVLink72,接下来是不是应该考虑基础设施、电力和其他系统组件的问题了?
黄仁勋:英伟达有个宗旨,只做两件事情——要么是别人没在做的事,要么是我们能做得明显更好的事。所以英伟达进入新业务的标准其实很高。比如,如果英伟达不造NVLink72,谁去造呢?如果英伟达不开发Spectrum X这样的以太网交换机,谁能做呢?
虽然我们有32000人,仍然是相对较小的公司。作为一家规模不大的公司,我们需要确保资源高度聚焦在能做出独特贡献的领域。
从早期的Hopper架构,到现在的Blackwell架构,功率密度在不断提升。这是必然的发展趋势,因为更高的功率密度,意味着更好的性能。不管光子的速度有多快,我们还是倾向于让计算机更紧凑,而且现在Blackwell在液冷方面都已经做的很好。
【2】谈AI PC:“我们正在把云端AI引入端侧AI”
问:这次英伟达发布了很多关于AI PC的消息,但现阶段AI PC的采用率还没有真正起飞,你认为是什么原因阻碍了它的发展?英伟达如何帮助改变这种局面?
黄仁勋:很好的问题。AI技术最初是在云端环境下发展起来的,如果回顾英伟达过去几年的增长轨迹,你会发现主要集中在云计算领域,这是因为训练AI模型需要超级计算机。这些模型规模都很庞大,在云端部署和通过API调用比较容易。
但我们认为,仍然有很多设计师、软件工程师、创意工作者和技术爱好者,他们更倾向于在PC上开发AI应用。其中一个挑战在于,由于AI生态系统主要集中在云端,大量的精力、发展动力和工程努力都投入在云端,导致开发端侧AI应用的人相对较少。
但其实Windows PC完全有能力支持AI开发,特别是通过WSL2(Windows Subsystem for Linux 2)。WSL2本质上是一个虚拟机,是一个运行在Windows内部的双操作系统,它最初是为云原生应用创建的,支持Docker容器,而且支持CUDA。
我们正在努力确保PC上的WSL2能够完美支持这些技术,从而把原本为云端打造的AI技术引入到PC端,就相当于把云端能力带到PC端。
我坚信这是未来的正确方向,我对此很兴奋,所有的PC制造商也都表现出极大的兴趣。我们正在与合作伙伴一起,让所有PC都支持带有WSL2的Windows系统,这样就能把云端AI的所有技术进展、工程成果、生态系统带到个人电脑上。
【3】谈投资、竞争与合作:“我们的紧迫感来自客户的真实需求”
问:去年GTC大会上,你分享了英伟达在以色列增加投资的情况,加强了你们作为该国最大雇主之一的地位。2024年你们继续扩张,你们打算如何进一步增加在以色列的投资?具体来说,我们是否很快就会听到一个正在进行中的新交易?另外,考虑到目前的局势,你是否看到从那里引进人才的机会?
黄仁勋:我们从世界各地吸引优秀人才,目前英伟达网站上收到了超过100万份简历申请,而我们公司只有32000名员工。这表明大家对加入英伟达的兴趣非常高,因为我们做的工作很有趣。
在以色列,我们有很大的发展机会。最初我们收购迈络思的时候,在那里有2000名员工,现在我们在以色列的员工已达到近5000人。我们可能是以色列发展最快的企业雇主之一,我为此感到非常自豪。
在过去一段时间里,我们的以色列团队创造了NVLink、Spectrum X、Bluefield 3等重要产品,我对团队的专业水平和敬业精神感到非常自豪。
关于新的收购计划,今天暂时没有要宣布的消息,但我们始终保持开放态度。如果你们知道一些必须要拿下的好项目,请第一时间告诉我,只告诉我(开玩笑)。
问:作为一个游戏玩家,我感到很兴奋,因为当你谈到内存时,特别提到了HBM,为什么没有选择三星的?
黄仁勋:我认为三星和SK不生产显卡,对吧?(此时黄仁勋问向现场媒体)他们生产吗?(得到肯定回复后)好吧,抱歉,是我搞错了,别告诉他们我说了这些。
关于HBM,他们正在努力,他们一定会成功的,这毫无疑问,我对此充满信心。要知道,最早的HBM内存就是三星开发的,英伟达使用的第一块HBM内存就来自三星,所以他们会重新崛起的,他们会强势回归的。
追问:为什么他们花了这么长时间?
黄仁勋:其实并不算太长。当然,韩国产业求变心切,这是好事。
但他们需要设计新方案,我相信他们一定能做到。而且他们进展很快,非常投入,我很有信心他们会成功。SK和三星都是优秀的公司,尤其在内存领域,所以我相信他们会继续取得成功。你们昨天也看到了Blackwell中使用了多少HBM内存,HBM内存对我们的计算非常重要。
问:尽管超大规模客户对英伟达产品的需求已经很明确,但我好奇的是,你们在扩大收入来源方面的紧迫感有多大?特别是在开拓企业客户和政府客户,帮助他们部署具有高性能AI计算能力的数据中心方面。尤其是在亚马逊等公司正在研发自己的AI芯片时,你们感受到多大压力?然后,能否详细说说你们在企业和政府方面的进展吗?
黄仁勋:我们的紧迫感来自于客户的真实需求。我从不会因为一些客户也在开发芯片而担忧,因为大家做的是不同的事情。
我很高兴看到客户在云端使用英伟达的技术,很高兴他们用英伟达的技术来开发AI。我们的技术进步现在非常快,每年性能可以翻一番,就代表每年成本降低一半。这比摩尔定律最好时期的进步要快得多。所以,我们会积极响应客户需求,用产品回应他们。
关于企业级市场,现在主要有两大行业服务:软件服务商(比如ServiceNow、SAP等),以及帮助他们将软件适配到业务流程中的解决方案集成商。英伟达的策略是与这两个生态系统合作,帮助他们构建Agentic AI,而NIM、NeMo、AI Blueprints都是用于构建Agentic AI的工具包。
比如在软件服务商方面,我们与ServiceNow团队的合作就很成功,他们将因此推出一系列基于ServiceNow的AI代理服务,服务于员工和客户。这就是我们的基本战略。
在解决方案集成商方面,我们与埃森哲等公司合作。埃森哲在帮助客户采用Agentic AI方面做得非常出色。
所以第一步是帮助整个生态系统开发AI,过去一年我们在构建Agentic AI工具包方面做得不错,接下来就是部署的环节了。
问:很多公司都在开发Agentic AI,你们是如何与AWS、微软、Salesforce这些同样在为客户提供开发平台的公司合作或竞争的?你们是如何与这些公司打交道的?
黄仁勋:英伟达不是一家直接服务企业的公司,而是一家技术平台公司。我们在构建工具包、库和AI模型,这些都是为ServiceNow、SAP、Oracle、Synopsys、Cadence、西门子这样的服务商提供的,但在计算层面、AI库层面不是这些公司花精力投入的领域,所以英伟达可以为他们创建。
这其实相当复杂,因为我们实际在做的事情是在把类似ChatGPT的功能打包整合到容器中。优化这些端点和微服务是非常复杂的。不过一旦完成,客户就可以在任何云平台上使用我们的产品,所以我们开发NIM、NeMo、AI Blueprints不是为了与他们竞争,而是为了服务他们。
事实上,已经有很多云服务提供商用NeMo训练他们的模型,他们的云商店里也有NeMo和NIM,我们对此感到很高兴。我们创建了这整个技术层,理解NIM和NeMo的作用就像理解CUDA和CUDA X库一样重要。CUDA X库对于英伟达平台起到了关键作用,其中有用于线性代数的cuBLAS,用于深度神经网络处理的cuDNN(这真正革新了深度学习),以及cuTLAS等所有这些我们谈论的高级模型,我们为行业创建这些库,这样他们就不必自己做了。
同理,我们开发NeMo和NIM也是为了服务整个行业,这样企业就不必自己从零开发了。
问:我来自中国台湾。CES主题演讲提到,Digits的CPU是与联发科合作的,想请您谈谈更多与其他中国台湾公司合作的情况。另外还想了解英伟达是否会在中国台湾建设总部?
黄仁勋:我们在中国台湾有很多员工,但现有的办公地太小了,我需要找到解决方案,也许我之后会宣布一些消息,我们正在物色地产。如果你知道好地方,请务必第一时间只告诉我一个人。
关于联发科,我们在多个领域都有合作。比如自动驾驶汽车领域,双方合作为行业提供完全软件定义的智能汽车解决方案。所以我们在汽车行业的合作非常非常顺利。
此外,新的Grace GB10 CPU也是与联发科合作开发的。我们共同设计架构,实现了芯片间的互联以及CPU和GPU的内存一致性。
坦白说,联发科在芯片设计和制造方面都做得很出色,第一次做出来的就很完美,性能优异。大家都知道联发科在低功耗方面的优势,确实名不虚传。我们很高兴能与这样优秀的公司合作。
问:关于贸易限制,这个话题现在依然广受关注,你对贸易限制可能影响到整个行业(包括英伟达)的盈利前景担心吗?
黄仁勋:我并不担心。我相信政府会在贸易谈判中做出正确的决定。无论最终结果如何,我们都会尽最大努力帮助客户,推动市场向前发展。就像我们一直以来做的那样。
【4】谈AGI:“人在使用工具,机器终究是工具。”
问:我来自韩国,想问个哲学问题。最近Sam Altman发推文说我们已经接近AI“奇点”了,你这次也提到“通用机器人的ChatGPT时刻即将到来”,如果这是真的,机器人很快就会出现在我们身边,也许有些机器人会比我们聪明,也许有些对我们来说很难理解。那么你认为,机器人会站在哪一边?是与人类站在一起,还是对抗人类?
黄仁勋:会与人类站在一起,因为我们就是这样设计它们的。
AGI(超级智能)这个概念并不陌生。在我的公司里,我的管理团队、领导们和公司的科学家们都表现出超级智能,我已经被AGI包围了,但我更愿意被AGI包围,而不是相反的情况,因为这就是未来。
你会有超级智能来帮助你写作、分析问题、做供应链规划、编写软件、设计芯片、做数字营销、做播客等等,而且它们随时待命,为你提供服务。
追问:所以你不认为它们会有冲突?
黄仁勋:技术可以被用于多种用途。但要记住,是人在使用工具,机器终究是工具。
【5】谈Cosmos:“一个能理解物理世界的基础模型,会让机器人成为现实”
问:这次在CES演讲的某些部分,感觉像是在听技术研讨会,内容很专业。但现在你们的受众群体更广了,能否重新解释一下这次发布的AI进展的核心意义,让那些完全不了解技术的普通观众也能理解。
黄仁勋:首先,我承认有这个问题,但这还是次要的。要知道,英伟达是一家技术公司,而不是消费品公司,我们的技术会影响和改变消费电子产品的未来。
虽然CES热情邀请英伟达来分享,但我们始终是一家专注于技术的公司。当然,这并不能成为我没有把技术讲解得更好的借口。
我重新试着讲解一下。
我们这次宣布的一个最重要的突破,是开发了一个能够理解物理世界的基础模型Cosmos。就像GPT是理解语言的基础模型,Stable Diffusion是理解图像的基础模型一样,我们创造了一个理解物理世界的基础模型。
它能理解摩擦力、惯性、重力、物体的存在和持续性,以及几何和空间关系等概念——这些都是人类孩子们与生俱来就能理解的东西。我们认为需要有这样一个“理解物理世界”的基础模型,它能以大语言模型目前无法做到的方式理解物理世界。
现在,通过Cosmos,所有你能用GPT和Stable Diffusion完成的任务,都可以用它来实现。比如,你可以跟这个世界模型对话,问它“现在看到了什么?”它通过摄像头获取的画面,可以描述“看到很多人坐在桌前,大家在一个房间里”的现实场景。
为什么我们需要Cosmos?因为如果你希望AI能够在物理世界中合理地运作和互动,就必须让AI理解物理世界。
自动驾驶汽车需要理解物理世界,机器人也需要理解物理世界,Cosmos是实现所有这些应用的起点。就像GPT催生了我们今天经历的一切,就像Llama对当前所有的AI活动都很重要,就像Stable Diffusion触发了所有这些生成式图像和视频模型一样。
我们希望Cosmos也能达到同样的效果,Cosmos会让机器人成为现实。
问:我想问这次发布的模型,尤其是Cosmos,这些模型能在智能眼镜上运行吗?或者在开发这些模型时,你们有考虑过智能眼镜吗?因为考虑到行业的发展方向,智能眼镜似乎是未来很多人体验AI代理的一个重要平台。
黄仁勋:是的,我对智能眼镜很感兴趣,它能回答“我看到了什么、如何到达目的地”,它可以帮助你阅读,还有很多其他用途,使用场景非常广阔。
对于Cosmos的使用方式,云端的Cosmos可以提供视觉理解能力,如果你想在设备本地运行,那么你可以使用Cosmos来提炼出一个小型模型。这样,Cosmos就变成了一个知识迁移的AI工具,它将知识转移到一个更小的AI模型中。
这种做法之所以可行,是因为更小的AI模型虽然通用性较差,但在特定领域非常专业,这就是为什么可以进行定向的知识迁移。这也是为什么我们总是先构建基础模型(大模型),然后通过知识蒸馏逐步构建更小的模型。
【6】谈DLSS:“从最初没人相信,现在大家终于意识到它确实是未来”
问:关于DLSS 4,你这次做了一些视频展示,我想详细了解一下,比如多帧生成技术,它是否仍然是渲染两帧,然后在中间生成并进行插值?
另外,关于演示视频里提到的RTX Neural Material,这是游戏开发者需要专门采用的技术吗?还是它是驱动程序层面的功能,可以让大部分PC游戏受益?
黄仁勋:在Blackwell中,我们增加了着色器处理器能够运行神经网络,这样就可以在着色器管线中混合使用代码和神经网络模型。这非常重要,因为纹理和材质的处理,都是在着色器中处理的。
如果着色器能运行AI,那么就能利用神经网络带来在算法上带来的进步。比如压缩技术,现在的纹理压缩效果比我们过去30年使用的压缩算法要好得多,压缩比有了巨大提升。对于很多纹理可以额外压缩5倍。现在游戏体积都很大,所以这是个重要进步。
第二点关于材质。材质决定了光线在表面的传播方式,它的各向异性特性,会让光线以特定方式反射,让我们能分辨这是金子、还是油漆、还是金箔。这种特性本质上是原子层面发生的,光线在材料的微观结构上的反射、折射和散射造就了材质的特性。用数学方法很难描述这个过程,但我们可以用AI来学习它。所以我认为,这种神经材质技术是一个重大突破,能为计算机图形带来前所未有的生动感和逼真度。
这两项技术都需要内容端的配合,所以开发者首先要开发内容,然后我们就可以轻松整合进去。
关于DLSS,帧生成不是插值关系,而是字面意义上真正的生成。我们是在预测未来,而不是在对过去进行插值,这样做是为了提高帧率。DLSS 4是一个彻底的突破,你们一定要去体验。
问:AI在PC游戏中是否扮演了更决定性的作用,你能想象传统渲染的画面帧,未来全部都变成AI生成的帧吗?
黄仁勋:不是的,我来解释一下原因。ChatGPT刚出来时,大家说“现在我们可以让AI生成一整本书了”,但实际上内部人员都知道这并不现实,原因是AI生成内容需要获得基准事实,这叫做条件控制(Conditioning)。
Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40
地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com
Powered by PHPYun.