文 观察者网心智观察所
华为的创始人任正非在最近的访谈中坚定地表示,对于芯片的难题,我们无需过度忧虑。通过采用“叠加”与“集群”等先进技术,华为在计算领域的实力已经能够与全球最顶尖的水平相媲美。
在全球半导体市场竞争激烈、技术封锁不断加码的形势下,这样的言论宛如一针强心剂。那么,面对芯片制造工艺的差距,华为的信心源自何处呢?
任正非所提及的“叠加与集群”概念,其核心在于通过系统层面的创新来弥补单一芯片性能的局限性。这种集群计算模式,通过将多片性能略逊一筹的芯片以高效的网络进行连接,实现协同处理复杂任务,进而构建出强大的综合计算能力。华为推出的昇腾910B芯片,正是这一理念的实证。昇腾芯片虽然在制造工艺上略逊于国际前沿的3纳米芯片,然而凭借自主研发的CCE通信协议,成功搭建了高效的集群系统,这一系统有力地支撑了盘古大模型的训练需求,其整体计算能力足以与一些顶尖的GPU相媲美。
在实施“以数量弥补质量”的战略过程中,科技企业持续寻求突破和创新。谷歌的TPU集群便是一个典型的例子。尽管谷歌的TPU v4芯片在单片性能上略逊于英伟达的A100,然而,谷歌通过Cloud TPU集群的强大协同作用,成功培育出了拥有5400亿参数的PaLM模型。这充分表明,在人工智能等擅长并行处理的工作领域,集群计算在规模上的优势能够有效抵消单芯片性能上的不足。
华为在算法优化领域同样有着卓越的表现。任正非所倡导的“以数学弥补物理”的指导思想,在华为的具体实践中得到了体现,例如通过运用稀疏计算、模型量化和剪枝等先进技术,显著减少了对于硬件性能的依赖。此外,华为的MindSpore框架通过动态图优化和低精度计算,成功将AI训练的计算需求降低了30%以上。非但如此,DeepSeek模型通过运用高效的模型压缩手段,成功在常规服务器上实现了流畅运行,并对传统高性能硬件的领先地位构成了挑战。这种软硬件结合的优化方式,使得华为即便在制程技术相对落后的情况下,依然能够实现高效的计算效能。
2021年,天津港无人化码头的运营实况,充分展现了这一技术的显著优势。由数百枚昇腾芯片构成的计算集群,在天津港的无人化码头中扮演着“超级大脑”的核心角色。它能够实时处理海量的传感器数据,并精确地指导无人驾驶集卡与智能吊机的操作。AI集群的问世不仅显著提高了工作效率,减少了能源消耗,而且使得码头工作人员无需再遭受风吹日晒的困扰,从而摆脱了繁重的体力劳动。
华为的自信不仅建立在技术实力之上,还源自其宽广的战略视野,倡导开放与包容。任正非始终秉持“借鉴他人之长”的理念,这一指导思想使得华为在全球技术生态中能够主动出击、随机应变。即便遭遇制裁的挑战,华为依旧通过同开源社区及国际合作伙伴的紧密协作,有效地汇聚了各种资源。昇腾芯片与PyTorch等主流开源框架相兼容,显著减轻了开发者转换平台的负担;同时,Atlas平台通过软硬件的紧密协作,打造出了其独有的竞争优势。

AMD的发展历程对华为而言是一笔宝贵的经验。2000年代,AMD一度遭受英特尔的打压,然而,在CEO Lisa Su的领导下,该团队采纳了模块化设计(Chiplet)以及高效的互联技术,成功推出了Zen架构的处理器。他们更注重架构和生态系统的构建,而非仅仅追求单一的制程技术。行业报告显示,AMD的EPYC处理器在2020年占据了全球服务器市场的约15%份额,成为一股不可忽视的力量。这种成就与华为专注于5G基站、AI计算等特定领域,并通过对这些领域进行针对性优化,从而使得集群效率远超通用芯片的策略,在本质上具有相似之处。
芯粒技术充分展现了任正非的战略理念在工程领域的具体应用。通过架构的革新和系统层面的优化,该技术有效地缩小了单芯片制程的代际差异,并实现了整体性能的实用化重大突破。
传统的“摩尔定律”通过缩小制程来增强性能,然而,面对3nm/5nm等先进制程的物理边界,还承受着外部限制。Chiplet技术突破单一制程的束缚,将庞大而复杂的芯片分解成多个功能清晰的小芯粒。这些芯片可根据其功能需求,通过不同的工艺节点进行生产;在核心计算单元方面,我们追求的是先进的制程技术;而对于I/O接口、模拟模块以及存储单元等,则可以选择成熟、稳定且成本相对较低的制程。借助2.5D/3D封装等前沿技术,我们将这些异构芯粒紧密且高效地组合,使得系统整体性能在多个方面可与顶尖制程的单芯片相媲美,甚至有所超越,同时巧妙地解决了单一芯片全面追赶尖端制程的难题。
然而,Chiplet 架构在实现芯粒间的高速、低功耗和高带宽互连方面遭遇了挑战,这要求我们依赖精确的数学模型以及信号完整性的深入分析。华为在高速SerDes技术、高阶封装的互连线路设计、信号与电源完整性仿真领域进行了大量投入,并致力于低延迟、高带宽的互连协议研发。公司通过复杂的算法优化,对数据传输路径进行细致调整,有效减少噪声干扰,提高能效比。这样,华为能够最大限度地克服物理距离和封装寄生效应导致的信号衰减和延迟等物理限制,确保多个芯片核心能够像单一芯片一样,实现高效协同运作。
Chiplet技术凸显了华为在“系统级创新”方面的策略优势,有效应对了“单点短板”的挑战。它并未急于在单一芯片制造工艺上与竞争对手比肩,转而采取“非摩尔”的异构集成策略,借助“数学”驱动的互联与系统优化技术,以及“群计算”的分布式架构,在芯片系统(SoIC/SiP)领域实现了功能、性能和能效的实用化,甚至达到了领先的水平。这一事实充分表明,在高科技领域的竞争之中,创新性的系统架构设计以及卓越的系统工程实力,完全可以作为弥合基础物理技术差距、实现逆袭及特色竞争的关键动力。
台积电的创始人张忠谋曾明确指出,芯片技术的进步离不开人才的持续积累,虽然技术可以追赶,但人才的积累却需要时间的沉淀。正是对人才和教育的长期投入,成为了华为强大的根基。华为拥有大约11.4万名研发人员,在过去十年中,其研发投入累计超过了1.2万亿元。此外,华为的“天才少年”计划也成功吸引了众多杰出人才。
华为深知,稀疏计算等具有革命性的技术变革的成就,与杰出人才的深度介入密不可分。因此,华为精心打造了一套完善的人才培养与吸纳机制,通过实施“天才少年”项目、与世界一流高校展开合作,以及内部类似“黄埔军校”的高强度研发实战训练,成功聚集并培育了一大批既精通稀疏计算理论又擅长工程实践的顶尖人才。这些人才深度介入昇腾AI芯片的架构规划,确保硬件能够原生高效地支持稀疏特性,比如零值跳过和结构化稀疏加速单元,从而实现了算法创新与芯片设计的紧密协作。正是这支技艺高超的团队,成功将前沿的稀疏计算理念转化为芯片的实际算力提升,为华为在算力底层创新领域奠定了核心竞争力。
尽管如此,困难依旧存在。集群计算在能耗控制、成本效益以及通信限制等方面仍需克服难关。另外,在那些对单线程性能要求极高的科学计算领域,集群计算的优势难以得到充分体现。若华为能在芯片制造技术、供应链稳定性以及全球战略布局上不断进步,便有望在更广阔的领域与国际上的领先企业展开激烈竞争。
华为创始人任正非所提出的“芯片无需担忧”的信念,源于其在集群计算技术、算法改进以及生态合作领域的丰富技术底蕴,还有公司在人才培养和教育领域的持续战略性投资。面对硬件发展的瓶颈,系统创新和生态合作成为了突破困境的核心动力。
Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40
地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com
Powered by PHPYun.