电话:4008119163
关闭
您当前的位置:首页 > 职场资讯 > 职场攻略

2亿美元起价挖人,扎克伯格搅翻硅谷,Meta大模型何去何从?

来源:网络整理 时间:2025-07-14 作者:佚名 浏览量:

以2亿美元为起始价招募人才,有的甚至高达10亿美元,是行业标准的一百倍,扎克伯格的这一举动使得硅谷风云变幻。

他不仅要组建一支顶尖的人工智能精英团队,还意图另辟蹊径,让他人陷入困境:若是OpenAI成为业界领先的AI企业,便使其成为人才流失的高发区;若是中国诞生了卓越的开源模型DeepSeek,便招募一批会说普通话的专家。

扎克伯格此番决心进行一场全面革新。Meta在Llama1至3的迭代中,始终秉持着开源模型的理念,然而,年初却意外地被DeepSeek超越,紧接着推出的Llama4在硅谷引发了笑谈,而其旗舰模型Behemoth更是羞于示人。如今,Meta的大模型已经落后于竞争对手整整一代。

扎克伯格充分认识到,要想在这场超级智能的“笼中角斗”中获胜,就必须实施比马斯克在孟菲斯创建的超级算力集群更为迅速、更为决绝的策略。

Meta不再将本地电网视为重点,转而在俄亥俄州的数据中心内自行搭建了两个容量各为200兆瓦的天然气发电站,其中包含15台涡轮发电机以及15台作为备用电源的往复式发动机。

为了迅速完成数据中心的建设,Meta公司迅速搭建了类似帐篷的简易结构,并在其中部署了数千台G200/300GPU。这一举措并非出于对美观的追求或节省成本的考虑,其根本目的仅在于加速进程。在俄亥俄州,Meta公司建立了全球最大的算力集群,该集群被命名为普罗米修斯(Prometheus)。在路易斯安那州设立数据中心集群,预计到2027年底,它将演变成为世界上最大的独立园区;第一阶段投入的IT电力将超过1.5吉瓦。该数据中心内部被称为Hyperion。

以300亿美元的价格直接收购了AI数据处理领域的独角兽企业Scale AI公司49%的股份,这一举措源于对数据质量对模型性能上限的决定性影响的深刻认识。

人才方面:Meta超级智能实验室(MSL)的研究员们不仅能够获得远超足球巨星转会费用的薪酬,还享有独一无二的强大算力资源,这有助于他们打造最优秀的开源模型系列,并且他们有机会与超过20亿的日活跃用户群体互动。此次引进的研究员们,通过现金、签约奖金以及股票等多种形式的激励,四年累计收入可轻松突破2亿美元。据传,Meta曾开出超过十亿美元的巨资,意图招募OpenAI在研究及工程领域的高级人才,但截至目前,这一计划尚未如愿以偿。

扎克伯格不仅致力于在人力方面对OpenAI施加压力,更在算力领域寻求超越,Meta即将推出的1.5GW级超级计算集群,其规模已超越了位于德州阿比林的“星际之门”1.2GW的集群。

Semianalysis指出,Meta曾一度在开源AI领域占据主导地位,但近期却开始落后,被OpenAI、Anthropic、DeepSeek和xAI超越。这主要是因为Meta采取了“渐进主义”的策略,其AI技术主要服务于自身业务,如内容推荐、广告服务、内部效率工具等,虽然这些技术能促进现有业务的增长,带来财务收益,但Meta在追求超级智能方面存在不足,尤其在人才和算力基础设施方面,其短板日益凸显。与其他行业巨头相比,Meta可能面临在AI领域错失机遇的风险。

然而,作为一家上市公司的高层,扎克伯格频繁需向股东及投资者汇报,说明他在人工智能领域投入资金后,对企业运营和财务状况产生了何种积极影响。

根据Semianalysis的研究,在Llama4的训练过程中,Meta团队遭遇了若干技术难题:

1,分块注意力:

挖人2亿美元起,扎克伯格还要碾压“星际之门” | 笔记_挖人2亿美元起,扎克伯格还要碾压“星际之门” | 笔记_

Behemoth在追求效率的过程中,通过实现分块注意力机制,却遭遇了盲点问题,尤其是在不同块之间,这种割裂现象尤为明显。这一缺陷对模型在思维链超出单个块长度时发展推理能力产生了不利影响。因此,模型在长程推理方面的表现并不理想。尽管事后看来这显而易见,然而当时Meta 并未构建起恰当的长上下文评估及测试系统,以此确定分块注意力机制是否适宜于推理模型的开发。

2,专家选择路由

在运行阶段,Meta由原先的专家挑选模式转变为基于token的路由选择,这一转变使得专家们难以在专业领域内发挥出应有的专长。

3,预训练数据质量

在Llama 4 Behemoth问世之前,Meta公司长期依赖公共数据源,诸如Common Crawl等,然而,其数据采集策略发生了转变,转而采用自建的内部网络爬虫。尽管这一改变往往能带来更优的效果,但也随之产生了一系列挑战。在处理和淘汰新增数据流的过程中,团队遭遇了重重难题。此外,这些数据处理流程尚未经过充分的压力测试验证。

此外,与OpenAI和Deepseek等公司不同,Meta并未依赖YouTube的数据,该平台上的讲座记录及各类视频内容构成了极为珍贵的数据资源。若缺失这些数据,Meta在构建多模态模型的过程中或许会遇到较大的困难。

4,扩展策略和协调

Llama 4 团队在将研究实验全面转化为训练过程中遭遇了挑战。不同研究方向间存在竞争,且缺乏强有力的领导力来判定哪条路径最为高效。某些模型架构的选取甚至未经过适当的消融实验,便直接纳入模型,造成了扩展梯度管理的混乱。作为Meta公司如此关键的一次大规模预训练运行,却显得缺乏严谨性与充分的准备。

上述几点揭示了Meta在人才储备上的不足,促使扎克伯格下定决心,实施了极为丰厚的奖励政策。

One More Thing

这次,扎克伯格恰逢特朗普提出的“大漂亮法案”的利好。依据该法案,人工智能企业在研发及设备采购上的支出,可享受税收减免。因此,扎克伯格精打细算:购入越多,节省的税款也就越多。

--

参考文章:

在https://semianalysis.com/2025/07/11/这篇文章中,作者探讨了元超级智能的领导力、计算才能以及数据的重要性。

客服服务热线
4008119163
24小时服务
微信公众号
手机浏览

Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40

地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com

Powered by PHPYun.

用微信扫一扫