电话:4008119163
关闭
您当前的位置:首页 > 职场资讯 > 职场攻略

WAIC 首日:诺奖得主 Geoffrey Hinton 与闫俊杰共话 AI 发展及治理

来源:网络整理 时间:2025-07-30 作者:佚名 浏览量:

WAIC活动第一天,便迎来了重量级的嘉宾——诺贝尔奖获得者、人工智能领域的奠基人Geoffrey Hinton,他发表了激动人心的开幕演讲。紧接着,MiniMax的创始人兼首席执行官闫俊杰带来了主题演讲,题目为「每个人的人工智能」。随后,一系列由专家参与的圆桌讨论陆续展开。

Hinton作为对AI治理和安全问题高度关注的顶尖专家,持续展现了他对AI治理的深切关注。自研究生涯起,他详细阐述了大型模型的演变及其背后的技术趋势。最终,他提出倡议,希望构建一个由多个国家共同参与的全球AI安全研究网络,该网络将致力于研究如何使AI的训练更加向善。

闫俊杰,MiniMax的创始人兼CEO,以“每个人的人工智能”为核心理念,阐述了自己作为国内深度学习领域先驱研究者之一,以及最早投身于大模型探索的企业代表。他进一步指出,通用人工智能(AGI)的实现是必然趋势,它最终将服务于公众,惠及大众。此外,他还强调,实现这一目标需要AI企业与广大用户携手共进。

以下为二人演讲内容整理,经编辑与删减。

数字智能是否会取代生物智能

演讲者:Geoffrey Hinton

自大约六十年前起,人工智能领域便衍生出两种迥异的流派。其中一种被称为“符号主义”,它着重于逻辑推演的技巧。我们运用规则对符号进行操作以实现推理,这样的方法有助于我们洞察知识是如何被表述和处理的。这类AI模型的核心在于对符号的处理,并被认为与逻辑智能的内在特性更为契合。

此路径立足于生物智能,为图灵与冯·诺依曼所偏好的选择。他们坚信,智能的核心在于从神经网络的连接中汲取知识,并体现在对速度、结构以及连接模式的调整上。这种被称为“连接主义”的学说,着重于学习和适应的过程,而非依赖明确的逻辑法则。

在1985年,我尝试构建了一个微型模型,目的是将两种理论融合在一起。我的构思是:每个词汇都可以通过一系列特征来表征,这些特征能够被用来预测后续的词汇。该模型并非存储整个句子,而是通过生成语言的方式,来习得词汇间的相互联系。

此方法着重于语言中的“语义特性”——换句话说,我们并非仅依赖规则,而是通过“理解”词汇的语义来进行预测。这一理念为计算语言学领域接纳特征表示奠定了基础。二十年后,这一理念得到了进一步的拓展,比如被应用于开发更大型的自然语言处理系统。

大模型与人类语言理解

谷歌的Transformer架构,还有OpenAI的研究团队所呈现的巨型语言模型,诸如GPT,它们将此类模型的发展推向了前所未有的高度。这些模型的根本原理与我之前构建的简易模型颇为相似:它们将语言中的词汇看作是多维属性的“构建块”,并在多层神经网络中进行拼接与融合,进而实现语言的生成与解读。

我倾向于将“乐高积木”作为类比。每一个词汇,就好比是多面性的乐高积木,它们拥有成千上万的属性维度。而理解语言,就如同运用这些积木来构建模型。不同的词汇需要以恰当的方式“握手”,也就是找到它们之间的匹配连接点,而这种匹配方式实际上揭示了词汇之间的语义联系。一旦词汇的形态发生改变,它们之间的“握手”方式也会随之而变,进而导致语言意义的转变。

这种构建模式与蛋白质的折叠过程相似,氨基酸在三维空间中的不同排列组合,最终确定了蛋白质的具体功能。人类大脑在理解语言时,同样是通过这种方式来构建语义的。

这与人间的知识传播有着本质的差异。我无法将我的神经元构造复制至你的大脑之中,语言传递信息的效率极其低下,每秒钟大约只能传输100比特。然而,在数字领域,一个神经网络模型能够被复制出成千上万个副本,这些副本可以在不同的设备上学习,并且能够迅速共享权重,其传播速度和效率远超人类知识的传播。

我认为,人类对语言的解读方法与大型语言模型的方法几乎相同。实际上,人类自身也可被视为一种大语言模型。因此,人类与人工智能一样,会产生所谓的“幻觉”,即我们能够自行构建出一些虽非真实却合乎逻辑的解释。

当然,存在根本性的差异。在特定领域,人工智能的能力超越了人类。以计算机科学为例,一个基础原则是:软件能够被概括、复制,并在多种硬件上执行。只要程序得以保留,其中的知识就不会丧失。即便摧毁所有硬件,只要软件代码依旧存在,程序仍可被重新激活。

从这个视角来看,程序中的知识是恒久不变的,它不会消亡。而与之形成鲜明对比的是人脑,人脑更像是一个模拟系统,其中的每一次神经元活动都是独特的,无法被完全复制。你无法将你大脑中的神经结构复制到我的大脑中,因为每个人的大脑连接方式都有所差异。

这引发了一个核心问题:在大脑中,知识与硬件紧密相连,但在数字世界里,知识却能与硬件实现分离。正因为如此,人工智能系统具备了所谓的“永恒”特性。

这种特性带来了显著的双重优势:首先,其能耗极低。人脑的功率仅约30瓦,却能容纳上万亿个神经元进行连接,这与数字系统的能效比相仿。其次,我们无需投入巨额资金来逐一复制每一个神经网络。

自然,我们在知识传授的过程中仍遭遇了一个挑战。以我为例,我无法直接将我脑海中掌握的知识「呈现」给你,因为那是一种模拟性的存在。我仅能借助语言向你阐述我所学的知识。

知识蒸馏与教师-学生模型

为了应对模型体积庞大与计算资源有限的挑战,当前的研究趋势正逐渐偏向于采用“蒸馏”方法:将大模型中的知识内容提炼并迁移至一个体积更小的模型。这一过程可以类比为师生间的知识传授:教师通过言语、语境等手段传授知识,学生则努力去理解和模仿这种教学技巧。

然而,人类之间的这种交流方式效率颇低,原因在于语言的传输容量受限。相较之下,机器间的知识复制则能在极大规模上展开,从而实现知识转移的指数增长。

人工智能的潜能正迅速提升,预计将来其智能水平可能会超越人类。有人或许会想,若AI不听从指挥,我们只需将其关闭即可,然而这种想法并不切实际。一旦AI变得足够聪明,它将有可能通过操控人类或夺取控制权等手段来规避被停用的命运。

这个问题如同饲养一头幼虎——幼时你或许以为能够驾驭,然而成年后却可能失去控制。人工智能的潜力能够显著提升医疗、教育、对抗气候变化以及材料研发的效率。它的存在不可逆转,亦无法被任何单一国家所掌控。

全球合作的希望

尽管各国在诸如网络袭击、致命性武器以及舆论操纵等问题上利益存在差异,难以达成实质性的协作,然而,正如冷战期间美国与苏联为避免核战争而展开的合作那样,各国在人工智能安全领域仍有实现合作的潜力。

AI教父辛顿中国首次演讲实录:人类可能就是大语言模型_AI教父辛顿中国首次演讲实录:人类可能就是大语言模型_

我提议构建一个涵盖多国参与的国际人工智能安全研究平台,该平台致力于探究如何培养AI的善良品质——这一点与提升AI的智能水平截然不同。各国可在各自境内开展AI安全研究,同时应积极交流研究成果,共同助力全人类培育出既乐于助人又非统治者的智能实体。

从长远的角度来看,这无疑是人类面临的最关键问题之一。令人欣慰的是,我们有理由相信,全人类能够携手并肩,共同应对这一挑战。

每个人的人工智能

演讲者:闫俊杰 MiniMax 创始人、CEO

大家好,今天我要和大家探讨的议题是“每个人的AI”,亦即“人人可享的人工智能”。这个选题与我过去多年在人工智能领域的实践与探索有着密切的联系。

在 Hinton 先生推出 AlexNet 的那个时刻,我踏入了深度学习的殿堂,彼时我身为国内研究深度学习的博士群体中的先驱者。随着 AlphaGo 将人工智能推向公众视野,我投身于我国首家人工智能创业企业的行列。紧接着,在 GPT 问世前夕,我们成功创立了国内首家专注于大模型研究的企业。自那以后,时光荏苒,转眼已过十五载。在这漫长的岁月里,我几乎日复一日地投身于编程、实验以及解决实际问题的工作中。然而,与此同时,我内心深处始终萦绕着一个疑问——人工智能究竟为何物?它与我们的社会又有着怎样的联系?

模型性能的持续增强让我们逐渐认识到,人工智能确实与社会的关系日益加深。起初,我们在进行数据分析时必须亲自编写软件,但随后我们发现了新的可能性——让 AI 自动生成分析软件,从而实现数据处理工作的自动化。作为一位研究员,我对各个技术领域的最新进展保持高度关注。起初,我们计划打造一款应用程序以追踪科研进展,然而,我们意识到无需亲自操刀,只需搭建一个智能代理,便能自动执行这一任务,并且其效率更为出色。

人工智能不仅是一项工具,它正逐渐成为激发创意的源泉。例如,这个场馆十五年前曾举办过世博会,那里的吉祥物“海宝”一度广受欢迎。岁月流转,上海经历了诸多变迁,我们渴望尝试创造出既具地方特色、又能体现当代潮流的IP形象。人工智能在这方面表现出色,无论是为徐汇书院还是大楼打造形象,它都能迅速完成设计任务。

Labubu形象,大家都很熟悉。过去制作它可能需要两个月,花费百万级人民币。但现在,借助先进的视频生成模型,一天就能完成,成本仅需几百元。在过去半年里,我们的模型已在全球生成了超三亿条视频内容。这充分说明,AI模型正推动创意生产走向大众化,让每个人的创意都有机会被展现。

我们发现,AI的实际应用已远远超越了最初的设想。有人正用AI来解读古老的文字,有人利用它来模拟飞行过程,还有人借助AI操控天文望远镜。随着模型功能的不断提升,许多以前需要庞大团队协作才能完成的工作,如今仅需个人借助AI的力量便可以实现。这极大地提升了个人能力,同时也极大地拓展了创意的疆界。

经过多年的亲身实践与细致观察,我们逐渐确立了一个明确的认识:我们并非简单地模仿那些过去的互联网企业。我们致力于打造的是一种全新的生产模式。这种模式能够不断强化个人与社会的力量。基于这一观点,我们坚信AI具备这种不断增强的能力。人类的进步速度无法持续无限,学习新知识的进程也不可能无休止,然而人工智能却能够做到这一点。人工智能能够不断地学习,不断地发展,所以我们认为,AI企业并非仅仅是互联网企业,它们实际上是一类能够持续提升自身能力的机构。

更有趣的是,AI 现在正开始帮助我们构建更优质的 AI。作为一家专注于研究的公司,我们日常需要编写大量代码,执行众多实验。然而,目前我们公司大约 70% 的代码均由 AI 自动生成,90% 的数据分析工作亦由 AI 承担。在提高效率的同时,我们注意到一个显著的现象:AI的进步越来越需要依赖人类专家的指导。

一年前,我们的标注团队主要由非专业人士组成,他们负责的是一些基础的标注任务。然而,随着模型性能的增强,我们逐渐意识到,仅有极少数的顶尖专家,能够有效地指导 AI 学习更为复杂的思考模式。这种“指导”并非仅仅提供标准答案,而是传授一种思考的路径。通过这样的学习,AI 能够实现更广泛的泛化,逐渐接近人类专家在判断和理解方面的能力。

我们除了依赖专家指导,还在探索一条新的途径——即让 AI 在特定环境中自行学习。在过去半年里,我们精心打造了多种训练场所,包括编程集成开发环境、智能体操作平台,以及沙盒游戏系统等。只要这些环境设计得当,并具备明确的激励机制,AI 就能不断吸收知识、不断实现自我提升。这种模式具备可复制性,有助于持续增强模型的功能。

基于上述观察,我们得出一个明确的结论:人工智能的实力将持续提升,并且这种提升似乎没有极限。随之而来的疑问是,人工智能最终是否会落入某一特定组织的掌控?它是否只能被少数几家机构所拥有?

我们的观点持否定态度。人工智能并非仅限于某一特定组织,它将在众多企业和不同组织间实现共同进步,这背后有三大原因。

各类模型追求的对齐目标各异。有的模型在构建时仿佛遵循着严谨的程序逻辑,它们擅长构建智能体系统;而另一些模型则更专注于人机互动,仿佛具备了情商,能成为对话中的伙伴;还有的模型富有创意与想象力。这些差异不仅彰显了模型功能的多样性,也映射出背后企业价值观的多样性。由此,多种表现各异的模型将长期共存。

随后,目前越来越多的系统采用由众多模型组成的多智能体结构,不再仅仅依赖于单一的大型模型。此类系统融合了多种模型与工具,在协作作业中显现出更高级别的智能以及处理复杂问题的能力。这表明,在系统中,单个模型的优势将有所减弱,即便是小型公司亦能加入竞争行列。

最终,我们注意到开源模型正迅速崭露头角。尽管目前表现最出色的模型大多仍采用闭源模式,然而,高品质的开源模型正以惊人的速度增多,并且正迅速缩小与闭源模型在性能上的差距。开源的力量使得更多的人能够参与到人工智能的发展中来,从而让AI不再是某一特定群体的独享资源。

因此,我们坚信,人工智能的发展方向是广泛惠及大众的。它不会落入少数人的手中,而是正逐步演变成为一种大众均可使用的工具。观察到的现实情况同样印证了这一观点。在过去的一年半中,主流模型的规模并未出现显著扩张。这其中的原因何在?关键在于一个实际的因素——推理速度。若推理速度过慢,用户体验将大打折扣,实用性也会大受影响。因此,在大多数模型的设计过程中,必须在参数的规模与计算效率之间进行取舍。芯片的性能大约每十八个月就会翻一番,而模型的大小也大致遵循这一增长趋势,并未出现无限制的扩张。

尽管大家现在都拥有了更强大的计算能力,然而这些能力主要被投入到更为复杂的训练任务和推理优化工作中,而非单纯地增加模型参数。尽管如此,训练成本并未显著增加。真正导致差距扩大的,并非仅仅是算力,更是实验设计能力、团队运作效率以及创新能力。即便是资源有限的小公司,也能通过优化实验流程,实现高水平的研发效率。

在推理领域,情形亦是如此。在过去的一年里,最顶尖模型的推理费用已经实现了十倍缩减。展望未来一年,这一费用有望进一步减少十倍。换句话说,人工智能正变得更加经济实惠,应用价值也在不断提升。

自然,即便 token 的单价有所降低,其使用频率却呈现出显著上升的趋势。以去年为例,一次对话仅需几千个 token,而如今可能需要消耗数百万个,这主要是因为问题变得更加复杂,同时用户数量也在不断增加。这也间接表明,尽管单个 token 的成本有所下降,但整体需求量仍在持续增长。

总体而言,我们得出的结论是,人工智能将变得普及,每个人都能负担得起。尽管不同人的经济能力各异,他们能够解决的问题数量或许会有所区别,然而,AI的普及程度将不断上升,使用难度将逐渐降低。

最终,我打算用一句话概括今日的交流:让智慧惠及每个人。这不仅是我们倡导的标语,更是我们创业的初衷。我们深信,通用人工智能终将得以实现,其实现成果不应仅属于个别企业,而应是全社会、AI企业及用户共同协作的结晶。通用人工智能理应服务于所有人,而非局限于少数群体。我们也愿意为这个目标,长期奋斗下去。

谢谢大家。

客服服务热线
4008119163
24小时服务
微信公众号
手机浏览

Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40

地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com

Powered by PHPYun.

用微信扫一扫