6月27日正和岛2025案例共学年会聚焦AI，刘庆峰预判今年是全民AI元年

来源：网络整理 时间：2025-07-07 作者：佚名 浏览量：

6月27日，在合肥举办的“正和岛2025案例共学年会暨AI+先行者创新大集”活动持续进行中，大会以“向新力”为核心议题，吸引了千余名企业家齐聚一堂，共同就AI时代背景下的企业组织变革和商业生态进行深入交流与探讨。

在此次会议中，科大讯飞公司的董事长刘庆峰以“激发生产潜能，拓展思维边界——通用人工智能技术的最新发展及其代表性应用”为主题，发表了一场引人入胜的演讲。

在交流中，刘庆峰预测今年将成为全民AI和全行业AI的起始之年。针对美国对高端算力芯片对中国实施的限制，中美在大模型竞赛中的差距已缩小至3至6个月，难以再出现代际差异。他强调，相较于以往，国产自主可控的需求更为紧迫，我们务必在国产化平台上坚定不移地推进通用人工智能的发展。

以下为刘庆峰在正和岛案例共学年会上的发言全文，特此呈现给广大读者，其中部分内容已有所删节。

口述：刘庆峰科大讯飞董事长

编辑：明瑞

来源：正和岛（ID：zhenghedao）

大模型在高考中的表现

我想和大家探讨一下人工智能领域的最新进展，特别是那些以大型模型为标志的通用人工智能技术，以及它们的应用情况。

目前，人工智能技术的广泛应用正极大地释放各行各业的生产潜能，从而使得人们能够拥有更多的时间去从事那些充满创意和趣味的活动。

今日，众人皆疲于奔命、劳苦不堪，各行各业若想借助人工智能的力量，从这紧张繁忙、饱和度极高的工作中解脱出来，投身于更有价值的事务，展望更加美好的未来，这正是我们在2023年5月6日推出的科大讯飞星火1.0版本时所坚守的核心宗旨。

现今，众人借助人工智能各显神通，投身于各自最擅长的领域，而科大讯飞秉持的理念始终未变，即期望通过人工智能技术的进步，切实提升生产力，激发创造力。

这项技术进展如何？人们对于人工智能大模型在高考中的表现十分关注。近日，高考成绩揭晓，这标志着广大考生经过十年的刻苦学习，迎来了人生中最为重要的转折点。语文考试落幕，作文解析环节到来之际，上海报业集团旗下的界面新闻迅速邀请了两位在高考教学领域具有丰富经验的资深特级教师，对国内六家主流的大规模语言模型进行了高考作文的评估，这些模型包括DeepSeek、豆包、文心一言、通义千问以及腾讯元宝。

讯飞星火有幸荣获了第一名，其作文得分高达60分满分，而我们团队取得了53分的好成绩。在高考英语科目中，6月9日作文题目一经公布，新京报便迅速组织了评测。在20分的满分标准下，讯飞星火获得了19.5分的高分。

在首届供应链博览会上，李强总理与我相见之际，他开口便说：我们中华民族在创作诗歌、绘制画作等传统文化方面表现不俗，但在自然科学领域，我们的表现究竟如何？这恰恰是国家真正亟需了解的。

讯飞星火在数学领域的表现究竟如何？6月8日，高考数学卷一的结果公布后，IT之家随即邀请了6家主流的大规模语言模型，同时还包括了美国最新发布的OpenAI-O3模型，共同参与了测试。

OpenAI-O3在数学、科学和编程领域实现了显著进展。特别是在今年的高考数学一卷中，总分150分，参与的7个模型中，讯飞星火和DeepSeek均成功超越了140分的大关。

讯飞星火是4月20日推出的版本，而DeepSeek则是在5月28日发布。值得一提的是，DeepSeek缺乏多模态功能，与之相对，讯飞星火却具备了这一能力，并且能够通过OCR技术直接解答数学题目，这一点相当出色。

在本次评测中，我们得以观察到大型模型在处理理科问题方面的能力。同时，高考数学试题的命题是严格保密的，不允许提前进行训练，这使得大模型在数理逻辑推理方面的表现得以全面展现。这一表现不仅体现在高考数学领域，同样在国内外奥数竞赛、美国各类竞赛，以及英语、数学、物理等多个学科中，国内的大型模型均表现出色。

今日，我们对于大型模型的期待，不仅限于其在高考中表现出色。讯飞致力于教育事业，期望借助大模型技术，实现试卷批改的精确度提升，并向孩子们提供更为精准的学习资源推荐。如此一来，孩子们的学习体验将更加愉悦，心理健康状况也将得到改善。最终，它旨在助力我们共同塑造一个更加美好的未来。

在同期，该领域的数学成绩未曾超过110分，但短短一年间，成绩有了显著提升，预计明年便能接近满分。依照当前的发展势头，不出两年，该大模型的能力有望超越诺贝尔奖标准。事实上，去年诺贝尔物理学奖和化学奖均授予了AI4S领域的科学家。

今年是全民AI元年

今天，AI到底发展到了什么阶段？

去年，我们观察到了一组引人注目的数据：人工智能领域的创业投资总额显著攀升，超过了1000亿美元的大关。这一数字并未计入英伟达、微软、谷歌等科技巨头所进行的巨额投资布局。与此同时，与去年同期相比，投资额实现了80%的同比增长。在当前全球经济面临诸多不确定性的情况下，这样的增长速度尤为引人瞩目。

我国算力规模已突破72.53万匹，增幅高达74%。与此同时，大模型的招投标活动数量也激增，增长幅度超过十倍。在去年春节前夕，我国生成式人工智能的覆盖范围已扩展至2.49亿人，占总人口的17.7%。

从技术进步的视角分析，大型模型的应用已步入一个至关重要的节点。杰弗里·摩尔的著作《跨越鸿沟》每次重温都颇具启发性，至今仍被硅谷视为创业领域的经典教本。每当一项新技术问世，初期创新者仅占总数的2.5%，而具备远见卓识的长线投资者和热衷于探索的极客爱好者则占据了13.5%。当这两类人群相继迈过门槛，市场便进入了实用主义用户的阶段。

为何这种跨越鸿沟的几率必然是16%呢？16%的数字意味着在人群中，相互间的交流已经达到了一定的密度。在每张容纳8至10人的餐桌旁，总会有一个个体正在使用新技术，进而影响周围的人。无论是语音识别技术还是手写识别等新技术的进步历程，都曾经历过这一阶段。而现在，大模型技术的应用也大体上达到了这样的水平。

2025年标志着全民AI与全行业AI时代的开启，那时大家普遍下载过各种大模型应用，对它们的功能有所了解，并对它们在生活与生产领域引发的变革有了深刻的认识。

大规模模型标志着人工智能在通用人工智能领域取得的显著成就，其特点可以从以下几个方面进行划分：

一是运算智能。机器能存会算，这是支撑认知智能发展的基础；

第二点是感知智能领域。机器具备听与说、视与辨的能力。语音识别技术已超越专业速记员的水平；语音合成技术甚至能为中央电视台提供配音服务；机器翻译的准确率已超过99%的大学六级考生，且已通过国家翻译师资格考试。人类无法察觉的红外线、紫外线，听不到的超声波、次声波，机器都能感知得到。

第三，是认知智能领域。自2017年新一代人工智能规划发布以来，科大讯飞承担了建设我国唯一认知智能国家重点实验室的重任。伴随着认知智能在多模态交互、具身智能等领域的不断突破，运动智能亦与之相互促进，共同推动了机器人行业的迅猛发展。展望未来，具备知识储备、自我进化、陪伴互动和学习能力的机器人将走进亿万家庭，进而极大地促进认知智能的进一步发展。

从技术层面来看，大模型的发展历程可划分为数个阶段。2017年，一种名为生成式预训练的新方法问世；紧接着在2018年，GPT1.0模型诞生，这一预训练技术通过强化学习，使得机器在数学考试中的成绩从约100分提升至140分；随后，技术进步从强化学习与慢思考领域拓展至世界模型领域，从而更深入地理解客观世界，促使技术持续高速发展。

在成长历程中，讯飞语音合成技术不仅为央视提供配音服务，而且能够支持80余种语言的翻译需求，其应用范围遍及200多个国家和地区，系统参数量级在数百万至两千万之间。

大模型指的是一种怎样的技术？当初GPT问世时，其参数量高达1750亿个浮点数，这样的深度神经网络通常拥有千亿以上的参数。通过将海量的多元多模态数据，包括文本、视频、语音等，输入其中进行训练，机器在一定程度上展现出了跨领域的智慧涌现。其核心功能涵盖了文本创作、语言解析、知识咨询、逻辑判断、数学运算、编程技能以及跨模态交互等多个方面。

2023年，长三角人工智能产业链联盟携手中科院人工智能产学研联盟共同打造了通用人工智能的评估框架与技术标准，该框架涵盖了七大评估维度，并提出了超过400种的细分任务类别。截至目前，这一评估体系已扩充至包含1000多项的细分任务。

这些能力将催生出专家级别的虚拟助手，它将彻底改变传统的编程模式，充当科研的加速器，并对科研的整体范式进行颠覆，同时也会对信息的传播、获取、内容的制作以及人与机器的交互方式产生变革。

中美AI大模型差距，缩短至3到6个月

中国的高考仅能作为观察人工智能技术进步的一个缩影。放眼全球，诸如海外奥数竞赛等活动亦广泛运用了人工智能技术。然而，就技术发展的全局态势而言，在以GPT框架预训练和强化学习为代表的大规模模型竞赛中，中美两国间的差距正在逐步缩小。

美国领先企业如OpenAI和Anthropic等逐渐将目光聚集，致力于将数学、物理等领域的杰出人才培育成为人工智能领域的专家，因此，在科学模型的构建方面，美国展现出独特的风格。

中国市场竞争激烈，“百模大战”使得头部企业数量锐减，仅剩5至10家。去年9月13日，OpenAI发布了深度思考模型，该模型在数学和深度推理方面实现了显著进步。今年1月，我们推出了一个体积小巧的13B深度推理模型，但由于算力限制，我们不得不研发体积较小的模型，以确保国产算力能够承受。

自那时起，DeepSeek、豆包、阿里等公司展开激烈角逐，争相追赶，在这轮通用大模型的竞赛中，中美双方的实力已经十分接近，二者间的差距仅限于3至6个月，绝对不会再出现明显的代际差异。

_刘庆峰持有科大讯飞多少股份_科大讯飞刘庆峰全家福

在此情境下，美国对我们实施了哪些限制？随着DeepSeek的问世，美国感到了极大的震惊。此前，他们对中国的大规模模型以及科技创新实力存在误解，然而，当他们目睹中国的发展速度如此接近美国时，便决定进一步强化对计算能力的管控。

自2022年10月7日开始，美国对我国的大规模模型及人工智能芯片实施了严格的限制措施。这些限制包括对芯片性能的限定，即单个芯片的算力上限设定为312T；以及对数据传输宽度的限制，大模型间的数据交换带宽不得超过400G。随后，美国政府进一步扩大了限制范围，宣布实施全面禁售，甚至连经过削减功能的芯片版本也不再提供。

今年，美国出台了一项新规定，将出口管制范围扩大至包括三星、台积电在内的多家芯片代工厂，针对其生产十几纳米级别的芯片实施出口限制。在此之前，我们曾通过堆叠工艺将芯片尺寸缩小至7纳米，但如今，这些途径均已遭封锁。

在这种条件下，我国在大型模型与人工智能基础设施领域与美国相比，差距仅维持在3至6个月，然而我们的算力支持情况究竟如何？我想向各位说明，在提及的高考语文、英语及数学的主流模型中，仅有讯飞公司采用的是国产算力进行训练。而DeepSeek、豆包等企业则完全依赖英伟达芯片进行训练，这使得国产算力训练的大模型面临着巨大的压力。

2022年11月30日，GPT正式发布之际，美国针对中国的芯片实施了一系列严格的限制措施。在这些限制下，华为的910B芯片的算力达到了113T，这一数值与美国同类产品相仿。同时，带宽的规定也被严格限制，不得超过400G。然而，中国实际使用的带宽仅为392G。

在理论层面，我国有望实现A100或A800芯片性能的80%至90%。然而，在那个时期，即便是在相同的硬件技术支持下，我们在大规模模型训练的效率上仅能达成30%。

华为公司由任正非领导，打造了一支史上最高级别的精英团队。截至2023年10月，我们与团队共同努力，成功将训练效率提升至95%。基于此，2024年1月30日，我们自豪地发布了首个依托国产算力进行训练的千亿级大模型——讯飞星火3.5，为国家的技术安全提供了坚实保障。

去年9月13日，DeepSeek R1的深度思考模型技术引起了广泛关注，得益于我们丰富的经验和扎实的基础，仅仅经过一个月的努力，我们便成功实现了所有技术的复现。

然而，在运用国产算力进行训练的过程中，我们原本算法的效率从95%骤降至25%，为此，我们付出了三个多月的努力，最终将效率提升至73%。这一成果在高考中得到了验证。如今，中国的大模型训练必定是在全国产算力支撑下，以更低的算力消耗和更小的模型参数，培养出与国际水平相媲美的技术，这才让我们有了可持续发展的信心。

我们是如何实现这一点的呢？首先，我们的模型规模达到70B，若岛亲机构想全面使用R1，则需要两块显卡。然而，R1在深度训练方面存在局限，这就意味着需要自行使用开源模型进行训练，这或许需要多达512块显卡。相较之下，我们采用星火X1，仅需32块显卡即可。而OpenAI的O1规模更为庞大，可能需要上万的显卡。我们之所以能够做到这一点，关键在于中国拥有自主创新的算法技术。

迅速作出判断是迅速得出答案，而经过深入推理和反复验证，则能提供最优质的模型。然而，V3与R1是独立训练的，这意味着一家企业需要部署两个系统。我们在此领域内首次采用了一种统一的框架，企业只需安装一套系统，即可灵活地在快速思考和深度思考模式之间进行切换，既可选择快速模式，也可选择深度模式。

由于这些技术的突破，我们得以在自主掌控的通用平台上迅速培育出针对行业的模型，进而深入企业应用领域。通常情况下，一项新技术的广泛应用需要其准确率至少达到89%至90%。

当摩托罗拉的手写识别技术达到89%的识别率时，人们纷纷开始使用这项功能；随着手机上语音识别准确率提升至90%，用户数量从几十万激增至数亿，目前该技术的准确率已经高达98%。

大模型的典型应用场景

今日，通用大模型在初步应用阶段常显现出幻觉现象，并带有诸多“讨好型人格”的特点；其平均准确率大约在78%上下。而与之相较，行业专用的模型在经过精确训练后，其准确率能够提升至80%以上，且场景界定明确，准确率更是可以达到95%。

在这个基础框架中，我们需要明确的前提是什么？我们是否能在完全自主可控的平台上培养出我们的基础模型。以教育领域为例，凭借自主可控的模型，我们可以将机器的思维流程转变为教师的教学思维流程，以问题为导向，打造出能够辅助中小学教师的工作助手，这些性能指标显然超越了GPT4.5。

在医疗行业，我们的模型成功通过了国家执业医师的资格考试，其表现超越了99%的考生。此外，我们与葛均波院士携手开发的心内科应用，以及与安徽医科大学校长翁建平教授共同推进的糖尿病专业应用，均取得了显著成果，已达到主治医师以上的专业水平。深度推理技术的问世，使得今年推出的大型模型在众多专业领域取得了卓越的进展，这主要得益于一套高效的行业训练工具链的诞生。

今年两会结束之后，最高人民检察院采纳了人工智能技术，借助大型模型以促进司法公正，实现了类案推荐、法规匹配、量刑辅助以及文书自动生成等十项功能。我们运用了专业化的模型，其准确率得以提升至83%，在众多领域甚至超过了90%。不久前，在工信部组织的能源行业碳排放评估测试中，该大型模型在48位参赛者中取得了第五名的成绩，成功进入了前20%的行列。

这些技术进步推动了大模型在多个领域的广泛应用。

在教育界，大型模型能够扮演口语、科学、编程教师以及心理辅导的角色。在医疗行业，它已经协助完成了接近4亿份电子病历的记录和超过10亿次的辅助诊断任务，纠正了约170万次不准确的诊断以及超过9000万次的不合理处方，并且持续致力于打造个人健康助手。在翻译界，大型模型的表现已经超越了绝大多数六级考生，其应用范围已从旅游领域拓展至商务谈判及合同签订辅助，特别是在抗干扰、长距离交流、离线翻译以及专业领域方面，展现出卓越的能力。

此外，我们成功研发了图像文字创作以及视频编辑软件，这些工具能够支持多种语言，有效帮助农副产品以及工业制品走向国际市场。

与岛亲出海相关的应用，比如在翻译领域，大模型的表现已超越99%的大学六级考生。如今，翻译机的功能已不再局限于出国旅游、日常聊天和点餐等，它还能支持商务谈判以及合同签署。即便在没有网络的情况下，它也能流畅地处理英语、俄语、法语、德语等多种语言。

中国企业在海外设立工厂，这一增长迅速的领域在工厂的噪音环境中展现出出色的抗噪能力，并能实现远程交流，这无疑是一项重大突破。除此之外，我们研发了一系列工具，无论是农产品还是工业产品的出口，只需提供几张图片和一个具体要求，便能迅速生成文案或视频，并且还能提供所需国家语言的版本。

我们推出了行业内首个同步传译的大型模型，只需录制一段中文，便能自动转换为多种语言，并且能够与视频内容、字幕以及手势动作实现同步。在本年度的东盟博览会上，我们正式推出了专门针对东盟地区电商的自动翻译服务支持平台。

在办公环境中，致力于成为每位员工的得力助手。在今天的会议中，若使用讯飞办公本，便能实现全程录音，并自动将录音内容转化为文字，进而自动生成会议纪要及待办事项。这款软件的功能究竟如何？今年其总用户量已突破九千万。即便是三到五人的小型会议，通过手机录音并上传至后台，也能迅速提炼出每位与会者的观点，并形成综合性的结论。

此外，我们携手中国移动，共同推进合作项目。在日常生活中，无论是驾驶途中还是行走之间，我们时常会接到领导的公务来电。如今，通过申请这项功能，通话一旦结束，会议纪要便会自动生成。这些实用功能受到了大家的热烈欢迎。

在工业界，现今的大规模模型几乎涵盖了研产供销服管等各个流程，我们借助前端麦克风阵列与语音、视频芯片，使各类设备具备“耳听口言、眼观识别”的能力，并通过后端的大模型，使设备实现“理解力强、思考能力佳”。

海尔在家电行业率先进行了大型模型的招标，我们成功赢得了这一项目，随后还与TCL、美的等众多家电品牌展开了紧密的合作。到了2022年，我们在家电芯片的出货量上已经超过了1300万片，而到了2024年，这一数字增加到了4000万片以上，预计在今年，这一出货量将实现突破，达到6000万片。

人机物万物智能互联的时代即将降临。基于这一背景，无论是产业数字化进程还是数字产业化的发展，实际上都离不开代码作为桥梁，将现实世界与虚拟世界紧密相连。如今，借助软件的力量显著提升效率，这一观点已逐渐成为行业内的普遍认知。

今年，计算机与软件领域的就业率和薪酬水平均出现了下降趋势；同时，OpenAI宣布GPT成功通过了谷歌的二级程序员考核，该职位年薪高达18万美元；这标志着编程技术的显著提升。

再来看几个案例，讯飞公司内部的智能黑板以及智能课堂系列产品，原本从Windows操作系统过渡到Linux系统需要耗时三个月进行开发，而现在这一过程仅需一个月即可完成。

效率的增强不仅加速了软件开发的进程，同时亦降低了技术壁垒，让那些不熟悉编程、对技术一窍不通的员工仅需把握岗位需求，直接下达指令，便能让模型代为完成相关工作，进而创造出众多智能体，极大地拓宽了创新与创造的潜在空间，摆脱了技术限制的束缚，其核心在于我们是否拥有丰富的想象力。

在招投标系统中，借助人工智能技术，我们不再仅仅撰写文章，过程既轻松又充满乐趣。它能够深入细致地解析那些严谨的标书，准确把握标书的核心要求和评审流程。此外，系统还能自动识别标书中的造假或雷同问题，并给出相应的替换建议。同时，它还能搜寻预警信息，甚至提供报价砍价的策略。近期，我国国家发改委作出决策，决定在全国范围内推广这一做法。在合肥市的招投标中心，这一实践已将专家评审的一致性比率从原先的75%显著提高至95%。

今日，众多应用领域广泛采纳了大模型技术。然而，最关键的是，要将这些通用的大模型有效转变为特定行业的模型，并确保其实际应用，这过程中必须克服众多核心难题。

必须掌握构建算力的方法，无论是依托国内平台还是融合国产与英伟达的混合算力调度系统。同时，还需了解如何有效整理数据，借助自动化工具，将效率提高至24倍。至于模型训练，企业需决定是采用参数量仅为几千万的小型模型，还是使用参数量高达千亿的大模型，这需根据具体情况进行精准匹配，确保应用场景中的安全性。最终，通过直观可见的现场实例和详实的数据统计，有力地展示了大型模型在实际应用中的显著成效。

只要向智能体提供一段文字或者一句话，它便会将此事拆解为若干个子任务，识别出所需调用的工具，搜寻必要信息，随后将各个子任务的结果串联起来，最终实现整体目标，这就是所谓的智能体。

以中国石油天然气集团公司为例，超过五千名员工投身于岗位技能提升竞赛，逾千支队伍成功研发了两千余个智能系统，其中百余个荣获奖项。目前，这些智能系统已在中国石油的百余项办公应用以及三百余个生产和销售环节中显现出显著的实际效益。

在当今的大模型时代，并非单一企业的角逐，而是整个生态系统的兴盛。我们必须确保我们的技术能够服务于更多企业，并激励更多创新者投身其中进行开发。

讯飞人工智能平台在去年一年迎来了170万新增的开发者团队，并成功推出了近100万款新应用。值得关注的是，这些新应用中，以往以社交、娱乐为主导的APP占据了多数，但如今，与工业相关的应用已占到了总数的54%。

在这一轮发展红利中，我国的大模型与美国之间的差距已经大幅缩短，仅为3至6个月。在行业应用领域，我国有望率先享受到这一红利。

作为产业的推动者和革新者，我们必须重视源头技术的创新。随着与美国的差距逐渐缩小，以更理性的视角来看，这实际上是原创技术与追赶技术之间的差距。我们在学习这些原创技术，而它们本身则是创新的产物。若我们无法在人工智能的源头基础上进行长远规划，那么在未来竞争中获胜的可能性将大大降低。

前天我们展开了对合肥这座城市的特性进行探讨，该城市正着手规划GPT框架的人工智能计算技术，并思考如何将其与量子计算进行深度融合，以期根本性地缓解算力方面的焦虑。同时，我们还探讨了如何运用人工智能技术来推动可控核聚变的发展，将原本需要10天的模拟实验缩短至仅需1天，并将准确率从93%提升至97%。一旦可控核聚变技术能够将1度电能转化为超过1度电的能量输出，并且实现能量的正向增益，那么能源问题将得到根本性的解决。

我们热切期望与各位携手，于正和岛年度盛会上进行深入探讨，一道展望未来，激发生产潜能，拓展创意思维。感谢大家的支持！

排版 | 小元

上一篇：三伏天广州高温持续，生食受追捧，生吃下一篇：华为AI大模型团队回应盘古开源模型被

6月27日正和岛2025案例共学年会聚焦AI，刘庆峰预判今年是全民AI元年

用微信扫一扫