随着春去夏来,上海的夏日气息愈发浓郁,今晚至明日清晨,雨水将接踵而至,仿佛预示着雨季的临近。近日,坐落于上海气象局气象大楼三层的上海市人工智能气象应用创新中心异常繁忙,那里的办公灯常常彻夜通明。一群年轻人围坐在电脑前,他们的目光紧盯着屏幕上不断变化的雷达回波图、卫星云图以及数值预报模型的输出数据。键盘敲击声不绝于耳,伴随着低声细语和激烈争论。
随着AI技术全面革新,由平均年龄不超过35岁的六位科研人员构成的年轻团队,正活跃在气象与人工智能的交汇领域,推动技术水平的提升。他们持续优化“雨师”和“扶摇”两款AI气象预报模型,细致调整参数设置,为即将到来的汛期进行最后的准备。同时,他们也在不懈地进行创新与探索,力求通过编程掌握风云变幻,运用数据分析天气奥秘,以保障这座超大型城市的安宁。
从“看天”到“算天”的跨界
本次算法的改进,需要进一步精确调整垂直速度场的物理限制。那名身形瘦削的青年人,说话轻柔而缓慢,但眼中却透露出坚定。他就是陈诗祺,上海市气象局人工智能团队中的一位“90后”工程师,主要负责“雨师”短临预警系列模型技术的研究开发,以及上海中心气象台气象人工智能关键算法的研发管理工作。自2024年模型开始试运行起,他加班加点的工作状态已变得司空见惯。
陈诗祺,南京信息工程大学气象学硕士,其办公桌上陈列着两本著作:《天气学原理》与《深度学习》。初入职场于2018年,他担任一线预报员,每日面对数值预报图,手动标记强对流云团。当时,全球数值模式主要依赖传统方法,以每3小时一次的预报为基准,其分辨率大致介于10至25公里之间。有时预报一出,暴雨可能早已降临,或是未能准确预测。提及早年面对的极端气候,他仍记忆深刻:城市中突如其来的局部暴雨曾导致地铁短暂停运,甚至让城市瞬间陷入“看海”的景象,而那时的预报系统却难以对这些“小尺度天气奇观”进行精确的“追踪”。
6人团队经常在一起讨论,坐着的是陈诗祺(左)和曹原(右)
陈诗祺在2023年迎来了一个转折点。当时,上海人工智能实验室向他伸出了合作之手,他随即向单位提出申请,渴望参与技术交流。正是在那里,他首次邂逅了正在复旦大学攻读计算机博士学位的曹原。正如“气象与人工智能”这一跨领域的变革趋势,陈诗祺与曹原共同经历了从观测天气到计算天气,从单一的人工智能领域到融合气象技术的角色转变与互补。曹原笑着说道,他一直认为气象是人工智能领域中的一个“终极难题”,这个领域不仅包含着时空序列的复杂特性,还面临着极端事件样本量小的挑战。他期望,每一行编写的代码都能使预警系统提前一步,有效地守护城市的安宁与安全。在攻读博士学位期间,他曾尝试过金融模型的开发,也涉足过健康AI的研究,然而,在毕业之际,他选择放弃了加入互联网巨头的机会,于2024年毅然决然地投身于气象AI的研究工作中。
驯服“数据噪音”的博弈

然而,AI模型并非无所不能,其形成并非一蹴而就。在研发过程中,技术上的竞争与较量无处不在。
神经网络在捕捉数据平均值方面具有天然优势,然而对于极端气候现象,它却视其为干扰信号。这些干扰信号恰恰是我们最关心、且最可能引发灾害的关键因素。曹原指出,在传统AI模型中,对于雷达回波强度达到35dBZ及以上的强回波识别准确率曾经相当低,就好比在考试中故意避开难题,只选择最稳妥的答案一样。
为了使AI能够“聚焦难题”,两位领军人物率队勇于探索:在“雨师”项目中,他们首次将三维连续性方程融入神经网络,以此模拟大气垂直运动的特点;同时,陈诗祺与上海人工智能实验室合作,特别设计了一个“物理约束层”,该层能够迫使模型掌握雷达回波的立体形态。经过数十轮的优化改进,随着新模型输出的不再是模糊不清、过于平滑的图像,而是能够准确描绘出强对流天气的落区,团队成员在办公室内激动地互相击掌,共同庆祝这一突破。
“扶摇”模型的研发充分展现了“数据融合”的智慧所在。雷达数据每分钟都在更新,数值预报则每小时发布一次,而卫星图像的更新频率是每半小时一张。在这样的情况下,如何让这些不同来源的数据能够实现实时同步,成为了一个关键问题。曹原所率领的团队成功构建了Nowcastformer架构,该架构如同“数据翻译官”一般,对雷达、卫星、激光测风等多元数据进行了有效处理。他们运用自回归预报建模技术,成功打造出时间间隔仅为1小时的降雨、风速等预报场,实现了同化预报的整合以及即时启动和快速更新的功能。目前,“扶摇”系统已具备生成逐小时街道级风雨预报的能力,未来甚至有望精准预测黄浦区某条小巷的瞬时风速。
防止AI“幻觉”的攻坚
在2024年的冬季,一场测试让我们的团队遭遇了AI的“致命幻觉”。陈诗祺回忆起,模型在长江口“幻化”出了一片强对流云团,然而实际雷达回波却显示那里是一片晴空。“这就像AI做了一个‘梦’,随意地将历史数据中的极端案例拼凑在一起。”分析结果显示,在样本量较小的场景中,生成式模型的随机噪声会被放大,进而导致误报率显著上升。
为降低此类“错觉”,陈诗祺提出了“确定型加概率型”的级联策略:首先,运用确定型模型把握中大型尺度降水的发展走向;接着,利用概率型模型专注于小尺度极端天气事件。这相当于为AI安装了两重保障,确定型模型宛如经验老道的天气预报员,勾勒出天气变化的“轮廓”,而概率型模型则如同高精度的显微镜,捕捉到每一个潜在的极端天气波动。曹原在代码中引入了“自适应权重算法”,此举使得模型能够更加关注历史案例中的“异常情况”,那些以往被当作噪声的极端数据,如今变成了训练中的“宝贵样本”。
现在,“雨师”与“扶摇”在上海气象局中被誉为“双星”。其中,“雨师”主要负责对突发性强对流天气的预测工作,它能够精确描绘雷暴单体的三维结构,帮助气象人员准确判断对流天气何时形成、何时结束。凭借这一显著优势,“雨师”成功实现了对未来3小时内每6分钟、1公里分辨率范围内的雷达降水预报,有望将强对流天气的预警时间提前15至45分钟。“扶摇”项目专注于短期内的强降雨以及伴随的雷暴大风。该项目通过自回归模型,将雷达、卫星以及数值预报等不同来源的数据整合,形成一幅生动的动态图像。预报的更新频率也从原本的每小时一次提高到了每十分钟一次,而且预警的精确度有望达到街镇级别。
这场“解码风云”的征途方才起步,为了精炼模型,曹原自今年年初便开启了每周一次的大气基础知识网络课程自学之旅;与此同时,陈诗祺则日复一日地追踪着深度学习的最新进展。这支由年轻人构成的创新团队,持续在代码与云图之间辛勤耕耘。在他们心中,未来的AI将揭开更多关于天气的奥秘:通过强化学习技术来提升台风路径的预测准确性,借助大型模型来预测气候变化的走向,甚至可以使气象预警像新闻推送一样,便捷地到达每位市民的手机端。
Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40
地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com
Powered by PHPYun.