首页 > 新闻中心 > 赋能AI4Science,积算科技算力服务加速气象AI前沿探索

赋能AI4Science,积算科技算力服务加速气象AI前沿探索

2026-06-04

在气象预报领域,我们正迎来一场从“数据拟合”到“物理学习”的变革。近日,北京积算科技有限公司(以下简称“积算科技”)深度支持了针对行星尺度气象建模的AI for Science研究项目UniPhy。该项目通过模拟大气演化的连续过程,成功打破了传统AI天气模型在时间步长上的刚性限制,为下一代更精准、更灵活的天气预报奠定了技术基石。

为了将创新构想转化为科研成果,研发团队需要一个高性能、高稳定的计算平台上。气象大模型研发链路长,单个实验周期长达数周,任何底层的波动都会成倍放大研发时间成本。积算科技为其量身定制了智能算力解决方案,提供计算性能先进、数据处理迅速、运行稳定、服务保障高效的算力平台及专家服务,为科研成果的诞生保驾护航。

01

UniPhy让天气预报像视频一样连贯

传统的数据驱动天气模型虽然精度很高,但它们在本质上像是在拍“快照”,即每隔固定时间(比如6小时)预测一次大气状态。这种离散的预测方式存在明显的局限性:它无法灵活查看任意时刻的天气细节,且容易忽略大气中那些连续变化的物理规律。

UniPhy(统一物理基础模型)的出现,正是为了解决这一难题。其核心创新体现在以下三个方面:

地球表面是有弧度的,直接用平面的计算方法会产生畸变。UniPhy引入了一套巧妙的数学变换,将复杂的地球球面平滑地映射到计算空间里,既保留了地理特征,又提高了计算效率。  

大气的变化往往不是平稳的,有时会突然产生剧烈的能量波动。UniPhy不再假设系统永远处于守恒状态,而是能够敏锐捕捉到那些瞬间的能量增长,从而更真实地还原雷暴、寒潮等极端天气现象的启动机制。

天气系统受长期因素影响很大(如厄尔尼诺现象)。UniPhy设计了一个“全局通量追踪器”,它不仅关注眼前的变化,还能像管家一样记录全球长期的能量账本,确保预报轨迹不会随着时间推移而跑偏。

2.jpg

UniPhy在平均海平面气压(MSLP)变量上的零样本时间泛化定性比较

02

算力挑战:如何高效支撑前沿科研

UniPhy团队是在AI for Science领域进行从无到有的开拓性研究。这种极具挑战性的探索模式对计算平台提出了极其严苛的要求。

一是算力必须稳定、可靠。研发团队需要调度规模庞大的计算资源高效协同作业,单个研发周期长达21天。在这三周的时间里,整个计算平台必须全速、稳定运转,中间绝不能有半点中断。因为在如此大规模的分布式计算中,底层的任何一点问题都可能导致研发进度停滞。

二是数据吞吐压力倍增。UniPhy的设计本质上要求每个样本包含一段连续的时间序列,单个样本数据量高达5GB,这导致每个batch的数据体量是同类单帧模型的数倍乃至十数倍。多机协同研发时,海量的数据洪流会瞬间压垮普通的网络和存储系统。如果存储带宽不够,昂贵的GPU就会长时间处于空转等待状态,研发效率将大打折扣。

03

积算科技:全链路优化+专家服务,为科学研究按下“快进键”

针对UniPhy项目在稳定性和研发效率上的需求,积算科技提供智能算力平台及专家服务的全套解决方案。

算力平台系统包含AI服务器节点、高性能并行存储、全线速无阻塞Infiniband高速计算网络、万兆管理网络,配套部署相应的系统管理和作业调度软件。AI计算节点采用支持FP8和FP16算力、内部高速互联的AI芯片,通过高速Infiniband网络,实现多机多卡的高效并行。为了应对数据吞吐压力,采用高性能并行存储,支持弹性在线扩容,支撑业务长期演进、冷热智能分层,兼顾性能与成本、高速组网,释放存算协同性能。

积算科技为UniPhy科研项目提供了7*24小时的专家级技术服务。首先,积算科技根据项目的需求特点,对算力平台做了全链路优化,包括底层计算资源、驱动、调度、数据处理等,确保平台性能处于最佳状态。在科研团队非常关注的数据读取和处理环节,设计带宽聚合与精细的分配策略。实际运行中,面对远超常规模型的数据吞吐需求,整个平台的任务运行依然保持流畅,GPU利用率始终维持在高位,彻底解决了数据加载的瓶颈问题。

其次,为保证UniPhy团队保质、按时交付科研成果,让团队将100%的精力投入到模型创新和实验设计中,积算科技提供了24小时在线工程师支持服务。无论白天还是深夜、凌晨,从未出现过问题过夜的情况,确保所有故障均在当天得到跟进和处理,即便是遭遇硬件损坏这类问题,也能在小时级时间内完成修复。

积算科技诞生于全球生成式AI浪潮,专注于智能算力服务市场,致力于成为中国最具价值的智能算力服务商。公司聚焦互联网、运营商、高校、新能源汽车等领域,为多家头部客户提供专业算力服务。积算科技拥有万卡级先进智能算力资源池,提供裸金属、智能算力系统、专属智能算力系统等多元化算力服务产品,广泛适用于大模型训练与推理、算法研究、大数据分析、自动驾驶及智能科学计算等场景。其运维和服务团队具备大规模智能算力系统设计建设、大模型开发应用及性能优化能力,可提供全栈大模型应用开发服务支持,并根据客户需求提供灵活的服务模式。