近日,IBM (NYSE: IBM) 与开源 AI 平台 Hugging Face 共同宣布,基于美国宇航局 (NASA) 卫星数据构建的 IBM watsonx.ai 地理空间基础模型,现已在 Hugging Face 上发布。它将成为 Hugging Face 上至今最大的地理空间基础模型,也是首个与 NASA 合作构建的开源 AI 基础模型。
获取最新数据仍然是气候科学研究面临的主要挑战,因为环境条件几乎每天都在变化。尽管数据量不断增加 (NASA 预估到 2024年,其新任务将产生 25 万 TB 的数据),但科学家和研究人员们在分析这些大型数据集时仍面临障碍。作为与 NASA 签署的空间行动协议 (Space Act Agreement) 的一部分,IBM 今年早些时候构建了一个用于处理地理空间数据的 AI 基础模型。现在,双方联手业内公认的开源领导者和 Transformer 模型库 Hugging Face,共同发布上述地理空间基础模型,以扩大气候和地球科学研究中对 AI 技术的访问和应用,从而加速创新。
IBM 研究院人工智能副总裁 Sriram Raghavan 表示:“在加速气候变化等关键领域的研究发现上,开源技术的角色越来越重要。IBM 的基础模型旨在创建灵活、可复用的 AI 系统,通过将其与 NASA 的地球卫星数据库相结合,并发布在领先的开源 AI 平台 Hugging Face 上,我们可以利用协作的力量,实施更快速、更有影响力的解决方案,改善地球环境。”
Hugging Face 产品和增长业务负责人 Jeff Boudier 表示:“AI 仍然是一个以科学为驱动的领域,而科学进展必须通过信息共享和合作取得。这就是为什么开源 AI、开放数据集和模型对于 AI 的持续发展如此重要,从而让更多人受益于技术。”
NASA 首席科学数据官 Kevin Murphy 表示:“我们相信基础模型有潜力改变观测数据分析的方式,帮助我们更好地了解我们的星球。通过开源这些模型并向全世界开放,我们希望扩大其影响力。”
该基础模型由 IBM 和 NASA 共同训练,使用了过去一年在美国大陆范围内的 Harmonized Landsat Sentinel-2 (HLS) 卫星数据,并基于洪水和焚烧区域的标记数据进行了调优。相比于目前的领先技术,该模型仅使用同等条件下一半的标记数据,便实现了 15% 的效果改进。通过进一步的调优,该模型还可以应用于追踪森林砍伐、预测农作物产量、检测和监测温室气体等新任务。IBM 和 NASA 的研究人员还与克拉克大学合作,将该模型用于时间序列分割和相似性研究等领域。
此次发布紧随双方在今年早些时候联合发布的 AI 模型,后者旨在加速卫星图像分析、推动科学发现。这也是 NASA 为期十年的开源科学倡议的一部分,该倡议旨在建立一个更为开放、包容、协作的科学共同体。
此次发布的地理空间模型借助了 IBM 基础模型技术,是 IBM 创建和训练可用于不同任务、实现多情境下信息应用的 AI 模型的一部分。今年 7 月,IBM 宣布其 AI 和数据平台 watsonx 开始正式上市,它旨在基于可信任的数据,帮助企业扩大和加速领先 AI 技术的影响力。作为 IBM watsonx 的一部分,该地理空间模型的商业版将于今年晚些时候通过 IBM Environmental Intelligence Suite (IBM 环境智能套件,EIS) 推向市场。