AI“翻译官”统一解读恒星光谱数据
记者25日从中国科学院国家天文台获悉,来自该台、中国科学院大学等单位的科研团队,成功开发出一款名为SpecCLIP的人工智能模型。该模型像一位精通多门“恒星语言”的翻译官,统一解读来自不同望远镜的恒星光谱数据,为天文学研究提供了全新的技术工具。相关研究成果发表于《天体物理学报》。
恒星光谱,常被科学家比作研究宇宙的“指纹”。每一颗恒星的光谱都隐藏着它的“身份信息”——温度、化学成分以及表面重力。通过分析这些“化学印记”,天文学家可以像考古学家复原历史一样,追溯银河系从诞生至今的演化历程。
然而,现实研究面临一个不小的难题:不同的巡天项目,比如中国的郭守敬望远镜(LAMOST)和欧洲的盖亚(Gaia)卫星,获取光谱数据的方式、分辨率和波段范围各不相同。这些数据就像用不同方言讲述的故事,很难直接放在一起进行大规模分析。
SpecCLIP模型的诞生,正是为了打破这个数据壁垒。研究团队创新性地将类似“大语言模型”的思路引入天文领域,通过“对比学习”的方法,让AI自动学习并建立不同来源光谱数据之间的内在联系。
论文通讯作者、中国科学院大学副教授黄样解释:“SpecCLIP就像一位‘翻译官’,它能将LAMOST的低分辨率光谱和Gaia的高精度光谱,转换成同一种‘通用语言’。这样一来,科学家就能轻松地对它们进行联合分析,实现跨仪器、跨巡天项目的数据对齐与转换。”

基于SpecCLIP基座模型构建的面向科研人员的恒星光谱专业分析平台界面。
更重要的是,SpecCLIP并非只能完成单一任务的“专才”,而是一个接近“基础模型”的框架。它不仅能一次性预测恒星的大气参数和元素含量,还能进行光谱相似性搜索,甚至帮助发现特殊的天体。这种能力在“银河考古学”中尤为关键——它有望高效地从海量数据中筛选出极其稀有的、金属含量极低的古老恒星,为研究银河系早期的形成与并合历史提供关键线索。
基于强大的数据统一表征能力,SpecCLIP已在多项前沿科学探索中发挥作用。例如,在搜寻第二地球的“地球2.0(ET)”任务中,它能精确刻画行星寄主恒星的特征,从而提升潜在宜居行星的筛选效率。
黄样表示,SpecCLIP模型展示了人工智能在处理融合海量天文数据方面的巨大潜力。它不仅架起了一座连接不同观测系统的桥梁,更有望推动人类对银河系结构与演化历史的认识迈向更高精度。
(受访者供图)


