人工智能和机器学习在数据分析、网络安全、药物开发、音乐创作和艺术渲染等广泛应用中变得无处不在。近年来,大规模语言模型(LLM)也出现了,将人类交互和写作添加到一长串应用程序中。ChatGPT是一门法学硕士,自两年前推出以来产生了巨大的影响。该应用程序引发了有关人工智能潜在用途和影响的大量争论(和争论)。
机器学习被用来筛选大量数据,寻找行星凌日的迹象,纠正大气干扰,并找到噪音模式。一个国际天体物理学家团队表示,这只是人工智能给天文学带来的可能性的开始。在最近的一项研究中,研究人员利用天文观测来微调生成预训练Transformer(GPT)模型。在这个过程中,我们成功证明了GPT模型可以有效支持科学研究。
该研究得到了国际相对论天体物理中心、中国科学院天体物理研究所、中国科学技术大学、中国科学院高能物理研究所的支持、帕多瓦大学和伊斯法罕理工大学,由费雷拉大学的国际研究人员联盟国际进行相对论天体物理网络。他们的论文“TestofFine-TuningGPTbyAstrophysicalData”的预印本最近发布在网上。
活跃类星体的插图如上所述,天文学家广泛依赖机器学习算法来筛选现代望远镜和观测仪器获得的大量数据。这种做法大约始于十年前,此后呈指数级增长,直至人工智能融入整个研究过程。ICRA主席兼该研究的主要作者王瑜在一封电子邮件中告诉《今日宇宙》:
天文学一直是由数据驱动的,天文学家是最早采用机器学习的科学家之一。机器学习目前被用来提高地面和太空望远镜在太空望远镜的制造和控制方面的性能,例如自适应光学系统的性能,从数据分析(例如去噪、数据插补、分类、模拟等)到理论模型,已用于建立和验证(测试修正重力、约束中子星状态方程等)。)
数据分析仍然是这些应用程序中最常见的,因为它是最容易集成机器学习的领域。传统上,数十名研究人员和数百名公民科学家分析观察活动产生的大量数据。但在现代望远镜每天收集数TB数据的时代,这是不现实的。这包括全天空巡天,例如甚大阵列巡天(VLASS)以及斯隆数字巡天(SDSS)采取的许多步骤。
由于法学硕士相对较新,迄今为止它们仅在天文学研究中零星地应用。但像王这样的倡导者表示,法学硕士正在产生巨大的社会影响,至少有可能与“工业革命”相媲美。王预测,影响的上限将有很大差异,并可能导致人类“启蒙或毁灭”。但与工业革命不同的是,人工智能的变革和整合速度要快得多,其采用的广泛程度仍然存在疑问。
斯隆数字巡天望远镜矗立为了确定GPT在天文学领域的潜力,他和他的同事采用了预先训练的GPT模型并对其进行微调以识别天文现象:
OpenAI提供了一个预训练的模型,我们所做的就是在原始模型的基础上改变一些参数进行微调。这和OpenAI为本科生提供的类似,就像训练一个学生成为天文学的研究生一样。我们以适度的分辨率提供了有限的数据,并且训练GPT的次数比常规模型少。尽管如此,结果还是令人印象深刻,达到了90%左右的准确率。如此高的准确率是由于GPT在理解数据处理方面已经具备了坚实的基础,逻辑推理和沟通能力。#深度好文计划#为了微调模型,研究人员引入了对不同目录中不同天文现象的观测。其中包括2,个SDSS类星体、星系、恒星和宽吸收线(BAL)类星体样本(每个个)。它还集成了对短伽马射线暴和长伽马射线暴(GRB)、星系、恒星和黑洞模拟的观测。经过测试,他们的模型能够对不同的现象进行分类,区分类星体的类型,根据红移推断距离,并测量黑洞的旋转和倾斜。“这项研究表明,至少LLM可以处理天文数据。而且,LLM处理各类天文数据的能力是其他专业模型所不具备的能力。我们希望能够整合不同类型的数据,并找出共同的基础帮助我们理解世界的原则。”当然,这是一项艰巨的任务,仅靠天文学家无法完成。
年4月黄昏的维拉鲁宾天文台。经过漫长的等待,天文台将于今年晚些时候看到第一缕曙光。
当然,研究人员承认,与现代天文台的数据输出相比,他们实验的数据集很小。对于像VeraC.Rubin天文台这样的下一代天文台来说尤其如此,该天文台最近推出了世界上最大的数码相机LSST相机。一旦投入运行,鲁宾天文台将进行为期10年的时空遗产巡天(LSST),预计每晚将产生15TB的数据。王说,满足未来活动的需求需要天文台和专业人工智能公司之间的改进和合作。
然而,LLM在不久的将来将越来越多地应用于天文学已成定局。鉴于当今天文学研究产生的大量数据,这不仅是一种可能的发展,而且是必要的。由于这种情况在不久的将来可能会呈指数级增长,因此人工智能很可能成为该研究领域不可或缺的一部分。
作者声明:内容由AI生成