人工智能将成为人类探索宇宙的新工具
在人类努力理解探索宇宙的过程中,我们变得更加“贪婪”,虽然一直都在不断努力,但是其实并不知道应该做什么。每年,宇宙中的卫星都会传送回大量的数据,比如在智利的天文望远镜,每天晚上都会产生巨大空间的太空图标,但人类不可能对这些所有的数据进行筛选。就像天文学家Carlo Enrico Petrillo说的那样:“观察星系的图片,是人类的工作中最浪漫的部分。”但为了保持专注,Peetrillo专门开发训练了一套人工智能程序来进行筛选。
Petrillo正在和他的同事们寻找一种能够立刻识别出太空望远镜数据的技术。当一个巨大的对象,可以是星系或黑洞,而作为地球上的观察者,通过周围空间和光线的弯曲,创建一种特别的透镜,这些透镜是人类了解宇宙的关键。不过目前为止,这项工作的进展一直缓慢而乏味。
而这也就成为了人工智能的用武之地,而发现引力透镜也只是一个刚开始。就像斯坦福大学的教授AndrewNg所说的那样,人工智能的能力可以让任何事情自动化。普通人可以用不到一秒钟的时间完成一项工作,虽然听起来这样的速度也很快,基本不用思考的时间,但是如果放到海量的天文数据筛选中,那效率简直就是低到不行。
而现在的人工智能技术可以帮助天文学家不仅仅是在思考问题是寻找筛查数据的排序,而且他们正在探索一种全新的科学模式,通过人工智能技术可以将我们从未见过的宇宙描绘出来。
但首先要知道引力透镜,爱因斯坦的广义相对论在1930年就曾预言了这一现象,但直到1979年才第一次发现了例子。为什么?因为太空很大,人类要花很长的时间去观察它,尤其是没有今天这种先进的望远镜。到目前为止,这使得对引力透镜的搜寻变成了一种零零散散的工作。
“我们现在的天文望远镜镜头是通过各种各样不同的方式寻找目标。”明尼苏达大学天体物理学教授Liliya Williams表示。有些是被偶然发现,有些人则在寻找完全不同的目标。虽然还有一些是通过推理计算发现,但是大部分,都是通过偶然的方式发现。
就像我们在上个月的一篇论文中看到的那样,将这项技术引入到寻找引力透镜的方法,非常简单,直截了当。首先,科学家们制作了一个数据集来训练神经网络,这意味着可以生成600万个假想图,然后这些图像显示了引力透镜的作用。然后,神经网络对数据失去了控制,让它慢慢识别出不同的模式。最后再进行一些微调,可以在一瞬间识别出有引力透镜现象的程序。
Petrillo说:“一个高水平的人类工程师团队每小时可以筛选出1000个图像对比。”比如他自己的团队估算出的数据,大约每3万个星系中就会出现一个。因此,一周无休的情况下也最多只能找出五到六个。相比之下,神经网络可以在短短20分钟之内筛选21789张图片数据库。Petrillo说,这还是一个古老的计算机处理器,但已经可以大幅缩短过程。
神经网络并不像计算机那么精确,为了避免遗漏,它的参数筛选条件并不严格。它会产生761个可能的后选择,再通过人类的方式筛选,最后缩小到56个。这种方法需要人类的进一步观察来配合。但Petrillo表示,其中只有大约三分之一的数据有效。与过去几十年整个科学界发现大约100个引力透镜相比,现在每一分钟就会发现一个。这是一个令人难以置信的提升速度,也是非常完美的方法。
找到这些现象对于天文学的奥秘发现有着重要的意义。宇宙到底是什么构成,我们所熟悉的物质(包括行星、恒星、小星星等)只占宇宙空间物质的5%,而其余不知道成分的物质,占了95%的比例。这包括一种被称为暗物质的假象物,但人类从未直接观测到。相反,我们研究它对宇宙的引力作用,可以作为引力透镜的关键指标。
那么人工智能技术还能做些什么呢?研究人员正在研发一些新的工具。比如Petrillo就在进行类似于身份识别的工作,他对星系进行分类。而还有一些科学家则在帮助梳理数据流,寻找有趣的信号,比如一个神经网络,可以消除来自于无线电望远镜的人为干扰,帮助科学家寻找到更有价值的信号。而更多的应用是用来识别脉冲恒星,定位异常的外行星,或者提高天文望远镜的图像分辨率。简而言之,人工智能还有大量的潜在应用价值。
这次技术爆发的部分原因是由于硬件的发展趋势,是的人工智能的应用更加 广泛。比如大量的廉价计算能力,这也是由于天文学的变化导致。天文学家不再每天晚上“孤单”的观察某个行星,而是用精密的机械装置取代,直接收集来自于太空大量的数据。Williams表示,更好的望远镜和更好的数据库,要比以往任何时候处理的数据都要更多。
分析大量的数据证实人工智能最擅长的工作,我们可以教会它识别方法,然后它就会像一位不知疲倦的助手夜以继日的工作,不用睡觉、始终如一。
至于天文学家们是否担心过于信任一台计算机,但这台计算机缺乏发现新事物、没有人类观察能力呢?Petrillo表示自己并不介意。总体来说,人类要比计算机更容易出现偏见、效率更低、更容易犯错。Williams也同意这样的观点:“电脑肯能会漏掉某些东西,但这种错误的概率并不高。我们只要不断完善步数规则,就不会有太大的风险。”
对一些天文学家来说,人工智能的潜力不仅仅是数据库排查,人工智能还可以用来创造信息,填补我们对宇宙的盲点。
天文学家Kevin Schawinski和他的团队,专门研究星系和黑洞天体物理学,该团队使用人工智能来提高模糊的望远镜图像分辨率。为了做到这一点,团队部署了一种神经网络,可以生成各种数据的变体。它就像一位训练有素的伪造者,可以模仿名人的字画作品。这些网络被称作“对抗者”,可以根据名人的照片制作假面;可以根据声音生成假对话,还有一系列的数据类型。它们是当代人工智能研究最丰富的领域之一,对Schawinski来说,可以获得以前从未有过的信息。
今年年初,该团队发表了一篇论文,展示了人类如何使用GAN来提高太空照片的质量。它们降低了一些无关信息的图像质量,增加了噪点和模糊,然后用望远镜图像上的数据提高关键部位的分辨率,并且将这些图像与原始图像进行对比。结果惊人的准确,足以让Schawinski相信,人工智能有可能改善天文学中的各种数据集。
目前Schawinski对这个项目还保持相对谨慎的态度,毕竟这看起来像是一种违背科学核心的原则,但我们现在只能通过观察的方式来了解宇宙,因此这也是一种比较危险的工具。但正是因为这个原因,我们才可以在某些时候发挥它的功效。当然前提是需要有足够多的训练样本,包括之前从未有过的数据细节。
如果这些方法被证明富有成效,那么就可以出现一种全新的探索方式。Schawinski将计算机模拟结合到一起,虽然现在还为时尚早,但回报潜力非常巨大。“如果已经拥有了这项工具,就可以对现有的条件进行改善,并且提取出更多的科学价值。”
人工智能将会成为科学炼金术,帮助我们将旧转化成新知识,帮助我们探索前所未有的空间。


雷达卡




京公网安备 11010802022788号







