楼主: 时光永痕
813 0

[数据挖掘新闻] 机器学习和对 ET 的搜索 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

10%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2022-3-17 11:32:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
机器学习和寻找外星人


在过去十年中,使用 ML 进行系外行星探测呈指数级增长。
CNN 正在识别更多类似地球的行星。
如果我们确实找到了外星生命,那将是在人工智能的帮助下。
如果地球以外有生命,那么它将在系外行星上找到——这些行星围绕着我们自己的太阳以外的恒星运行。系外行星的数量被认为数以万亿计 [1],但尽管来自开普勒、K2 和 TESS 等系外行星探测任务的大量数据,但只有几千颗潜在的系外行星得到了证实。最大的问题是信息过剩。2018 年发射的 NASA 凌日系外行星调查卫星 (TESS) 任务 [2] 每天收集大约 30 GB。这为天文学家提供了海量数据进行分析。候选恒星的数量达到数百万,这使问题变得复杂,并导致太多候选系外行星在没有 ML 帮助的情况下无法管理。

除了信息过载之外,另一个障碍是如何识别系外行星。TESS 任务的目的是通过监测附近恒星的亮度变化来寻找系外行星。然而,亮度变化不容易分类;来自恒星的光比围绕轨道运行的昏暗行星要亮 1000 万到 100 亿倍 [3],这使得它们的识别成为天文学家面临的一项重大挑战。另一个问题是误报的挑战。当恒星旋转时,恒星表面的星点和颗粒等恒星活动会产生与环绕岩石行星产生的“摆动”相同的“摆动”。这种现象在人手分类时会产生许多误报[4]。

所有这些问题的解决方案是机器学习,它可以自动执行系外行星探测任务。机器学习与天文学的进步保持同步——改进的算法、非专家的可访问性以及通过云计算和虚拟化提供的巨大计算能力。这为两个学科的合作创造了一个理想的环境。

机器学习进入

在过去的几年中,出现了各种自动化系外行星检测的机器学习方法。  Autovetter由 McCauliff 及其同事于 2015 年首次开发 [5],是使用 ML 识别系外行星的首次尝试。Autovetter 使用随机森林结合手动标记的示例来学习并将候选事件分为三类:

行星候选(PC),
天体物理假阳性 (AFP),例如非凌日双星。
非过渡现象 (NTP),例如仪器噪声。
Shallue 和 Vanderburg [6] 使用了一个名为Astronet的深度卷积神经网络 (CNN) 分类器,该分类器是开源的,可在 github [7] 上获得,以提高系外行星搜索的速度和灵敏度。CNN 接受过训练,可以将来自 Kepler 或 TESS 的信号分类为系外行星或误报。

上图来自 Shallue 和 Vanderburg 的研究,是他们的 CNN 嵌入其输入光曲线的 2D 几何空间的可视化。真正的行星候选者是蓝色的,误报是红色的。Astronet 继续发展;2019 年,AstroNet-K2 使用 NASA 的开普勒太空望远镜发现了两个新的“超级地球”[8]。2021 年创建了一个按比例缩小、更精确的 CNN 模型,其可训练参数比 Astronet [10] 少 8 倍。希望这些按比例缩小的版本可能能够在资源受限的环境中实施。

许多其他研究已将 ML 应用于寻找系外行星的问题,并取得了不同程度的成功。Chaushev & Raynard [9] 将 CNN 应用于来自下一代交通调查 (NGTS) 的数据。位于智利北部阿塔卡马沙漠的这种基于地面的系外行星机器人搜索已经确定了几颗新的系外行星。

下一步是什么?

寻找生命始于寻找系外行星,然后将范围缩小到“宜居带”中的那些行星,简而言之,在这里你会发现液态水。从那里,航天器可以被派去分析大气,也许会发现类似地球的大气的迹象——氧气、二氧化碳和甲烷的混合物将是可能存在生命的强烈迹象。对来自系外行星的光进行分裂和分析的过境光谱学也可以提供有关这些行星上的气体和化学物质的信息,包括那些与生命的可能性有关的信息。[11] 由于这涉及到大量的分类和搜索数据,如果我们真的找到了生命,那将是在人工智能的帮助下。

编辑推荐
1、2022年300个以上最佳免费数据科学课程
2、大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、机器学习模型方法总结
4、历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、机器学习如何应用于商业场景?三个真实的商业项目
6、数据工作者的自我修养 | 哪些技能是必不可少的?
7、《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、文本挖掘常用的107个语料库
9、一图读懂“东数西算”工程
10、零基础转行数据分析,看这篇文章就够了

DA内容精选

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 kepler GitHub astro Shall

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-31 07:48