AI可能真的比人更懂这个宇宙

宇宙“创造”了人类,人类创造了AI。但似乎,AI比人类更“懂”这个宇宙。

用AI来帮助有“中国天眼”之称的世界最大单口径射电望远镜FAST更好寻找星星的探星计划启动已过一年,FAST找到了22颗脉冲星候选体。在没有AI帮助时,这很难做到。

去年的世界人工智能大会上,腾讯与国家天文台合作的探星计划宣布正式启动。腾讯优图实验室的计算机视觉技术能力、腾讯云计算及存储能力,将会帮助中国天眼FAST提升脉冲星搜索效率,并辅助快速射电暴和近密双星系统中脉冲星的搜索。

在今年世界人工智能大会的腾讯论坛上,探星计划到目前为止的最新进展首次披露。

腾讯云副总裁、腾讯优图实验室总经理吴运声表示,截至目前,优图AI天体探索方案已从巡天观测数据中找到22颗脉冲星候选体。其中包括在天体物理中具有较高观测研究价值的高速自转的毫秒脉冲星7颗,具有间歇辐射现象的年老脉冲星6颗。

此外,优图实验室的动态谱AI模型还首次探测到了某磁陀星射电脉冲。

这是FAST与腾讯优图实验室连续第二年一同出现在世界人工智能大会上,背后是天文探索与AI的结合愈发紧密。

AI在几十亿张图片中找10颗星星

20171010日,中国科学院国家天文台公布世界最大单口径射电望远镜,也就是被称为中国天眼FAST所取得的首批成果。其中最重要的一项是我国射电望远镜首次发现脉冲星。而最新的公开资料显示,FAST已经捕获了超过660颗脉冲星。

FAST的观测只是发现脉冲星的第一步,这个500米口径的庞然巨物带来的是峰值每秒接近40G的数据量,以多模态的数据形式传输回来。于是一个天文问题被转化成了数据标注问题。如何在海量而极其相似的数据中判断出目标星体的信号,是FAST团队最核心的工作。

图源:贵阳网

这份22颗脉冲星的候选名单中,短周期的脉冲星发现大概是在10颗左右,我们是在几十亿张图片中找到这10颗脉冲星的,复旦大学教授池明旻做了个粗略的比方,她也是探星计划中一位同时拥有计算机和天文领域背景的研究成员。

通过大数据训练,机器学习能为天体探索标注处理掉其中很大一部分一眼假的数据信息,这种能力通过半监督学习来实现。

半监督学习属于无监督学习(没有任何标记的训练数据)和监督学习(完全标记的训练数据)的中间地带。以少量标记数据结合大量未标记数据,在机器学习领域中被认为可以明显提高机器学习的准确性,在对于脉冲星信号数据的辨识中,这些标识数据可以被理解为天文工作者抽取了某些图片预先做了标注,这些标注形成一个初筛的判断标准后会对接收到的所有图片做第一次的过滤。

比如色散值,色散有一个曲线,这个曲线如果没有峰值的话,我们就可以排除掉它是脉冲星的可能,池明旻表示,因此我们在机器学习面有一个色散值的判定标注就非常重要。当捕获的天体信号精度足够高,色散值就可以起到过滤的作用,池明旻说。

色散值是FAST接收到天体数据的其中一个纬度。天体研究中的数据信息往往是跨模态的,这有利于对天体是否是脉冲星的综合判断。腾讯优图实验室提供的AI解决方案中加入了包括频率、色散以及相位的多模态融合的技术,这是腾讯优图实验室为天体探索提供的另一项关键能力。

天体研究非常独特和艰难的地方在于,这是一个统计学几乎无从下手的领域。

根据哈勃太空望远镜2019年以前的观测结果建立的假设是,宇宙共有2万亿个星系,其中小型星系有几十亿颗恒星,大的星系可以包含近4000亿颗恒星,如果以每个星系平均2000亿颗恒星在估计。 全宇宙总共有4千万亿亿颗恒星,而这仅仅是恒星。

除了我们所居住的地球以及已知极其有限的天体外,宇宙中几乎所有空间都藏在未知里,人类对于宇宙的理性认知长期处在极其贫乏的数据基础上。

AI、机器学习当下的应用普遍总与大数据联系在一起,但在天文探索的语境下,这个已知数据的仓库家徒四壁,于是小样本学习(Few-shot Learning被更加重视起来。

小样本学习不是某项技术,而是一种综合的研究方式,指在有限的信息中建立完整的分类模型,并且以这个模型去对未知的信息完成分类。简单来说,一个孩子在看了几张绵羊的照片之后就可以在动物园里认出其他品种的羊,这就是某种通过少量图像识别某个视觉对象的小样本学习概念。

图源:源于网络

这对人类大脑来说轻而易举,但对于机器学习来说却非常困难,但由于天体研究的特殊性,小样本学习又是必不可少的。

腾讯优图实验室总监汪铖杰表示,虽然整体上优图需要处理处理百亿TB1TB=1024GB)的数据量,但实际上其中有效样本很少。现在为止我们用于学习的也就是100TB左右的脉冲星样本,而FAST每天产生的数据量就高于500TB

半监督学习是小样本学习的一个思路,在统计学概念缺乏实际土壤时,以脉冲星样本搭配更多非脉冲星样本来构建训练模型,可以使得机器学习整体在特征提取上更加充分。

除此之外,在这个脉冲心探索的项目中有另外两种小样本学习的具体思路。

一种是数据扩增,即在常规的脉冲星上面做位移的偏移,或加一些宇宙仿真的噪音叠加,通过把观测数据的误差人为地加进去,AI可以将那些疑似脉冲星的图片数据标注出来。

另一种方式是对抗生成式的学习方法,让AI在学习过程中从已有样本中生成新的样本,然后继续用于未来的计算。优图实验室里与FAST合作的算法团队在今年新引进了一位国家天文台的博士后来做小样本学习的模型设计,也是为了在样本数量有限的情况下让模型能进一步契合对脉冲星特性的预测。

M31(仙女座星系)做个例子,到目前为止M31还没有找到任何一个脉冲星,我们可以预测一下它可能的样子,然后大量模拟出数据放到模型里学习,然后用FASTM31观测到的大量数据去比对,因为只要找到一颗,这就是一个从01的突破,汪铖杰说。

宇宙也在“培养”AI

探星计划一年之后,汪铖杰提到了优图实验室与FAST最初结缘的细节。

2019年腾讯宣布企业文化升级,科技向善被提到了显眼位置,那之后优图实验室团队在部门内部做了一次讨论,关于AI在普适化过程,除了一些常规应用外还能做哪些事情。探星计划并不产生任何经济效益,动力在于优图实验室对于AI普世化的愿景。

那场头脑风暴之后排出了一个序列,优先级最高的就是FAST

彼时的优图实验室副总经理黄飞跃带着项目去见FAST团队,两个小时后双方就签订了项目合同。我从来没有见过一个项目这么快就定下来的情况,可见大家对这个项目认可度非常高,池明旻表示。

AI为天文探索带来了效益,天文反过来对AI带去了什么?

汪铖杰总结成三点,技术上探星计划中相当多的数据对于优图实验室本身在研究无监督学习或者异常检测算法等技术上都带来了珍贵的实践经验。并且随着探索脉冲星的积极影响,优图实验室与更多天文领域相关的的合作也已经提上日程。

图源:新发现

最主要的则是探索出了一个AI和天文结合的模式,与基础科学建立联系是AI普适化的一个重要维度。

优图实验室下一个即将开启的探索领域是甲骨文的破译,用AI技术来尝试对甲骨文进行缀合和摹本,为专家提供破译线索,其中视觉AI将试图对甲骨文进行3D建模,以进一步帮助甲骨文的识别与考释。

汪铖杰表示,甲骨文的难度可能会比脉冲星会更高,甚至可能要高出一两个数量级。因为AI对脉冲星探索的帮助更多在效率层面,但在甲骨文这个领域里面已经有好多年没有任何新发现了。

探寻自己能力的边界,这可能是每个人、每个团队或者每家公司都在探究的东西,FAST这个项目实际上是我们朝着自己未知的能力边界迈出的一步。

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/81237

(0)
上一篇 2022年9月6日
下一篇 2022年9月6日

相关推荐

  • 【CIS-Asia 2024】全力以赴,助力化学制药创新发展

    广州2024年9月21日 /美通社/ -- 当前,中国制药行业正经历着快速的发展与变革。随着国家政策的支持和市场需求的不断增长,创新药物的研发和高质量制剂的开发与生产成为行业的关注重点。在此背景下,CIS-Asia 2024 …

    发现 5小时前
    9.4K
  • 复宏汉霖H药 汉斯状®(斯鲁利单抗)获欧洲药品管理局人用药品委员会积极意见,支持其用于一线治疗广泛期小细胞肺癌

    H药 汉斯状®是全球首个获批一线治疗ES-SCLC的抗PD-1单抗 H药 汉斯状®有望成为首个且唯一在欧洲上市用于一线治疗 ES-SCLC的抗PD-1单抗 H药 汉斯状®目前已在中国、印度尼西亚、柬埔寨、泰国等国家获批上市,惠及约80,…

    发现 8小时前
    12.0K
  • 华为全联接大会:All Intelligence成主角,行业数智化大势所趋

    TechWeb 文/卞海川日前,华为全联接大会在沪召开,其不仅展示了华为在数智化领域的最新成果,也深入探讨了企业如何在数字化转型中,数智化带来的价值跃升及实现的技术手段和路径等。智能化时代来临,华为All Intell…

    发现 9小时前
    12.3K
  • 高通被曝洽购英特尔 后者市值不足1000亿美元

    【TechWeb】9月21日消息,据国外媒体报道,知情人士称,芯片巨头高通正在洽谈收购英特尔。如果这笔交易成功,将成为半导体行业最大的并购案之一。不过,外媒称,目前并不清楚双方磋商细节,英特尔目前也未同意并购…

    发现 11小时前
    12.9K
  • 支付宝寻“安心”

    对于支付宝来说,近期有一个好消息,一个坏消息。好消息是,根据中国证券投资基金业协会公布的2024年上半年公募基金销售保有规模百强榜单(简称“基金代销百强榜单”),截至2024年上半年,与支付宝紧密结合的蚂蚁基…

    发现 11小时前
    10.6K
  • 丰巢没有安全感

    曾经“没人看好”的丰巢居然盈利了。为了解决“最后一公里”难题,出现了众多的快递驿站和快递柜。虽然网上对驿站和快递柜吐槽颇多,但事实上,大家还是需要的。以快递柜赛道的龙头企业丰巢为例,截至2024年5月31日,丰…

    发现 11小时前
    10.6K
  • 小杨哥“跌倒”,白牌“没吃饱”

    三只羊直播间的月饼翻车了,带着“疯狂小杨哥”一起翻。直播间里喊着“香港品牌”的口号,却不在香港线下销售,消费者显然不买单了,不仅群嘲“小杨哥的直播间里,唯一的港货是‘曾志伟’”,还掀起了一场“滔天巨浪”,将三…

    发现 11小时前
    11.5K
  • 乐高®品牌"太空灵感库"快闪活动空降成都,开启宇宙灵感探索之旅

    成都2024年9月21日 /美通社/ -- 9月20日,乐高®品牌"太空灵感库"快闪活动登陆成都万象城。此次活动结合乐高集团与先锋艺术家和设计师Pharrell Williams联名设计的最新产品——"跨月狂欢",通过"太空弹珠机"和"宇宙档…

    发现 11小时前
    11.2K
  • On昂跑全国最大门店落地武汉 展现品牌全新面貌

    武汉2024年9月20日 /美通社/ -- 9月20日,瑞士运动品牌 On昂跑 武汉SKP店盛大开业。作为目前全国最大的 On昂跑 实体店,武汉SKP店是品牌立足武汉布局华中市场的重要一步,为华中地区的商业布局、运动消费和生活方式…

    发现 12小时前
    11.6K
  • 雅诗兰黛集团2024年粉红丝带公益活动正式启动

    "同声相应,共生于爱" 上海 2024年9月20日 /美通社/ -- 今天,雅诗兰黛集团作为上海首届国际光影节的合作伙伴,在上海展览中心正式启动「同声相应,共生于爱」2024年粉红丝带公益活动。 9月20日晚,上海展览中心被…

    发现 13小时前
    12.1K

发表回复

登录后才能评论
联系我们
联系我们
分享本页
返回顶部