星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

天文

闷热的中午,古诗教学宋朝秦观的〈鹊桥仙〉结束,距换节还有5分钟。坐最前排的鬼马艾琳握着邻座芬的手,含情脉脉看着芬边吟诵“两情若是久长时,又岂在朝朝暮暮”。我补上一句大姐你莫要中毒太深啊。全班笑翻了。同学们可知道牛郎织女星相距多远?16光年。老师那是什么概念呢?简单来说若牛郎要打无线电话给织女,需要等上32年才有回应。 告诉大伙,实际上织女星与牛郎星都是天空中的恒星,织女与地球相距27光年,牛郎星近一些,也有16光年。意思是光从牛郎星来到地球,要16年4个月。两者的亮度和热度皆比太阳强,我们看了觉得小,那是因为距离远。故喜鹊筑桥是浪漫的传说,若从科学角度来看,那些鸟儿早已BBQ烤焦了。此言一出,大伙乱笑接着哀号老师啊你怎么那样冷冰冰。 小学时期对天文星象异常着迷,举凡报章相关天文现象的报导皆剪下黏在学校旧的作业簿做剪报收集。哈雷彗星人马座流星雨或九星连珠日食月食、火星上发现水源等新闻皆没错过。每天晚饭后陪同老爸散步约一个小时,回到家拿一张藤椅坐在庭院仰望星空。这一看两三个小时,待街坊关灯后浩瀚星光特别明亮璀璨。那时依照图书馆借得的百科全书按图索骥认星座,当然先由腰带3颗星呈一排直线的猎户座开始,接着再大熊座小熊座北斗七星等,常看得忘我,直到老妈在屋里频频催促妹啊你怕我们家蚊子饿死吗,才依依不舍回到屋里去。 人小小志愿大,小学时级任老师填写全班的志愿卡,志愿一栏一直是天文学家,唯自升上高小发现自己对数目字特别迟钝,永远搞不清千丝万缕的数字关系,数学特差一直到中学毕业没及格过读理科班无望,这梦想方作罢。 香港作家西西花5年时间书写的最新著作《钦天监》,故事特别。以皇帝为主角的小说读过不少,写皇帝身边的天文部门官员的则是第一回读到。透过西西笔下主人公周若闳与妻子的求学经过和日常生活及工作细节,我仿佛回到从前清朝初期的都城,穿梭在北京紫禁城与街道与周边钟楼鼓楼,一窥当时人们的生活琐碎细节及食物娱乐建筑民情等,还有故事主人翁的如何绘制观星图,上至天文下至地理,读得我手不释卷废寝忘食。 天上的星就是地上的人 十多年前岁末长假曾独游北京背包一个月,细雪纷飞的冬天,我细细走名人故居逛故宫及周边景点,北京古观象台当是我这天文迷必清单首榜。那8架历史悠久异常珍贵,建于康熙初年至乾隆初年的天文仪器天体仪、六分仪、赤道经纬仪等印象深刻历历在目,自己还在馆外苍劲的古槐树旁不知谁人堆的雪人旁拍照留影,记得那时花整整一天游走观星台。如今读着西西的文字,旅途中的吉光片羽再次流转。这是阅读的珍贵收获和体验。 隔周华文课,带上《钦天监》书本向大伙简介。播放北京背包游投影照片,大伙看到紫禁城哗然声连连,老师这建筑群好有气派啊。和大伙说我足足花了3天,每天最早报到然后最后一个离开,细细走慢慢看,少年人下巴几乎掉下。老师不会闷啊每天走同样的地方? 我打开书本夹着书签那页,娓娓念来“天子既然是人间的紫微星,在天上受北斗七星围绕,那么在人间的住所也当然对应成为禁区。地方阔大,根本就是一座城,所以叫紫禁城。 星空的世界如同人间世界,既有帝王将相,也有河船桥路。天上的星就是地上的人,一颗星是一人,或一物。一般人的星不为人所见,因为太卑微了。只有帝王将相的星象,才特别光亮,乃是紫微星。紫微星恒久发光发热,若是暗晦起来,必定大事不妙。” 告诉大伙西西的书本知识性特丰富,每次读完她的书,可以学习很多新领域的知识,最后将书本借给同学让大伙传阅。 下课前大伙问老师您相信星座吗?那些星座的性格和适合的行业以及每日或每月运程?有时读到报章上的每日运程很准呢。告诉少年人,源自古希腊时期的星座划分是当时人们用来占卜和预测未来的参考;而星座拥有自己独特的性格和象征意义。虽说星座可以帮助我们更好处理人际关系及了解自己的性格特点,唯它不是决定我们人生的唯一因素。每个人的成长背景生活经验还有价值观等迥异,自身的努力和行动是更加决定人生的重要元素。 与大伙约好——毕业离校前,找个天气晴朗的深夜,到学校操场观星。此言一出,少年人欢呼。生活,总该有些期盼的,不是吗?
1年前
当OpenAI发布了ChatGPT,那个月简直不要太疯狂。事实上,业内早有大型语言模型在测试中,但都等待着一个先行者。OpenAI勇敢地走在了前列,行业巨头如谷歌都hold不住了,紧随其后发布了自家的Bard模型。 在Bard的示范中,它回答了这样一个问题:“如何向我的9岁孩子解释詹姆士·韦伯望远镜的某个发现?”Bard说:“韦伯望远镜拍下了第一张太阳系外行星的照片。”虽然听起来感觉没问题,但如果Bard读过《星洲日报》的专栏,就会知道这是错的。尽管韦伯望远镜主要用来研究太阳系外的行星和它们的大气,并拥有高清成像功能,但首张行星照片的记录其实是20年前的事。(20年前,“自适应光学”Adaptive Optics开始在天文领域流行,尤其应用在8-10公尺的大望远镜上。这技术为望远镜提供了“降噪”功能,通过调整镜片消除大气扰动,使我们能更清楚地观测远方的行星。) 当Bard的这一错误被揭露后,资本市场对谷歌这类大模型的信心大受打击,谷歌市值蒸发了千亿。 深入机器学习:训练大型语言模型的机制 那么,为何Bard会犯下这种“幻想”(即一本正经胡说八道)的错误呢?要理解这一点,我们首先得了解这些模型的训练机制。前文曾经提过,机器学习和传统编程不同的地方在于:我们不再逐个给机器下命令,而是让机器自己从数据中发现规律。 实际上,机器学习语言的方式跟我们小学的文字游戏很像,即从网络上的大量文本中挖掉一些词,然后尝试填补空白。例如,“(某某)是马来西亚的第十任首相”,或“(某某)是马来西亚的传统美食”。在这过程中,每个句子里的关键词都有可能被隐藏,模型的任务就是要猜测这些空格的内容。有时候,一个空格可能有多个合适的答案,因此机器不仅要给出答案,还要给出各种答案的可能性。 看起来简单,但是模型可以通过这种方式学习到很多东西。就像我们小时候在各种科目做的填空题,虽然填空,但每门课教给我们的东西是不同的,比如语文教我们语法;历史教史实;数学教逻辑。同样的,机器也在大量数据中努力学习,仿佛不停地刷题。 大型语言模型就像云顶高原的老虎机,每次“摇动”都产生不同的输出。通过大数据训练,我们就像在老虎机上作弊,使得它的输出更符合我们的预期。 超越ChatGPT:开源模型的多样化应用 了解这个概念后,你就能明白为什么Bard突然短路了。詹姆士·韦伯望远镜有很多“第一”,它确实重点研究太阳系外行星并拥有先进的成像技术,但把这些信息组合起来却反而不对,这就像有人问你在马来西亚应该吃什么,你回答“Roti Canai夹榴梿配 Laksa。” 虽然当前的AI仍然会犯一些低级错误,但是大语言模型的应用不仅仅局限于简单地使用ChatGPT,要知道ChatGPT只是众多大型语言模型中的其中一个。虽然OpenAI已经不再 Open(开源),但众多模型包括脸书Meta的LLaMa模型系列仍是开源的,而这些开源的模型允许我们在这些训练模型的基础上进行微调,进而释放更多潜力。 这好比你已经有一群优秀的大学毕业生,虽然他们不一定会有特定领域的专长,比如说天体物理的一些特定知识,但如果可以让这些模型再“进修”,那么它就可以发挥更大的能量。 这正是我的研究团队正在探索的其中一个方向。 让AI看懂30万篇天文论文 最近我们的团队对这些开源模型进行了微调,利用过去30年天文科学期刊发布的大约30万篇文章对其进行训练,训练方法和上述说的文字填空和接龙是一样的。当然,这里对于模型的训练还包括我们的一些小巧思。比如说让两个语言模型“对战”,其中一个模型扮演学生回答天文问题,另一个则扮演教授点评学生的答案,两者互相竞争。(这里就不谈技术细节了) 其实我们一开始也没底,就觉得可以试一试。模型的表现确实让大家很震惊,比如说我们尝试用AI生成天文学博士论文的研究方向,并请天文物理学家评分。评分结果显示,AI生成的论文题目在专家眼中甚至优于一般天文物理博士生能够提出的论文方向,一些同事不禁戏称:“真的不能让你继续搞下去,不然我们都失业了。” 必须说明的是,我们的目标并非取代人类工作,但我们必须接受的是,在这个新的时代里,AI生成的答案已俨然成为了评价的基线,只有超越AI的答案才被视为有价值。虽然这么说感觉有点残忍,但这未尝不是好事,因为AI把所有人的基准能力都拔高了一个纬度。要知道每个人都有自己的特长,而这些特长大概率还是比目前的模型更好,但是模型却可以补足每个人在其他方面的短板。 比方说,我以前觉得自己做研究还可以,但比较苦恼的是如果要我用英文写期刊文章,我就觉得对我这种非英语母语的人特别吃亏。虽然现在的模型不见得能写出媲美狄更生和王尔德的大作,但我却可以享受着类似用母语写作的畅快。 AI:平等的桥梁与公正的裁判 从宏观角度来看,我乐观地认为无论是回顾历史还是展望未来,这些AI模型将促进人与人之间的平等,并为弱势群体创造更多机会。 比如说,以前我们时常依赖某些指标,例如论文的被引用次数来评估一个人对于某个领域的贡献,但学术界其实并非完全公正。有时候,一些普通的论文莫名火起来,而其他有价值的论文却可能因为种种原因被埋没,所以这些指标往往并不能很公平地去评断一篇学术论文的价值。而我们的研究团队正在研究的其中一个方向,就是用我们微调后的模型去读遍所有论文,忽略人为的主观评价,客观地分析所有文章,从而找出任何一个能推进这个领域的真正先驱。 至于展望未来的部分,AI也只会让科技更加平等与开放。以天体物理为例,这是一个高投资的研究领域,可惜绝大部分的人再有才识也可能只屈就于一些岗位上,找不到人去交流。但微调后的大型模型可以独当一面,能力未必比各个领域的博士们差,可以成为弱势研究者的研究伙伴,不让个人际遇妨碍他们的成就。这也是我们团队做这项研究的最大初衷,而我们的团队也逐步在网上公开所有AI生成的天体物理博士论文方向。 还记得IBM的深蓝吗? 有人说,AI的出现是人类的消亡,可是要知道这种论述在历史上从来没有断过,但是也从来没有预言成真过。 还记得IBM的超级电脑深蓝曾经击败国际象棋大师卡斯帕罗夫吗?当时有人悲观地认为国际象棋已经结束了,但在二十多年后的今天,人们反而可以在任何地方、任何时间和AI对弈及学习,我们看见的是国际象棋更加昌盛,在很多非传统强国也是遍地开花。 更多相关文章: 【代码之外】丁源森/做AI时代里的 六边形战士 【代码之外】丁源森/论AI的养成与黯然销魂饭  【代码之外】丁源森/AI、ChatGPT与我妈的扫地机器人
1年前
2年前
2年前
韦伯是什么? 如果你是天文学迷的话,你一定还记得去年的盛事,那就是韦伯望远镜成功升空,成为天文界最新的宠儿。比起勤勤恳恳工作数十载的哈勃望远镜,韦伯望远镜更具优势,笔者也就不跟大家哈拉,上来直接给你们硬核的。 韦伯的半径是哈勃的3倍。因为采光的速率和镜面的面积成正比,所以韦伯的效率约为哈勃望远镜的10倍,即一个哈勃需要花10年去干的活,韦伯只需要一年就“搞定”。更重要的是,哈勃主要的观测波段是紫外线和可见光,而韦伯观测波长较长的红外线。韦伯当初设计时采取红外观测的主要考量,就包括了目前天文界比较火爆的两个课题——寻找太阳系外的生命,和寻找最古老的星系。 寻找系外生命 关于前者,天文界寻找外星文明的主要手段是仔细刻画太阳系外行星(简称系外行星)的大气——看看那些类似地球的行星中有没有一些有机气体和水分。而韦伯在这里发挥的作用是巨大的。要知道水分在大气中主要“发光”的波段为红外线,但是地球的大气水分同时也大量地吸收红外线,所以地球上的天文仪器很难去捕捉系外行星红外的波段。由于韦伯发射在地球之外,不会被地球大气所“蒙蔽”,因此也成为了少数可以去研究系外行星大气的仪器。 而现在实测下来也确实如此。要知道当初韦伯的第一次成果发表会,NASA发了5个结果 “秀秀肌肉”,就展示了韦伯能够精确无误探测到系外行星的水气。当然了,那个结果并不意外,因为我们之前就通过一些手段知道该行星是有水分的,不过因为那个行星并不在适合生命发生的宜居带,所以这个结果也只是实测一下韦伯的能力。但即便如此,笔者当初在线上观看这个“直播”时也是被震掉了一个下巴。依韦伯的这个实力,估计找到在宜居带且有水分和有机气体的行星也就是10年以内的事了。 寻找最古老的星系 不过除了寻找系外生命,韦伯的另一个主要突破点,如上所说,是寻找宇宙中最古老的星系。这里请跟随笔者一个比较绕的逻辑链。宇宙里最古老的星系也是离我们最远的星系,这是因为光“只能”以光速传播。比如说,太阳离我们有大概8“光分”,即光需要8分钟才能从太阳抵达地球。但是换一个说法,我们现在看到的太阳并不是现在的太阳,而是8分钟前的太阳(是的,如果太阳现在爆炸了,你还有8分钟能活)。 以此类推,如果一个星系离我们130亿光年,它们的光在宇宙中传播了约130亿年(这里稍微不准确,应为精确的算法还需要涉及宇宙的膨胀)才抵达我们,也就是说我们现在接受到的关于这些星系的照片,是宇宙130亿年前的情况。简单扼要地说,只要找到越远的星系,他们对应的也是最古老的星系。 可是如何找到这些遥远的星系呢?这里,宇宙的膨胀又帮上了一个大忙。由于宇宙一直在膨胀,因此当光运行的时候,它们也会不断地被时空拉长——可见光会被“拉扯”成红外线。而因为越遥远的星系的光要运行得更久,一般的星系发射的光大部分都在可见光的波段,所以如果它们是遥远的星系,它们现在就会呈现成一个主要在红外波段发光的天体。 笔者绕了九转十八弯,简单扼要地说,只要我们能找到在韦伯(红外线)能观测到,而比如说哈勃(可见光)又看不见的星系,这些都有可能是最古老星系。 韦伯的意外发现 在韦伯还没发射前,透过哈勃我们知道的最古老的星系约为宇宙大爆炸后4亿年的星系,而且就只有一个。而韦伯发射后,天文圈的“考古队”真是内卷得不可开交。就一两周的时间,多个团队陆续发表已搜索到“一打”比5亿年还年轻的星系,而且刷新了之前的纪录。现在最古老的星系约为3亿年。笔者的一些同事都是没日没夜地卷。 这样刷榜可能看起来没什么营养,但其实不然。这个发现可以说是天文界的一个震撼弹,笔者这里震掉的就不止一个下巴了。 天文圈之前虽然知道韦伯必然能超越哈勃找到更古老的星系,但这个成群的发现其实是远超乎预期的,主要因为宇宙这么早期就出现“星系婴儿潮”实际上违背天文其他的一些观测,比如说所谓的宇宙再电离现象。简单说,如果有大量的早期星系,他们的辐射应该会将宇宙早期的气体(比诺兰更高级的“Intergalactic” medium) 造成一定的影响,而这个和现在对于再电离的研究还是有点分歧的,因此韦伯前几个月的观测迫使了天文学家再次审视关于星系形成和演化的理论。 韦伯真的要來了 说到这里,就要回到笔者的标题党。不说你不知道,一说你吓一跳。 笔者将在吉隆坡(2月6日到10日)组织第一次,由国际天文学联合会(International Astronomical Union, IAU)冠名的天文会议(详情浏览 jwstmalaysia.com)。这项会议将迎来许多天文界国际大腕,重点讨论韦伯的发现和关于古老星系的形成,届时将有八十多个演讲和170个与会者。这项会议也是IAU第一次在马来西亚的会议,上一次IAU在东南亚的会议还得追溯到30年前在印尼的会议了。 虽然这个会议的对象是天文界的科研工作者,不过为了让民众共襄盛举,我们也特别邀请3位天文界大腕在2月8日(星期三)下午两点半,在马来亚大学公开演讲,这场活动免费且完全对外公开,不管你是男女老少,懂不懂天文,爱不爱天文,都欢迎前来感受天文的美。有兴趣的人请到jwstmalaysia.com点击“Public Talk” 登记。 号外 笔者两年前还常常在星洲日报《活力副刊》和大家聊天文,本以为休息一段时间后再执笔,可是这两年一直都搁着,因为工作确实比较忙,要带十多人的科研小组,还要写企划书找经费写得头顶冒烟,以及组织这个会议(其实还有一个同其他大马天文学家组织的2023年全球大马天文学家大会GMAC),搞得笔者这两年都一直处在爆肝状态,所以就没更新专栏。 不过,如果这次在吉隆坡的天文会议能够点燃大家对于大自然的兴趣,那已足矣。 作者丁源森现任澳洲国立大学天文系与电脑科学系副教授,主要研究方向为人工智能在天文中的应用。他是吉隆坡中华独中校友,2017年哈佛大学天文系博士毕业,后为NASA哈勃学者、普林斯顿大学及普利斯顿高等研究院博士后研究员。   更多文章: 【研究故事】利用真菌修复被污染的土壤 2青年为少数民族室内设计夺金奖 2022年USAHA TEGAS文化遗产美术赛:学生结合经验及想法,画出独有文遗创作 绘画,是21岁的她在俗世中唯一念想
2年前
3年前
3年前
3年前