18歲天才高中生,利用AI竟發現了150萬個隱藏天體,震驚全球。這篇獨著論文已登上天文學頂刊,或將助力探索宇宙起源之謎。為此,他斬獲了25萬美元科學競賽大獎,直通斯坦福。
在NASA的2000億條數據中隱藏著150萬個未知天體,而揭開它們神秘面紗的,竟是一位美國高中生!
他就是Matteo Paz,來自加州南帕薩迪納高中的天才少年。
基于加州理工學院的研究,Matteo挖掘了美國國家航空航天局(NASA)某項任務「沉睡的數據」,并以獨著身份在天文學頂級期刊發文。
憑借這項成果,他直接拿下了Regeneron科學人才搜索競賽競賽的25萬美元獎金。
2025年3月11日,Matteo Paz與加州理工學院院長Thomas F. Rosenbaum在Regeneron科學人才探索獎頒獎典禮上的合影。
目前,這項研究已于去年11月發表在《The Astronomical Journal》上,并在文中作了詳細闡述。
不過,該論文中并未提及的是,唯一作者只有18歲。
150萬潛在天體,
18歲拿下25萬美元獎金
近日,來自美國加州的18歲高中生Matteo Paz,憑借將機器學習與天文學巧妙融合的卓越研究,在2025年Regeneron科學人才搜索競賽(Regeneron Science Talent Search,簡稱Regeneron STS)中力壓群雄,斬獲一等獎,并將25萬美元獎金收入囊中。
2025年Regeneron科學人才搜索競賽獲獎者,中間為Matteo Paz
Regeneron科學人才搜索競賽始于1942年,被譽為美國「歷史最悠久、最具聲望的高中生科學與數學賽事」,最初名為西屋科學天才搜索(Westinghouse Science Talent Search),旨在表彰并賦能那些有潛力的年輕科學家。
他利用AI,處理了來自NASA的2000億條數據,揭示了150萬個先前未知的潛在天體。
在2013年12月,NEOWISE發現的第一顆近地小行星的運行軌跡,紅色點表示移動路徑。
接受采訪時,Matteo Paz坦言:「能參與競賽已是榮幸,從闖入前十到最終奪冠,驚喜接踵而至,至今仍覺得像在做夢。」
Matteo Paz站在后排,對自己獲得第一名的成績感到震驚。
在贏得25萬美元獎金后,Paz的下一個征途是大學。
他表示,自己已被斯坦福大學錄取。
就在參加頒獎典禮的幾周前,Paz在帕薩迪納的家中醒來,透過窗戶看到外面烈焰翻騰。
伊頓山火(Eaton Fire)蔓延得極快,以至于他未收到任何官方警報。
伊頓山火(Eaton Fire)于2025年1月7日傍晚爆發,在天氣影響下,火勢迅速蔓延,共造成至少18人死亡,摧毀了9,000多座建筑,成為加州歷史上死亡人數第五高、破壞程度第二嚴重的野火
在疏散和數日的火情之后,他的家最終幸免于難。
這讓他有了新的視角。
現在,他正在思考是否有可能將一臺紅外望遠鏡送入地球軌道——這次是為了監測地球本身的新發火災。
不過,眼下他更希望利用他在NEOWISE數據中的研究成果,探索宇宙從大爆炸以來的神秘膨脹速度,幫助科學家解開宇宙學中最大謎題之一。
「這項工作要么能幫助解決當前研究中一個極具爭議的問題,要么將揭示一些關于宇宙起源的真正基礎性的東西。」
「追星」路上,偶得名師
早在小學時期,Paz對天文學的熱愛便已萌芽。
那時,母親常帶他參加加州理工學院的公眾觀星講座(Stargazing Lecture Series),璀璨星空就此在他心中種下探索的種子。
2022年夏天,他走進加州理工學院,在Andrew Howard教授領銜的行星探測器學院(Caltech Planet Finder Academy),系統學習天文學與相關計算機科學知識,開啟了更深入的學術探索之旅。
天文學教授:Andrew Howard
2023年,他參與了加州理工學院為期六周的暑期研究計劃(Summer Research Connection,SRC)。
該項目由教學、學習和推廣中心運營,旨在為當地高中生匹配校園實驗室導師,支持學生開展科研實踐。
加州理工學院2023年Kirkpatrick小組SRC項目匯報
天文學家和IPAC高級科學家Davy Kirkpatrick擔任Paz的導師。
在過去的五年里,除了本科生、公民科學家和來訪的研究員之外,Kirkpatrick還指導過高中生。
天文學家:Davy Kirkpatrick
Paz很幸運地遇到了導師Davy,Davy給予了他充分的自由和支持。他回憶道:
我記得在我們第一次交談時,我提到自己的目標是發表論文,這個目標遠遠超出了六周項目的周期。他非但沒有勸阻,反而欣然回應:「好的,那我們來談談吧」 。
在研究過程中,他為我提供了充分的自主探索空間,而正是這種自由,使我在科研道路上得以迅速成長。
Kirkpatrick成長于田納西州的農業社區,在九年級化學與物理老師Marilyn Morrison的助力下,圓了天文學家之夢。
Morrison老師向他和母親點明其天賦,并悉心指導升學所需課程,為大學深造鋪路。
如今,Kirkpatrick希望將老師當年的指引傳遞下去,他表示:「一旦發現別人的潛力,我一定會全力幫助他充分發揮出來。」
2025年Regeneron科學天才搜索一等獎得主Matteo Paz手持獎杯
但Kirkpatrick希望從NEOWISE(近地天體廣域紅外探測器)項目中獲取更多有價值的信息。
巡天功臣,澤被后代
NEOWISE是NASA已退役的紅外望遠鏡。
在服役的十多年間,它不間斷地掃描整片天空,專注搜尋地球附近的小行星及其他天體。
NEOWISE在2024年底重返大氣層并安全燒毀
雖然NASA的NEOWISE望遠鏡以觀測小行星為主要任務,但在運行期間,它還敏銳捕捉到遙遠宇宙物體的熱量變化。
這些天體有的會發出強烈閃光或脈動,有的在相互遮掩時會出現亮度衰減,反映出宇宙天體運動過程中的多樣性和復雜性。
天文學家將這些亮度變化的現象統稱為變星,其中一些類型如類星體、超新星和互相遮掩的雙星系統,因其變化不易捕捉而尤為復雜。
模擬的雙星系統亮度變化
然而,這些關于變星的數據尚未得到充分利用。
當時,團隊已積累超十年的探測數據,總數據量接近2000億行。
2024年,NEOWISE團隊公布了項目的最終數據和未發現圖像
Kirkpatrick的設想是:
在夏天先選取一小塊天空進行分析,看看能否從中找到一些變星。
然后,我們再向天文界展示這些成果,告訴他們「這是我們親自發現的新事物,想象一下整個數據集蘊含的巨大潛力吧!」
AI下場,大顯身手
面對NEOWISE近2000億行的海量數據,Paz并未選擇手動篩選,而是憑借在校積累的知識另辟蹊徑。
在一門融合了編程、理論計算機科學和數學的選修課上,他對AI產生了濃厚的興趣。
他深知,AI在大規模有序數據集上訓練效果最好,而導師Kirkpatrick提供的數據恰好滿足這一條件。
幸運的是,他完成了AP微積分(Advanced Placement Calculus)BC課程,具備了開發機器學習模型所需的數學能力。
2014―2018年天文學中應用深度學習的論文研究主題和各主題數量趨勢
在那六周里,他開始構建AI模型,該模型初見成效。
研究期間,Paz常向Kirkpatrick請教天文學與天體物理學知識。
談及這段經歷,他總是難掩喜悅:
每次和Davy見面,我們只有10%的時間在討論工作,剩下90%的時間都在閑聊。能有這樣一個人可以一起暢談科學,真是太棒了!
Kirkpatrick還將Paz介紹給了加州理工學院的天文學家Shoubaneh Hemmati、Daniel Masters、Ashish Mahabal和Matthew Graham。
他們在天文學中的機器學習應用,以及不同時間尺度下變星的研究方面,為Paz提供了寶貴的專業知識。
Paz與Kirkpatrick意識到,NEOWISE的觀測方式存在局限性,難以有效檢測和分類那些快速閃爍或緩慢變化的天體。
夏天結束后,還有很多工作要做。
第二年也就是2024年,Paz和Kirkpatrick再次合作。
現在,Paz已經改進了AI模型,用于處理來自NEOWISE觀測的全部原始數據,并分析了結果。
現在,Paz已經改進了AI模型,用于處理來自NEOWISE觀測的全部原始數據,并分析了結果。
Matteo Paz于2023年的研討會上展示了他的初步研究成果
他補充說,加州理工學院的研究人員已經開始使用帕茲編制的潛在變星體目錄——VarWISE,用于研究雙星系統。
在2025年,Paz和Kirkpatrick計劃發布包含NEOWISE數據中亮度變化顯著的天體的完整目錄。
AI+天文學:全新方法
Matteo Paz設計了一套處理流程,從NEOWISE數據中提取變星候選體。
以前的方法在檢測周期性信號方面非常有效,但它們在處理WISE如此大規模數據(高達數十千億行)時速度極慢,幾乎無法在實際中使用。
而Paz采用的全新機器學習模型,卻能在現實可行的時間范圍內解決這一問題!
它的目標就是,分析天空中任意天體的光變曲線,并將其分類為靜態源、新星/明亮瞬變源、雙星系統或脈動光源。
具體來說,Paz采用卷積操作和變換技術來提取高細節特征,讓模型能夠有效檢測到周期性和非周期性的亮度變化。
對于每條約含2000個數據點的光變曲線,在一張22GB顯存的GPU上,VARnet處理速度大于53微秒/天體。
但訓練VARnet需要大量訓練數據。為此,Paz專門為每類目標光源開發了一個精準的合成光變曲線生成器,以便為這一復雜模型提供無限量的訓練樣本。
生成一條完整的合成光變曲線樣本的步驟如下:
1. 構造一個基礎亮度函數f(t)
2. 按照WISE的觀測節奏(采樣間隔)對該函數進行采樣
3. 加入高斯噪聲 ,其中噪聲方差為亮度函數的某種函數形式
偽代碼詳見算法2。
這一方法論(見圖1)實現了極快的運行速度,并在測試集上表現出高精度和強性能,最終生成了高質量的異常目標列表。
原文圖1:異常檢測流程示意圖
整個流程如下:
(1)收集并預處理數據
采用基于密度的方法,對單次曝光源目錄中的天體顯現(apparitions)進行空間聚類,以及一系列數據變換,提高數據質量。
VARnet使用一維小波分解來最大限度地降低異常數據對分析結果的影響,并對離散傅里葉變換(DFT)進行了創新性的改進,從而快速檢測周期性并提取時間序列特征。
VARnet將這些特征分析整合,利用機器學習實現對天體類型的預測,主要依賴卷積神經網絡。
VARnet模型的完整結構
VARnet模型的完整結構如上圖所示。
整個模型統一采用ReLU激活函數,開始包含三個卷積層,用于處理信號,并將其壓縮為三通道,送入傅里葉特征提取模塊。在模型實際運行中,最終的輸出向量會經過softmax操作,使預測結果可以被解釋為概率形式,并按置信度進行排序
他還驗證了,VARnet對已知及新發現的變星源均具有高度的敏感性與準確性。
果然,VARnet產生了一些有趣的探測結果!
首先,它以極高的置信度,恢復了許多已知物體。
而且,VARnet還發現了全新的天體。
位于J2000赤經/赤緯1.53483°,−59.08751°的天體,就被VARnet標記為變星候選體。經檢索發現,該天體在現有文獻或任何星表中均無相關記錄。
甚至,模型還發現了一顆超新星!
2023年6月,該天體曾出現快速變亮的現象;而在WISE的下一次觀測中,其亮度又恢復至平均水平(見下圖)。
在對瞬變事件目錄進行檢索后,可以發現,該事件與AT 2023lkp的觀測記錄相符。
考慮到該事件的持續時間及其起源于該星系的事實,Paz等人判斷:這很可能是一顆超新星。