精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)

發(fā)布于 2025-9-17 07:36
瀏覽
0收藏


能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

谷歌全新人工智能系統(tǒng)將大型語言模型(LLMs)與樹搜索(Tree Search)技術相結合,實現(xiàn)了專家級科學軟件的自動化創(chuàng)建。通過將研究重構為“可評分任務”,該系統(tǒng)在生物信息學、流行病學和神經(jīng)科學領域展現(xiàn)出超越人類的性能,預示著加速科學發(fā)現(xiàn)的新時代到來。

假設你是一名科學家,正凝視著屏幕。你的目標是研究亞馬遜雨林的森林砍伐問題——你已掌握拍字節(jié)(PB)級別的衛(wèi)星數(shù)據(jù),但要將這些原始數(shù)據(jù)轉化為可靠的“森林砍伐檢測工具”,還需要專門的軟件支持。這絕非普通軟件,而是實證軟件(empirical software) ——一組復雜的代碼組合,需經(jīng)過精心設計,以最大化單一可測量的質(zhì)量分數(shù)。從數(shù)據(jù)預處理到模型架構,每一個選擇都如同道路的岔路口,而可供選擇的路徑幾乎無窮無盡。

你該如何選擇?

數(shù)十年來,答案始終離不開深厚的領域專業(yè)知識、直覺判斷、有根據(jù)的猜測,以及耗時費力的反復試驗。這一過程——即實證軟件的人工創(chuàng)建過程——是制約現(xiàn)代研究發(fā)展的“隱形痛點瓶頸”。它效率低下、枯燥繁瑣,且嚴重受限于人類的能力邊界:我們只能探索極小部分可能的解決方案。

若能改變這一現(xiàn)狀呢?若能構建一個不僅能協(xié)助科學家,還能主動代其探索這片廣闊可能性空間的系統(tǒng)呢?

谷歌團隊發(fā)表的一篇突破性論文《一款助力科學家編寫專家級實證軟件的人工智能系統(tǒng)》(“An AI system to help scientists write expert-level empirical software”),恰好揭開了這類系統(tǒng)的面紗。這并非人工智能輔助編碼領域的又一小步迭代,而是人類探索計算科學方式的根本性范式轉變。該團隊開發(fā)的人工智能系統(tǒng)能夠系統(tǒng)性地自動生成科學軟件,且在眾多學科領域中,其性能不僅能與人類持平,還能持續(xù)超越人類專家。

接下來,我們將深入探討谷歌如何打造出這款能夠加速科學本身發(fā)展的人工智能。

科學領域的隱形瓶頸:實證軟件的“創(chuàng)建之痛”

在深入了解谷歌的解決方案前,我們首先需要認清問題的嚴重性。如今,從基因組學到天體物理學,幾乎所有學科都依賴軟件來驗證假設、實現(xiàn)發(fā)現(xiàn)。其中大部分軟件被論文稱為“面向可評分任務的實證軟件”。

可評分任務(Scorable Task):指可通過明確指標衡量解決方案質(zhì)量的科學問題。例如,預測新冠病毒(COVID-19)住院人數(shù)就是一項可評分任務,其中“加權區(qū)間分數(shù)(Weighted Interval Score,WIS)”即為質(zhì)量指標。而用于實現(xiàn)該預測的軟件就是實證軟件。

創(chuàng)建這類軟件堪稱一項“赫拉克勒斯式的艱巨任務”。盡管實證軟件曾助力化學、蛋白質(zhì)折疊等領域取得諾貝爾獎級別的突破,但其創(chuàng)建過程始終停留在“手工匠人式”的階段。科學家們往往被迫基于直覺或便利性做出無數(shù)設計選擇,而非通過全面的實驗驗證。

  • 我應選擇哪種統(tǒng)計模型?
  • 如何預處理這些含噪聲的數(shù)據(jù)?
  • 哪些超參數(shù)能帶來最佳結果?
  • 是否應結合兩種不同的理論方法?

每個問題都代表一個分支節(jié)點。潛在程序的總數(shù)構成了一個“解決方案空間”,其規(guī)模之龐大,任何人類團隊都無法完全探索。我們找到的只是“足夠好”的解決方案,但在那些未被探索的分支中,幾乎必然隱藏著具有革命性的發(fā)現(xiàn)——而這些發(fā)現(xiàn)正被我們遺憾地錯過。

這一局限嚴重拖累了科學進步的步伐。若能更高效地探索這片解決方案空間,我們本可以為更多疾病建立模型、預測更多氣候模式。

谷歌的解決方案:能“撰寫科學”的人工智能系統(tǒng)

谷歌團隊的核心洞見在于重新定義這一挑戰(zhàn)的本質(zhì):不再將軟件創(chuàng)建視為人類執(zhí)行的任務,而是將其視為人工智能可解決的“搜索問題”。最終目標是:在廣闊的解決方案空間中,找到能最大化質(zhì)量分數(shù)的特定程序。

為實現(xiàn)這一目標,團隊構建了一個如同“不知疲倦、才華橫溢且極具系統(tǒng)性的研究助手”的系統(tǒng)。它基于一個簡單卻深刻的反饋循環(huán)運行:提出方案→測試驗證→學習改進→循環(huán)迭代

該系統(tǒng)的核心由兩個協(xié)同工作的組件構成:

  1. 創(chuàng)意編碼器(大型語言模型——LLM):這是系統(tǒng)的“創(chuàng)新引擎”。給定問題描述和當前最優(yōu)代碼后,LLM的任務是重寫代碼,提出可能提升分數(shù)的智能“變異(mutation)”。它就像一位出色的程序員,能根據(jù)高層級思路,瞬間生成代碼的新版本。
  2. 策略主導者(樹搜索——TS):這是系統(tǒng)的“核心大腦”。若缺乏策略指導,生成無數(shù)代碼變體將毫無意義。樹搜索算法會智能引導探索過程:它會構建一個包含所有已嘗試代碼解決方案的“樹結構”,記錄有效與無效的方案。關鍵在于,它會通過平衡“利用(exploitation)”與“探索(exploration)”來決定下一步探索的路徑——“利用”指對已有高分程序進行小幅調(diào)整,“探索”則指嘗試全新且具有風險、可能帶來重大突破的思路。

不妨將其比作國際象棋大師:樹搜索算法如同大師,俯瞰全局棋盤并規(guī)劃多步之后的走法;而LLM則像大師可咨詢的一組世界級棋手,大師會向他們提問:“從當前局面出發(fā),有哪些有創(chuàng)意的走法可嘗試?”隨后,大師會綜合這些建議,選擇符合整體獲勝策略的走法。

這種組合將緩慢的人工科學編碼過程,轉化為自動化、系統(tǒng)性且可規(guī)模化的“高分解決方案搜索過程”。

探索引擎的內(nèi)部機制:LLM與樹搜索如何開辟新領域

讓我們揭開“引擎蓋”,看看這一系統(tǒng)的實際運作方式。LLM與樹搜索算法的協(xié)作,就像一場精心編排的舞蹈。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

本方法的示意圖與性能表現(xiàn)。a,本方法算法的示意圖:將可評分任務及用于解決該任務的研究思路輸入LLM,LLM在“沙箱(sandbox,安全測試環(huán)境)”中生成用于評估該可評分任務的代碼。隨后,代碼被嵌入樹搜索算法中,新節(jié)點的選擇會平衡“利用”與“探索”,并從LLM中采樣(具體方法見“方法”章節(jié))。b,代碼生成方法在Kaggle Playground基準測試中的性能表現(xiàn):結果顯示16項任務的公共排行榜百分位平均性能。基于本方法的模型以粗體標注。誤差線代表標準差。BDT,梯度提升決策樹(boosted decision tree)。c,用于生成解決科學問題的初始研究思路的機制。

整個過程始于一個初始提示詞(prompt),其中包含AI啟動所需的所有信息:

  • 科學問題描述(例如“預測新冠病毒住院人數(shù)”);
  • 具體評分指標(例如“最小化加權區(qū)間分數(shù)WIS”);
  • 相關數(shù)據(jù)的訪問權限;
  • 初始代碼(可非常簡單,如基礎模板)。

該提示詞被發(fā)送至LLM后,LLM會生成第一個候選解決方案。代碼在安全的“沙箱環(huán)境”中執(zhí)行,其性能會被評分——至此,樹搜索正式啟動。

該算法基于因AlphaGo而聞名的樹預測Upper Confidence邊界算法(Predictor + Upper Confidence bound for Trees,PUCT) 構建可能性樹。樹中的每個節(jié)點都是一個完整、可運行的軟件片段。為決定下一個待擴展的節(jié)點,PUCT會為每個候選節(jié)點計算一個“價值分數(shù)”,該分數(shù)同時兼顧節(jié)點的已知性能和未來改進潛力。

這一設計可避免系統(tǒng)陷入“局部最優(yōu)陷阱”:若系統(tǒng)僅對高分代碼進行調(diào)整(純“利用”),可能會錯過另一種最終性能更優(yōu)的全新方法;而通過將部分搜索資源分配給探索較少的分支(“探索”),系統(tǒng)能夠實現(xiàn)類似人類“概念飛躍”的突破,進而催生真正的創(chuàng)新。

更重要的是,該系統(tǒng)并非盲目搜索——它能結合人類知識進行引導。提示詞可通過多種渠道補充“研究思路”:

  • 科學論文:系統(tǒng)可利用另一款LLM閱讀并總結相關學術論文,將核心思路直接注入提示詞;
  • 專家建議:人類科學家可提供高層級策略建議,例如“嘗試將線性模型與梯度提升機結合”或“重點優(yōu)化特征工程的魯棒性”;
  • 過往解決方案:最巧妙的是,系統(tǒng)能從自身成功經(jīng)驗中學習——它可提取兩個此前發(fā)現(xiàn)的高分解決方案,讓LLM將二者“重組”,生成融合兩者優(yōu)勢的全新混合方案。

這種整合外部知識、生成新型混合方案的能力,正是系統(tǒng)的“超能力”。它模仿了人類科學發(fā)現(xiàn)的過程——“站在巨人的肩膀上”——但執(zhí)行規(guī)模和速度遠超人類能力極限。

技術深度解析:引導式進化與思路重組的藝術

對于希望深入了解機制的讀者,我們將聚焦兩個關鍵技術細節(jié):搜索算法與“思路重組”過程。

PUCT搜索算法

樹搜索的核心并非簡單選擇分數(shù)最高的節(jié)點,而是通過PUCT公式計算并選擇下一個待擴展的節(jié)點??u*??:

??u* = argmax(u) [RankScore(u) + C * P(u) * sqrt(N_total) / (1 + V(u))]??

我們將在不陷入復雜數(shù)學的前提下拆解這一公式:

1. RankScore(u):這是“利用”項,代表該代碼解決方案迄今為止的表現(xiàn)優(yōu)劣——分數(shù)越高,表明這是一條已知的優(yōu)質(zhì)路徑。

2. C * P(u) * sqrt(N_total) / (1 + V(u)):這是“探索”項,各參數(shù)含義如下:

  • ??P(u)??:先驗概率(系統(tǒng)初始時認為所有路徑的可能性均等);
  • ??V(u)??:該節(jié)點的訪問次數(shù)——若某節(jié)點被訪問多次,此項數(shù)值會變小,系統(tǒng)選擇該節(jié)點的概率也會降低;
  • ??N_total??:總模擬次數(shù)——隨著搜索推進,此項會促使系統(tǒng)去探索訪問較少的節(jié)點;
  • ??C??:控制“利用”與“探索”權衡關系的常數(shù)——C值越大,系統(tǒng)越傾向于探索。

這一簡潔的公式讓系統(tǒng)能夠動態(tài)調(diào)整策略:既聚焦有潛力的路徑,又不放棄對新穎思路的嘗試。它為管理龐大的搜索空間提供了一套嚴謹?shù)姆椒ㄕ摗?/p>

程序化思路重組

這或許是最令人興奮的技術細節(jié)。假設系統(tǒng)已完成兩次獨立搜索,為單細胞RNA測序(scRNA-seq)的批次整合任務找到了兩個性能優(yōu)異但思路迥異的解決方案:一個基于??ComBat???方法,另一個基于??BBKNN??方法。人類科學家可能需要數(shù)周時間研究兩者,才能想出融合方案——而AI系統(tǒng)可實現(xiàn)這一過程的自動化。具體步驟如下:

1. 提取最優(yōu)代碼:系統(tǒng)從??ComBat???搜索樹和??BBKNN??搜索樹中,分別提取最終的最高分代碼。

2. 基于LLM的分析:系統(tǒng)將兩個代碼解決方案輸入LLM(如論文實驗中使用的Gemini 2.5 Flash),并附帶特定提示詞:

“對比這兩個代碼解決方案……解釋兩者在核心原理上的差異。”

3. 生成混合提示詞:LLM對差異的解釋會被程序化地嵌入一個新的提示詞中,用于啟動新的樹搜索。該新提示詞會明確指示系統(tǒng):

“請設計一種算法,融合兩種策略的優(yōu)勢部分,構建一種出色的混合策略,使其性能分數(shù)高于兩種單獨策略中的任意一種。”

4. 啟動新搜索:以“重組思路”為起點的全新樹搜索正式啟動,此時LLM的核心目標是生成能智能融合兩種“父思路”的代碼。

這種自動化的“分析→合成→實現(xiàn)”過程,是強大的創(chuàng)新引擎。正如我們將在下文看到的,這些AI生成的混合方案往往能超越兩種“父方案”的性能。

從理論到實踐:跨科學領域的“超人類”成果

該系統(tǒng)實力最有力的證明,在于其在真實科學基準測試中的表現(xiàn)。谷歌團隊在六個極具多樣性和挑戰(zhàn)性的領域對其進行了測試,結果令人震驚。

案例研究1:重塑單細胞分析領域的生物信息學

挑戰(zhàn):單細胞RNA測序(scRNA-seq)讓我們能夠研究單個細胞,但來自不同實驗室或實驗的數(shù)據(jù)集(稱為“批次”)存在技術差異,會掩蓋真實的生物信號。“批次整合(batch integration)”是消除這類技術噪聲的關鍵任務,同時也是一大難題——目前已有近300種相關工具,該領域競爭異常激烈。

結果:研究團隊在OpenProblems基準測試(該任務的公共排行榜)中對AI系統(tǒng)進行了測試:

  • 系統(tǒng)開發(fā)出40種全新方法,全部超越排行榜上已有的所有方法;
  • 其表現(xiàn)最佳的解決方案是對BBKNN(一種常用批次整合方法)的改進版本,相比已發(fā)表的最優(yōu)方法,**整體性能提升了14%**;
  • 突破點:系統(tǒng)并非簡單優(yōu)化BBKNN的實現(xiàn)——如以下圖表所示,它發(fā)現(xiàn)了一項關鍵創(chuàng)新:將BBKNN與另一種方法??ComBat??(批次效應校正方法)結合,在“尋找鄰居”前先對數(shù)據(jù)進行校正。這一混合思路由系統(tǒng)自主發(fā)現(xiàn),正是其性能領先的核心原因。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

樹搜索在scRNA-seq批次整合任務中的性能表現(xiàn)。a,批次整合任務示意圖:對不同數(shù)據(jù)集(青綠色和紅色)進行處理,消除數(shù)據(jù)中的批次效應,同時保留生物變異性。b,樹搜索方法(方法名稱以粗體標注,后綴為“(TS)”)與已發(fā)表的同類方法在OpenProblems基準測試v2.0.0中的性能對比。“按細胞類型添加抖動的完美嵌入(Perfect embedding by celltype with jitter)”是代表最佳可能性能的陽性對照方法,“按批次隨機整合(Shuffle integration by batch)”是不進行任何批次整合的陰性對照方法。“整體分數(shù)(Overall score)”是所有數(shù)據(jù)集和指標的平均值。“數(shù)據(jù)集(Datasets)”列中的每一項均為該數(shù)據(jù)集所有指標的平均值。“指標(Metrics)”列中的每一項均為該指標在所有數(shù)據(jù)集上的平均值。若指標無法計算或性能低于最低陰性對照,則賦值為0,顯示為空。c,表現(xiàn)最佳的批次平衡k近鄰(BBKNN)實現(xiàn)版本的性能提升與代碼創(chuàng)新標注:在第429次實現(xiàn)嘗試中引入了基于ComBat的嵌入生成方法。d,OpenProblems基準測試v2.0.0中,非對照方法、有無思路重組的本方法、Gemini深度研究(Gemini Deep Research)方法以及帶AI協(xié)科學家(AI co-scientist)的本方法的整體分數(shù)。Y軸下限為陰性對照方法“按批次隨機整合”的整體分數(shù)。未顯示7種重組方法、5種基礎方法和2種未達此性能的AI協(xié)科學家方法。*表示該方法為重組方法(即使未明確提示重組)。TS,樹搜索(tree search);fastMNN、mnnCorrect,均為batchelor工具包中的批次整合方法。

這一結果意味著什么?它表明,人工智能現(xiàn)在可以進入一個復雜、成熟的生物信息學領域,并在幾小時內(nèi)發(fā)明出優(yōu)于人類數(shù)年研究成果的全新解決方案。

案例研究2:用更智能的新冠模型“超越疫情預測極限”

挑戰(zhàn):預測新冠病毒住院人數(shù)是一項關鍵的公共衛(wèi)生任務。美國疾病控制與預防中心(CDC)協(xié)調(diào)管理的“新冠預測中心(COVID-19 Forecast Hub)”匯總了數(shù)十個專家團隊的模型,其中“新冠中心集成模型(CovidHub Ensemble)”(融合最優(yōu)模型的結果)是準確性的黃金標準——要超越這一模型難度極大。

結果:谷歌團隊對2024-2025賽季進行了回顧性研究:

  • AI系統(tǒng)生成了14種不同的預測策略,全部超越官方的“新冠中心集成模型”;
  • 其最終的“谷歌回顧性模型(Google Retrospective)”平均WIS得分為26,顯著優(yōu)于集成模型的29(分數(shù)越低越好);
  • 協(xié)同混合優(yōu)勢:系統(tǒng)發(fā)現(xiàn),性能最佳的模型均為“混合模型”——它持續(xù)將簡單穩(wěn)定的“氣候學基礎模型”與復雜且響應迅速的“自回歸模型”融合,生成了兼具魯棒性和高適應性(能快速應對最新趨勢)的全新模型——這一復雜策略完全由AI自主發(fā)現(xiàn)。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

樹搜索在新冠病毒預測任務中的性能表現(xiàn)。a,預測實驗中使用的滾動驗證窗口:每次搜索的輸出結果在之前的時間段(藍色)進行內(nèi)部驗證,生成的模型隨后用于其對應預測周期(橙色)的預測。訓練數(shù)據(jù)包括2020年8月8日及之后、驗證集之前的所有日期。b,時間序列排行榜:顯示各參與團隊和“谷歌回顧性模型”的每周預測性能(平均WIS),按平均WIS排序。分數(shù)為所有52個轄區(qū)和4個預測時間范圍的匯總結果。每個單元格內(nèi)的數(shù)字為該模型當周的絕對平均WIS。單元格背景色直觀顯示相對于“新冠中心集成模型(CovidHub-ensemble)”的性能:藍色表示W(wǎng)IS更低(性能更好),紅色表示W(wǎng)IS更高(性能更差)。c,本模型與“新冠中心集成模型”在轄區(qū)層面的預測誤差(平均WIS)直接對比:表明本模型在大多數(shù)地區(qū)的性能更優(yōu)。d,本模型在2024/25新冠賽季全周期內(nèi)預測誤差(平均WIS)的地理分布:誤差值越低(顏色越淺),性能越好。e,不同建模策略的匯總預測性能對比:包括新冠中心競賽的基準模型、本研究的回顧性模型、對提交模型的復現(xiàn)結果、通過重組生成的新型混合模型、深度研究模型(Deep Research)和AI協(xié)科學家模型。在3周評估周期(3個參考日期×4個時間范圍×52個轄區(qū))內(nèi),有14種策略(10種重組策略、2種深度研究策略、1種AI協(xié)科學家策略和1種復現(xiàn)基準策略)的性能超越官方“新冠中心集成模型”。未顯示性能低于“新冠中心基準模型(CovidHub-baseline)”的模型。

這一案例證明,該系統(tǒng)能夠在高風險、高競爭的環(huán)境中運作,并生成性能優(yōu)于數(shù)十個人類專家團隊集體智慧的策略。

案例研究3:從斑馬魚大腦到復雜積分運算

研究團隊還在其他多個領域測試了系統(tǒng)的通用性:

  • 地理空間分析:在DLRSD基準測試(用于衛(wèi)星圖像分割)中,AI生成的解決方案平均交并比(mean Intersection over Union,mIoU)得分超過0.80,顯著優(yōu)于此前的學術領域最優(yōu)結果;
  • 神經(jīng)科學:在ZAPBench基準測試(用于預測幼體斑馬魚全腦神經(jīng)活動)中,系統(tǒng)生成的模型性能超越所有其他基準模型(包括復雜的視頻基模型),且訓練速度快了數(shù)個數(shù)量級——在單塊GPU上訓練僅需不到2小時,而對比模型在16塊A100 GPU上訓練需36小時;
  • 數(shù)值分析:最令人驚訝的是,團隊還讓系統(tǒng)解決了一個純數(shù)學問題:求解標準且高度權威的??scipy.integrate.quad()??函數(shù)無法處理的復雜積分。系統(tǒng)從調(diào)用??quad()??的簡單代碼開始,逐步優(yōu)化,最終生成了一個復雜的全新程序——在19個“無法求解”的預留積分問題中,該程序正確求解了17個,相當于為這類特殊場景提供了一個可直接替代標準庫函數(shù)的解決方案。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

各模型在DLRSD基準測試中的性能對比表:表格顯示了樹搜索解決方案和參考論文中方法的發(fā)表年份、架構、關鍵特征及報告的平均交并比(mIoU)。

在所有領域中,結果都指向同一個結論:自動化系統(tǒng)能夠系統(tǒng)性地探索可能的程序空間,并找到性能等同于甚至優(yōu)于人類多年專注研究成果的解決方案。

未來屬于“可評分”:我們正處于科學革命的臨界點嗎?

這項研究的潛在影響怎么強調(diào)都不為過——我們正在見證一個“計算發(fā)現(xiàn)過程被根本性加速”的未來。

反復試驗是科學進步的核心……該系統(tǒng)能以極快的速度生成專家級解決方案,將一組思路的探索時間從數(shù)周或數(shù)月縮短至數(shù)小時或數(shù)天。以這種方式加速研究,將對科學發(fā)展產(chǎn)生深遠影響。

這項技術為科學研究增添了一件全新的“利器”:對于任何可通過“評分”衡量進步的領域,都可部署該系統(tǒng)。試想這樣一個未來:

  • 材料科學家為新型電池電解質(zhì)的“效率與穩(wěn)定性”定義“質(zhì)量分數(shù)”,AI系統(tǒng)探索化學和模擬空間,提出全新候選材料;
  • 氣候科學家讓AI優(yōu)化全球氣候模型中“云形成參數(shù)化”(一項眾所周知的“可評分任務”);
  • 制藥公司利用類似系統(tǒng)優(yōu)化臨床試驗設計,探索能最大化患者療效和統(tǒng)計效力的方案。

當然,該系統(tǒng)并非萬能藥。其主要局限在于,它需要以“可評分任務”為前提——而許多科學研究具有探索性,無法簡化為單一數(shù)值。此外,對“解決方案背后原理”的解釋仍需人類洞察力:系統(tǒng)能發(fā)現(xiàn)性能卓越的新型方法組合,但理解其成功的深層理論原因,仍是人類的任務。

但對于日益龐大的“計算型科學領域”而言,這無疑是一個分水嶺。我們正從“科學家使用軟件作為工具”的時代,邁向“科學家與軟件作為創(chuàng)新伙伴協(xié)作”的時代。

谷歌的這篇論文不僅展示了一款強大的新型人工智能,更讓我們得以窺見未來:人類直覺的瓶頸被打破,科學發(fā)現(xiàn)的速度僅受限于“提出正確問題”和“定義正確評分標準”的能力。

科學革命由新工具驅動——望遠鏡、顯微鏡莫不如此。而這款人工智能探索引擎,或許將成為21世紀最具決定性的科學工具。

核心要點

  • 新范式:科學軟件開發(fā)可被定義為一個搜索問題,借助人工智能實現(xiàn)自動化,從而加速科學發(fā)現(xiàn)。
  • LLM + 樹搜索:系統(tǒng)核心是“創(chuàng)意LLM代碼生成器”與“策略樹搜索算法”的強大組合,后者負責引導對可能解決方案的探索。
  • 知識整合:系統(tǒng)的真正優(yōu)勢在于其整合外部知識的能力——可融入論文、專家建議及自身過往發(fā)現(xiàn)(思路重組)中的研究思路。
  • 超人類性能:在生物信息學、流行病學等多樣且競爭激烈的科學領域,該系統(tǒng)已展現(xiàn)出超越專家水平的領域最優(yōu)性能。
  • 加速科學:通過自動化實證軟件的人工創(chuàng)建過程,這一方法有望從根本上提升科學進步的速度。

參考文獻

Aygün, E., Belyaeva, A., Comanici, G., et al. (2025). An AI system to help scientists write expert-level empirical software. arXiv:2509.06503v1

本文轉載自?????????AIGC深一度??

收藏
回復
舉報
回復
相關推薦
国产精品久久综合青草亚洲AV| 大地资源二中文在线影视观看| 黄网站免费在线观看| 国产一区二区不卡老阿姨| 久久久女女女女999久久| 国产jk精品白丝av在线观看| 2020国产精品小视频| 亚洲国产综合在线| 五月天亚洲综合情| 蜜桃视频在线观看www| 日韩中文字幕不卡| 欧美富婆性猛交| 亚洲色图100p| 五月国产精品| 精品国产露脸精彩对白| 亚洲第一狼人区| 黄在线观看免费网站ktv| 中文字幕欧美一区| 女女同性女同一区二区三区91| 国产精品人人爽| 日韩国产欧美视频| 韩国三级电影久久久久久| 国产成人在线网址| 伊甸园亚洲一区| 精品国产sm最大网站| 天堂一区在线观看| 性欧美hd调教| 亚洲v精品v日韩v欧美v专区 | 欧美伦理在线视频| 亚洲国产高清自拍| 中文字幕乱妇无码av在线| 51一区二区三区| 色吊一区二区三区| 免费看日本毛片| 成人免费高清观看| 亚洲免费观看在线视频| 亚洲图片都市激情| 搞黄视频在线观看| 久久久亚洲精品石原莉奈| 国产精品青青草| 午夜精品久久久久久久爽| 久久成人麻豆午夜电影| 国产精品一区二区性色av| 免费看日批视频| 欧美亚洲一区二区三区| 欧美亚州一区二区三区| 日本少妇吞精囗交| 极品中文字幕一区| 欧美大片在线看| 久久网中文字幕| 欧美三级在线| 久久99国产精品自在自在app| 亚洲色图综合区| 中文在线日韩| 欧美激情综合亚洲一二区 | 91精品国产调教在线观看| 日韩一区二区三区国产| 精品在线观看一区| 在线成人激情| 欧美国产中文字幕| 永久免费看片在线播放| 国产欧美69| 国产精品扒开腿做爽爽爽男男 | 精品久久国产字幕高潮| 中国特级黄色片| 国内精品偷拍| 亚洲精品网站在线播放gif| 国产手机在线观看| 精品久久91| 精品国产欧美一区二区三区成人| 日本在线一级片| 欧美特黄一级| 欧美一级高清免费播放| 日韩av免费播放| 裸体在线国模精品偷拍| 99久久99| 国产一二在线观看| 中文字幕一区二区三区精华液| www.-级毛片线天内射视视| 欧美人动性xxxxz0oz| 午夜精彩视频在线观看不卡| caopor在线视频| 福利一区二区免费视频| 日韩欧美中文字幕制服| 亚洲精品女人久久久| 欧美色图一区| 久久99久久99精品中文字幕| 中文字幕一区二区人妻电影| 精品在线你懂的| 国产一区免费观看| 91caoporn在线| 亚洲一区二区欧美日韩| 国产又大又黄又粗的视频| japansex久久高清精品| 日韩av网站大全| 极品色av影院| 日韩午夜黄色| 成人激情视频在线| 亚洲av片在线观看| 成人免费在线播放视频| 看av免费毛片手机播放| 精品国产亚洲一区二区三区| 亚洲欧美国产日韩中文字幕| 在线观看成人毛片| 美女久久一区| 成人蜜桃视频| 午夜毛片在线| 欧美性猛交xxxx富婆| 日批视频在线看| 欧美综合另类| 国产91成人在在线播放| av综合在线观看| 中文字幕不卡在线播放| 日韩精品视频久久| 加勒比视频一区| 欧美精品日韩www.p站| 精品乱码一区内射人妻无码| 99久久精品国产麻豆演员表| 免费观看黄色大片| 成人免费在线观看视频| 日韩av在线导航| 麻豆一区产品精品蜜桃的特点| 三级影片在线观看欧美日韩一区二区| 99理论电影网| 国产秀色在线www免费观看| 色8久久人人97超碰香蕉987| av网页在线观看| 欧美日韩一区二区国产| 成人久久一区二区三区| seseavlu视频在线| 欧美性色xo影院| 在线免费播放av| 在线观看一区| 国产精品免费一区二区三区四区| av在线app| 91精品婷婷国产综合久久| 欧美精品日韩在线| 日韩成人av影视| 日本午夜精品一区二区三区| 日韩激情电影免费看| 精品对白一区国产伦| 欧美三根一起进三p| 国产乱子轮精品视频| 久久久成人精品一区二区三区| 四虎国产精品免费久久5151| 爽爽爽爽爽爽爽成人免费观看| 欧美另类高清videos的特点| 欧美激情一二三区| 视频二区在线播放| 日韩专区精品| 91视频免费网站| 成人区精品一区二区不卡| 91精品国产综合久久久蜜臀粉嫩| 国产18无套直看片| 极品少妇一区二区三区精品视频| 一区中文字幕在线观看| 99久久99九九99九九九| 久久精品一偷一偷国产| 国产成人毛毛毛片| 亚洲一二三专区| 亚洲精品女人久久久| 日韩精彩视频在线观看| 亚洲精品在线视频观看| 亚洲日韩中文字幕一区| 欧美精品在线看| 人妻精品一区一区三区蜜桃91 | 中文字幕精品视频在线观看| 国产欧美日韩在线观看| 91女神在线观看| 午夜精品久久| 国产在线一区二区三区欧美| 中文一区一区三区高中清不卡免费 | 天天综合网久久| 欧美三级网页| 蜜桃999成人看片在线观看| 日本综合视频| 久久综合网hezyo| 天堂资源中文在线| 欧美视频在线观看一区| 妺妺窝人体色www聚色窝仙踪| 91亚洲男人天堂| 欧美特级aaa| 极品av少妇一区二区| 日韩少妇中文字幕| 精品中文在线| 欧美在线视频网| 黄色视屏免费在线观看| 亚洲高清在线观看| 一二三四区视频| 婷婷激情综合网| 国产福利在线导航| 成人免费视频播放| 亚洲欧美日韩综合网| 亚洲三级色网| 一区二区三区四区欧美日韩| 成人性生交大片免费看中文视频| 国产精品96久久久久久| 午夜在线激情影院| 亚洲欧美中文字幕在线一区| 精品国产无码一区二区三区| 在线这里只有精品| 日本少妇激情舌吻| 亚洲视频图片小说| 免费在线观看污| 顶级嫩模精品视频在线看| 国产wwwxx| 国产精品日本| 超碰97在线看| 青青草国产免费一区二区下载| 国产精品一区二区欧美黑人喷潮水| 欧美日韩亚洲国产| 17婷婷久久www| 日本一级理论片在线大全| 国产一区二区三区在线播放免费观看 | 无遮挡爽大片在线观看视频| 美女福利精品视频| yw193.com尤物在线| 日韩精品亚洲视频| 亚洲黄色小说网| 3atv在线一区二区三区| 免费看污视频的网站| 精品久久中文字幕久久av| 四虎免费在线视频| 成人免费在线观看入口| 污污视频网站在线免费观看| 久久精品日产第一区二区三区高清版| 中文字幕免费高清视频| 国产精品99久久久久久久女警| 亚洲欧美久久久久| 久久亚洲色图| 韩国日本在线视频| 在线一区欧美| 男人日女人下面视频| 亚洲色诱最新| 少妇av一区二区三区无码| 亚洲视频一二| 人人妻人人澡人人爽欧美一区双| 欧美午夜一区| 国产爆乳无码一区二区麻豆| 中文字幕乱码亚洲无线精品一区| 伊人久久婷婷色综合98网| 欧美超碰在线| 曰韩不卡视频| 天天超碰亚洲| 99中文字幕在线观看| 综合五月婷婷| 日本免费a视频| 最新日韩欧美| 逼特逼视频在线| 免费在线亚洲| 成人小视频在线看| 日韩影院免费视频| 91热这里只有精品| 久久草av在线| 91视频免费入口| 成人性视频网站| 国产伦精品一区二区免费| 99久久婷婷国产综合精品电影| 成年人的黄色片| 国产色产综合产在线视频 | 亚洲电影在线播放| 日韩欧美三级在线观看| 色欧美日韩亚洲| 亚洲一区中文字幕永久在线| 91精品国产欧美一区二区18| 亚洲精品国产片| 日韩精品视频观看| 国内在线精品| 久久97久久97精品免视看| 国产高潮在线| 国产精品视频xxxx| 香蕉大人久久国产成人av| 精品国产一区二区三区久久久久久 | 久久精品国产99| 色综合久久久无码中文字幕波多| 99精品视频在线免费观看| 免费在线观看污| 亚洲欧美经典视频| 国产欧美日韩另类| 欧美午夜宅男影院| 国产成人av免费看| 亚洲美女免费精品视频在线观看| av在线女优影院| 欧美激情视频网址| 欧美一级二级视频| caoporen国产精品| 精品国产乱码久久久久久果冻传媒| 中文字幕一区二区三区在线乱码| 国内揄拍国内精品久久| 蜜桃免费在线视频| 国产成人啪免费观看软件| 西西444www无码大胆| 亚洲精品免费在线播放| 中文人妻av久久人妻18| 日韩欧美一二三区| 精品视频三区| 久久久久中文字幕| 国产乱子精品一区二区在线观看| 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 91国产精品视频在线观看| 成人毛片视频在线观看| 国产jizz18女人高潮| 天天色天天操综合| 国产乱码精品一区二区| 亚洲欧美日韩中文在线| 免费不卡av| 国产一区香蕉久久| 你微笑时很美电视剧整集高清不卡 | 成人性生交大片免费看小说| 午夜欧洲一区| 国产精品www在线观看| 精品一区二区免费| 国产精品高清无码在线观看| 亚洲国产成人av| 国产黄色av片| 日韩在线视频观看| 欧美大片免费高清观看| 国内视频一区| 欧美理论在线| 手机av在线网站| 国产精品成人网| 在线观看不卡的av| 国产香蕉精品视频一区二区三区| 蜜桃在线视频| 国产日韩一区欧美| 激情91久久| 天堂va欧美va亚洲va老司机| 亚洲欧美另类综合偷拍| 国产又粗又黄又爽的视频| 一区二区三区黄色| 欧美电影免费观看高清完整| 精品一区二区不卡| 亚洲伦理精品| 婷婷五月精品中文字幕| 亚洲一区二区三区爽爽爽爽爽| 国产成人精品a视频| 欧美大奶子在线| aaa国产精品视频| 国产精品三级一区二区| 国产成人在线网站| 成人观看免费视频| 精品国产91久久久久久久妲己| 欧洲黄色一区| 国产精品一区二区三区在线观 | 国产69精品久久久久9999| 6080成人| 日韩av在线第一页| 2019国产精品| 亚洲中文无码av在线| 伊人久久综合97精品| 成人午夜在线| 正在播放一区| 国产一区二区视频在线播放| 全程偷拍露脸中年夫妇| 日韩精品一区二区三区视频在线观看 | 亚洲天堂伊人网| 亚洲精品第1页| 黄色片网站免费在线观看| 97在线观看免费高清| 亚洲人亚洲人色久| www.久久久精品| 亚洲精品欧美综合四区| 黄色一级大片在线免费看国产| 久久久久亚洲精品国产| 久久99国内| 久久久久xxxx| 五月天精品一区二区三区| 欧美3p视频在线观看| 国产原创欧美精品| 欧美激情五月| 中文字幕一二三四区| 欧美日韩免费观看一区二区三区 | 欧美在线日韩在线| 日韩欧美综合| 亚洲av熟女高潮一区二区| 欧美性猛交xxxx乱大交极品| 成年人在线观看| 国产不卡一区二区三区在线观看 | 亚洲男人天堂2021| 婷婷久久综合九色综合绿巨人| 成人18在线| 福利视频久久| 日日欢夜夜爽一区| 欧美丰满艳妇bbwbbw| 亚洲精品一区二区网址| 精品视频在线播放一区二区三区| 久久这里只有精品23| 国产欧美一区二区精品婷婷| 精品人妻一区二区三区日产乱码 | 国产情侣在线播放| 96精品视频在线| 91亚洲国产成人久久精品| 97人妻精品一区二区三区免费 | 中文字幕一区二区在线观看视频 | 亚洲国产人成综合网站| 国产精品久久久久久久龚玥菲 | 尤物网站在线看| 一本久久综合亚洲鲁鲁五月天| 91麻豆免费在线视频| 日韩久久在线|