精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達的AI已經開始接管整個項目了?SATLUTION自主進化代碼庫登頂SAT競賽

人工智能 新聞
NVIDIA Research 的研究人員提出了?SATLUTION,首個將 LLM 代碼進化能力從「算法內核」擴展到「完整代碼庫」規模的框架。

AI 開發復雜軟件的時代即將到來?

近年來,以 Google 的 AlphaEvolve 為代表的研究已經證明,AI 智能體可以通過迭代來優化算法,甚至在某些小型、獨立的編程任務上超越人類。然而,這些工作大多局限于幾百行代碼的「算法內核」或單個文件。

但現實世界的軟件,比如一個頂級的 SAT 求解器,是一個龐大而復雜的系統工程,包含數百個文件、精密的編譯系統和無數相互關聯的模塊。手動打造一個冠軍級求解器不僅需要極高的領域知識,而且投入產出比越來越低。

為此,NVIDIA Research 的研究人員提出了 SATLUTION,首個將 LLM 代碼進化能力從「算法內核」擴展到「完整代碼庫」規模的框架。SATLUTION 能夠處理包含數百個文件、數萬行 C/C++ 代碼的復雜項目,并在被譽為「計算理論基石」的布爾可滿足性(SAT)問題上,取得了超越人類世界冠軍的性能。

  • 論文標題:Autonomous Code Evolution Meets NP-Completeness 
  • 論文地址:https://arxiv.org/pdf/2509.07367

SATLUTION 框架通過協調 LLM 智能體,在嚴格的正確性驗證和分布式運行時反饋的指導下,直接對 SAT 求解器的代碼庫進行迭代優化。值得一提的是,在這一過程中,它還會同步地「自我進化」其進化策略與規則。

基于 2024 年 SAT 競賽的代碼庫與基準,SATLUTION 進化出的求解器不僅在 2025 年的 SAT 競賽中擊敗了人類設計的冠軍,而且在 2024 年的基準測試集上,其性能也同時超越了 2024 年和 2025 年兩屆的冠軍。

SATLUTION 在 2025 年 SAT 競賽基準測試中的驚人表現。圖中柱狀圖的高度代表 PAR-2 分數(一種衡量求解器性能的指標,越低越好)。左側顏色漸變的柱體是 SATLUTION 進化出的求解器家族,它們的分數顯著低于人類設計的 2025 年競賽冠軍(藍色)和亞軍(綠色)。

SATLUTION 是如何工作的?

SATLUTION 圍繞 LLM 智能體、一套動態規則系統以及一個嚴格的驗證與反饋循環構建。

雙智能體架構

該系統由兩個協同工作的 LLM 智能體驅動,基于 Cursor 環境和 Claude 系列模型實現。

規劃智能體:負責高層次的戰略制定。在進化周期的初始階段,它會分析作為起點的求解器代碼庫及其性能,提出有潛力的修改方向。在后續周期中,它會綜合考量累積的代碼變更、性能指標和歷史失敗記錄,為下一次迭代制定新的進化計劃。

編碼智能體:負責執行具體的開發任務。它根據規劃智能體的藍圖,直接對 C/C++ 求解器代碼庫進行編輯和實現。其職責還包括管理輔助任務,例如更新 Makefile 等構建系統配置、修復編譯錯誤以及調試功能性或執行時錯誤。

規則系統:引導與約束

規則系統是確保進化過程高效和穩定的關鍵。它為智能體的探索提供了必要的引導,有效減少了在無效或錯誤方向上的嘗試。

在進化開始前,研究人員為系統設定了一套靜態規則,編碼了基礎的領域知識和硬性約束。這包括:基本的 SAT 啟發式算法原則、嚴格的正確性要求(如必須為無解實例生成 DRAT 證明)、統一的代碼庫目錄結構規范以及詳細的評估協議。

實驗表明,在缺少這套初始規則的情況下,智能體的表現會顯著下降,容易產生偏離目標的修改。

該框架的一個核心特點是規則庫本身能夠動態演進。在每個進化周期結束后,一個分析器會對過程中的編譯錯誤、驗證失敗和新出現的失效模式進行復盤,并自動提出規則補丁。

例如,系統可以根據一次失敗的經驗,自動向規則庫中添加一個新的「禁止代碼模式」,從而防止智能體在未來重復同樣的錯誤。這使得規則系統與求解器代碼共同進化,不斷提升框架的整體效率和魯棒性。

驗證與評估流程

為保障代碼質量和求解的正確性,每個新生成的求解器版本都必須通過一個嚴格的流程。

  • 兩階段驗證

第一階段是編譯和基本功能測試。 系統會嘗試編譯新代碼,成功后在一個包含 115 個簡單 CNF 實例的測試集上運行,以捕捉編譯錯誤、段錯誤等基礎問題。

第二階段是完整的正確性驗證。 通過第一階段的求解器會在一個更大的、結果已知的基準測試集上運行。對于其輸出的每一個結果,系統都會進行核查:如果報告「可滿足」(SAT),則驗證所給出的賦值是否正確;如果報告「不可滿足」(UNSAT),則使用外部檢查工具驗證其生成的 DRAT 證明的有效性。

只有完全通過這兩個階段驗證的求解器,才會被認為是「正確」的,并進入下一步的性能評估。

  • 分布式評估與反饋

通過驗證的求解器會被部署到一個由 800 個 CPU 節點組成的集群上,在完整的 SAT Competition 2024 基準測試集(包含 400 個實例)上進行并行評估。這種大規模并行使得整個評估過程可以在大約一小時內完成,從而為智能體提供近乎實時的性能反饋。

反饋指標非常詳盡,包括已解決的 SAT/UNSAT 實例數量、不同時間段內解決的實例分布、內存使用情況,以及作為核心驅動指標的 PAR-2 分數(一種對未解決實例進行高額時間懲罰的平均運行時指標)。

實驗結果

SATLUTION 在 70 個進化周期的實驗中,展現了清晰且穩健的性能提升軌跡。

根據論文中對 2024 年基準測試集的性能追蹤圖表(圖 8)顯示,在最初的 5-10 個迭代周期中,系統取得了快速進展,這主要是因為它整合了多個初始種子求解器的互補優勢。

隨后,性能提升的速度有所放緩,但仍在持續進行,表明智能體開始處理更細微和復雜的優化問題。

大約在第 50 次迭代時,SATLUTION 進化出的求解器在 2024 年的基準上已經開始優于 2025 年的人類設計冠軍。

到第 70 次迭代結束時,其性能已穩定地超越了所有用于比較的基準求解器。整個過程表現出高度的穩定性,由于驗證保障措施的存在,沒有發生過嚴重的性能衰退。

SATLUTION 自進化性能曲線。

整個 SATLUTION 自我進化實驗過程的總計成本低于 20000 美元。相比之下,由人類專家開發一個具有競爭力的 SAT 求解器通常需要數月乃至數年的持續工程投入,而 SATLUTION 在數周內便取得了超越頂尖人類水平的成果。

更多細節請參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-20 13:16:45

2024-03-22 13:36:51

英偉達微服務

2025-10-09 18:02:37

黃仁勛OpenAI英偉達

2022-07-20 13:55:28

算法AI人工智能

2025-01-26 07:30:00

2024-05-28 14:41:00

2024-07-22 08:30:00

神經網絡AI

2023-05-26 17:15:40

AI搜索

2023-05-29 09:55:11

GPT-4英偉達

2024-03-04 00:40:00

英偉達AI引擎

2021-03-29 12:47:58

Crate.io代碼開源

2023-05-26 17:15:45

2025-03-10 12:09:37

2021-12-06 09:35:38

英偉達人工智能軟件

2023-10-13 13:11:58

數據智能

2025-11-05 09:00:00

2024-09-05 14:10:00

AI計算

2023-09-28 08:04:39

GPU芯片AI芯片
點贊
收藏

51CTO技術棧公眾號

欧美三级韩国三级日本一级| 99re6这里只有精品| 亚洲国产日韩在线一区模特| 国产日韩一区欧美| 亚洲天堂一区在线观看| 亚洲精品一区二区三区中文字幕| 亚洲一区二区在线观看视频| 精品久久久久久中文字幕动漫| 9i看片成人免费看片| 久久成人综合| 欧美色成人综合| av动漫在线免费观看| 你懂的视频在线播放| 久久99久久久久久久久久久| 欧美激情按摩在线| www.久久av| 96视频在线观看欧美| 婷婷综合久久一区二区三区| 神马影院我不卡| 国产视频一区二区三| 国产亚洲一区在线| 日韩有码在线电影| 国产日韩视频一区| 欧美综合影院| 欧美日韩午夜剧场| 波多野结衣三级在线| 天堂a中文在线| 久久精品国产在热久久| 18性欧美xxxⅹ性满足| www.色天使| 一区二区三区四区高清视频| 在线观看中文字幕不卡| 丁香婷婷综合激情| 中文字幕在线播放| 不卡一二三区首页| 3d蒂法精品啪啪一区二区免费| 欧美性猛交bbbbb精品| 欧美日韩视频| 久久久精品2019中文字幕神马| 日韩片在线观看| 欧美精品三级在线| 精品视频1区2区3区| 日韩av高清在线看片| av网址在线免费观看| 国产欧美日本一区二区三区| 久久国产精品一区二区三区四区| 精品久久久中文字幕人妻| 全国精品久久少妇| 日韩女优在线播放| 亚洲影院在线播放| 国产亚洲福利| 91精品国产91久久| 国产精品111| 久久久久久影院| 色偷偷亚洲男人天堂| 成人无码www在线看免费| 日韩高清在线观看一区二区| 欧美日韩国产精品自在自线| 色悠悠久久综合网| 日韩经典一区| 日韩欧美在线视频观看| 精品一区二区三区无码视频| 国产在线高清理伦片a| 国产精品五月天| 色99中文字幕| av网站在线免费观看| 国产欧美一区视频| 精品伦精品一区二区三区视频| 午夜免费福利视频| 精品一区二区三区在线播放 | 狠狠躁日日躁夜夜躁av| 精品一二三四区| 91精品久久久久久久久久久| 中文精品久久久久人妻不卡| 日本不卡123| 国产精品嫩草影院一区二区| 97人妻精品视频一区| 99riav国产精品| 欧美黑人xxxx| 日韩久久精品视频| 久久三级视频| 国产精品视频精品视频| 11024精品一区二区三区日韩| 老司机精品视频在线| 国产欧美一区二区三区视频| 国产精品一品二区三区的使用体验| 日韩精品91亚洲二区在线观看| 国产精品女视频| 天天干天天插天天射| 激情成人综合网| www.久久久| 毛片免费在线播放| 综合色中文字幕| 超碰成人免费在线| 日韩成人亚洲| 欧美一级片在线看| 欧美大喷水吹潮合集在线观看| 亚洲涩涩av| 日韩亚洲一区二区| 久久精品免费av| 久久久久国内| 国产精品视频公开费视频| 亚洲av无码乱码国产麻豆| 97久久久精品综合88久久| 日韩免费三级| 污视频网站免费在线观看| 五月天亚洲精品| 不卡的av中文字幕| 中文一区二区三区四区| 国产午夜精品麻豆| 欧美丰满熟妇bbbbbb| 国产欧美一级| 96国产粉嫩美女| 嫩草影院一区二区| 国产精品毛片久久久久久久| 欧美精品久久久久久久久久久| 亚洲a∨精品一区二区三区导航| 日韩三区在线观看| 免费网站在线高清观看| 欧美日韩伊人| 日本欧美在线视频| 超碰福利在线观看| 国产精品乱码久久久久久| 成人免费播放器| 国产精品美女久久久久| 亚洲欧美综合v| 精品无码人妻一区二区三区品| 人人精品人人爱| 久久精品国产第一区二区三区最新章节 | 免费看国产黄色片| 中文有码一区| 欧美诱惑福利视频| 四虎影院在线域名免费观看| 亚洲国产精品精华液网站| 中文字幕日韩久久| 婷婷伊人综合| 亚洲一区二区三| 精品国产99久久久久久| 欧美日韩国产一区二区三区地区| 日本性高潮视频| 日韩国产精品久久| 日韩成人在线资源| 欧美成人影院| 亚洲人成在线观看| 男人的天堂av网站| 欧美国产精品一区二区三区| 91视频免费版污| 日本在线电影一区二区三区| 国产精品丝袜高跟| 美女隐私在线观看| 91精品国产一区二区人妖| 四虎影院中文字幕| 国产成人精品1024| 成年人看的毛片| 青草久久视频| 国产精品白嫩初高中害羞小美女| 国产爆初菊在线观看免费视频网站| 日本乱人伦一区| 最新中文字幕av| 久国产精品韩国三级视频| 一区不卡字幕| 国产精品99久久免费| 欧美大片网站在线观看| 人妻中文字幕一区| 欧洲一区在线观看| 国产免费一区二区三区四区| 国产精品一区二区三区99| 国产精品久久久久9999爆乳| 日韩精品丝袜美腿| 国产精品美女久久久久av超清| 91视频在线观看| 日韩欧美在线影院| 国产精品suv一区二区三区| 91麻豆国产精品久久| www.精品在线| 欧美日本不卡高清| 乱一区二区三区在线播放| 素人啪啪色综合| 欧美国产亚洲精品久久久8v| 午夜小视频在线播放| 欧美伊人久久久久久久久影院 | 91亚洲国产成人久久精品| 亚洲淫片在线视频| 色是在线视频| 久久色精品视频| 少妇高潮一区二区三区99小说| 色综合久久88色综合天天6| 中文字幕乱码av| 99久久精品一区| 最新国产黄色网址| 亚洲欧美日韩专区| 国产成人生活片| 九九久久精品| 高清国产在线一区| 成人精品一区二区三区电影| 欧美大尺度在线观看| 裸体xxxx视频在线| 欧美xingq一区二区| 亚洲高清视频免费观看| 亚洲国产成人av网| 亚洲熟女少妇一区二区| 99综合电影在线视频| 亚洲欧美日韩综合网| 国产视频一区免费看| 国产四区在线观看| 精品国产91久久久久久浪潮蜜月| 成人h视频在线观看| 日韩黄色三级| 日韩免费中文字幕| 国产直播在线| 欧美激情精品久久久| 亚洲精品承认| 亚洲欧美综合图区| 免费国产精品视频| 欧美一级欧美一级在线播放| 亚洲一区二区视频在线播放| 欧美午夜激情小视频| 免费麻豆国产一区二区三区四区| 国产精品欧美综合在线| 欧美熟妇一区二区| 97久久超碰精品国产| 日本一级大毛片a一| 极品尤物av久久免费看| 亚洲成人av免费看| 久久在线精品| aa在线免费观看| 99热精品在线| 黄色国产一级视频| 亚洲高清在线| 男女啪啪免费视频网站| 欧美成人一品| 国产精品igao激情视频| 天天影视综合| 秋霞在线一区二区| 香蕉综合视频| 久久久久福利视频| 欧美精品成人| 免费网站永久免费观看| 欧美啪啪一区| 欧美日韩dvd| 欧美第一精品| 亚洲小说欧美另类激情| 一区二区在线影院| 日韩精品一区二区三区四| 欧美日韩mv| 给我免费播放片在线观看| 一区二区亚洲| 免费在线a视频| 视频一区免费在线观看| 99视频免费播放| 免费成人在线观看| 中文字幕资源在线观看| 国产精品影视网| 久久久久久久人妻无码中文字幕爆| 国产传媒日韩欧美成人| 野战少妇38p| 26uuu精品一区二区| 蜜乳av中文字幕| 欧美激情一区二区三区在线| 男人的午夜天堂| 亚洲综合无码一区二区| 日本学生初尝黑人巨免费视频| 精品毛片网大全| 国产精品无码粉嫩小泬| 欧美高清视频www夜色资源网| 国产欧美第一页| 亚洲成人在线视频播放| 美国成人毛片| 久久天天躁夜夜躁狠狠躁2022| 色婷婷在线播放| 欧美在线视频a| 亚洲我射av| 国产女人水真多18毛片18精品| 色婷婷精品视频| 亚洲不卡一卡2卡三卡4卡5卡精品| 成人午夜国产| 免费看日b视频| 午夜亚洲精品| 欧美激情国内自拍| 99re66热这里只有精品3直播 | 日韩一区电影| 国产女教师bbwbbwbbw| 国产精品普通话对白| 爱爱爱爱免费视频| 91网站视频在线观看| 色欲一区二区三区精品a片| 精品欧美国产一区二区三区| 中文字幕 亚洲视频| 欧美一二三四区在线| 韩国精品视频| 欧美精品电影在线| 国产精品99| 久久婷婷开心| 一区二区三区四区在线观看国产日韩| 欧美 日韩 国产 高清| 韩国精品在线观看| 瑟瑟视频在线观看| 亚洲综合图片区| 国产精品无码免费播放| 亚洲视频在线观看免费| 久草在线视频福利| 国产日韩在线看片| 欧美美乳视频| 免费毛片网站在线观看| 精东粉嫩av免费一区二区三区| 久久久久久久久久久久| 午夜久久久久久| 国产成人a人亚洲精品无码| 亚洲视频日韩精品| 九色porny自拍视频在线播放| 亚洲综合日韩在线| 色爱综合网欧美| av无码精品一区二区三区| 成人aaaa免费全部观看| 久久久久久国产精品视频| 4438x成人网最大色成网站| 黄色影院在线播放| 91国产高清在线| 北条麻妃在线一区二区免费播放| 亚洲欧美日韩另类精品一区二区三区| 亚洲精品看片| 无码人妻丰满熟妇区毛片蜜桃精品 | 91九色02白丝porn| 神马久久久久| 国产91精品久久久久久| 国产精品久久久网站 | 国产精品外国| 小毛片在线观看| 亚洲国产一区二区a毛片| 99久久精品日本一区二区免费| 日韩在线免费视频观看| 农村妇女一区二区| 亚洲一卡二卡| 免费成人在线观看| 波兰性xxxxx极品hd| 欧美精品精品一区| 爆操欧美美女| 91国产在线播放| 极品中文字幕一区| 欧美日韩一区二区三区四区五区六区| 玉米视频成人免费看| 亚洲av无码国产精品永久一区| 欧美福利视频在线| 国产亚洲成av人片在线观黄桃| 久艹在线免费观看| 99视频超级精品| 欧美三级韩国三级日本三斤在线观看 | 欧美成人自拍| 欧美69精品久久久久久不卡| 亚洲靠逼com| 亚洲伦理在线观看| 57pao精品| 欧美日韩精品在线一区| 午夜免费高清视频| 亚洲欧美日韩久久精品| 亚洲av无码乱码在线观看性色| 久久久久久伊人| 中文字幕伦av一区二区邻居| 男女爽爽爽视频| 18欧美亚洲精品| 老牛影视av牛牛影视av| 91av国产在线| 免费在线a视频| 国产精品欧美久久久久无广告 | 日韩视频免费观看高清| 亚洲美女激情视频| 日本欧美在线| 国产一线二线三线女| 久久免费的精品国产v∧| 国产精品午夜一区二区| 欧美成人手机在线| 日韩电影不卡一区| 在线观看国产福利| 亚洲成a人在线观看| 国产大片在线免费观看| 51国偷自产一区二区三区的来源| 亚洲免费播放| 国产aaaaaaaaa| 亚洲变态欧美另类捆绑| 日韩一区二区三区免费| 免费日韩在线观看| 久久久久久夜精品精品免费| 91久久国语露脸精品国产高跟| 久久男人资源视频| 成人激情在线| xxxx黄色片| 337p亚洲精品色噜噜| 天堂电影一区| 欧美xxxx吸乳| 国产亚洲精品免费| 亚洲精品国产精| 国产裸体写真av一区二区| 91久久综合| 一级性生活免费视频| 亚洲精品视频网上网址在线观看 | 亚洲黄色免费av| 久久久久久久久网| 国产日韩影视精品| 日批视频免费播放| 91精品视频在线|