精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI再卷數學界,DSP新方法將機器證明成功率提高一倍

人工智能 新聞
谷歌的吳宇懷 (Yuhuai Tony Wu)等研究者設計了一種叫做「Draft, Sketch, and Prove」 (DSP)的新方法將非形式化的數學證明轉化為形式化的證明。實驗結果顯示,自動證明器在 miniF2F 上解決的問題比例從 20.9% 提高到了 38.9%。

自動證明數學定理是人工智能的一個初衷,也是一直以來的難題。到目前為止,人類數學家使用了兩種不同的方式來書寫數學。

第一種是大家都熟悉的方式,即用自然語言來描述數學證明。大部分的數學都是以這種方式書寫的,這包括數學課本,數學論文,等等。

第二種稱之為形式化數學(formal mathematics)。這是近半個世紀計算機科學家創造的,用來檢驗數學證明的一種工具。

如今看來,計算機可以被用來驗證數學證明,但它們只有在使用專門設計的證明語言時才能做到這一點,而無法處理數學符號和數學家使用的書面文本的混合體。如果把用自然語言編寫的數學問題轉換為形式化代碼,讓計算機更容易解決它們,或許能夠幫助構建能探索數學新發現的機器。這個過程被稱為形式化(formalisation),自動形式化(autoformalization)指的是自動從自然語言數學翻譯成形式化語言的任務。

形式化證明的自動化是一項具有挑戰性的任務,深度學習方法在該領域尚未大獲成功,這主要是因為形式化數據的稀缺。事實上,形式化證明本身是非常困難的,且只有少數專家能做到,這使得大規模的注釋工作并不現實。最大的形式化證明語料庫是用 Isabelle 代碼 (Paulson, 1994) 編寫的,大小不到 0.6GB,比視覺或自然語言處理中常用的數據集小幾個數量級。為了解決形式證明的稀缺性,以往的研究提出使用合成數據、自監督或強化學習來合成額外的形式化訓練數據。雖然這些方法在一定程度上緩解了數據的不足,但都無法將大量人工撰寫的數學證明充分利用起來。

我們以語言模型 Minerva為例。當在足夠多的數據訓練之后,我們發現它的數學能力非常強,可以在高中數學測試中拿到高于平均分水平。然而這樣的語言模型也有不足,它只能模仿,而不能自主訓練而提高數學水平。形式化證明系統提供了一個訓練環境,但形式化數學的數據非常少。

與形式化的數學不同,非形式化的數學數據是豐富和廣泛可用的。最近,在非形式化數學數據上訓練的大型語言模型展示了令人印象深刻的定量推理能力。然而,它們經常產生錯誤的證明,而自動檢測這些證明中的錯誤推理是很有挑戰性的。

在最近的一項工作中,谷歌的吳宇懷 (Yuhuai Tony Wu)等研究者設計了一種叫做 DSP(Draft, Sketch, and Prove )的新方法,將非形式化的數學證明轉化為形式化的證明,從而同時具備形式化系統提供的邏輯嚴謹性和大量的非形式化數據。

圖片

論文鏈接:https://arxiv.org/pdf/2210.12283.pdf

今年早些時候,吳宇懷與幾位合作者使用了 OpenAI Codex 的神經網絡進行自動形式化工作,證明了用大型語言模型將非形式化語句自動翻譯成形式化語句的可行性。DSP 則更進一步,利用大型語言模型從非形式化證明中生成形式化證明草圖。證明草圖由高層次的推理步驟組成,可以由交互式定理證明器這樣的形式化系統來解釋。它們與完整的形式化證明不同,因為它們包含無理由的中間猜想的序列。在 DSP 的最后一步,形式化證明草圖被闡述為一個完整的形式化證明,使用一個自動驗證器來證明所有中間猜想。

吳宇懷表示:現在,我們展示了 LLM 可以將其生成的非形式化證明轉化為經過驗證的形式化證明!

圖片

方法

方法部分描述了用于形式化證明自動化的 DSP方法,該方法利用非形式化證明來指導自動形式化定理證明器的證明草圖。這里假設每個問題都有一個非形式化命題和一個描述該問題的形式化命題。整體 pipeline 包括三個階段(如圖 1 所示)。

圖片

圖 1.

非形式化證明的起草

DSP 方法的初始階段,包括根據問題的自然數學語言描述(可能用 LATEX)為其尋找非形式化證明。由此產生的非形式化證明被看作是后續階段的草稿。在數學教科書中,一般都會提供定理的證明,但有時會缺失或不完整。因此,研究者考慮了與非形式化證明的存在或不存在相對應的兩種情況。

在第一種情況下,研究者假設有一個「真實的」非形式化證明(即由人寫的證明),這是現有數學理論形式化實踐中的典型情況。在第二種情況下,研究者做了一個更普遍的假設,即沒有給出真實的非形式化證明,并且用一個經過非形式化數學數據訓練的大型語言模型來起草證明候選。該語言模型消除了對人類證明的依賴,并能為每個問題產生多種備選解決方案。雖然沒有簡單的方法來自動驗證這些證明的正確性,但非形式化證明只需要在下一階段對生成一個好的形式化證明草圖有用。

將非形式化證明映射為形式化草圖

形式化證明草圖對解決方案的結構進行編碼,并撇開低層次的細節。直觀地說,它是一個部分證明,概述了高層次的猜想命題。圖 2 是一個證明草圖的具體例子。盡管非形式化證明經常撇開低層次的細節,這些細節不能在形式化證明中排出,這使得非形式化證明到形式化證明的直接轉換變得困難。相反,本文建議將非形式化證明映射到共享相同高層結構的形式化證明草圖上。證明草圖中缺少的低層次細節可以由自動證明器來填補。由于大型非形式化 - 形式化平行語料庫不存在,標準的機器翻譯方法不適合這項任務。相反,這里使用一個大型語言模型的小樣本學習能力。具體來說,用了一些包含非形式化證明及其相應的形式化草圖的例子對來 prompt 該模型,然后是一個有待轉換的非形式化證明,然后讓模型生成后續的 token,以獲得所需的形式化草圖。這個模型稱為「自動形式化器」。

圖片

圖 2.

證明草圖中的公開猜想

作為這個過程的最后一部分,研究者執行現成的自動證明器來填補證明草圖中缺失的細節,這里的「自動證明器」是指能夠產生形式上可驗證的證明的系統。該框架對自動證明器的具體選擇是不可知的:它可以是符號證明器(如啟發式證明自動化工具)、基于神經網絡的證明器或者混合方法。如果自動證明器成功地填補了證明草圖中的所有空白,它就會返回最終的形式化證明,可以對照問題的規格進行檢查。如果自動證明器失敗(例如,它超過了分配的時間限制),則認為評估是不成功的。

實驗

研究者進行了一系列實驗,包括從 miniF2F 數據集中生成問題的形式化證明,并表明很大一部分定理可以用這種方法自動證明。此處研究了兩種環境,其中非形式化證明是由人類寫的,或者是由一個在數學文本上訓練的大型語言模型起草的。這兩種設置對應于現有理論形式化過程中經常出現的情況,即通常有非形式化證明,但有時作為練習留給讀者,或者由于空白處的限制而缺失。

表 1 展示了在 miniF2F 數據集上發現的成功形式化證明的比例。結果包括本文實驗的四條 baseline,以及帶有人類編寫的證明和模型生成的證明的 DSP 方法。

圖片

可以看出,附加了 11 種啟發式策略的自動證明器大大增加了 Sledgehammer 的性能,在 miniF2F 的驗證集上將其成功率從 9.9% 提高到 18.0%,在測試集上從 10.4% 提高到 20.9%。兩個使用語言模型和證明搜索的 baseline 在 miniF2F 的測試集上分別達到 29.9% 和 35.2% 的成功率。

基于人類編寫的非形式化證明,DSP 方法在 miniF2F 的驗證和測試集上取得了 42.6% 和 39.3% 的成功率。488 個問題中共有 200 個可以通過這種方式進行證明。Codex 模型和 Minerva(8B)模型在解決 miniF2F 上的問題時給出了非常相似的結果:它們都指導自動驗證器分別解決了驗證集和測試集上 40.6% 和 35.3% 的問題。

當切換到 Minerva(62B)模型時,成功率分別上升到 43.9% 和 37.7%。與人編寫的非形式化證明相比,其在驗證集上的成功率要高 1.3%,在測試集上要低 1.6%。總的來說,Minerva(62B)模型能夠解決 miniF2F 上的 199 個問題,比用人編寫的證明少一個。Minerva(540B)模型在 miniF2F 的驗證集和測試集中分別解決了 42.6% 和 38.9% 的問題,也生成了 199 個成功的證明。

在兩種情況下,DSP 方法都能有效地指導自動證明器:使用人類的非形式化證明或語言模型生成的非形式化證明。DSP 幾乎將證明器的成功率提高了一倍,并在使用 Isabelle 的 miniF2F 上產生了 SOTA 性能。此外,更大的 Minerva 模型在指導自動形式化證明器方面幾乎和人類一樣有幫助。

如下圖所示,DSP 方法顯著提高了 Sledgehammer + 啟發式證明器的性能(~20% -> ~40%),在 miniF2F 上實現了新的 SOTA。

Minerva 的 62B 和 540B 版本生成的證明與人類的證明非常相似。

圖片

更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-30 17:23:54

數據模型

2009-09-16 10:05:06

GoogleChrome 3.0瀏覽器

2023-07-03 16:01:51

AI數學

2024-01-03 17:39:23

云計算混合云

2010-11-18 10:59:00

求職

2024-02-05 08:00:00

代碼生成人工智能自然語言

2022-06-24 08:20:56

requests爬蟲Python

2021-01-20 18:13:52

VRAR守門員

2025-11-18 16:47:16

AI模型訓練

2024-04-02 10:13:25

在線小工具開發

2012-07-04 08:48:59

程序員

2023-04-10 14:22:26

PCIe6.0PCIe

2012-07-04 09:30:49

程序員開發效率

2025-09-03 09:02:00

2024-10-23 19:47:54

2020-05-12 10:43:30

谷歌算法人工智能

2011-02-22 09:29:33

無線網絡無線網速

2013-01-22 17:39:57

360瀏覽器搶票專版

2025-07-29 00:15:00

2009-06-15 08:47:33

微軟Windows 7操作系統
點贊
收藏

51CTO技術棧公眾號

三区精品视频观看| 日韩一级完整毛片| 欧美日韩在线观看一区| 成人免费毛片视频| 五月精品视频| 亚洲大胆人体在线| 黄色一级二级三级| 欧美6一10sex性hd| 久久蜜桃av一区精品变态类天堂| 国产精品色婷婷视频| 青娱乐国产在线视频| 国产永久精品大片wwwapp| 久久er99精品| 成人一区在线观看| 日韩av日韩在线观看| 午夜少妇久久久久久久久| 亚洲第一二三区| 91精品国产乱| www.99av.com| www.av视频在线观看| 久久91超碰青草在哪里看| 亚洲久本草在线中文字幕| 免费观看国产成人| 丰满熟女一区二区三区| 久久成人av少妇免费| 69久久夜色精品国产69| 四虎精品免费视频| 成人免费av| 欧美午夜免费电影| a级黄色一级片| 国产精品久久久久久福利| a在线欧美一区| 亚洲自拍欧美色图| 中文字幕在线日亚洲9| 性xx色xx综合久久久xx| 欧美精品免费在线| 日韩在线一卡二卡| 日韩国产在线| 在线观看欧美视频| 亚洲第一成人网站| 伊人久久大香线蕉| 日韩av网站导航| 久久免费精品国产| heyzo欧美激情| 日韩一区二区免费在线观看| 黄色小视频免费网站| 91综合国产| 在线观看精品一区| 99视频在线免费| 我爱我色成人网| 色综合天天天天做夜夜夜夜做| 久久久久99精品成人片| 蜜桃传媒在线观看免费进入 | 日韩欧美在线视频播放| 精品久久成人| 在线看国产精品| 一级片黄色录像| 久久精品久久久| 久久天天躁狠狠躁老女人| 国产视频精品免费| 亚洲精品网址| 欧美激情精品久久久久久免费印度 | 亚洲综合区在线| 91青青草免费观看| 精品人妻午夜一区二区三区四区 | 中文字幕中文在线不卡住| 亚洲精品中文字幕乱码三区不卡| 精品人妻无码一区二区| 国产高清视频一区| 国产精品久久久久免费| 婷婷在线观看视频| 91丨九色丨蝌蚪丨老版| 日本不卡高清视频一区| 91在线视频| 亚洲免费电影在线| 91精品国产91久久久久麻豆 主演| hd国产人妖ts另类视频| 欧美视频二区36p| 成人午夜激情av| 高清不卡一区| 亚洲国产中文字幕久久网| 精品无码人妻一区| 久久精品高清| 久久久久久久97| 网站永久看片免费| 欧美午夜不卡| 青草热久免费精品视频| 亚洲最大成人在线视频| 免费在线亚洲| 成人久久久久久| 色欲久久久天天天综合网| 久久精品视频在线看| 最新精品视频| 三级在线看中文字幕完整版| 欧美日韩一区二区在线观看视频| 苍井空张开腿实干12次| 蜜桃精品wwwmitaows| 久久躁狠狠躁夜夜爽| 国产性猛交╳xxx乱大交| 久久国产精品72免费观看| 国产a一区二区| 成年网站在线| 亚洲v日本v欧美v久久精品| 无人在线观看的免费高清视频| 成人在线啊v| 亚洲欧美日韩在线一区| 波多野结衣亚洲色图| 久久av一区二区三区| 亚洲精品欧美日韩专区| 国产黄色在线| 亚洲成人av一区二区三区| 欧美一级裸体视频| 久久a爱视频| 久久天天躁狠狠躁夜夜躁 | 国产日韩欧美一区| 91免费综合在线| 精品国产一区二区三区成人影院| 国产视频在线观看一区二区| 丰满少妇被猛烈进入一区二区| 在线亚洲国产精品网站| 91久久精品国产91性色| 九一国产在线| 亚洲成av人**亚洲成av**| 午夜视频在线观| 伊人网在线播放| 欧美一区二区网站| 日本一区二区视频在线播放| 精品一区二区三区中文字幕老牛| 久久久久久亚洲精品不卡| 一区二区三区亚洲视频| 久久婷婷成人综合色| 国产日韩亚洲欧美在线| av日韩久久| 中文字幕亚洲一区二区三区五十路| 天天综合天天干| www.亚洲精品| 欧美性潮喷xxxxx免费视频看| 国产精品亚洲综合在线观看| 日韩在线视频免费观看高清中文| 波多野结衣激情视频| 97精品国产露脸对白| 久久香蕉视频网站| 国产日韩在线观看视频| 久久久91精品国产一区不卡| 午夜视频网站在线观看| 久久只精品国产| 日本黄色三级大片| 一区二区导航| 国产精品久久国产精品99gif| 欧美zzoo| 日本精品一区二区三区高清 | 国产男男gay体育生白袜| 欧美国产精品v| 在线观看亚洲色图| 四季av一区二区三区免费观看| 国产乱肥老妇国产一区二| av电影在线观看| 欧美色倩网站大全免费| 日韩欧美在线视频播放| 国产在线视频一区二区| 法国空姐在线观看免费| 久久久久毛片免费观看| 欧美日本国产在线| 欧美视频一二区| 黑丝美女久久久| 受虐m奴xxx在线观看| 免费精品99久久国产综合精品| 亚洲五月六月| 136福利精品导航| 性色av一区二区三区| 久久精品五月天| 国产精品亲子乱子伦xxxx裸| 天天爽夜夜爽视频| 国产亚洲一级| 一本色道久久99精品综合| 日韩高清二区| 日韩在线中文字| 国产wwwxxx| 亚洲国产va精品久久久不卡综合| 国产呦小j女精品视频| 麻豆精品久久精品色综合| 菠萝蜜视频在线观看入口| 欧美做受69| 国产一区二区在线免费视频| 波多野结衣在线观看| 亚洲视频777| 精品人妻午夜一区二区三区四区| 欧美色视频日本高清在线观看| 懂色av蜜臀av粉嫩av永久| 成人h精品动漫一区二区三区| 无码日韩人妻精品久久蜜桃| 欧美成人日本| 亚洲自拍欧美色图| 在线观看涩涩| 久久中文久久字幕| 手机在线精品视频| 欧美中文字幕不卡| 青青草手机在线观看| 久久精品一区二区三区不卡 | 尤物视频在线看| 欧美在线观看视频一区二区| 午夜剧场免费在线观看| 不卡影院免费观看| 日本免费色视频| 日韩视频中文| 亚洲欧美日韩另类精品一区二区三区 | 亚洲一卡二卡三卡四卡五卡| 日韩av黄色在线观看| 超鹏97在线| 日韩精品黄色网| 91片黄在线观看喷潮| 欧美午夜精品伦理| 一起操在线播放| 久久久综合精品| xxxx国产视频| 热久久国产精品| 欧美大黑帍在线播放| 欧美久久精品一级c片| 成人三级在线| 人人精品久久| 国产成人精品一区二区在线| 久久av色综合| 北条麻妃99精品青青久久| 欧美一级视频免费| 欧美人xxxx| 日韩精品一区二区亚洲av观看| 亚洲国产精品久久不卡毛片| 欧美色图亚洲视频| 欧美国产日本视频| 18禁裸乳无遮挡啪啪无码免费| 久久99精品久久久| 色片在线免费观看| 日韩精品一二三区| 国产精品无码一区二区在线| 波多野结衣一区二区三区免费视频| 欧美在线视频免费播放| av在线导航| 久久好看免费视频| 国产日产一区二区| 久久精品成人一区二区三区| 超碰免费在线观看| 亚洲免费电影在线观看| 欧美在线一卡| 亚洲高清久久久久久| 午夜精品小视频| 日韩午夜精品电影| 亚洲av综合色区无码一区爱av | 久久999免费视频| 免费在线看黄色| 国产亚洲福利一区| 日韩精品一区二区亚洲av| 亚洲国产色一区| 久久久久噜噜噜亚洲熟女综合| 亚洲欧美日韩成人高清在线一区| 免费看一级大片| 亚洲色图一区二区三区| 日韩av毛片在线观看| 国产精品久久久久影院| 国产男女猛烈无遮挡在线喷水| 一区在线中文字幕| 久久久久无码国产精品一区李宗瑞| 国产亚洲成人一区| 国产97色在线 | 日韩| 狂野欧美一区| 国产视频一区二区视频| 老司机免费视频一区二区| 99热这里只有精品在线播放| 日本中文字幕一区二区视频 | 六月丁香综合在线视频| 午夜大片在线观看| 国产精品亚洲一区二区三区在线| 国产成人av免费观看| 国产主播一区二区| 国产精品成人免费一区久久羞羞| 国产成人av一区二区| 国产精品日日摸夜夜爽| 久久在线观看免费| 97人妻人人揉人人躁人人| 中文字幕第一区综合| 女人十八毛片嫩草av| 亚洲三级电影网站| 久久久久久激情| 日韩欧美成人网| 亚洲视频一区在线播放| 这里只有精品99re| 亚洲精品一区二区三区不卡| 亚洲欧洲一区二区三区久久| 777电影在线观看| 欧美久久精品一级黑人c片 | 亚洲欧美一区二区在线观看| 午夜免费激情视频| 一本色道久久综合亚洲aⅴ蜜桃| 91丨九色丨海角社区| 宅男噜噜噜66一区二区66| 精品国产99久久久久久宅男i| 亚洲国产精品字幕| jizz在线观看中文| 久久91精品国产91久久跳| 久久99久久99精品免观看软件| 成人黄色av网| 老司机在线精品视频| 一区二区三区四区视频在线| 欧美日本一区| 亚洲成熟丰满熟妇高潮xxxxx| 国产精品一级在线| 国产一二三四五区| 一区二区三区四区国产精品| 国产精品黄色网| 91精品国产色综合久久不卡蜜臀| 瑟瑟在线观看| 久久亚洲精品成人| 成人激情视屏| 激情久久av| 亚洲一级淫片| 亚洲精品无人区| 在线精品一区| 一区二区在线免费看| 成人免费观看男女羞羞视频| 五月激情四射婷婷| 婷婷亚洲久悠悠色悠在线播放| 中文字幕免费高清网站| 亚洲国产美女精品久久久久∴| 黄色网址在线免费| 青草青草久热精品视频在线网站| 高清精品视频| 中文字幕黄色大片| 久久精品综合| 艳妇乳肉豪妇荡乳xxx| 亚洲婷婷综合久久一本伊一区| 国产乡下妇女三片| 亚洲老司机av| 精品丝袜在线| 国产在线一区二区三区四区| 亚洲有吗中文字幕| 三级视频中文字幕| 国产精品污www在线观看| 国产无遮挡呻吟娇喘视频| 精品国产精品一区二区夜夜嗨| 免费污视频在线| 91久久极品少妇xxxxⅹ软件 | 99久久综合精品| 日本精品人妻无码77777| 91精品中文字幕一区二区三区 | 免费99精品国产自在在线| 男人亚洲天堂| 色一情一乱一伦一区二区三区| 午夜影院日韩| 丰满熟女人妻一区二区三区| 亚洲精品国产无天堂网2021| 性生交生活影碟片| 萌白酱国产一区二区| 久久久久久久久久久久电影| 日本免费成人网| 国模娜娜一区二区三区| 最新av电影网站| 欧美一级日韩一级| av片在线观看免费| 亚洲精品欧美一区二区三区| 亚洲特色特黄| 毛茸茸free性熟hd| 天天影视涩香欲综合网| 色呦呦免费观看| 亚州欧美日韩中文视频| 要久久爱电视剧全集完整观看| 丝袜老师办公室里做好紧好爽| wwwwww.欧美系列| 中文字幕有码无码人妻av蜜桃| 在线国产精品播放| 欧美亚洲人成在线| 在线观看成人一级片| 国产91丝袜在线播放| 国产精品第108页| 亚洲欧美三级伦理| 欧美一级在线| 少妇一晚三次一区二区三区| 91在线视频免费观看| 国产精品午夜一区二区| 欧美不卡视频一区发布| 91免费精品国偷自产在线在线| 日本中文字幕网址| 国产精品理论片| 国产sm主人调教女m视频| 久久夜色精品亚洲噜噜国产mv| 久久亚州av| 久久精品免费网站| 亚洲免费高清视频在线| 性一交一乱一透一a级| 热99在线视频| 天天影视天天精品| 国产精品久久不卡| 欧美网站大全在线观看| www在线免费观看视频| 鲁丝片一区二区三区| 麻豆精品视频在线观看视频| 性欧美疯狂猛交69hd| 日韩av资源在线播放| 先锋影音一区二区| 日韩 欧美 高清| 亚洲精品视频自拍| 深夜福利免费在线观看|