精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

PNAS最新研究:81%解題率,神經網絡 Codex 推開高等數學世界大門

人工智能 新聞
機器生成的問題已經能讓學生無法辨別,說明Codex 在生成新內容方面已達到了人類的表現水平。

近日,一項新研究發布于PNAS,再次刷新了神經網絡的能力。這次神經網絡被用來解決了高等數學題,而且還是麻省理工數學課程難度的數學題!

在這項新研究中,研究團隊證明了 OpenAI 的 Codex 模型可以進行程序合成從而解決大規模的數學問題,并通過小樣本學習自動解決數據集中 81%的數學課程問題,并且 Codex 在這些任務的表現上達到了人類水平。

圖片

原文鏈接:https://www.pnas.org/doi/10.1073/pnas.2123433119

這項研究的出現,顛覆了人們普遍認為神經網絡無法解決高等數學問題的共識。研究團隊指出,Codex 之所以能做到實現這樣的能力,正是因為團隊進行了一大創新,過去那些不成功的研究只使用了基于文本的預訓練,而此次現身的 Codex 神經網絡不僅要基于文本進行預訓練,并且還對代碼進行了微調。

研究的問題數據集選用來自 MIT 的六門數學課程和哥倫比亞大學的一門數學課程,從七門課程中隨機抽取 25 個問題:MIT的單變量微積分、多變量微積分、微分方程、概率與統計概論、線性代數和 計算機科學數學和哥倫比亞大學的 COMS3251 計算線性代數。

同時,研究團隊使用了一個用于評估數學推理的最新高級數學問題基準 MATH,用 MATH 來檢測OpenAI Codex 的能力,MATH 從6大數學板塊:初級代數,代數,計數和概率,中級代數,數論,和初級微積分中各抽取15個問題。

圖片

圖注:研究中使用的課程問題數據集和MATH基準測試

研究顯示,Codex 解決了問題數據集和 MATH 數據集中的 265 個問題,其中有 213 個是自動解決的。

創新何所在

在 Transformer 發布后,基于 Transformer 的語言模型在各種自然語言處理 (NLP) 任務,包括在零樣本和少樣本語言任務中取得了巨大成功。但是因為 Transformer 僅在文本上進行了預訓練,所以這些模型基本上不能解決數學問題,GPT-3就是一個典型例子。

后來,通過小樣本學習(few-shot learning)和思維鏈 (Chain-of-thought, CoT) 提示,GPT-3 的數學推理能力得到了提高;然而,在沒有代碼的情況下,即便有小樣本學習和 CoT 提示, GPT-3 在大學水平數學問題和 MATH 基準測試中仍然無能為力。

過去關于解數學題的研究,可能在相對簡單的數學水平上有一定成績。舉個例子,基于協同訓練輸出來驗證或預測表達式樹的技術,比如MAWPS 和 Math23k,能夠以超過 81% 的準確率解決小學級別的數學問題,但是其不能解決高中、奧林匹克數學或大學難度的課程。協同訓練與圖神經網絡 (GNN) 相結合以預測算術表達式樹,能夠以高達 95% 的準確率解決機器學習中的大學水平問題。但是這項工作也僅限于數字答案,并且產生了過擬合,不能推廣到其他課程。

而這項工作的最大創新點之一就是,不僅對Codex 這種Transformer 模型進行了文本上的預訓練,還在代碼上進行了微調,使得其可以生成大規模解決數學問題的程序。

圖片

研究團隊從數據集中隨機選擇不需要輸入圖像或證明的問題樣本來進行測試。其中,僅對文本進行預訓練的語言模型 (GPT-3 text-davinci-002) 僅自動解決了課程問題中的18%和 MATH基準測試問題中的25.5%。

相比之下,使用零樣本學習和對文本進行預訓練并在代碼上進行微調的神經網絡(OpenAI Codex code-davinci-002)合成的程序可以自動解決課程問題中的 71%和 MATH 基準測試問題中的72.2%。

而使用相同的神經網絡 Codex 再加上少樣本學習,便可自動解決課程中81%的問題和 MATH 基準測試中81.1%的問題。而其余模型無法自動解決的19%的課程問題和18.9%的MATH基準問題,最后通過手動提示解決。

小樣本學習方式的補充,則是這項研究的第二大創新點。從上圖中可以看出,當零樣本學習無法解答問題時,便會使用(問題,代碼)對(pair)執行小樣本學習:

1) 使用 OpenAI 的 text-similarity-babbage-001 嵌入引擎嵌入所有問題;

2) 使用嵌入的余弦相似度從其課程中計算與未解決問題最相似的已解決問題;

3) 將最相似的問題及其相應的代碼作為小樣本問題的示例。

圖片

圖注:4種方式的自動解題率對比

上圖分別是Codex的零樣本學習、小樣本學習和GPT-3的零樣本學習、小樣本學習4種方式的自動解題率對比。圖上可以看出,橙色條狀所代表的小樣本學習 Codex 在自動解題率上的優秀表現,基本上在每個數學領域上的表現都強于其他3種方式。

這項研究的第三大創新點,便是提供了一條解決數學問題和解釋為何如此解答的管道,下圖展示了MIT 5門數學課程中管道的執行流程。

圖片

以 18.01 單變量微積分問題為例,給定一個問題和自動生成的前綴“使用 SymPy”,Codex 被提示并輸出一個程序。運行程序會產生正確答案的方程式。然后,程序會自動提示再次輸入 Codex,從而生成生成的代碼解釋。

問題解決之后

除了解決數學問題和解釋答案,Codex 也被用于為每門課程生成新問題。

為了評估生成的問題水平,團隊在參加過這些課程或者同水平課程的MIT學生中做了調查,主要是比較機器生成的問題和人工編寫問題的質量和難度。

在MIT的6門課程中,每門選擇5個人工編寫問題和5個模型生成問題混合起來并且隨機呈現。對于 60 個問題中的每一個問題,參與調查的學生都需要回答 3 個調查問題:

1)你認為這個問題是人工編寫的還是機器生成的?

2)你認為這個問題適合還是不適合特定課程?

3 ) 在 1(最簡單)和 5(最難)之間,你認為這個問題的難度級別是多少?

圖片

在收回的問卷中,學生調查結果總結如下:

  • 機器生成和人工編寫的問題難度相似。
  • 人工編寫的問題比機器生成的問題更適合課程。
  • 人工編寫的答案很難被識別錯,而機器生成的問題被學生認為既可能是機器生成的,也可能是人工編寫的。

機器生成的問題已經能讓學生無法辨別,說明Codex 在生成新內容方面已達到了人類的表現水平。

但是,該模型也有無法解決的問題,比如,如果問題以圖像或其他非文本形式出現,它就無法回答;帶有需要證明的解決方案的問題,或者計算上難以解決的問題,比如分解非常大的素數,該模型也無法解決。不過,最后一種問題也不應出現在任何數學課程作業中,因為就算是真人學生也沒法回答。

責任編輯:張燕妮 來源: AI科技評論
相關推薦

2022-11-04 17:02:31

AI模型

2022-05-10 09:19:29

異網漫游5G網絡

2017-04-18 10:59:28

軟件測試認證

2021-01-18 14:38:53

神經網絡人工智能神經元

2022-12-06 09:44:00

算法神經網絡

2021-01-15 07:55:09

Python腳本語言

2022-01-15 23:04:03

人工智能高等數學技術

2017-04-04 20:49:27

深度神經人工智能語音合成

2021-12-20 09:00:00

深度學習神經元網絡安全

2017-11-13 14:38:53

深度學習神經網絡數學

2018-07-03 16:10:04

神經網絡生物神經網絡人工神經網絡

2022-04-22 12:36:11

RNN神經網絡)機器學習

2020-04-03 16:52:01

基建數字發展

2025-03-11 13:42:19

2023-07-04 07:17:47

神經網絡大規模GNN

2017-07-18 11:40:44

深度神經網絡數學基礎拓撲

2017-09-10 07:07:32

神經網絡數據集可視化

2025-02-25 14:13:31

2021-11-02 10:05:18

神經網絡AI算法

2018-11-20 09:48:22

AI量子科技
點贊
收藏

51CTO技術棧公眾號

波多野结衣在线观看视频| 熟女人妻一区二区三区免费看| 99re在线视频| 国产黑丝在线一区二区三区| 91精品国产高清久久久久久91| 扒开jk护士狂揉免费| 日本久久久久| 欧美日韩国产色| 懂色av一区二区三区四区五区| 秋霞欧美在线观看| 蜜桃91丨九色丨蝌蚪91桃色| 久久久久久亚洲精品不卡| 色婷婷国产精品免| 男人的天堂久久| 欧美一区二区三区视频在线| 黄www在线观看| 制服丝袜中文字幕在线| 日本一区二区在线不卡| 国产精品果冻传媒潘| 久草热在线观看| 国产精品乱看| 欧美国产在线电影| 老司机成人免费视频| 国产欧美日韩免费观看| 精品国产乱码久久| 91视频福利网| 欧美综合影院| 在线观看亚洲一区| 亚洲午夜精品久久久久久人妖| 色呦呦呦在线观看| 国产精品成人免费| 日韩欧美手机在线| 天堂v视频永久在线播放| 久久99久久99| 国产精品综合久久久| 日韩综合在线观看| 亚洲免费网址| 97视频在线免费观看| 久草视频在线资源站| 亚洲成人tv| 久久精品青青大伊人av| 日韩不卡av在线| 欧美理论视频| 少妇av一区二区三区| 黄大色黄女片18免费| 欧美一级本道电影免费专区| 亚洲欧美日韩精品久久| 好吊日免费视频| 日韩成人av在线资源| 日韩精品视频免费在线观看| 黄色工厂在线观看| 亚洲日本黄色片| 国产在线观看av| 国产精品福利影院| 一区二区三区免费看| 欧美尤物美女在线| 亚洲丝袜自拍清纯另类| 一本二本三本亚洲码| 超碰超碰在线| 一区二区三区欧美视频| 国产精品日韩三级| 免费在线国产视频| 亚洲18女电影在线观看| 欧美二区在线视频| 日本韩国欧美| 欧美日韩一区久久| 污污的视频免费观看| 精品中文字幕一区二区三区| 精品精品国产高清a毛片牛牛| 亚洲色图欧美另类| 日韩精品亚洲aⅴ在线影院| 亚洲摸下面视频| xxxxx99| 一区二区三区毛片免费| 久久久久久久一| 三级网站在线播放| 韩国v欧美v日本v亚洲v| 国产厕所精品在线观看| 青青草免费观看免费视频在线| 久久久国产午夜精品| 一区二区三区免费看| 成人在线免费观看黄色| 色呦呦国产精品| 在线免费看v片| 国产精品网在线观看| 亚洲欧美激情精品一区二区| 女同久久另类69精品国产| 欧美三区视频| 国产精品精品视频一区二区三区| 一级欧美一级日韩| 99国产精品久久久| 在线精品亚洲一区二区| a级片免费在线观看| 在线亚洲一区观看| 97超碰免费在线观看| 青青草原在线亚洲| 不卡av电影院| 精品人妻一区二区色欲产成人| 精品一区二区三区欧美| 久久资源亚洲| 永久免费网站在线| 在线观看网站黄不卡| 丰满少妇中文字幕| av永久不卡| 97超碰色婷婷| 国产色片在线观看| 国产欧美一区二区精品仙草咪| av中文字幕av| 国产一区一一区高清不卡| 精品国产凹凸成av人导航| 亚洲天堂精品一区| 免费看的黄色欧美网站| 成人自拍偷拍| 含羞草www国产在线视频| 日韩欧美在线视频免费观看| 免费黄色在线播放| 999国产精品999久久久久久| 日韩免费视频在线观看| 色欲av伊人久久大香线蕉影院| 国产精品国产自产拍高清av王其| 欧美激情国产精品日韩| 国产成人精品福利| 欧美乱大交做爰xxxⅹ性3| 中文字幕在线观看免费| 91麻豆.com| 欧日韩免费视频| 一区二区三区四区高清视频| 日韩视频―中文字幕| 亚洲大尺度在线观看| 99久久综合狠狠综合久久| www.男人天堂网| 视频一区日韩| 欧美日韩成人精品| 国产黄频在线观看| 亚洲欧美一区二区久久| jizz欧美性11| 欧美亚洲国产激情| 国产精品福利在线观看网址| 福利成人在线观看| 91久久精品网| 久久久久亚洲av无码a片| 久久久久久夜| 青青草成人网| 日韩免费小视频| 伊人久久久久久久久久| 久久精品视频2| 日本一区二区三区高清不卡 | 97伦伦午夜电影理伦片| 香蕉久久久久久久av网站| 久久久水蜜桃| 午夜无码国产理论在线| 国产亚洲欧美日韩一区二区| 日本中文字幕在线观看视频| 国产欧美精品一区二区三区四区| 99热手机在线| 婷婷成人基地| 成人动漫在线视频| av免费不卡| 亚洲欧洲在线播放| 在线免费看毛片| 亚洲天堂成人网| 麻豆tv在线观看| 一区福利视频| 免费久久99精品国产自| 精品福利在线| 久久久国产在线视频| www.日韩高清| 天天综合网 天天综合色| 成年人网站免费看| 免费日本视频一区| 免费的一级黄色片| 天堂综合网久久| 国产九九精品视频| 色呦呦在线观看视频| 日韩精品免费电影| 中文字幕一级片| 亚洲图片欧美综合| 精品人妻一区二区三区蜜桃视频| 久久国产人妖系列| 久久国产精品视频在线观看| 精品成人影院| 国产精品区一区| 日本另类视频| 久久露脸国产精品| 国产一级网站视频在线| 日韩欧美在线不卡| 亚洲国产成人无码av在线| 亚洲婷婷在线视频| 免费黄色在线视频| 国产在线国偷精品产拍免费yy| av日韩一区二区三区| 成人激情开心网| 国产欧美日韩亚洲| 久久精品97| 77777少妇光屁股久久一区| 日本免费在线观看| 日韩精品极品视频| 精品国产亚洲一区二区麻豆| 色婷婷综合久久久久中文一区二区| 久久成人小视频| 26uuu色噜噜精品一区| av在线网站免费观看| 天堂成人国产精品一区| 国产夫妻自拍一区| 99久久亚洲精品| 欧美日韩高清在线一区| 日韩视频在线直播| 成人精品一区二区三区电影黑人| 欧美xxxhd| 久久久久久国产免费| 日本视频不卡| 国产亚洲精品高潮| 欧美一级片免费| 91精品国产综合久久精品麻豆 | 九色综合狠狠综合久久| 免费裸体美女网站| 一道本一区二区| 青青草视频国产| 久久久久国产| 亚洲7777| 欧美精品一区二区三区精品| 精品久久中出| 高清一区二区三区| 91青青草免费在线看| 成人在线啊v| 国产欧美精品一区二区三区-老狼| 亚洲天堂手机| 2020国产精品视频| 成人国产电影在线观看| 欧美久久精品一级黑人c片 | 综合av第一页| 韩国一级黄色录像| 国产精品毛片无遮挡高清| 在线小视频你懂的| 国产午夜亚洲精品羞羞网站| 人妻少妇一区二区| 久久久久久久综合色一本| aaaaaav| 91性感美女视频| av网页在线观看| 99久久精品情趣| 中文字幕一区二区三区乱码不卡| 国产成人精品免费网站| 波多野吉衣在线视频| 国产成人免费视频网站 | 538任你躁精品视频网免费| 91成人理论电影| 国产精品超碰| 精品蜜桃传媒| 一本色道久久综合亚洲精品酒店| 欧美一二三四五区| 欧美精品一区二区三区精品| 亚洲精品自在在线观看| 婷婷久久综合| 国产精品视频一二三四区| 欧美精品偷拍| 国产av麻豆mag剧集| 久久久噜噜噜| 国产又黄又猛又粗又爽的视频| 免费成人在线视频观看| 看看黄色一级片| 国产不卡高清在线观看视频| 国产二级一片内射视频播放 | 久久伊人资源站| sdde在线播放一区二区| 国产精品亚洲天堂| 欧美视频一区| 99色精品视频| 久久精品99国产精品日本| 日本女人性视频| 91麻豆视频网站| 成人欧美一区二区三区黑人一| 亚洲丝袜自拍清纯另类| 日本一级一片免费视频| 欧洲亚洲国产日韩| 99热这里只有精品99| 亚洲第五色综合网| 国产二区视频在线观看| 欧美日韩高清区| 成人av免费电影网站| 成人女保姆的销魂服务| 精品一区二区男人吃奶| 亚洲一区二区高清视频| 亚洲国产91| 另类小说第一页| 成人永久aaa| 日韩影视一区二区三区| 亚洲综合久久av| 一级久久久久久| 精品国产伦一区二区三区观看方式| 欧美精品少妇| 精品中文字幕在线| 日韩精品影片| 国产麻豆一区二区三区在线观看| 不卡中文字幕| 丰满少妇大力进入| 久久99热狠狠色一区二区| 国产网站无遮挡| 亚洲人xxxx| 亚洲男人天堂网址| 亚洲精品在线观| 国产1区在线| 国产成人鲁鲁免费视频a| 亚洲性视频在线| 一区二区免费在线视频| 久久精品日韩欧美| 国产清纯白嫩初高中在线观看性色| 中文一区二区在线观看 | 欧美日韩激情一区二区三区| 婷婷综合激情网| 美女福利视频一区| 成人午夜在线| 日本不卡在线播放| 国产午夜久久| 国产白袜脚足j棉袜在线观看| 中文字幕制服丝袜一区二区三区 | 熟女少妇内射日韩亚洲| 五月婷婷久久综合| 亚洲精品国产一区二| 久久视频在线播放| 久久人体av| 日本精品一区二区三区视频| av成人天堂| 少妇搡bbbb搡bbb搡打电话| 玉足女爽爽91| 国产日韩一级片| 久久久极品av| 日韩免费在线电影| 亚洲欧美日韩精品久久久 | 五月天亚洲精品| 人人妻人人澡人人爽精品日本 | 黄色a级片在线观看| 欧美夫妻性生活| 在线观看麻豆蜜桃| 国产精品视频免费在线| 日韩一区电影| www.久久av.com| 亚洲欧美日韩一区| 97国产成人无码精品久久久| 色阁综合伊人av| 99精品美女视频在线观看热舞| 亚洲一区二区三区精品动漫| 蜜臀久久久久久久| 亚洲精品国产精品乱码在线观看| 欧美日韩免费视频| 免费黄色网页在线观看| 成人www视频在线观看| 国产电影一区二区在线观看| 一级黄色片国产| 亚洲蜜臀av乱码久久精品| 国内精品偷拍视频| 欧美激情精品久久久久久黑人| 99这里只有精品视频| 青青青免费在线| 久久久精品综合| 中文字幕永久在线观看| 日韩日本欧美亚洲| 综合视频一区| 久久成人免费观看| 久久久午夜电影| 91国产精品一区| 欧美国产精品va在线观看| 久久97精品| 黄色av免费在线播放| 中文字幕一区二区三区四区不卡 | 国产精品色婷婷在线观看| 乱熟女高潮一区二区在线| 99免费精品视频| 波多野结衣视频观看| 久久久99免费视频| 久久香蕉精品香蕉| 黄色免费网址大全| 亚洲卡通欧美制服中文| 日本黄色免费视频| 国产精品18久久久久久首页狼| 午夜激情久久| 日本一卡二卡在线| 欧美亚洲动漫制服丝袜| 在线观看h网| 欧美美乳视频网站在线观看| 美国欧美日韩国产在线播放| 久久久久成人网站| 亚洲视频在线观看视频| 国产一区 二区| 黄在线观看网站| 亚洲另类春色国产| 国产精品一区在线看| 亚洲字幕一区二区| 久久精品一区二区国产| av成人免费网站| 亚洲男人天堂九九视频| 激情综合婷婷| 日韩手机在线观看视频| 亚洲一区在线观看免费| 国产精品毛片一区二区三区四区| 99re在线视频上| 蜜桃视频一区二区三区| 国产精品男女视频| 久久国产精品久久久久| 精品国产1区|