精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

新聞 人工智能
北大博士生沈劍豪領銜的一篇關于「用語言模型來解決數學應用題」(Generate & rank: A multi-task framework for math word problems)的EMNLP投稿在綜合評審時被認為不夠重要,最終收錄于Findings而沒有被主會接收。

 [[433838]]

最近,EMNLP 2021開獎了!華人作者包攬了最佳長、短論文。

然而,有人歡喜有人憂。

北大博士生沈劍豪領銜的一篇關于「用語言模型來解決數學應用題」(Generate & rank: A multi-task framework for math word problems)的EMNLP投稿在綜合評審時被認為不夠重要,最終收錄于Findings而沒有被主會接收。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

「審稿人普遍喜歡這篇論文,但這看起來是一篇邊緣的論文。鑒于這是BART在數學問題上的應用,而數學問題的解決對于NLP來說并不是一個真正重要的任務,我懷疑這個任務的高度工程化解決方案的價值。」

[[433839]]

根據官方的文件來看,一般被列為Findings的論文得分會更低一些,或者被認為不怎么「新穎」。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

拓展了特定任務的SOTA,但是對EMNLP社區而言,沒有新的見解或更廣泛的適用性;

有良好的、新穎的實驗,并提出了全面的分析和結論,但使用的方法不夠「新穎」。

雖然,但是OpenAI覺得這個論文很重要

有趣的是,就在10月29號,OpenAI提出了一個新方法「驗證」(verification),聲稱可以解決小學數學問題。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

論文地址:https://arxiv.org/pdf/2110.14168.pdf

GSM8K數據集地址:https://github.com/openai/grade-school-math

OpenAI要解決的數學應用題是長這個樣子滴:

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

OpenAI的GSM8K數據集中的三個問題示例,紅色為計算的注釋

而且,OpenAI發現「驗證」可以讓60億參數的GPT-3,解數學應用題的準確率直接翻倍,甚至追平了1750億參數,采用微調方法的GPT-3模型。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

更重要的是,一個9-12歲的小孩子在測試中得分為60分,而OpenAI的方法在同樣的問題上可以拿到55分,已經達到了人類小學生90%左右的水平!

都是解決數學應用題,那會不會這兩篇文章是「異曲同工」呢?

巧了,還真是!

不僅如此,OpenAI這個最新工作《Training Verifiers to Solve Math Word Problems》文中還引用了北大博士生沈劍豪在9月7號提交的《Generate & Rank: A Multi-task Framework for Math Word Problems》這篇論文。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

沈劍豪,尹伊淳,李琳,尚利峰,蔣欣,張銘, 劉群,《生成&排序:一種數學文字問題的多任務框架》,EMNLP 2020 Findings。該工作由北大計算機學院和華為諾亞方舟實驗室合作完成。

論文地址:https://arxiv.org/abs/2109.03034

再看看沈同學文中要解決的數學應用題長啥樣。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

兩者確實很像啊!

深入OpenAI的論文的Introduction部分,可以找到下面這句話。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

OpenAI在論文中表示其思路和沈劍豪的論文相似

在Related Methods中,還可以看到下面這句。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

我們的工作與他們的方法有許多基本相似之處,盡管我們在幾個關鍵方面有所不同。

在文末,OpenAI也對沈博士的文章注明了引用。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

也就是說,OpenAI認可了沈同學文中的方法的價值,而且沈劍豪的論文其實比OpenAI還要早發一個月!

值得一說的是,這篇論文的一作沈劍豪是2014年浙江省高考狀元,同時也曾是北大數學學院數據方向的第一名,目前是北大計算機學院在讀博士研究生,導師為張銘教授。

[[433840]]

語言模型能解數學題嗎?

OpenAI的GPT-3「文采出眾」,上知天文,下知地理。模仿名家的寫作風格,展示一下廣博的知識,這都不在話下。

然而,GPT-3這種「語言」模型卻是典型的偏科生,擅長文,但不擅理,沒法完成精確的多步推理,比如,解決小學數學應用題。

其問題就在于,語言模型只能模仿正確解決方法的規律,但它卻并不理解「邏輯」。

所以,人類要想教會大語言模型理解復雜的邏輯,就必須得讓模型學會識別它們的錯誤,并仔細選擇他們的解題步驟。

從這個角度出發,OpenAI和博士生沈劍豪都提出了一種「先生成,后排序」的方法來幫助語言模型掌握數學推理能力,知道自己推理是否有誤。

兩者內容對比

核心框架是:生成器+重排序/驗證器。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

北大與華為諾亞的生成與重排序框架

沈同學文中的模型由一個生成器和一個排序器組成,并通過生成任務和排序任務進行聯合訓練。

生成器的目標是生成給定數學應用題的解答表達式。排序器則需要從一組候選者中選擇一個正確的表達式。

兩者共享同一個的BART模型進行編碼-解碼,排序器在此基礎上增加了一個評分函數為表達式打分。

此外,他們還構建了一個表達式庫,為排序器提供訓練實例。其中使用了兩種不同的策略:基于模型的生成和基于樹的干擾。

基于模型的生成是利用生成器通過線束搜索方法,得到前K個表達式加入到表達式庫中。

基于樹的干擾則首先將正確表達式轉化成一棵二叉樹,然后采用擴展、編輯、刪除、交換四種操作得到新的表達式,作為前一種方法的補充。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

基于樹的干擾

訓練過程包括多任務訓練和表達式在線更新。首先為生成任務對預訓練的BART進行微調。之后,使用經過微調的BART和基于樹的干擾來生成表達式,作為排序器的訓練樣本。然后,進行生成和排序的聯合訓練。

這個過程是以迭代的方式進行的,兩個模塊(即生成器和排序器)繼續相互促進。同時,用于排序器的訓練實例在每輪迭代后會被更新。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

Generate & Rank的訓練過程

而OpenAI的方法中是包含一個生成器和一個驗證器。

北大計算機博士生先于OpenAI發表預訓練語言模型求解數學題論文

OpenAI的驗證器

驗證器(verifier)可以判斷模型生成的解決方案正不正確,所以在測試時,驗證器會以問題和候選解答為輸入,輸出每個解答正確的概率。驗證器(verifier)訓練時,只訓練解決方案是否達到正確的最終答案,將其標記為正確或不正確。

驗證器具體訓練方法分「三步」:

  1. 先把模型的「生成器」在訓練集上進行2個epoch的微調。
  2. 從生成器中為每個訓練問題抽取100個解答,并將每個解答標記為正確或不正確。
  3. 在數據集上,驗證器再訓練單個epoch。

測試時,解決一個新問題,首先要生成100個候選解決方案,然后由「驗證器」打分,排名最高的解決方案會被最后選中。

思路上確實是相近的,不過有幾處細節并不相同。

一、OpenAI在文中表示他們的生成器和驗證器是分開單獨訓練的,目的是限制生成器的訓練并防止過度擬合,但原則上,他們認為應該可以組合這些模型進行聯合訓練,而沈同學則確實是使用了聯合訓練方法,實驗結果也表明聯合訓練對最終的效果有提升。

二、沈同學提出了一種幫助訓練重排器的方法:Tree-based Disturbance,其實就是設計了一系列比較難的負樣本,在正確的表達式基礎上增加了一點小擾動作為新的負樣本。而OpenAI并沒有提到類似的過程。

三、OpenAI為了評估「驗證器」的表現,收集了全新的「GSM8K數據集」并將其開源以方便研究。

GSM8K由8500個高質量、高多樣性、中等難度的小學數學問題組成。數據集中的每個問題都需要計算2到8個步驟來得出最終答案,涉及到「加減乘除」四則運算。

而沈同學最終是在兩個常用的數據集上進行了實驗:Math23K和MAWPS。

其中,Math23K是一個大規模的中文數據集,包含23162個數學應用題及其對應的表達式求解。MAWPS是一個包含2373個問題的英語數據集,所有的問題都是一個未知變量的線性問題,可以用一個表達式來解決。

當然,最明顯的就是用的語言模型不同了。沈同學用的是預訓練模型BART,而OpenAI用的則是60億和1750億參數的GPT-3。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2021-12-06 10:48:20

計算機博士 技術

2025-10-29 02:11:00

2025-09-15 09:05:00

AI數學模型

2024-03-11 16:33:26

機器狗訓練

2025-07-08 09:07:00

2017-06-06 17:03:59

機器學習模型算法

2025-10-08 10:19:29

2017-04-12 09:00:53

機器學習發生框架

2024-01-02 09:30:13

模型AI

2019-07-03 09:01:29

博士生頂會計算機

2023-03-20 10:19:25

ChatGPT數學

2013-02-22 16:08:30

易語言語言

2012-04-19 11:15:50

人腦計算機

2020-03-03 14:42:40

AI 數據人工智能

2025-03-31 09:35:00

GPT-4oAI模型

2025-02-10 08:52:00

2024-10-28 10:20:00

OpenAIGPT-4o

2022-04-08 07:54:40

人工智能核算結果Python

2022-06-24 14:52:34

AI模型

2021-07-19 15:02:48

機器人人工智能算法
點贊
收藏

51CTO技術棧公眾號

日韩电影中文 亚洲精品乱码| 亚洲国产毛片aaaaa无费看| 国产精品青草久久久久福利99| 国产成人精品视频免费| 婷婷视频一区二区三区| 欧美性猛交xxxx免费看| 中文字幕中文字幕99| www.com欧美| 视频一区二区中文字幕| 美女福利精品视频| aa一级黄色片| 日韩欧美中文字幕一区二区三区| 欧美午夜影院在线视频| 亚洲一区二区三区精品视频| 色哟哟国产精品色哟哟| 久久精品国产999大香线蕉| 亚洲3p在线观看| a一级免费视频| 先锋影音国产精品| 欧美成人aa大片| 午夜宅男在线视频| 欧美男人天堂| 亚洲美女一区二区三区| 日本一区二区在线视频观看| 亚洲精品97久久中文字幕无码| 日韩综合小视频| 欧美精品久久久久久久免费观看| 日本精品在线观看视频| 无码国模国产在线观看| 欧美日产国产精品| 少妇高潮喷水久久久久久久久久| 中文字幕资源网在线观看| 亚洲国产精品黑人久久久| 精品久久久久久中文字幕动漫 | 欧美在线黄色| 宅男66日本亚洲欧美视频| av直播在线观看| 欧美一区自拍| 亚洲第一色中文字幕| 色婷婷一区二区三区在线观看| 日韩网站中文字幕| 日韩欧美第一页| 黄色一级视频片| 99re6在线精品视频免费播放| 亚洲乱码中文字幕综合| 亚洲制服中文| 免费黄色在线网站| 国产精品成人网| 亚洲一区二区在线免费观看| 在线免费观看的av网站| 国产亚洲1区2区3区| 欧美日韩一区综合| 亚洲色图欧美视频| 91在线你懂得| 久久资源亚洲| 美女做暖暖视频免费在线观看全部网址91 | 年下总裁被打光屁股sp| 一区二区三区亚洲变态调教大结局 | 国产精品三级电影| 亚洲精品一区二区三区蜜桃久| 国产九色在线| 国产精品电影院| aaa免费在线观看| 青青草视频在线免费直播| 亚洲已满18点击进入久久| 青草网在线观看| 毛片电影在线| 色呦呦一区二区三区| 成人性做爰aaa片免费看不忠| 精品91久久| 色欧美乱欧美15图片| 免费涩涩18网站入口| 亚洲精品伦理| 日韩免费一区二区三区在线播放| 亚洲美女高潮久久久| 欧美有码在线| 色噜噜狠狠狠综合曰曰曰88av| 日韩国产第一页| 亚洲成人在线| 91sao在线观看国产| 懂色av中文字幕| 精东粉嫩av免费一区二区三区| 91在线免费看片| 瑟瑟在线观看| 亚洲国产成人午夜在线一区| 成人国产一区二区三区| 夜鲁夜鲁夜鲁视频在线播放| 欧美日韩在线三区| 男人的天堂免费| 中文精品一区二区| 美女视频黄免费的亚洲男人天堂| 久久久久久久九九九九| 玖玖在线精品| 91偷拍精品一区二区三区| 日本私人网站在线观看| 亚洲欧美日韩一区二区| 天堂…中文在线最新版在线| 九七影院97影院理论片久久| 精品欧美一区二区在线观看| 色欲狠狠躁天天躁无码中文字幕 | 国产免费无遮挡| 91在线观看免费视频| 伊甸园精品99久久久久久| 1024在线看片你懂得| 欧美曰成人黄网| 美女露出粉嫩尿囗让男人桶| 久久香蕉国产| 欧美亚洲激情在线| www.日本在线观看| 国产欧美日韩精品在线| 美脚丝袜脚交一区二区| 综合久久av| 亚洲一级免费视频| 日韩精品视频免费看| 精品写真视频在线观看| 日韩免费一区二区三区| 玖玖在线播放| 日韩一区二区三区高清免费看看| 三区四区在线观看| 国产视频一区欧美| 国产高清精品一区二区三区| 久草中文在线| 欧美日本一道本| 亚洲av综合一区二区| 136国产福利精品导航网址| 91在线中文字幕| 999国产在线视频| 91国产福利在线| 日本黄色片在线播放| 亚洲大片av| 成人h视频在线观看| 精品孕妇一区二区三区| 欧美三片在线视频观看| 人人爽人人爽人人片| 日日欢夜夜爽一区| 日韩欧美在线一区二区| 大胆人体一区二区| 亚洲精品一区二三区不卡| 男人天堂中文字幕| 成人免费视频免费观看| 日韩激情视频一区二区| 一区二区三区视频播放| 欧美国产日韩一区| www.日韩在线观看| 亚洲影院免费观看| jjzz黄色片| 亚洲二区视频| 久久精品国产精品青草色艺| 国产高清自产拍av在线| 日韩电影网在线| 影音先锋在线国产| 久久综合久久鬼色中文字| 国产精品免费观看久久| 韩日一区二区三区| 国产精品一区久久| 黄色网页在线免费看| 在线播放亚洲一区| 91免费公开视频| 国产v日产∨综合v精品视频| 国产精品va在线观看无码| 麻豆成人入口| 日韩女优在线播放| 91大神在线网站| 91麻豆精品国产自产在线| 国产一二三四在线| 91亚洲精品久久久蜜桃网站| 欧在线一二三四区| 日韩大片在线播放| 亚洲va码欧洲m码| 丁香花在线电影小说观看| 亚洲激情免费观看| 午夜精品久久久久久久蜜桃| 中文字幕在线观看不卡| 三上悠亚 电影| 噜噜噜91成人网| 手机成人av在线| 成人自拍在线| 国产成人精品在线| 成人免费高清| 日韩高清a**址| 亚洲天堂avav| 亚洲一区欧美一区| 最近中文字幕免费视频| 国产一区二区女| 中国丰满人妻videoshd| 五月天久久久| 久久综合色一本| 免费视频观看成人| 久久久久久伊人| av网站在线播放| 精品国免费一区二区三区| 免费黄色网址在线| 亚洲精品成人在线| 欧美图片第一页| 国产精品亚洲一区二区三区在线| 欧美一级片中文字幕| 中文在线日韩| 亚欧精品在线| 里番精品3d一二三区| 国产区精品在线观看| 欧美xxxbbb| 中国人与牲禽动交精品| 香蕉视频免费在线看| 在线综合视频播放| 日日夜夜操视频| 亚洲尤物视频在线| 久草福利资源在线| 91蝌蚪porny| 逼特逼视频在线观看| 国内成人自拍视频| 性生活免费在线观看| 性欧美videos另类喷潮| 人妻少妇精品无码专区二区 | 日韩视频―中文字幕| 日产精品久久久久久久性色| 日韩精品中文字幕一区二区三区 | 蜜臀av亚洲一区中文字幕| 欧美日韩一道本| 在线日韩中文| 国产xxxx振车| 中文精品久久| 三级网在线观看| 日韩伦理视频| 小说区图片区图片区另类灬| 欧美激情在线精品一区二区三区| 国产美女精品在线观看| 亚洲福利合集| 亚洲japanese制服美女| 午夜精品久久久久久毛片| 国产精品九九九| 亚洲www啪成人一区二区| 热门国产精品亚洲第一区在线| av资源在线看片| 欧美激情精品久久久久久黑人| 1区2区在线观看| 欧美成在线视频| av官网在线播放| 操日韩av在线电影| 成人av福利| 欧美成人精品在线视频| 岛国成人毛片| 欧美久久精品午夜青青大伊人| 美女国产在线| 美日韩精品视频免费看| 色婷婷在线播放| 欧美黄色片免费观看| 麻豆av在线播放| 97人人做人人爱| 天堂√8在线中文| 日韩av免费在线播放| 99久久er| 亚洲一区二区久久久久久久| 久久av网站| 国产精品美女久久久久av福利| 国产精品17p| 蜜桃999成人看片在线观看| 男男gay无套免费视频欧美| 日韩欧美视频一区二区三区四区 | 日韩欧美精品免费| 国产一区二区三区久久久久久久久 | 香蕉久久国产| 一区二区三区国产免费| 九色porny丨国产精品| 一区二区三区人妻| 99精品视频一区二区三区| 丰满圆润老女人hd| 国产精品青草久久| 草视频在线观看| 欧美日韩午夜视频在线观看| 国产情侣小视频| 91精品一区二区三区在线观看| 成人免费视频国产| 亚洲偷欧美偷国内偷| 国产激情在线| 2020欧美日韩在线视频| 欧美大陆国产| 国产不卡一区二区在线观看| 国产精品美女久久久久久不卡| 日本黄色a视频| 一区二区三区福利| 天天干在线影院| 成人中文字幕电影| 免费看黄色av| 亚洲自拍另类综合| 免费又黄又爽又猛大片午夜| 9191精品国产综合久久久久久| 色婷婷激情五月| 久久精品国产精品亚洲| 手机在线理论片| 亚洲va久久久噜噜噜| 婷婷五月色综合香五月| 日韩 欧美 自拍| 香蕉久久久久久久av网站| 日本美女久久久| 国产欧美一区二区在线| 久久伊人成人网| 欧美性视频一区二区三区| 亚洲av无码乱码国产精品久久| 亚洲无限av看| 爱啪啪综合导航| 亚洲自拍小视频| 精品毛片免费观看| 2019日韩中文字幕mv| 国内久久婷婷综合| 亚洲av综合一区二区| 亚洲一本大道在线| 国产精品视频第一页| 国产午夜精品美女视频明星a级| 国产蜜臀av在线播放| 国产一区二区色| 国产成人三级| 免费在线观看亚洲视频| 国产精品1区2区| 波兰性xxxxx极品hd| 色综合久久中文字幕| 国产综合无码一区二区色蜜蜜| 色悠悠久久88| 国产激情久久| 日韩av在线电影观看| 欧美一级视频| 久久国产精品无码一级毛片| 亚洲一区二区三区视频在线| 国产日韩欧美中文字幕| 精品国产一区二区三区久久久| 国模视频一区| 欧美一区1区三区3区公司 | 成人国产精品一区| 欧美日韩水蜜桃| 黄色av免费在线播放| 久久综合资源网| 4438国产精品一区二区| 日韩成人在线视频观看| 97人人爽人人澡人人精品| 999日本视频| 欧美91视频| 日韩精品――色哟哟| 亚洲精品亚洲人成人网在线播放| 亚洲综合精品视频| 久久久国产一区二区| 亚洲一区二区小说| 欧美爱爱视频网站| 国产一区二区三区精品视频| 国产成人自拍网站| 91精品婷婷国产综合久久性色| 久草免费在线| 91传媒视频免费| 今天的高清视频免费播放成人| 激情综合激情五月| 婷婷亚洲久悠悠色悠在线播放| 日本精品一二区| 国产91精品久久久久久久| 美女久久久久| 久久久国产欧美| 国产精品乱码一区二区三区软件| 91国内精品久久久| 欧美成人四级hd版| 狠狠久久伊人| 熟妇人妻va精品中文字幕| 国产精品视频九色porn| 国产男女猛烈无遮挡| 久久久久久久久久av| 欧美wwwwww| 最近免费中文字幕中文高清百度| 中文字幕乱码亚洲精品一区| 国产精品一区二区免费视频| 欧美巨大黑人极品精男| 日韩福利视频一区| 黑人粗进入欧美aaaaa| 亚洲色图在线视频| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 91福利视频网| 91九色精品国产一区二区| 亚洲av无码成人精品区| 狠狠躁天天躁日日躁欧美| av网站在线播放| 国产精品视频免费一区| 久久只有精品| 翔田千里88av中文字幕| 亚洲精品91美女久久久久久久| 一二区成人影院电影网| 国产女主播av| 久久婷婷综合激情| 国产精品视频一区二区三区,| 97久久精品人搡人人玩| 日韩欧美精品一区| 欧亚乱熟女一区二区在线| 在线视频欧美区| 久草在线资源站资源站| 特级西西444www大精品视频| 国产大片一区二区| 波多野结衣视频网址| 欧美精品videos性欧美| 成人精品电影| 国产一级免费片| 欧美日韩日日摸| 超碰91在线观看| 日本一二三区视频在线| 久久九九99视频| 亚洲AV无码一区二区三区性| 国产精品黄色影片导航在线观看|