精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題

發布于 2024-7-12 11:44
瀏覽
0收藏

《思考快與慢》中人類的兩種思考方式,屬實是被Meta給玩明白了。


研究人員通過把AI的“慢思考”結果蒸餾進“快思考”,讓Llama2表現提升了257%,變得比GPT4還能打,同時還能降低推理成本。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

這里的快慢兩種思考方式,指的就是2002年諾貝爾經濟學獎得主丹尼爾·卡尼曼推廣的系統1和系統2——


簡單說,系統1是簡單無意識的直覺,速度更快;系統2則是復雜有意識的推理,準確性更強。


Meta所做的“蒸餾”,就是用系統2生成數據,然后對用系統1推理的模型進行微調。


有網友看了后表示,這種模式和人類很像,一旦解決了一個難題,再解決(相似的問題)就變得簡單了。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

將系統2蒸餾到系統1

對于大模型而言,模仿人類的“系統2”的方式有很多種,在模型中所處的環節也不盡相同,這里作者一共研究了四種:


  • CoT,即Chain of Thought,思維鏈,從提示詞入手讓模型逐步思考;
  • S2A,即System 2 Attention,由Meta自己提出,直接修改了模型的注意力機制,屏蔽與任務無關的信息;
  • RaR,即Rephase and Respond,先對問題進行重新表述,再根據重述后的問題生成答案;
  • BSM,即Branch-Solve-Merge,將復雜任務分解為多個分支,針對每個分支獨立生成評分,再將各個分支的評分綜合。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

但從整體流程上看則是殊途同歸,各種“系統2方法”都會在未標注數據集上生成推理結果。

在這過程當中,模型會在給出結果的同時生成詳細的中間推理步驟,但研究人員只保留最終的輸出結果


然后就得到了輸入-系統2輸出的數據對,可以視為一種無監督的“偽標簽”,將這些數據對收集起來,就形成初步的蒸餾數據集。


當然了,這步得到的數據還不能直接拿來微調系統1模型,需要進行過濾以確保其擁有足夠高的質量。


過濾的具體依據,是一致性和魯棒性


一致性篩選當中,對每個輸入樣本,都會用系統2模型采樣生成多個輸出,然后通過多數投票等方法進行比較,如果大多數都一致,則認為該輸出是可靠的;


魯棒性篩選是對一個輸入樣本進行適當的擾動,如改變無關細節、調整詞序等,然后觀察系統2模型在擾動前后的輸出是否一致。


篩選后的高質量蒸餾數據,就可以對系統1模型進行無監督微調了。


微調過程可以看作是一種知識蒸餾,但又與與傳統的知識蒸餾不同,這里兩種系統使用的是同一個基礎模型。


系統1模型的目標是直接學到系統2模型的輸出行為,而不是中間的復雜推理過程,在后續推理時也不需要執行系統2的推理步驟,而是直接生成輸出。


但從輸出質量上來看,表現卻能接近系統2模型,也就是實現了系統2能力向系統1的轉移。

那么,為什么要專門收集數據去微調系統1模型,而不直接用系統2模型推理呢,作者也給出了解釋。


道理其實很簡單,從系統2的另一個名字“慢系統”當中,很容易就能看出答案:

因為系統2的速度慢,在實時交互、移動設備部署等場景下,模型的延遲可能是無法接受的。


另外,由于需要輸出完整的推理過程,系統2輸出的token長度也是系統1的數百倍。

就像開頭那位網友說的,系統2把復雜的推理解決了,再將數據喂給系統1,問題對其而言也會變得容易。


從表現上看,這樣的模式也確實讓系統1模型的表現大幅進步,甚至超過了真·系統2模型。

讓Llama2超越GPT-4

針對前面四種不同的系統2方法,研究人員分別使用不同的數據集,在不同的任務上進行了測試。


針對BSM方法,作者采用的數據集是Open Assistant 2和MT-bench,評估了模型作為“評判者”時的表現。


可以看到,在兩個數據集中,Llama-2的表現(人類一致性)分別從32.0%和28.1%,提高到了58.4%和72.4%,最高增幅達到了257%,比CoT方法更加有效。


而且,微調后的模型均超過了系統1版的GPT-4,甚至達到了GPT-4配合CoT的水準。


同時(改變選項位置后的)不一致性也大幅降低,而且和系統2相比,Token數量少到幾乎可以忽略不計。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

同時針對MT-Bench不同的子類任務,作者也分別分析了各種方法的人類一致性。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

接下來是S2A方法,它主要解決的是模型偏見問題,因此評估時采用了帶偏見的TriviaQA任務。


結果蒸餾后的準確率達到81.3%,超過了原始S2A的76%,生成的token數量也從147個減少到了56個。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

RaR的測試目標則是完成一些推理任務,這里作者測試了Last letter concatenation和Coin flip。


在Letter任務中,蒸餾后的系統模型準確率從30%飛升到了98%,也超過了系統1自蒸餾的69.5%,同時也優于原始的RaR方式。


而在Coin flip任務里,蒸餾后的準確率達到 75.69%,也與接近2-步原始RaR的77.2%接近,但生成的token數量大幅減少。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

不足的一點是,CoT的蒸餾效果與另外三種大相徑庭,作者發現,在數學推理任務上,CoT的推理能力很難遷移到系統1當中。


在GSM8K數據集上,蒸餾后的模型在k=1時準確率僅為7.13%,k=10時也只有7.35%,甚至不如沒蒸餾之前的版本。

AI慢思考蒸餾進快思考,Llama2躍升至GPT-4水平,不寫過程也能做對題-AI.x社區

所以,作者認為,接下來的研究目標是進一步明確這種蒸餾的應用場合,找到更類似于人類學習的方式。


論文地址:
???https://arxiv.org/abs/2407.06023??


本文轉自 量子位,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/l-fGuCMvnRngznYbmqOWhA??

標簽
收藏
回復
舉報
回復
相關推薦
99国产精品久久久久久| 色一情一乱一伦一区二区三区 | 波多野结衣国产| 久久不见久久见国语| 欧美精品123区| 国产九九九九九| 九色在线观看视频| 精品亚洲国产成人av制服丝袜 | 性感女国产在线| 国产精品女人毛片| 国产91视觉| 嫩草影院一区二区三区| 精品一区二区三区中文字幕老牛| 欧美美女一区二区在线观看| 日韩av高清在线看片| av网在线观看| 99久久伊人久久99| 亚洲free性xxxx护士白浆| 91看片在线播放| 999久久久91| 日韩成人中文字幕| 午夜视频在线网站| 久久毛片亚洲| 亚洲一二三区不卡| 亚洲一区二区高清视频| 日本高清视频网站| 国产一区二区伦理片| 热久久视久久精品18亚洲精品| 亚洲女人毛茸茸高潮| 加勒比色老久久爱综合网| 欧美精品自拍偷拍| 国产视频一区二区视频| 日本在线啊啊| 亚洲午夜视频在线观看| 伊人婷婷久久| aaa在线观看| 91免费看片在线观看| 国产精品视频免费观看| 精品国产av一区二区三区| 日产国产高清一区二区三区| 91超碰中文字幕久久精品| 欧美成人综合色| 亚洲精品成人无限看| 中文字幕综合在线| 天天舔天天操天天干| 中日韩免视频上线全都免费| 亚洲第一精品夜夜躁人人爽| 成人三级做爰av| 日本一区二区三区电影免费观看| 欧美三片在线视频观看| 日韩一级免费在线观看| 欧美电影免费观看高清完整| 精品日韩视频在线观看| 免费无码毛片一区二三区| 毛片网站在线看| 亚洲免费观看高清| 四虎免费在线观看视频| 免费a在线看| 亚洲色图视频免费播放| 正在播放久久| aa在线视频| 一区二区三区欧美激情| 成人污网站在线观看| 在线你懂的视频| 亚洲一区av在线| 成人在线播放网址| 国产高清中文字幕在线| 色偷偷88欧美精品久久久| 欧美激情国产精品日韩| 成人性生活av| 欧美性大战久久久| www.污污视频| 亚洲成人黄色| 日韩二区三区在线| 丁香花五月婷婷| 希岛爱理av一区二区三区| 欧美成人午夜激情视频| 国产无码精品在线播放| 午夜在线播放视频欧美| 国产精品狠色婷| 国产精品永久久久久久久久久| 国产伦精品一区二区三区免费 | 性猛交ⅹ×××乱大交| 四虎国产精品永久在线国在线 | 亚洲综合色自拍一区| 日韩日韩日韩日韩日韩| 中文字幕在线看片| 欧美猛男男办公室激情| 白丝校花扒腿让我c| 校花撩起jk露出白色内裤国产精品| 亚洲天堂男人天堂女人天堂| 91香蕉视频污在线观看| 伊人成年综合电影网| 国产成人aa精品一区在线播放| 成人一级免费视频| 国产精品123区| 欧美亚洲免费高清在线观看 | 国产成人精品免费看视频| 99久久免费视频.com| 日韩视频在线播放| 激情图片在线观看高清国产| 色屁屁一区二区| 欧美激情第一区| 一区二区三区视频免费观看| 精品国内亚洲在观看18黄| 日韩人妻无码一区二区三区99| 久久一区欧美| 国产精品久久久久久免费观看| 黄色片在线播放| 亚洲在线免费播放| mm131国产精品| 亚洲动漫在线观看| 久久久91精品国产一区不卡| 日韩特级黄色片| 国产乱人伦偷精品视频不卡| 日本一区二区在线视频| 爱草tv视频在线观看992| 在线电影院国产精品| 亚洲专区区免费| 激情91久久| 成人性教育视频在线观看| 美女欧美视频在线观看免费 | 国产精品久久久久久久久免费丝袜| 91午夜在线观看| av国产精品| 一区二区三区www| 国产精品久久久久久99| 国产综合色在线| 日韩精品欧美专区| 在线观看爽视频| 亚洲国产精品成人va在线观看| 欧美丰满熟妇bbbbbb| 热久久国产精品| 日本欧美精品久久久| 亚洲私拍视频| 亚洲级视频在线观看免费1级| 人妻少妇精品一区二区三区| 久久精品国内一区二区三区| 热re99久久精品国99热蜜月| 波多野结衣亚洲一二三| 日韩精品久久久久久福利| 国产精品9191| 不卡一区二区中文字幕| 97超碰国产精品| 亚洲日本va午夜在线电影| 欧美xxxx做受欧美.88| 6—12呦国产精品| 亚洲天堂成人在线观看| 天堂中文av在线| 亚洲成人二区| 91成人免费视频| 国产盗摄一区二区| 精品国产亚洲在线| 日本视频www| caoporn国产精品| 免费看又黄又无码的网站| 欧美美女在线直播| 45www国产精品网站| 伦理片一区二区三区| 色哟哟亚洲精品| 18精品爽国产三级网站| 蜜臀久久久久久久| 亚洲综合激情五月| 中文一区二区三区四区| 97视频免费观看| 国产综合在线观看| 欧美理论电影在线| 欧美人妻精品一区二区免费看| 成人免费视频播放| 777米奇影视第四色| gogogo高清在线观看一区二区| 国产日韩精品视频| 青草在线视频在线观看| 日韩电视剧免费观看网站| 免费一级a毛片| 国产精品国产三级国产三级人妇 | 国产免费裸体视频| 偷拍亚洲色图| 国产精品自产拍在线观看中文| 国产视频在线播放| 亚洲电影免费观看高清| 日韩一级片中文字幕| 国产精品久久久久婷婷二区次| 国产黑丝在线视频| 亚洲欧美日韩在线观看a三区| 亚洲国产精品久久久久婷婷老年 | 美女一区二区三区在线观看| 91嫩草国产丨精品入口麻豆| 日韩激情啪啪| 成人妇女免费播放久久久| 女子免费在线观看视频www| 亚洲欧美国产视频| 国产欧美一级片| 欧美日韩亚洲系列| www日韩在线| 91麻豆精东视频| 97人人模人人爽人人澡| 久久九九免费| www.亚洲成人网| 成人在线国产| 精品久久sese| 亚洲午夜剧场| 欧美最顶级丰满的aⅴ艳星| 黄色网址在线免费观看| 亚洲精品一区二区在线| 亚洲av无码乱码在线观看性色| 91成人免费网站| 久久高清免费视频| 中文字幕在线不卡一区| 丰满少妇高潮一区二区| 丰满白嫩尤物一区二区| www欧美激情| 校园激情久久| 996这里只有精品| 日韩视频在线观看| 欧美色图亚洲自拍| 日本欧美高清| av色综合网| 国产午夜精品一区在线观看 | 在线xxxxx| 亚洲福利电影| 91免费网站视频| 亚洲一区二区三区三州| 欧美va亚洲va日韩∨a综合色| 色就是色欧美| 九九久久精品| 久久99精品久久久久久水蜜桃| 国产精一区二区| 国产精品一区久久久| 大胆人体一区二区| 国产69精品99久久久久久宅男| 免费**毛片在线| 在线不卡国产精品| 国产色a在线| 国产丝袜一区视频在线观看| 欧美 日韩 国产 精品| 日韩一区二区三区四区 | 亚洲视频二区| 国内少妇毛片视频| 欧美~级网站不卡| 椎名由奈jux491在线播放| 成人激情诱惑| 亚洲国产日韩欧美| 日韩综合一区| 一本久久a久久精品vr综合| 久久要要av| 伊人久久男人天堂| 一级黄色性视频| 91蜜桃网址入口| 国产全是老熟女太爽了| 91农村精品一区二区在线| 91av在线免费| 久久综合九色综合97_久久久| 超碰97在线资源站| 99精品久久99久久久久| 亚洲 欧美 日韩在线| av一本久道久久综合久久鬼色| 岛国精品一区二区三区| 成人中文字幕合集| 国产精品九九视频| 91香蕉视频黄| 真实乱视频国产免费观看 | 欧美日韩中文字幕一区| 自拍偷拍精品视频| 欧美电影一区二区| 精品人妻久久久久一区二区三区| 日韩一级成人av| 成人av免费播放| 亚洲国产小视频| 极品白浆推特女神在线观看 | 中文字幕伦理免费在线视频| 色与欲影视天天看综合网| 在线观看中文| 97超级碰碰碰| 日本欧美韩国| 亚洲一区二区久久久久久| 午夜视频一区二区在线观看| 国产欧美日韩亚洲| 国产免费久久| 影音先锋男人的网站| 在线欧美福利| 亚洲黄色av网址| 国产精品18久久久| 一级片手机在线观看| 中文字幕中文乱码欧美一区二区| www.99re7| 欧美性20hd另类| 国产乱码精品一区二三区蜜臂 | 91精品国产综合久久香蕉最新版| 视频一区在线| 欧美日韩精品免费观看| 亚欧美无遮挡hd高清在线视频| 50度灰在线观看| 免费日韩一区二区| 成人性生交视频免费观看| av电影天堂一区二区在线| 中文字幕av久久爽一区| 亚洲激情一二三区| 久久久久久无码午夜精品直播| 91麻豆精品国产自产在线观看一区| 少妇人妻一区二区| 久久精品久久精品亚洲人| 在线观看的黄色| yy111111少妇影院日韩夜片| 郴州新闻综合频道在线直播| 人妻无码一区二区三区四区| 老牛影视一区二区三区| 2025中文字幕| 国产精品传媒视频| 你懂的国产在线| 日韩精品中文字幕一区| 最新国产在线观看| 欧美孕妇孕交黑巨大网站| 国产乱码精品一区二区三区亚洲人| 欧美一卡2卡3卡4卡无卡免费观看水多多| 亚洲久久久久| 少妇激情一区二区三区| 99久久婷婷国产精品综合| 欧美三级小视频| 欧美日韩国产成人在线免费| 免费毛片在线| 91产国在线观看动作片喷水| 99久久人爽人人添人人澡| 中文字幕精品一区日韩| 日韩精品久久久久久| 亚洲图片综合网| 一区二区三区四区在线| 最近中文字幕免费在线观看| 日韩av网站大全| 黄页网站在线| 国产精品久久久久久久小唯西川 | 欧美激情小视频| 99精品国产九九国产精品| 日韩少妇中文字幕| 日韩国产在线观看| 国产又粗又猛又爽又黄av| 欧美日韩国产色视频| 欧美一级性视频| 欧美精品久久久久久久免费观看| 91视频亚洲| 少妇高潮大叫好爽喷水| 精品一区二区精品| 亚洲欧美精品aaaaaa片| 欧美精品久久久久久久多人混战| 最近高清中文在线字幕在线观看| 国产精品福利在线观看网址| 嫩草影视亚洲| 日日摸天天爽天天爽视频| 久久在线观看免费| 国产黄色免费观看| 亚洲男人天堂古典| 午夜激情成人网| 视频三区二区一区| 免费成人在线视频观看| 精品国产国产综合精品| 日韩一区二区三区四区| 欧美性爽视频| 精品国产乱码久久久久| 亚洲在线观看| xxxx日本黄色| 欧美精品 日韩| 国产嫩草在线视频| 九九九久久久| 老司机午夜免费精品视频| a资源在线观看| 538prom精品视频线放| 91麻豆免费在线视频| 国产成人精品一区二区三区福利| av不卡在线看| 好吊视频在线观看| 欧美精品自拍偷拍动漫精品| 青青草视频在线免费直播| 久久99久久精品国产| 日韩av电影天堂| 人妻久久一区二区| 日韩高清中文字幕| 日韩毛片在线| 男女啪啪免费观看| 99国内精品久久| 亚洲午夜无码久久久久| 欧美成人精品激情在线观看| 国产人妖ts一区二区| 少妇性l交大片| 亚洲九九爱视频| 天天干天天爽天天操| 国产精品久久久久久五月尺| 最新精品国产| 性欧美精品中出| 欧美一区二区三区四区久久| 欧美a级在线观看| 99re99热| 久久亚洲一区二区三区明星换脸| 一级做a爱片久久毛片| 久久久久五月天| 欧美日韩国产一区二区三区不卡| 9191在线视频| 欧美性视频一区二区三区| 国产丝袜精品丝袜| 一本色道久久综合亚洲二区三区| www..com久久爱|