精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI慢思考蒸餾進(jìn)快思考,Llama2躍升至GPT-4水平,不寫(xiě)過(guò)程也能做對(duì)題

人工智能
研究人員通過(guò)把AI的“慢思考”結(jié)果蒸餾進(jìn)“快思考”,讓Llama2表現(xiàn)提升了257%,變得比GPT4還能打,同時(shí)還能降低推理成本。

《思考快與慢》中人類(lèi)的兩種思考方式,屬實(shí)是被Meta給玩明白了。

研究人員通過(guò)把AI的“慢思考”結(jié)果蒸餾進(jìn)“快思考”,讓Llama2表現(xiàn)提升了257%,變得比GPT4還能打,同時(shí)還能降低推理成本。

圖片

這里的快慢兩種思考方式,指的就是2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼推廣的系統(tǒng)1和系統(tǒng)2——

簡(jiǎn)單說(shuō),系統(tǒng)1是簡(jiǎn)單無(wú)意識(shí)的直覺(jué),速度更快;系統(tǒng)2則是復(fù)雜有意識(shí)的推理,準(zhǔn)確性更強(qiáng)。

Meta所做的“蒸餾”,就是用系統(tǒng)2生成數(shù)據(jù),然后對(duì)用系統(tǒng)1推理的模型進(jìn)行微調(diào)。

有網(wǎng)友看了后表示,這種模式和人類(lèi)很像,一旦解決了一個(gè)難題,再解決(相似的問(wèn)題)就變得簡(jiǎn)單了。

圖片

將系統(tǒng)2蒸餾到系統(tǒng)1

對(duì)于大模型而言,模仿人類(lèi)的“系統(tǒng)2”的方式有很多種,在模型中所處的環(huán)節(jié)也不盡相同,這里作者一共研究了四種:

  • CoT,即Chain of Thought,思維鏈,從提示詞入手讓模型逐步思考。
  • S2A,即System 2 Attention,由Meta自己提出,直接修改了模型的注意力機(jī)制,屏蔽與任務(wù)無(wú)關(guān)的信息。
  • RaR,即Rephase and Respond,先對(duì)問(wèn)題進(jìn)行重新表述,再根據(jù)重述后的問(wèn)題生成答案。
  • BSM,即Branch-Solve-Merge,將復(fù)雜任務(wù)分解為多個(gè)分支,針對(duì)每個(gè)分支獨(dú)立生成評(píng)分,再將各個(gè)分支的評(píng)分綜合。

圖片

但從整體流程上看則是殊途同歸,各種“系統(tǒng)2方法”都會(huì)在未標(biāo)注數(shù)據(jù)集上生成推理結(jié)果。

在這過(guò)程當(dāng)中,模型會(huì)在給出結(jié)果的同時(shí)生成詳細(xì)的中間推理步驟,但研究人員只保留最終的輸出結(jié)果。

然后就得到了輸入-系統(tǒng)2輸出的數(shù)據(jù)對(duì),可以視為一種無(wú)監(jiān)督的“偽標(biāo)簽”,將這些數(shù)據(jù)對(duì)收集起來(lái),就形成初步的蒸餾數(shù)據(jù)集。

當(dāng)然了,這步得到的數(shù)據(jù)還不能直接拿來(lái)微調(diào)系統(tǒng)1模型,需要進(jìn)行過(guò)濾以確保其擁有足夠高的質(zhì)量。

過(guò)濾的具體依據(jù),是一致性和魯棒性。

一致性篩選當(dāng)中,對(duì)每個(gè)輸入樣本,都會(huì)用系統(tǒng)2模型采樣生成多個(gè)輸出,然后通過(guò)多數(shù)投票等方法進(jìn)行比較,如果大多數(shù)都一致,則認(rèn)為該輸出是可靠的;

魯棒性篩選是對(duì)一個(gè)輸入樣本進(jìn)行適當(dāng)?shù)臄_動(dòng),如改變無(wú)關(guān)細(xì)節(jié)、調(diào)整詞序等,然后觀察系統(tǒng)2模型在擾動(dòng)前后的輸出是否一致。

篩選后的高質(zhì)量蒸餾數(shù)據(jù),就可以對(duì)系統(tǒng)1模型進(jìn)行無(wú)監(jiān)督微調(diào)了。

微調(diào)過(guò)程可以看作是一種知識(shí)蒸餾,但又與與傳統(tǒng)的知識(shí)蒸餾不同,這里兩種系統(tǒng)使用的是同一個(gè)基礎(chǔ)模型。

系統(tǒng)1模型的目標(biāo)是直接學(xué)到系統(tǒng)2模型的輸出行為,而不是中間的復(fù)雜推理過(guò)程,在后續(xù)推理時(shí)也不需要執(zhí)行系統(tǒng)2的推理步驟,而是直接生成輸出。

但從輸出質(zhì)量上來(lái)看,表現(xiàn)卻能接近系統(tǒng)2模型,也就是實(shí)現(xiàn)了系統(tǒng)2能力向系統(tǒng)1的轉(zhuǎn)移。

那么,為什么要專(zhuān)門(mén)收集數(shù)據(jù)去微調(diào)系統(tǒng)1模型,而不直接用系統(tǒng)2模型推理呢,作者也給出了解釋。

道理其實(shí)很簡(jiǎn)單,從系統(tǒng)2的另一個(gè)名字“慢系統(tǒng)”當(dāng)中,很容易就能看出答案:

因?yàn)橄到y(tǒng)2的速度慢,在實(shí)時(shí)交互、移動(dòng)設(shè)備部署等場(chǎng)景下,模型的延遲可能是無(wú)法接受的。

另外,由于需要輸出完整的推理過(guò)程,系統(tǒng)2輸出的token長(zhǎng)度也是系統(tǒng)1的數(shù)百倍。

就像開(kāi)頭那位網(wǎng)友說(shuō)的,系統(tǒng)2把復(fù)雜的推理解決了,再將數(shù)據(jù)喂給系統(tǒng)1,問(wèn)題對(duì)其而言也會(huì)變得容易。

從表現(xiàn)上看,這樣的模式也確實(shí)讓系統(tǒng)1模型的表現(xiàn)大幅進(jìn)步,甚至超過(guò)了真·系統(tǒng)2模型。

讓Llama2超越GPT-4

針對(duì)前面四種不同的系統(tǒng)2方法,研究人員分別使用不同的數(shù)據(jù)集,在不同的任務(wù)上進(jìn)行了測(cè)試。

針對(duì)BSM方法,作者采用的數(shù)據(jù)集是Open Assistant 2和MT-bench,評(píng)估了模型作為“評(píng)判者”時(shí)的表現(xiàn)。

可以看到,在兩個(gè)數(shù)據(jù)集中,Llama-2的表現(xiàn)(人類(lèi)一致性)分別從32.0%和28.1%,提高到了58.4%和72.4%,最高增幅達(dá)到了257%,比CoT方法更加有效。

而且,微調(diào)后的模型均超過(guò)了系統(tǒng)1版的GPT-4,甚至達(dá)到了GPT-4配合CoT的水準(zhǔn)。

同時(shí)(改變選項(xiàng)位置后的)不一致性也大幅降低,而且和系統(tǒng)2相比,Token數(shù)量少到幾乎可以忽略不計(jì)。

圖片

同時(shí)針對(duì)MT-Bench不同的子類(lèi)任務(wù),作者也分別分析了各種方法的人類(lèi)一致性。

圖片

接下來(lái)是S2A方法,它主要解決的是模型偏見(jiàn)問(wèn)題,因此評(píng)估時(shí)采用了帶偏見(jiàn)的TriviaQA任務(wù)。

結(jié)果蒸餾后的準(zhǔn)確率達(dá)到81.3%,超過(guò)了原始S2A的76%,生成的token數(shù)量也從147個(gè)減少到了56個(gè)。

圖片

RaR的測(cè)試目標(biāo)則是完成一些推理任務(wù),這里作者測(cè)試了Last letter concatenation和Coin flip。

在Letter任務(wù)中,蒸餾后的系統(tǒng)模型準(zhǔn)確率從30%飛升到了98%,也超過(guò)了系統(tǒng)1自蒸餾的69.5%,同時(shí)也優(yōu)于原始的RaR方式。

而在Coin flip任務(wù)里,蒸餾后的準(zhǔn)確率達(dá)到 75.69%,也與接近2-步原始RaR的77.2%接近,但生成的token數(shù)量大幅減少。

圖片

不足的一點(diǎn)是,CoT的蒸餾效果與另外三種大相徑庭,作者發(fā)現(xiàn),在數(shù)學(xué)推理任務(wù)上,CoT的推理能力很難遷移到系統(tǒng)1當(dāng)中。

在GSM8K數(shù)據(jù)集上,蒸餾后的模型在k=1時(shí)準(zhǔn)確率僅為7.13%,k=10時(shí)也只有7.35%,甚至不如沒(méi)蒸餾之前的版本。

圖片

所以,作者認(rèn)為,接下來(lái)的研究目標(biāo)是進(jìn)一步明確這種蒸餾的應(yīng)用場(chǎng)合,找到更類(lèi)似于人類(lèi)學(xué)習(xí)的方式。

論文地址:https://arxiv.org/abs/2407.06023

參考鏈接:https://x.com/emollick/status/1810659417634869610。

責(zé)任編輯:姜華 來(lái)源: 量子位
相關(guān)推薦

2023-07-25 09:23:23

Llama 2GPT-4

2024-02-07 12:13:03

AI模型

2025-05-08 02:02:02

2023-08-11 13:17:12

AI模型

2023-08-21 10:36:23

2023-06-19 08:19:50

2023-12-11 12:46:42

GPT-4LLaMA2模型

2023-09-11 15:57:16

人工智能模型GPT-4

2025-04-16 09:35:03

2024-04-19 10:32:08

2023-07-19 11:43:59

AIGPT-4

2023-05-29 09:29:52

GPT-4語(yǔ)言模型

2024-01-12 19:07:26

GPT-4AI產(chǎn)品

2023-08-25 13:12:59

AI開(kāi)源

2023-06-08 11:27:10

模型AI

2023-07-24 14:26:58

OpenAIGPT-4Karpathy

2023-09-11 13:28:00

AI模型

2025-05-30 07:40:56

2024-04-03 12:13:58

2023-08-15 15:03:00

AI工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产淫片在线观看| 日本三级片在线观看| 51一区二区三区| 亚洲女人的天堂| 国内外成人免费视频| 青娱乐av在线| 精品日韩一区| 欧美大片国产精品| 7m精品福利视频导航| 波多野结衣 在线| 免费视频成人| 精品久久久久久久久久久| 水蜜桃一区二区三区| 亚洲天堂黄色片| 91国内精品| 欧美三片在线视频观看| 精品无码国产一区二区三区av| 成人乱码一区二区三区 | 韩国精品主播一区二区在线观看| 国产一区二区三区在线观看免费 | 高清视频一区二区三区| 国产情侣小视频| 韩国精品一区二区三区| 色多多国产成人永久免费网站| 精品中文字幕av| 成人av黄色| 免费人成在线不卡| 2020国产精品视频| 精品少妇久久久久久888优播| 欧美日韩一二三四| 日韩av综合中文字幕| 亚洲午夜精品在线观看| 黄av在线免费观看| 欧美国产精品v| 欧美大香线蕉线伊人久久| www.五月婷婷| 国产一区二区三区久久久| 国产精品久久久亚洲| 日本中文在线播放| 亚洲动漫精品| 亚洲精品一区二区三区福利| www黄色日本| cao在线视频| 亚洲欧美中日韩| 亚洲一区美女视频在线观看免费| 自拍偷拍色综合| 视频一区欧美日韩| 国产成人a亚洲精品| 国产美女激情视频| 一本一本久久| 69视频在线播放| 在线观看亚洲天堂| 国产精品视频| 国产成人av网址| 中文字幕欧美人妻精品一区蜜臀| 日韩精品免费视频人成| 神马久久久久久| 五月婷婷欧美激情| 亚洲精选av| 欧美大片国产精品| av在线播放网址| 欧美三级自拍| 亚洲性夜色噜噜噜7777| 阿v天堂2014| 9999国产精品| 欧美成人精品xxx| 久草网站在线观看| 在线看片欧美| 日本视频久久久| 一区二区乱子伦在线播放| 日韩国产精品久久久久久亚洲| 欧美综合一区第一页| 成人免费视频国产免费| 卡一卡二国产精品| www.成人av| 亚洲三区在线播放| 国产日韩欧美不卡| 综合视频在线观看| 欧美videossex另类| 国产精品区一区二区三| 精品国产免费久久久久久尖叫| 中文字幕日韩第一页| 加勒比av一区二区| 国产亚洲二区| yiren22亚洲综合伊人22| 国产精品久久一级| 激情五月六月婷婷| 自由日本语热亚洲人| 欧美三级在线播放| 一级全黄裸体片| 国产一区二区三区91| 久久久91精品| 国产污污视频在线观看| 久久精品理论片| 国产精品午夜av在线| 激情福利在线| 一区二区三区欧美| 三级a在线观看| 一区二区网站| 中文字幕亚洲欧美日韩在线不卡| 极品久久久久久| 免费日韩av| av噜噜色噜噜久久| av在线电影观看| 亚洲午夜久久久久| 久久久久亚洲av无码专区喷水| ririsao久久精品一区| 在线国产亚洲欧美| 亚洲av人人澡人人爽人人夜夜| 精品av一区二区| 隔壁老王国产在线精品| 亚洲天堂网视频| 久久综合五月天婷婷伊人| 先锋影音日韩| 国产免费不卡| 亚洲激情在线观看视频免费| 超碰人人cao| 色综合天天爱| 国产成人精品电影久久久| 性猛交富婆╳xxx乱大交天津| 欧美国产综合一区二区| 成熟丰满熟妇高潮xxxxx视频| 成人在线精品| 中文字幕日韩精品有码视频| 91精品国产高清一区二区三密臀| 国产美女娇喘av呻吟久久| 蜜桃视频在线观看91| 欧美老女人性开放| 亚洲成av人在线观看| 国产又粗又猛大又黄又爽| 欧美黄色成人| 亚洲色图国产精品| 国产三级av片| 99久久国产综合精品色伊| 99re6这里有精品热视频| 成人午夜一级| 一区二区三区日韩在线| www亚洲视频| av成人动漫在线观看| 久久久天堂国产精品| 精品国产乱码一区二区三区| 日韩在线视频国产| 在线视频你懂得| 国产精品视频你懂的| 国产精品一区二区羞羞答答| 精品国产91久久久久久浪潮蜜月| 热久久视久久精品18亚洲精品| 色网站在线免费观看| 精品国产91久久久| 懂色av粉嫩av蜜乳av| 第一sis亚洲原创| 国产成人激情小视频| 久久精品蜜桃| 欧美性淫爽ww久久久久无| 91资源在线播放| 久久aⅴ国产欧美74aaa| 操bbb操bbb| 亚洲国产aⅴ精品一区二区| 色在人av网站天堂精品| 丰满大乳国产精品| 欧美日韩精品在线播放| 五级黄高潮片90分钟视频| 爽好久久久欧美精品| 亚洲在线视频一区二区| 久久国际精品| 91国内精品久久| 国产中文字幕在线播放| 欧美日韩一区二区三区在线看| 99热在线观看精品| 国产一区二区毛片| 青青草精品视频在线| 亚洲尤物av| 国产综合久久久久| 欧美人与牲禽动交com| 日韩经典中文字幕| 亚洲网站在线免费观看| 日韩美女啊v在线免费观看| 中国特级黄色片| 亚洲一区观看| 欧美亚洲视频一区| 黄色欧美在线| 国产欧美日韩精品在线观看| 污视频在线看网站| 亚洲男人的天堂在线| 国产精品无码一区二区桃花视频| 一区二区三区免费在线观看| 欧美做受xxxxxⅹ性视频| 韩国成人在线视频| 成年人午夜视频在线观看| 久久久免费人体| 久久6精品影院| 男男电影完整版在线观看| 欧美精品久久一区| 国产香蕉视频在线| 国产精品电影一区二区三区| 亚洲午夜久久久久久久久| 免费成人性网站| 黄色一级视频在线播放| 色一区二区三区四区| 精品国产中文字幕| 成人永久在线| 国产精品美女主播在线观看纯欲| 日本三级韩国三级欧美三级| 国产午夜一区二区| 三级在线观看网站| 3d动漫精品啪啪一区二区竹菊 | 日本不卡视频一区| 蜜桃av一区二区三区| 欧美一级视频免费看| 99久久99视频只有精品| 久久综合精品一区| 97视频一区| 成人日韩av在线| 欧美精品高清| 91精品国产91久久久久福利| 91亚洲天堂| 色综合亚洲精品激情狠狠| 无码国精品一区二区免费蜜桃| 欧美一区二区三区的| 免费成人深夜夜行网站| 久久综合九色综合欧美亚洲| 欧美老女人bb| 黄网站免费久久| 日本久久精品一区二区| 国产精品普通话对白| 亚洲国产精品无码观看久久| 国产精品伦理久久久久久| 日本a级片久久久| 日韩av三区| 国产美女精品久久久| 欧美激情精品| 91久久久在线| 国产精品高清一区二区| 91精品国产综合久久男男 | 日韩午夜精品| 久久人人爽人人爽人人av| 中文字幕亚洲综合久久五月天色无吗''| 日韩片电影在线免费观看| 久久不见久久见免费视频7| 国产一区喷水| 日韩成人动漫在线观看| 国产综合精品一区二区三区| 99精品在免费线中文字幕网站一区| 91久久久久久久| www.久久久久爱免| 久久久亚洲国产天美传媒修理工| 中国av在线播放| 色综合久久悠悠| 欧美人与动牲性行为| 久久久免费电影| 爱草tv视频在线观看992| 97热在线精品视频在线观看| 成人bbav| 日产日韩在线亚洲欧美| 欧美不卡高清一区二区三区| 国产精品国产三级国产aⅴ浪潮| 怡红院成人在线| 国产乱人伦真实精品视频| 香蕉久久久久久| 99久久99久久精品国产片| 波多野结衣欧美| 久久久久久久久久久一区| 国产日产精品一区二区三区四区的观看方式 | 天堂中文在线资源| 精品在线观看国产| 成人高清免费观看mv| 久久精品视频导航| 国产一线二线在线观看 | 人妻互换免费中文字幕| 亚洲福利免费| 国产又黄又猛又粗又爽的视频| 蜜桃精品视频在线观看| 国产成人av片| 国产午夜一区二区三区| 性生交大片免费全黄| 亚洲一级在线观看| 国产伦精品一区二区三区视频我| 欧美日韩一区二区三区不卡| 亚洲大尺度视频| 亚洲精品资源美女情侣酒店| 求av网址在线观看| 久久五月天色综合| 天堂8中文在线最新版在线| 国产精品久久久久久久久久久不卡| 高清一区二区三区av| 精品国产福利| 国产精品成人av| 国模无码视频一区二区三区| 麻豆精品国产传媒mv男同| 国产精品嫩草69影院| 国产亚洲欧美中文| 波多野结衣爱爱视频| 色婷婷综合中文久久一本| 国产精品一区二区黑人巨大| 亚洲精品久久久久国产| 米奇精品一区二区三区| 91成品人片a无限观看| 9.1麻豆精品| 欧美日韩在线一区二区三区| 综合视频在线| 蜜臀视频一区二区三区| 成人丝袜18视频在线观看| 大胸美女被爆操| 五月天一区二区| 国产视频手机在线观看| 亚洲欧洲在线播放| 暖暖在线中文免费日本| 国产精品老牛影院在线观看| 精品三级av| 最新av在线免费观看| 狂野欧美性猛交xxxx巴西| 精品人妻二区中文字幕| 国产精品国产精品国产专区不片| 韩国av免费观看| 欧美成人欧美edvon| 夜级特黄日本大片_在线| 青草青草久热精品视频在线网站 | 免费一级黄色大片| 欧美日韩一区二区三区在线看| 色视频在线观看| 午夜精品福利在线观看| 视频一区在线| 中文字幕日韩精品久久| 日韩va欧美va亚洲va久久| 三级电影在线看| 亚洲成人免费看| 亚洲精选一区二区三区| 欧美男插女视频| 24小时成人在线视频| 亚洲欧洲精品在线 | 国产人与zoxxxx另类91| 亚洲高清视频一区二区| 视频一区国产视频| 日本aaa视频| 黑人精品xxx一区一二区| 日本人妻丰满熟妇久久久久久| 久久久久久网站| 9国产精品午夜| 韩日视频在线观看| 成人涩涩免费视频| 黄网站免费在线| 精品99久久久久久| www.色在线| 久久99欧美| 美女视频一区免费观看| 中文字幕网av| 中文字幕精品在线不卡| 中文字幕日产av| 日韩一级裸体免费视频| 日韩在线你懂得| japanese在线视频| 国产精品456露脸| 久热这里只有精品在线| 亚洲国产成人久久综合| 国产在线看片免费视频在线观看| 国产嫩草一区二区三区在线观看| 亚洲精品少妇| 久久精品一区二区免费播放| 色一情一乱一乱一91av| 成人精品一区| 3d动漫啪啪精品一区二区免费| 欧美成人中文| 污污污www精品国产网站| 欧美日韩人人澡狠狠躁视频| 黄色在线观看网| 91精品久久久久久久久| 国产精品av一区二区| 香港三日本8a三级少妇三级99| 日韩欧美亚洲综合| 中文字幕在线视频区| 亚洲影院在线看| 国产情侣一区| 黄色免费一级视频| 日韩亚洲电影在线| 日本在线高清| 夜夜爽99久久国产综合精品女不卡 | 欧美电影免费| 国产又黄又嫩又滑又白| 香蕉成人伊视频在线观看| 黄色av免费在线看| 92裸体在线视频网站| 日韩亚洲在线| jizz18女人高潮| 欧美成人a∨高清免费观看| 伊人色综合一区二区三区影院视频 | 天天影视涩香欲综合网 | 欧美精品亚州精品| 婷婷精品视频| 无套内谢丰满少妇中文字幕| 欧美性猛交xxxx| 免费在线观看av网站| 精品国产免费一区二区三区| 免费不卡在线视频| 日韩少妇高潮抽搐| 色婷婷综合成人| 免费福利视频一区| 日本一二三四区视频| 色综合视频一区二区三区高清| 国产激情视频在线| 日韩av电影免费在线观看|