精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

重要的事情說兩遍!Prompt「復(fù)讀機(jī)」,顯著提高LLM推理能力

人工智能
盡管大模型能力非凡,但干細(xì)活的時(shí)候還是比不上人類。為了提高LLM的理解和推理能力,Prompt「復(fù)讀機(jī)」誕生了。

眾所周知,人類的本質(zhì)是復(fù)讀機(jī)。

我們遵循復(fù)讀機(jī)的自我修養(yǎng):敲黑板,劃重點(diǎn),重要的事情說三遍。

but,事實(shí)上同樣的方法對(duì)付AI也有奇效!

有研究證明,在提問的時(shí)候故意重復(fù)一遍——也就是復(fù)制粘貼,即可顯著提高LLM的推理能力。

圖片圖片

論文地址:https://arxiv.org/pdf/2309.06275

看下面的例子:

圖片圖片

作者認(rèn)為,通常情況下,問題中的重點(diǎn)token(比如這里的tennis balls)無法看到位于它后面的token(上圖)。

相比之下,使用重讀(re-reading,RE2)的方法,允許「tennis balls」在第二遍中看到自己對(duì)應(yīng)的整個(gè)問題(How many tennis balls does he have now?),從而達(dá)到雙向理解的效果(下圖)。

圖片圖片

實(shí)驗(yàn)表明,在14個(gè)數(shù)據(jù)集上的112個(gè)實(shí)驗(yàn)中,RE2技術(shù)都能帶來一致的性能提升,無論是經(jīng)過指令調(diào)整的模型(如ChatGPT),還是未經(jīng)調(diào)整的模型(如Llama)。

實(shí)踐中,RE2作為獨(dú)立的技巧,可以與CoT(Let’s think step by step)以及自我一致性方法(self-consistency,SC)一起使用。

下表展示了混合應(yīng)用多種方法對(duì)模型效果的影響。盡管自我一致性聚合了多個(gè)答案,但重讀機(jī)制仍然有助于大多數(shù)場(chǎng)景的改進(jìn)。

圖片圖片

接下來,在GSM8K數(shù)據(jù)集上(使用ChatGPT)進(jìn)一步研究輸入問題復(fù)雜性對(duì)CoT和RE2提示的推理性能的影響。

這里通過計(jì)算真實(shí)解釋中存在的推理步驟來衡量問題的復(fù)雜性,結(jié)果如下圖所示。

圖片圖片

隨著問題復(fù)雜性的增加,所有提示的表現(xiàn)通常都會(huì)下降,但重讀的引入提高了LLM應(yīng)對(duì)各種復(fù)雜問題的表現(xiàn)。

此外,作者還計(jì)算了各代和輸入問題之間的覆蓋度,證明RE2增加了輸出解釋中的n-gram (n=1,2,3,4) 召回率。

重要的事情說2遍

現(xiàn)有的推理研究主要集中在設(shè)計(jì)多樣化引導(dǎo)提示,而對(duì)輸入階段的理解卻很少受到關(guān)注。

事實(shí)上,理解是解決問題的第一步,至關(guān)重要。

當(dāng)今大多數(shù)LLM都采用單向注意力的decoder-only架構(gòu) ,在對(duì)問題進(jìn)行編碼時(shí),單向注意力限制了token的可見性,這可能會(huì)損害對(duì)問題的全局理解。

怎么解決這個(gè)問題?作者受到人類習(xí)慣的啟發(fā),嘗試讓LLM把輸入再讀一遍。

與引導(dǎo)模型在輸出中推理的CoT不同,RE2通過兩次處理問題將焦點(diǎn)轉(zhuǎn)移到輸入,促進(jìn)了單向解碼器的雙向編碼,從而增強(qiáng)LLM理解過程。

圖片圖片

上圖為GSM8K數(shù)據(jù)集上測(cè)試的注意力分布圖,較暗的單元格表示較高的注意力。

上虛線三角形內(nèi)的區(qū)域表明,第二遍輸入中的每個(gè)token都明顯關(guān)注第一遍中的后續(xù)token,證明LLM的重讀有望實(shí)現(xiàn)對(duì)問題的雙向理解。

從另一個(gè)角度考慮,重讀使LLM能夠?yàn)檩斎刖幋a分配更多的計(jì)算資源,類似于水平增加神經(jīng)網(wǎng)絡(luò)的深度。因此,擁有RE2的LLM對(duì)問題有更深入的理解。

普通推理

利用帶有CoT提示的LLM來解決推理任務(wù),可以用公式表述為:

圖片圖片

其中,Cx表示提示輸入,來自帶有CoT提示指令的模板,z表示自然語(yǔ)言中的采樣基本原理。

因此, LLM可以將復(fù)雜的任務(wù)分解為更易于管理的推理步驟,將每個(gè)步驟視為整個(gè)解決方案鏈的組成部分。

RE2 推理

受到人類重讀策略的啟發(fā),將上面的方程改寫為:

圖片圖片

所以RE2在實(shí)際應(yīng)用中就是下面這種格式:

圖片圖片

其中{Input Query}是輸入查詢的占位符,左側(cè)部分可以包含其他引發(fā)思考的提示。

實(shí)驗(yàn)

由于RE2的簡(jiǎn)單性和對(duì)輸入階段的重視,它可以與各種LLM和算法無縫集成,包括few-shot、自我一致性、各種引發(fā)思考的提示策略等。

為了驗(yàn)證RE2的有效性和通用性,研究人員在14個(gè)數(shù)據(jù)集上進(jìn)行了112個(gè)實(shí)驗(yàn),涵蓋算術(shù)、常識(shí)和符號(hào)推理任務(wù)。

算術(shù)推理

實(shí)驗(yàn)考慮以下七個(gè)算術(shù)推理基準(zhǔn):

數(shù)學(xué)應(yīng)用題的GSM8K基準(zhǔn)、具有不同結(jié)構(gòu)的數(shù)學(xué)應(yīng)用問題的SVAMP數(shù)據(jù)集、不同數(shù)學(xué)應(yīng)用題的ASDiv數(shù)據(jù)集、代數(shù)應(yīng)用題的AQuA數(shù)據(jù)集、三到五年級(jí)學(xué)生的加法和減法數(shù)學(xué)應(yīng)用題、多步驟數(shù)學(xué)問題數(shù)據(jù)集,以及單次運(yùn)算的初等數(shù)學(xué)應(yīng)用題數(shù)據(jù)集。

圖片圖片

上表為算術(shù)推理基準(zhǔn)測(cè)試結(jié)果。*處表示不使用任何技巧,但效果優(yōu)于CoT提示的情況。

常識(shí)和符號(hào)推理

對(duì)于常識(shí)推理,實(shí)驗(yàn)采用StrategyQA、ARC和CSQA數(shù)據(jù)集。

StrategyQA數(shù)據(jù)集包含需要多步驟推理的問題;

ARC數(shù)據(jù)集(ARC-t)分為兩個(gè)集合:挑戰(zhàn)集(ARC-c)和簡(jiǎn)單集(ARC-e),前者包含基于檢索和單詞共現(xiàn)算法都錯(cuò)誤回答的問題;

CSQA數(shù)據(jù)集由需要各種常識(shí)知識(shí)的問題組成。

實(shí)驗(yàn)評(píng)估兩個(gè)符號(hào)推理任務(wù):日期理解和Coinflip。日期理解是 BigBench數(shù)據(jù)集的子集,Coinflip是一個(gè)問題數(shù)據(jù)集,根據(jù)問題中給出的步驟,判斷硬幣翻轉(zhuǎn)后是否仍然正面朝上。

圖片圖片

結(jié)果表明,除了普通ChatGPT上的某些場(chǎng)景之外,具有簡(jiǎn)單重讀策略的RE2,持續(xù)增強(qiáng)了LLM的推理性能。

RE2展示了跨各種LLM的多功能性(Text-Davinci-003、ChatGPT、LLaMA-2-13B和LLaMA-2-70B),涵蓋指令微調(diào) (IFT) 和非IFT模型。

作者還對(duì)RE2在零樣本和少樣本的任務(wù)設(shè)置、思維引發(fā)的提示方法以及自洽設(shè)置方面進(jìn)行了探索,突出了其通用性。

Prompting

實(shí)驗(yàn)嚴(yán)格評(píng)估RE2模型在兩種基線提示方法上的性能:Vanilla(不添加特技)和CoT(通過逐步的思維過程來指導(dǎo)模型)。

圖片圖片

針對(duì)不同的任務(wù),作者在提示中設(shè)計(jì)了答案格式指令,以規(guī)范最終答案的結(jié)構(gòu),便于精確提取答案。

圖片圖片

實(shí)驗(yàn)的解碼策略使用貪婪解碼,溫度設(shè)置為0,從而產(chǎn)生確定性輸出。

最后探索一下問題重讀次數(shù)對(duì)推理性能的影響:

圖片圖片

上圖展示了兩個(gè)不同的LLM的表現(xiàn)如何隨問題重讀次數(shù)的變化而變化。我們可以發(fā)現(xiàn)重讀2次使性能提高,之后隨著問題重讀次數(shù)增加,性能開始下降。

猜測(cè)原因有兩個(gè):i)過度重復(fù)問題可能會(huì)起到示范作用,鼓勵(lì)LLM重復(fù)問題而不是生成答案,ii)重復(fù)問題會(huì)顯著增加推理和預(yù)訓(xùn)練之間的不一致。

參考資料:https://arxiv.org/pdf/2309.06275


責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2025-03-24 11:01:41

2017-12-26 14:17:24

潤(rùn)乾報(bào)表

2023-11-03 13:07:00

AI模型

2025-10-20 02:11:00

2011-11-01 09:31:16

寫代碼程序需要進(jìn)化

2014-06-20 09:35:09

產(chǎn)品經(jīng)理

2009-03-13 15:32:49

程序員論文架構(gòu)師

2024-07-05 15:06:00

2024-07-08 06:30:00

2023-02-09 15:48:15

模型研究

2025-03-07 09:34:14

2025-05-30 10:50:27

2024-12-23 07:20:00

LLM逆向思維語(yǔ)言模型

2025-04-24 10:26:40

2025-03-03 09:40:00

2025-10-10 02:00:00

2012-04-10 10:01:10

Ubuntu安裝事項(xiàng)

2025-05-08 02:02:02

2024-11-27 10:23:31

2025-01-14 13:52:56

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

性欧美精品一区二区三区在线播放 | 美腿丝袜亚洲综合| 国产亚洲人成网站在线观看| 看欧美ab黄色大片视频免费| 成人午夜在线影视| 不卡一区二区中文字幕| 国产成人高潮免费观看精品| 国产精品久久国产精麻豆96堂| 久久久久毛片免费观看| 午夜精品一区二区三区免费视频 | 中文字幕+乱码+中文| 涩爱av在线播放一区二区| 可以免费看不卡的av网站| 久久久91精品国产| 精品影片一区二区入口| 亚洲电影有码| 亚洲国产精品久久艾草纯爱| 日本在线播放不卡| www.国产免费| 日本系列欧美系列| 欧美理论电影在线观看| 国产小视频自拍| 午夜免费欧美电影| 在线看日本不卡| 久久观看最新视频| 五月激情婷婷综合| 国产一区二区三区久久久| 57pao成人国产永久免费| 91禁男男在线观看| 欧美日韩精品一区二区三区在线观看| 欧美亚洲综合网| 五十路熟女丰满大屁股| 黄网页在线观看| 久久综合久久综合久久| 成人免费91在线看| 亚洲精品毛片一区二区三区| 日韩视频二区| 欧美成人免费在线视频| 日韩av毛片在线观看| 亚洲电影男人天堂| 精品国产91乱码一区二区三区 | 国产99在线| 亚洲欧美国产77777| 欧美一区二区三区在线播放| 四虎在线视频免费观看| 国产一区91精品张津瑜| 国产欧美精品久久久| 超碰超碰超碰超碰| 欧美日韩国产色综合一二三四| 最近2019年好看中文字幕视频| 人妻少妇精品视频一区二区三区| 亚洲亚洲一区二区三区| 欧美一区二区久久久| 国产精品久久久久久久久久久久 | 中文字幕欧美人妻精品一区| av在线资源| 亚洲激情五月婷婷| 特级西西444| 性欧美ⅴideo另类hd| 国产日韩欧美综合一区| 欧美日本韩国一区二区三区| 头脑特工队2在线播放| www.在线成人| 懂色av一区二区三区在线播放| 国产日韩一级片| 捆绑紧缚一区二区三区视频| 国产日韩在线观看av| 欧美人一级淫片a免费播放| 香蕉视频成人在线观看| 欧洲成人性视频| 99超碰在线观看| 亚洲国产激情| 91av在线精品| 91丨九色丨海角社区| 日韩精品亚洲一区二区三区免费| 久久久久久久网站| 欧美亚韩一区二区三区| 欧美亚洲一区| 国产精品青青在线观看爽香蕉| 国产视频1区2区| 日韩国产欧美在线观看| 国产精品亚洲аv天堂网| 国产精品久久免费| 国产成人免费视频网站| 韩国精品一区二区三区六区色诱| 午夜国产在线视频| 久久久久久久久久久电影| 午夜精品一区二区三区四区| 日本三级在线视频| 一区二区高清视频在线观看| 国产无限制自拍| 午夜av不卡| 欧美在线观看一区| 特黄特黄一级片| 一区二区三区四区精品视频| 91麻豆精品国产91久久久久| xxxx视频在线观看| 久操成人av| 久久精品国产亚洲7777| 久久久久亚洲av片无码下载蜜桃| 国产亚洲网站| 91精品国产自产在线| 国产高清不卡视频| 国产成人精品亚洲777人妖| 开心色怡人综合网站| 日本视频不卡| 午夜精品视频一区| 午夜两性免费视频| 亚洲经典视频| 亚洲日韩第一页| 国产精品老熟女一区二区| 亚洲精品123区| 国产欧美一区二区三区久久| 亚洲精华国产精华精华液网站| 久久久精品国产免大香伊| 中文字幕精品—区二区日日骚| 啊啊啊久久久| 欧美美女网站色| 久久无码人妻精品一区二区三区| 99久久九九| 欧美影院在线播放| www.好吊色| 国产精品久久99| 久久久999免费视频| 香蕉久久久久久| 日韩精品免费在线视频观看| 极品盗摄国产盗摄合集| 日韩精品一区第一页| 精品久久久久久一区二区里番| 免费观看在线黄色网| 亚洲一区二区在线免费看| 五月婷婷六月合| 妖精一区二区三区精品视频| 色综合久久悠悠| 亚洲天堂视频网| 久久久久久久综合色一本| 精品人妻人人做人人爽| 亚洲天堂资源| 51精品秘密在线观看| 亚洲av片不卡无码久久| 国产伊人精品| 91青青草免费在线看| 暖暖日本在线观看| 日本高清免费不卡视频| 国产特黄级aaaaa片免| 影音先锋亚洲精品| 国产精品久久久久久一区二区| 污污网站免费在线观看| 亚洲成人精品一区| 好吊操视频这里只有精品| **女人18毛片一区二区| 国产精品视频一区国模私拍| 高清在线观看av| 一本高清dvd不卡在线观看| av2014天堂网| 99精品免费| 国产精品日韩欧美一区二区| 色操视频在线| 日韩欧美成人午夜| 青青青在线视频| 国产成人免费视频网站 | 草草视频在线播放| 一区二区三区在线视频免费观看| 亚洲18在线看污www麻豆| 伊甸园亚洲一区| 日韩av免费在线| 国产高清在线看| 精品久久久国产| 黄色正能量网站| 亚洲久久一区| 麻豆视频成人| 97久久香蕉国产线看观看| 国产亚洲a∨片在线观看| 波多野结衣视频免费观看| 日本一区二区视频在线| 岛国毛片在线播放| 综合国产在线| 精品人伦一区二区三区| 欧美电影网站| 色偷偷av亚洲男人的天堂| 国产尤物视频在线观看| 夜色激情一区二区| 午夜av免费看| 日韩成人一级片| 亚洲人成影视在线观看| 欧美性aaa| 欧美黑人极品猛少妇色xxxxx| 天堂成人在线视频| 色综合av在线| 国产极品美女在线| 不卡视频免费播放| 成人免费无码av| 久久久久久久久久久妇女| 国产一区二区自拍| 免费在线观看一区| 欧美另类老女人| 五月婷婷深深爱| 欧美色网一区二区| 久久人妻无码aⅴ毛片a片app| 粉嫩欧美一区二区三区高清影视| 一女被多男玩喷潮视频| 日韩成人综合| 国产午夜精品一区| 国产精品无码久久久久| 久久精品国产清自在天天线| 神马一区二区三区| 欧美猛男男办公室激情| 久久综合加勒比| 欧美国产禁国产网站cc| 免费黄色av网址| 视频在线观看一区| 精品无码av无码免费专区| 国产精品欧美三级在线观看| 97av自拍| 欧美a视频在线| 91爱视频在线| 日本视频不卡| 亚洲男人第一av网站| av老司机久久| 在线亚洲一区二区| 国产在线拍揄自揄拍| 国产精品久久免费看| 黄色国产在线视频| 九色综合狠狠综合久久| 亚洲中文字幕无码不卡电影| 国产精品啊v在线| 在线观看日韩片| 亚洲欧洲av| 国产精品免费视频一区二区| 日韩毛片网站| 污污的视频在线观看| 日韩一区二区在线观看视频播放| 国产精品成人久久久| 91福利在线看| 一级久久久久久| 欧美综合一区二区三区| 日韩熟女一区二区| 一本色道久久综合亚洲91| 国产中文字幕视频| 狠狠做深爱婷婷久久综合一区| 日本道在线观看| 福利二区91精品bt7086| 国产无遮挡呻吟娇喘视频| 欧美日韩一区二区在线| 800av免费在线观看| 懂色aⅴ精品一区二区三区蜜月| 国产精品变态另类虐交| 天天色 色综合| 久久亚洲天堂网| 一本色道久久综合精品竹菊| 波多野结衣电车| 欧美猛男gaygay网站| 国产三级视频在线播放| 日韩欧美一区二区视频| 人妻无码中文字幕| 亚洲欧美制服第一页| 大胆av不用播放器在线播放| 中文字幕av一区| 久cao在线| 久久久亚洲网站| 成人影院网站| 国产精品色视频| 亚洲国产精品免费视频| 国产尤物99| 第一会所亚洲原创| 国产一区二区三区播放| 国产精品一卡| 老司机久久精品| 粉嫩绯色av一区二区在线观看| 三级黄色片网站| 国产精品你懂的| 国产乱国产乱老熟300| 午夜av一区二区三区| av大片在线免费观看| 欧美日韩精品久久久| 亚洲精品一区二区三区蜜桃 | 国产一区二区影视| 美女少妇精品视频| 日韩影院在线| 91精品国产自产在线观看永久| 高潮久久久久久久久久久久久久| 欧美资源一区| 欧美日本久久| 成人在线免费播放视频| 国产成人av福利| 久久久久久国产免费a片| 一区二区三区四区视频精品免费 | av在线观看地址| 久久婷婷亚洲| 亚洲黄色小说在线观看| 国产日产欧美一区| 久久久国产精品人人片| 91精品福利视频| 五月天久久久久久| 久久夜色精品亚洲噜噜国产mv| 亚洲天堂资源| 国产精品污www一区二区三区| 日韩激情图片| 国产 福利 在线| 国产在线精品不卡| 性欧美一区二区| 天天色综合天天| 国产极品999| 色偷偷偷亚洲综合网另类| 亚洲少妇视频| 99久久自偷自偷国产精品不卡| 成人在线免费小视频| 日韩人妻精品无码一区二区三区| 国产精品白丝jk黑袜喷水| 精品日韩在线视频| 色综合网色综合| 天天干天天干天天干| 欧美高清视频在线观看| 欧美午夜三级| 日日噜噜噜噜夜夜爽亚洲精品| 日韩一级精品| 黄色性视频网站| 一区二区欧美国产| 国产精品毛片一区视频播| 中文字幕欧美国内| 亚洲欧美在线成人| 久久综合九色欧美狠狠| 最新日韩欧美| 中文字幕在线视频播放| 一区二区三区影院| 91中文字幕在线播放| 中文字幕亚洲专区| 日韩国产网站| 色姑娘综合网| 日韩和欧美的一区| 免费在线观看a视频| 一本到不卡免费一区二区| 色视频在线观看| 欧美在线视频一区| 亚欧日韩另类中文欧美| 亚洲国产精品久久久久婷蜜芽| 99精品一区二区三区| 日本中文在线播放| 日韩精品极品视频| 美女搞黄视频在线观看| 久久大香伊蕉在人线观看热2| 国产欧美大片| 欧美特级黄色录像| 欧美在线观看视频一区二区| 二人午夜免费观看在线视频| 国产精品视频在线播放| 欧美高清视频手机在在线| 欧美视频国产视频| 尤物在线观看一区| 高潮毛片7777777毛片| 97超级碰碰碰久久久| 国产成人黄色| the porn av| 亚洲狼人国产精品| 亚洲精品久久久久avwww潮水| 97视频网站入口| 怕怕欧美视频免费大全| 99视频在线视频| 日韩一区中文字幕| 亚洲国产日韩在线观看| 97在线观看视频| 国产综合久久久| 天天综合网久久| 一区二区三区免费在线观看| 网站黄在线观看| 国产va免费精品高清在线观看| 四虎成人av| 在线中文字日产幕| 欧美天堂在线观看| 日韩欧美小视频| 国产精品一区视频| 首页国产欧美久久| 精国产品一区二区三区a片| 亚洲第一区第二区| 成人免费在线观看视频| 中文字幕乱码免费| 久久综合九色综合欧美98| 一起草av在线| 97超碰国产精品女人人人爽| 日韩一级毛片| 粉嫩av懂色av蜜臀av分享| 欧美三级一区二区| 成人在线免费观看黄色| 亚洲欧美在线网| eeuss影院一区二区三区| 中文字幕一区二区三区波野结| 欧美大学生性色视频| 精品视频亚洲| 香蕉视频免费网站| 欧美三级电影一区| 国产777精品精品热热热一区二区| 亚洲韩国在线| 99久久99久久久精品齐齐| 99热这里只有精品5| 青青草国产精品一区二区| 伊人成综合网| 中国女人特级毛片| 日韩av在线不卡| 一区二区三区高清在线观看| www欧美激情|