精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

人會逆向思維,LLM也可以?DeepMind研究表明還能提升推理能力

人工智能
近日,北卡羅來納大學教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一個聯(lián)合團隊。他們發(fā)布的論文表明,逆向思維可以顯著 LLM 的推理能力,并且不限于數(shù)學任務。他們還提出了一個名叫 RevThink 的框架,可將逆向思維「灌輸」給語言模型。

人能逆向思維,LLM 也可以嗎?北卡羅來納大學教堂山分校與谷歌最近的一項研究表明,LLM 確實可以,并且逆向思維還能幫助提升 LLM 的正向推理能力!

圖片

論文一作 Justin Chih-Yao Chen 的推文

簡單來說,正向思維就是從問題開始,一步步地得出答案;而逆向思維則是先從一個預測答案開始,逆推到原始問題。

組合使用正向和逆向思維可讓我們驗證解答的正確性并找到可能的錯誤。

舉個簡單例子,如果小明有 2 個蘋果,小紅有 3 個蘋果,那么他們一共有多少個蘋果?

使用正向推理,我們可以得出 2 + 3 = 5。再使用逆向推理,我們可以從共有 5 個蘋果的結論開始,然后根據(jù)小明有 2 個來逆向得知小紅有 3 個。這些數(shù)值與原始問題相符,故此可以驗證 5 這個答案的正確性。如果正向推理出錯了,比如答案是 6 個,那么逆向推理時就會得到與原始問題不一樣的數(shù)值:小紅有 4 個蘋果。這種矛盾可讓我們重新檢視自己的推理過程哪里有誤。

大型語言模型(LLM)的數(shù)學能力也能通過正向 - 逆向推理得到提升,原因有二:

  • 數(shù)學本身是高度結構化的,因此正向和逆向推理之間存在明確的逆反關系;
  • 只需替換名稱或數(shù)值等變量,就可以創(chuàng)建出新的數(shù)學問題。

那么問題來了:逆向思維能否應用于更廣泛、結構性較差的領域?

此外,這些方法通常是測試時使用,目的是驗證:給定一個解,讓 LLM 逆向思考并查看正向推理是否正確。雖然它們比其它測試時方法(例如自我一致性)的表現(xiàn)稍微好一點,但還是存在未解的疑問:我們能否訓練一個本身就能逆向思維的模型,從而提升其正向推理效果,而不是在測試時使用逆向推理進行驗證?

近日,北卡羅來納大學教堂山分校、谷歌 Cloud AI Research、谷歌 DeepMind 的一個聯(lián)合團隊為上面兩個問題提供了解答。他們發(fā)布的論文表明,逆向思維可以顯著 LLM 的推理能力,并且不限于數(shù)學任務。他們還提出了一個名叫 RevThink 的框架,可將逆向思維「灌輸」給語言模型。

圖片

  • 論文標題:Reverse Thinking Makes LLMs Stronger Reasoners
  • 論文地址:https://arxiv.org/pdf/2411.19865

論文發(fā)布后,吸引來不少稱贊之聲。

圖片

圖片

方法

RevThink 主要包含兩個階段:數(shù)據(jù)增強和全新的學習目標。

圖片

數(shù)據(jù)增強

首先,對于推理數(shù)據(jù)集,該團隊使用了一個更大、能力更強的教師模型來對其進行增強。

我們知道,一般來說,推理基準數(shù)據(jù)由一個問題和一個答案構成。那么該如何增強它呢?該團隊的方法是通過對教師模式使用少樣本提示來(few-shot prompting)生成三種新數(shù)據(jù):正向推理、逆向問題、逆向推理。其中正向和逆向推理都會使用思維鏈。

只有當數(shù)據(jù)點的正向推理準確(與 ground truth 相符)且逆向推理與原始問題一致(通過提示教師模型進行驗證)時,該數(shù)據(jù)點才會被保留下來。

學習目標

完成數(shù)據(jù)集增強之后,該團隊還提出了三個用于訓練更小的學生模型的關鍵目標。

圖片

具體來說,學生模型需要學會:

  • 基于問題生成正確的正向推理;
  • 基于原始問題生成逆向問題;
  • 基于逆向問題生成逆向推理。

之所以要設置這三個目標,該團隊說明了三點原因:

  • 基于問題生成正確的正向推理是知識蒸餾的標準方法;
  • 生成逆向問題會促使學生模型「思考」如何逆向一個問題并確定要問的正確問題;
  • 最后,解決這個逆向問題可以增強學生模型逆向推理的能力。

在測試時,首先會使用問題來詢問該學生模型,而它只會生成前向推理 —— 類似于標準的零樣本推理。

本質上講,這個流程是在訓練過程中內化了逆向推理的能力,同時還能保證測試時間計算與零樣本方法一樣高效。

如圖 1 傳統(tǒng)的監(jiān)督式微調側重于從問題到答案的單向推理。相比之下,RevThink 基于新提出的數(shù)據(jù)增強方法和目標,通過學習兩個方向的推理而引入了雙向思維。這能為模型帶來更大的提升。

圖片

實驗和評估

該團隊通過實驗驗證了 RevThink 的有效性。具體來說,他們使用的教師模型是 Gemini-1.5-Pro-001,學生模型是 Mistral-7B-Instruct-v0.3 和 Gemma-7B-Instruct。訓練中,他們使用了 LoRA 微調,秩設為 32。所有比較方法都使用了 vllm 和貪婪解碼。

他們也選擇了多種任務進行評估,包括常識推理(StrategyQA、CommonsenseQA、ARCchallenge),數(shù)學推理(MATH、GSM8K),表格數(shù)據(jù)推理(TabMWP)、自然語言推理(ANLI),邏輯推理(Date Understanding)。

參與比較的方法大致可分為三類:零樣本方法、知識蒸餾(包含符號知識蒸餾和逐步蒸餾)和數(shù)據(jù)增強(包含問題重新表述、問題增強、答案增強)。更多實驗設置請參閱原論文。

主要結果

表 1 給出了主要結果。

圖片

首先,RevThink 的平均性能表現(xiàn)很好,在不同數(shù)據(jù)集和模型上都優(yōu)于基線。與學生模型的零樣本性能相比,RevThink 使用 Mistral 時實現(xiàn)了 12.68% 的平均提升,使用 Gemma 時實現(xiàn)了 14.37% 的平均提升。

圖片

此外,相比于符號知識蒸餾(SKD)和逐步蒸餾(Distill Step-by-Step)—— 依賴于使用來自教師模型的正確推理鏈來執(zhí)行監(jiān)督式微調,RevThink 有 6.44% 至 7.15% 的顯著提升。

與基于數(shù)據(jù)增強的基線方法相比,RevThink 帶來的增益也更為顯著,特別是在常識推理、表格推理和日期理解方面。雖然其中一些增強方法(例如答案增強 (AnsAug))對于數(shù)學推理很有效,但它們?yōu)槠渌I域帶來的改進較少。這表明數(shù)學是一個更結構化的領域,會隨著數(shù)據(jù)的增加而更好地擴展。

相比之下,RevThink 在各種推理任務上都能帶來穩(wěn)定的提升。并且表 3 表明,在留存數(shù)據(jù)集上進行評估時,RevThink 在領域外數(shù)學數(shù)據(jù)集上也能帶來更大的增益,表現(xiàn)出了更好的泛化能力。

圖片

下面還列出了 RevThink 的更多優(yōu)勢,相關詳情請訪問原論文:

  • RevThink 表現(xiàn)出了很好的樣本效率。
  • 逆向問題生成可提高性能,但充分利用新的數(shù)據(jù)集可獲得最佳性能。
  • RevThink 的目標比使用指令調整的單獨實例更有效。
  • 只需稍多一點 token,RevThink 就能獲得更大提升。
  • RevThink 與模型大小呈正相關。
  • RevThink 可泛化至 OOD 數(shù)據(jù)集。
  • RevThink 可作為現(xiàn)有方法的補充。
  • RevThink 在可逆問題和中等難度問題上表現(xiàn)出了更大的提升。
責任編輯:姜華 來源: 機器之心
相關推薦

2024-07-05 15:06:00

2024-06-17 13:34:54

2025-02-10 13:00:00

模型訓練AI

2021-04-02 09:40:06

量子計算芯片超算

2024-11-11 11:05:00

大語言模型系統(tǒng)

2025-11-05 07:51:14

2024-10-22 18:44:48

2025-06-04 08:35:00

2025-01-14 13:52:56

2022-12-01 08:00:00

2025-04-08 00:40:00

谷歌合成數(shù)據(jù)大模型

2025-02-17 14:43:51

2023-05-22 15:17:02

谷歌AI

2023-11-03 13:07:00

AI模型

2025-05-30 04:00:00

IBMRLVRGRPO

2025-09-15 09:43:33

分層推理模型循環(huán)網(wǎng)絡推理

2025-04-07 09:23:00

大模型LLM推理

2023-11-15 14:17:23

微軟語言模型AI 模型

2025-05-21 09:02:20

2025-07-08 08:38:09

推理錨點LLM大模型
點贊
收藏

51CTO技術棧公眾號

日韩精品久久理论片| 蜜桃精品wwwmitaows| 性欧美疯狂xxxxbbbb| 欧美激情专区| 国产三级按摩推拿按摩| 一本色道久久综合| 色琪琪综合男人的天堂aⅴ视频| 亚洲欧美日韩中文字幕在线观看| 交100部在线观看| 中文字幕五月欧美| 国产九区一区在线| 中文字幕+乱码+中文乱码91| 欧美一区高清| 在线成人免费网站| 天堂www中文在线资源| 成人黄色毛片| 精品久久久久久久久久久久久久 | 九九热hot精品视频在线播放| 91黄视频在线| a在线视频观看| 亚洲www色| 国产精品免费免费| 欧美12av| 欧美一区二区黄片| 精品亚洲免费视频| 国产精品91在线观看| 日韩美女一级片| 国产精品久久久久久久免费观看 | 亚洲精品婷婷| 欧美风情在线观看| 91视频青青草| 青青草成人影院| 亚洲精品自在久久| 国产人成视频在线观看| 日韩区一区二| 91麻豆精品久久久久蜜臀| 一区二区在线播放视频| 欧美aa视频| 欧美日韩另类在线| 国产手机免费视频| a'aaa级片在线观看| 亚洲精品自拍动漫在线| 亚洲砖区区免费| 在线观看免费黄视频| 国产拍揄自揄精品视频麻豆| 欧美日韩国产不卡在线看| 色婷婷av一区二区三区之e本道| 国产精品小仙女| 3d动漫啪啪精品一区二区免费| 最近中文在线观看| 青青草91视频| 国产精品丝袜白浆摸在线| 久久精品五月天| 久久午夜精品一区二区| 日本免费久久高清视频| 青青视频在线免费观看| 日本在线不卡视频| 国产精品久久婷婷六月丁香| 国产美女www| 日本成人在线不卡视频| 国产欧美一区二区三区久久人妖 | 日本一区视频在线| 国产在线免费观看| 中文字幕 久热精品 视频在线| 先锋影音一区二区三区| 欧美成人二区| 一区二区欧美国产| 日本韩国欧美在线观看| 韩国成人动漫| 欧美日韩在线播| 在线观看国产福利| 欧美黄视频在线观看| 欧美变态口味重另类| 成人在线观看一区二区| 欧美日韩一区二区三区四区不卡| 日韩成人中文电影| 国产在线综合视频| 亚洲色图网站| 66m—66摸成人免费视频| 人妻丰满熟妇av无码区| 麻豆精品在线播放| 超碰在线97av| 人人九九精品| 亚洲人123区| 国产深夜男女无套内射| 久久久成人av毛片免费观看| 欧美剧情片在线观看| 国产精品91av| 久久99国产成人小视频| 久久久91精品国产| 青青国产在线观看| 九一九一国产精品| 国产欧美一区二区视频| 二区在线观看| 亚洲一区中文日韩| 国产一区二区在线免费播放| 9l视频自拍蝌蚪9l视频成人| 在线播放国产一区中文字幕剧情欧美 | 国产精品毛片无遮挡高清| 4444在线观看| 精品免费av在线| 欧美不卡123| 免费一级suv好看的国产网站 | 三级a在线观看| 欧美日本三级| 一色桃子一区二区| 久草精品视频在线观看| 欧美96一区二区免费视频| 国产精品99久久久久久久| av成人手机在线| 狠狠干狠狠久久| 在线一区二区不卡| 欧美日韩黑人| 2019中文在线观看| 成人高潮片免费视频| 国产精品人妖ts系列视频| 成人在线观看你懂的| 欧美视频三区| 日韩在线视频免费观看高清中文| 特一级黄色大片| 国产福利一区二区三区| 日韩av电影免费在线观看| av午夜在线观看| 91精品国产麻豆| 国产三级aaa| 日本视频一区二区三区| 免费在线国产精品| 91福利区在线观看| 欧美成人精品福利| 人妻人人澡人人添人人爽| 青椒成人免费视频| 亚洲精蜜桃久在线| 日韩高清不卡| 国产一区二区三区视频在线观看 | 国产原创精品| 日本动漫理论片在线观看网站| 欧美欧美欧美欧美首页| 摸摸摸bbb毛毛毛片| 久久国产精品久久久久久电车| 成人自拍爱视频| 日韩伦理电影网站| 欧美不卡一区二区三区| 欧美黄色一区二区三区| 国产精品一区二区在线播放| 日本老太婆做爰视频| 国产精品xnxxcom| 久久精品免费播放| 国产精品一品二区三区的使用体验| 欧美激情一区二区三区四区| 五月婷婷之综合激情| 日韩国产一区二区| 91精品久久久久久久久久| 夜级特黄日本大片_在线 | 亚洲免费黄色片| 亚洲一线二线三线视频| 国产人妻黑人一区二区三区| 99热免费精品| 欧美精品在线一区| 成人午夜毛片| 久久夜色撩人精品| 国产成人久久精品77777综合| 一区二区三区蜜桃| 亚洲av永久无码精品| 国产九九精品| 日韩视频精品| 国产精品**亚洲精品| 欧美黑人性猛交| 四虎精品一区二区三区| 色综合久久中文综合久久97| 欧美人妻一区二区三区 | 深爱五月综合网| 在线电影一区| 欧美日韩一区二区三区在线观看免| 日韩免费小视频| xxx欧美精品| www.爱爱.com| 色一情一乱一乱一91av| 国产一二三四视频| 粉嫩嫩av羞羞动漫久久久 | 97成人资源| 神马久久桃色视频| 高清乱码毛片入口| 91官网在线免费观看| 国产少妇在线观看| 99久久久久久99| 亚州精品一二三区| 午夜亚洲福利| 日本一区二区三不卡| 国产一区二区三区国产精品| 97碰碰碰免费色视频| 91官网在线| 亚洲第一福利视频| 一级黄色大片免费| 婷婷开心激情综合| 亚洲色图100p| 2014亚洲片线观看视频免费| 永久av免费在线观看| 亚洲免费网站| 成人短视频在线观看免费| 教室别恋欧美无删减版| 成人免费看片网址| 久久伊人国产| 欧美亚洲另类视频| 3d玉蒲团在线观看| 亚洲四色影视在线观看| 亚洲国产精品久久久久爰性色| 91精品福利视频| 天海翼一区二区| 亚洲欧美日韩在线| 女女互磨互喷水高潮les呻吟 | 色婷婷av一区二区三区gif | 色综合色综合色综合| 久久久久久久中文字幕| 国产精品国产三级国产专播品爱网 | 99久久99九九99九九九| 日本精品视频在线播放| 污污的网站在线免费观看| 日韩在线视频线视频免费网站| 瑟瑟在线观看| 欧美精品一区二区久久久| 在线观看免费视频a| 91国内精品野花午夜精品| 日韩人妻无码一区二区三区99| 亚洲女人****多毛耸耸8| 中国特黄一级片| 久久久久亚洲蜜桃| 国产高清自拍视频| 成人免费高清在线观看| 在线视频一二区| 美国十次了思思久久精品导航| 国产免费成人在线| 国产精品色网| 国精产品一区一区三区视频| 在线欧美日韩| 精品成在人线av无码免费看| 欧美精品一卡| 菠萝蜜视频在线观看入口| 91久久久精品国产| 一区二区三区av在线| 欧美mv日韩| 中国成人亚色综合网站| 天天射天天综合网| 欧美 日韩 国产 在线观看| 久久理论电影| 中文字幕精品一区日韩| 9999国产精品| 亚洲国产精品女人| 欧美在线二区| 国产一二三在线视频| 亚洲黄页一区| 欧美视频在线播放一区| 国产精品综合色区在线观看| 毛片一区二区三区四区| 日韩制服丝袜av| www.亚洲高清| 国产在线不卡视频| 免费黄视频在线观看| 成人小视频免费在线观看| 精品国产一区在线| 久久久美女毛片| 日本综合在线观看| 亚洲码国产岛国毛片在线| 久久久久无码精品国产| 欧美日韩一区二区三区在线免费观看 | www.在线视频.com| 北条麻妃久久精品| 色呦呦在线看| 26uuu另类亚洲欧美日本一 | 成人看片在线| 一道在线中文一区二区三区| 亚洲国产欧洲综合997久久| 99久久久久国产精品| 日本阿v视频在线观看| 新67194成人永久网站| 三上悠亚在线一区二区| 国产乱子轮精品视频| av2014天堂网| 国产精品久久99| 国产精品suv一区二区69| 日韩欧美在线视频| 在线观看免费视频a| 精品国精品自拍自在线| 伦理片一区二区三区| 久久亚洲精品成人| 欧美freesex黑人又粗又大| 国产精品美女免费看| 88久久精品| 色之综合天天综合色天天棕色| 91精品一区二区三区综合| 久久久久久久久久网| 奇米影视一区二区三区| av在线天堂网| 国产精品美日韩| 国产网址在线观看| 欧美日韩日日摸| 欧洲成人一区二区三区| 日韩中文理论片| 免费毛片b在线观看| 国产欧美日韩免费看aⅴ视频| 精品国产一区二区三区成人影院| 亚洲一区三区| 久久久久在线| 久久久久无码国产精品一区李宗瑞| 久久色在线观看| 久久久精品国产sm调教网站| 欧洲精品在线观看| 深夜福利视频网站| 久久午夜a级毛片| 日本韩国欧美| 国产乱码精品一区二区三区中文 | 色yeye香蕉凹凸一区二区av| а√在线天堂官网| 91久久久一线二线三线品牌| 欧美一区二区三区高清视频| 男人日女人逼逼| 盗摄精品av一区二区三区| av在线播放中文字幕| 欧美视频中文在线看| www.爱爱.com| 日韩视频免费大全中文字幕| 国产一区二区精品调教| 好吊色欧美一区二区三区四区 | 青青青国产在线观看| 国产精品1024| www.5588.com毛片| 欧美日本高清视频在线观看| 岛国在线大片| 日韩免费av片在线观看| 日韩美女精品| 给我免费播放片在线观看| 国产成人免费视频| 午夜免费激情视频| 9191精品国产综合久久久久久 | 国产精品国产自产拍高清av| 少妇无套内谢久久久久| 亚洲免费av网址| sese综合| 久久精品女人的天堂av| 中文精品在线| 在线免费观看a级片| 欧美日韩国产精品专区 | 久久久久久久久久久电影| 在线观看亚洲欧美| 日韩成人在线观看| 免费看av不卡| 日韩资源av在线| 日韩福利视频导航| 国产高清一区二区三区四区| 色婷婷av一区二区三区软件 | 国产精品怡红院| 北条麻妃99精品青青久久| 色综合视频一区二区三区日韩| 亚洲免费不卡| 精品中文字幕一区二区小辣椒| 艳妇荡乳欲伦69影片| 91精品国产色综合久久ai换脸| 成年视频在线观看| 成人xxxxx色| 中文精品视频| 国产aⅴ激情无码久久久无码| 91福利国产成人精品照片| freemovies性欧美| 91精品综合视频| 国产字幕视频一区二区| 亚洲av无码一区二区三区观看| 欧美午夜片欧美片在线观看| 免费毛片在线| 国产主播欧美精品| 国内激情久久| 欧美成人午夜精品免费| 欧美在线你懂的| av毛片在线免费看| 国严精品久久久久久亚洲影视 | 香蕉综合视频| av漫画在线观看| 91高清在线观看| 亚洲精品白浆| 欧美精品中文字幕一区二区| 久久99精品国产91久久来源| 久久久久久久蜜桃| 亚洲人成免费电影| 日韩视频在线直播| 国产在线观看福利| 日韩美女视频一区二区| 日日夜夜精品免费| 国产欧美精品xxxx另类| 雨宫琴音一区二区在线| 51妺嘿嘿午夜福利| 欧美sm美女调教| www.久久.com| 国产高清av在线播放| 国产精品久久久久久久久免费相片| 欧美一区二区三区成人片在线| 国产精品劲爆视频| 亚洲青色在线| 尤物在线免费视频| 亚洲视频第一页| 国产精品巨作av| 一二三av在线| 欧美在线免费播放|