精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

思維鏈也會「跳幀」?浙大團隊提出CoT-Bridge,顯著提升數學推理性能

人工智能 新聞
浙江大學聯合微軟亞洲研究院、香港中文大學提出了 Thought Leap Bridge 任務,并開發了思維鏈修復方法:CoT-Bridge。實驗顯示,該方法顯著提升了多個數學與邏輯任務中的推理準確率,并能作為 “即插即用” 的模塊嵌入到知識蒸餾、強化學習等流程中。

本文的共同第一作者是徐皓雷和顏聿辰。徐皓雷是浙江大學的一年級碩士生,主要研究興趣集中在大模型推理和可解釋性研究;顏聿辰是浙江大學博士三年級研究生,主要研究興趣集中在大模型推理和智能體。本文通訊作者是浙江大學魯偉明教授和沈永亮研究員。

在大語言模型(LLM)飛速發展的今天,Chain-of-Thought(CoT)技術逐漸成為提升復雜推理能力的關鍵范式,尤其是在數學、邏輯等結構化任務中表現亮眼。

但你是否注意到:即使是精心構建的 CoT 數據,也可能存在 “跳躍式” 推理,缺失關鍵中間步驟。對人類專家來說這些步驟或許 “理所當然”,但對模型而言,卻可能是無法逾越的鴻溝。

為了解決這一問題,浙江大學聯合微軟亞洲研究院、香港中文大學提出了 Thought Leap Bridge 任務,并開發了思維鏈修復方法:CoT-Bridge。實驗顯示,該方法顯著提升了多個數學與邏輯任務中的推理準確率,并能作為 “即插即用” 的模塊嵌入到知識蒸餾、強化學習等流程中。

圖片

  • 論文鏈接:https://arxiv.org/abs/2505.14684
  • 項目主頁:https://zju-real.github.io/CoT-Bridge/
  • 代碼倉庫:https://github.com/ZJU-REAL/Mind-the-Gap

CoT 不等于 Coherent-of-Thought

思維跳躍是如何破壞推理鏈的?

CoT 的設計初衷是讓大模型像人一樣 “按步驟思考”,然而研究團隊發現,許多公開 CoT 數據中存在一種被嚴重低估的問題:Thought Leap。

Thought Leap 指的是 CoT 推理鏈中,前后步驟之間存在中間推理內容的省略,導致邏輯跳躍,破壞推理的連貫性。

這種現象往往源于專家在書寫推理過程時的 “經驗性省略”—— 由于熟練掌握相關問題,他們傾向于跳過自認為顯而易見的步驟。然而,模型并不具備這種人類專家式的 “思維粒度”:它需要更細致、逐步的推理過程來建立完整的邏輯鏈條。

論文中給出了一個典型例子:

對于問題 “兩顆八面骰子最少要投多少次,才能確保出現重復的和?”

原始 CoT 中跳過了兩個關鍵推理環節:15 種是怎么來的?為什么要使用鴿巢原理?

這種 “缺口” 雖然對人類來說輕松跨越,對模型而言卻是理解失敗的高風險點。

團隊通過實驗證明,這種結構性不完整對模型訓練帶來顯著負面影響:

  • 訓練效果降低:嚴重的思維跳躍可造成 27.83% 的性能損失
  • 學習效率變低:模型在訓練過程中的收斂速度顯著變慢

圖片

CoT-Bridge:為模型補上思維跳躍的 “橋梁”

為解決數學推理任務中推理鏈不連貫的問題,研究團隊提出了 Thought Leap Bridge Task,目標是自動檢測推理鏈中的結構性缺失,并補全相應的中間推理步驟,以恢復其邏輯完整性。

該任務包含兩個關鍵子問題:

1. Leap 檢測:識別推理鏈中相鄰步驟之間是否存在邏輯跳躍,即是否缺失必要的過渡性推理。

2. 步驟補全:對于檢測到的跳躍位置,生成滿足推理連貫性的中間步驟。

團隊將 ScaleQuestMath 作為 “理想” CoT 數據集,并基于其構建了專用訓練數據集 ScaleQM+。研究團隊通過有控制地刪除原始推理鏈中的若干中間步驟,構造出含有 Thought Leap 的 “不完整推理鏈”,并與被刪除的步驟配對,作為訓練樣本。這一設計使得模型能夠學習到如何識別不連貫結構,并生成適當的推理補全內容。

隨后,團隊基于 Qwen2.5-Math-7B 對模型進行指令微調,訓練出 CoT-Bridge 模型。該模型能夠作為獨立組件,接收可能存在缺口的推理鏈輸入,自動輸出所需的中間步驟補全,從而生成結構完整的推理過程。

圖片

實驗結果

補全后的數據集顯著提升 SFT 效果

研究團隊在兩個數學推理數據集 MetaMathQA 和 NuminaMath 上,分別使用補全前后的數據進行監督微調(SFT)對比實驗。結果顯示,使用 CoT-Bridge 補全 Thought Leap 后的數據在多個數學基準任務上均帶來了顯著的性能提升,其帶來的最大增益達到 + 5.87%。這表明:思維鏈的連貫性,正是限制模型進一步提升的瓶頸之一,修復這些 “跳躍”,能夠讓模型真正學會 “怎么思考”。

圖片

即插即用,增強蒸餾與強化學習流程中的訓練效果

在主實驗基礎上,研究進一步評估了 CoT-Bridge 在更廣泛訓練流程中的適配性,包括知識蒸餾與強化學習兩個典型場景。

蒸餾數據增強:使用大模型生成數學題解是當前訓練數據的來源之一。團隊將 CoT-Bridge 應用于使用 Qwen2.5-Instruct-72B 蒸餾得到的數據。實驗結果表明,補全后的蒸餾數據帶來 + 3.02% 的準確率提升。該結果說明,即便原始生成內容已具備較高質量,推理過程的結構優化仍能帶來額外增益。

強化學習冷啟動優化:在強化學習范式中,初始監督微調模型對最終性能具有重要影響。研究團隊將使用 CoT-Bridge 生成的數據用于 SFT,并在此基礎上繼續訓練。對比實驗顯示,該方案可作為更優的 “冷啟動模型”,在訓練初期即具備更高起點,并最終獲得更好的收斂性能。在 NuminaMath 數據集上,基于補全后數據訓練的模型在 RL 階段最終準確率較原始方案提升約 +3.1%。

圖片

泛化能力提升,改善 OOD 推理表現

為了驗證 CoT-Bridge 是否具備跨任務遷移能力,研究將邏輯推理類任務作為模型在 OOD 場景下的評估基準,包括 FOLIO、LogicQA、ProofWriter、ReClor 和 RuleTaker 等。

實驗結果表明,使用補全數據訓練的模型在大多數邏輯任務中準確率有不同程度提升,Meta-Llama3.1-8B 平均提升為 +2.99%,Qwen2.5-Math-1.5B 提升約 +0.99%。此外,模型生成無效輸出的比例有所下降,說明其在結構控制和推理一致性方面表現更為穩健。這意味著,補全思維鏈條不僅提升了數學能力,也讓模型更擅長 “解釋自己是怎么推理出來的”,從而在廣義邏輯任務中具備更強魯棒性。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-23 08:50:32

2025-08-04 09:13:00

AI智能體技術

2024-02-07 12:13:03

AI模型

2025-04-07 09:00:00

數據測試工具

2024-12-18 14:53:28

2024-08-16 14:15:00

AI訓練

2019-10-14 09:58:00

機器學習人工智能計算機

2025-09-03 10:02:19

2021-09-17 12:54:05

AI 數據人工智能

2024-12-19 09:48:07

2025-04-15 09:12:00

模型AI強化學習

2024-12-12 09:00:00

2024-12-09 13:40:26

2024-11-21 14:00:00

模型AI

2023-09-10 10:51:22

算法結構

2024-12-23 07:20:00

LLM逆向思維語言模型

2024-12-02 12:37:42

2025-04-21 09:07:00

2023-11-30 18:25:57

數據訓練

2025-02-17 14:43:51

點贊
收藏

51CTO技術棧公眾號

免费毛片小视频| 国产精品久久久久久久久久久不卡| 性生活在线视频| 草莓视频丝瓜在线观看丝瓜18| 成人午夜短视频| 97成人在线视频| 日本一卡二卡在线播放| 亚洲1区在线观看| 色婷婷亚洲一区二区三区| 亚洲资源视频| 香蕉人妻av久久久久天天| 蜜臀av国产精品久久久久| 九九精品视频在线| 一道本在线观看| 日韩在线精品强乱中文字幕| 色哟哟一区二区在线观看| 男女激烈动态图| 久久精品蜜桃| 国产高清不卡二三区| 国产国语刺激对白av不卡| 玖玖爱免费视频| 北条麻妃国产九九九精品小说| 日韩欧美一级特黄在线播放| 熟女性饥渴一区二区三区| www在线观看播放免费视频日本| 久久你懂得1024| 99高清视频有精品视频| 做爰视频毛片视频| 亚洲三级国产| 久久精品男人天堂| 五月天综合视频| 欧美色图婷婷| 欧美mv日韩mv国产网站app| mm131国产精品| 3d欧美精品动漫xxxx无尽| 17c精品麻豆一区二区免费| 欧美日韩亚洲在线| 水莓100国产免费av在线播放| 国产剧情一区二区三区| 国产美女91呻吟求| 波多野结衣一区二区在线 | 欧美精品一区二区三区四区| 中文字幕第100页| www.com.cn成人| 亚洲1区2区3区视频| 国产激情片在线观看| 日本三级视频在线播放| 久久精品一区二区三区不卡牛牛| 国产亚洲精品久久飘花| 亚洲AV无码一区二区三区少妇 | 稀缺呦国内精品呦| 欧美aaaaaa| 欧美三级日本三级少妇99| 亚洲成人免费在线视频| 国产精品自拍偷拍视频| 日韩av大片在线观看| 欧美视频一区| 久久99精品久久久久久青青91| www.99re6| 婷婷综合在线| 欧美亚洲三级| 九九精品在线视频| 欧美国产精品一二三| 综合天天久久| 久久99精品久久久久久琪琪| 免费一级a毛片夜夜看| 欧美激情日韩| 欧美精品999| 日韩成人免费观看| 亚洲欧美日韩专区| 日本久久久a级免费| 一二三区免费视频| 欧美a一区二区| 91精品久久久久久久久久久久久久 | 亚洲都市激情| 亚洲欧洲在线播放| 中文天堂资源在线| 久久久久亚洲| 欧美精品videossex性护士| 精品少妇久久久久久888优播| 日韩视频不卡| 国产精品白嫩美女在线观看| 一级α片免费看刺激高潮视频| 激情综合色播激情啊| av成人综合网| 美州a亚洲一视本频v色道| 国产精品青草久久| 91网站在线观看免费| 久久影院午夜精品| 欧美日韩一区二区电影| 国产xxx在线观看| 西野翔中文久久精品国产| 伊人伊人伊人久久| 激情小说中文字幕| 久久深夜福利| 国产精品视频99| www.日韩在线观看| 国产亚洲欧美一区在线观看| 成人免费看片视频在线观看| 麻豆网站免费在线观看| 欧美精品在欧美一区二区少妇| 97精品人人妻人人| 成人精品影视| 97涩涩爰在线观看亚洲| 亚洲综合网av| 91色综合久久久久婷婷| 日本福利视频导航| 中文不卡1区2区3区| 欧美三级日韩三级| 六月婷婷七月丁香| 国产综合精品一区| 国产日产久久高清欧美一区| 少妇高潮一区二区三区99小说| 中文字幕一区三区| 国产偷人视频免费| 粉嫩久久久久久久极品| 社区色欧美激情 | 黄色一级片免费在线观看| 韩国理伦片一区二区三区在线播放| 精品无码久久久久久久动漫| 99福利在线| 欧美日韩免费一区二区三区 | 99在线精品视频免费观看软件| 91蜜桃在线免费视频| 久久视频免费在线| 欧美成人家庭影院| 亚洲天堂男人天堂| 国产福利拍拍拍| 国产成人av电影在线| 中文字幕剧情在线观看一区| 欧美不卡高清一区二区三区| 亚洲毛茸茸少妇高潮呻吟| 国产无码精品一区二区| 国产成人精品免费一区二区| 欧美日韩一级在线| 欧美v亚洲v综合v国产v仙踪林| 国产亚洲精品综合一区91| 91精品国产综合久久久蜜臀九色| 成人免费av资源| www.激情网| 日本精品视频| 久久天天躁日日躁| 国产精选久久久| 中文字幕一区二区三区视频| 亚洲欧美国产日韩综合| 成久久久网站| 国产免费亚洲高清| 欧美成人三区| 91.麻豆视频| 国产免费一区二区三区四区| 免费欧美在线视频| 亚洲国产一区二区三区在线播| 欧美××××黑人××性爽 | 国内一区在线| 国产伦子伦对白在线播放观看| 精品成人私密视频| 在线观看亚洲欧美| 91丝袜高跟美女视频| 国产精品无码一区二区在线| 欧美顶级毛片在线播放| 5252色成人免费视频| 欧洲视频在线免费观看| 91成人国产精品| 欧美xxxooo| 国产精品99久久久久久久女警| 激情成人开心网| 你懂的在线观看一区二区| 51ⅴ精品国产91久久久久久| 国际av在线| 在线观看91av| 欧美成人精品激情在线视频| 成人美女在线观看| 久久久久狠狠高潮亚洲精品| 狠狠做六月爱婷婷综合aⅴ | 免费日韩中文字幕| 日韩电影免费网站| 亚洲最大成人在线| 国产自产自拍视频在线观看| 国产小视频国产精品| 国产又粗又猛又爽又黄视频| 一区二区不卡在线播放| 97人妻天天摸天天爽天天| 肉色丝袜一区二区| 97超碰免费观看| 人人香蕉久久| 国产日韩在线观看av| 日本电影在线观看| 亚洲欧洲av一区二区| 一区二区三区日| 午夜一区二区三区视频| 美国美女黄色片| 国产+成+人+亚洲欧洲自线| wwwxxx黄色片| 欧美韩国一区| 亚洲成人午夜在线| 成人h动漫免费观看网站| 国产精品高潮呻吟久久av无限 | 欧美在线视频a| 欧美a免费在线| 日韩精品中文字幕一区二区三区 | 欧美精品一区二区高清在线观看| 国产性猛交╳xxx乱大交| 国产精品麻豆欧美日韩ww| 精品人妻一区二区免费| 久久成人羞羞网站| 成人免费aaa| 午夜精品国产| 亚洲精品在线免费看| 精品嫩草影院| 亚洲综合最新在线| 欧美成人xxxx| 国产成人在线亚洲欧美| 久久不射影院| 久久亚洲国产成人| 国产一级网站视频在线| 亚洲成人性视频| 国产乱淫av免费| 欧美性大战久久| 成人精品免费在线观看| 一区二区三区国产豹纹内裤在线 | 香蕉视频黄色片| 精品国产青草久久久久福利| 国产又大又黑又粗| 在线视频综合导航| 日韩精品久久久久久久酒店| 亚洲美女一区二区三区| 天堂资源在线视频| 久久女同性恋中文字幕| 特级西西人体wwwww| 国产风韵犹存在线视精品| 狠狠热免费视频| 久久一综合视频| 久久精品香蕉视频| 亚洲欧美网站| 男人天堂999| 亚洲免费影视| 男人操女人逼免费视频| 在线看片一区| 福利视频一二区| 最新日韩av| 亚洲不卡中文字幕无码| 在线欧美日韩| 国产婷婷一区二区三区| 99国产精品| 欧美精品自拍视频| 夜夜嗨一区二区| 国产综合av在线| 六月天综合网| 黄色国产精品视频| 日韩福利视频导航| 午夜宅男在线视频| 麻豆精品一区二区综合av| 三上悠亚在线一区| 国产一区二区三区观看| 精品国产午夜福利在线观看| 国产伦精一区二区三区| 三级网站免费看| 成人午夜电影久久影院| 91九色蝌蚪porny| 久久香蕉国产线看观看99| 中文字幕国产专区| 中日韩免费视频中文字幕| 欧美一级特黄高清视频| 亚洲视频一区在线观看| 毛片a片免费观看| 欧美日韩精品在线观看| 在线观看亚洲黄色| 欧美日韩国产123区| www.我爱av| 日韩精品极品在线观看| 二人午夜免费观看在线视频| 久久黄色av网站| 久草在线资源站资源站| 日本欧美一二三区| 亚洲三级电影| 国产精品视频在线免费观看| 一区二区小说| 中文字幕av日韩精品| 亚洲激情精品| 蜜桃免费在线视频| 国产精品99久久久久久久vr| 黄色短视频在线观看| 国产精品久久久久久一区二区三区 | 97热在线精品视频在线观看| 99精品在免费线偷拍| 亚洲在线免费看| 亚洲精品推荐| 丰满女人性猛交| 国产精品久久久亚洲一区| 天天操,天天操| www.亚洲人| 老司机精品免费视频| 亚洲国产裸拍裸体视频在线观看乱了 | 欧美一级爆毛片| 男人天堂网在线| 色综合天天狠天天透天天伊人| 亚洲精品永久免费视频| 亚洲最大福利网| 阿v免费在线观看| 一本久久综合亚洲鲁鲁五月天| 国产乡下妇女三片| 日韩精品资源二区在线| 日韩a在线观看| 国产美女久久久久| 国产精品videossex国产高清 | 亚洲国产电影| 亚洲欧美精品一区| 五月婷婷在线视频| 97视频在线观看免费高清完整版在线观看| 在线成人视屏| 国产亚洲欧美一区二区| 青青草97国产精品麻豆| 久久躁日日躁aaaaxxxx| 一区二区电影免费观看| 亚洲一区二区在线播放| 欧美亚洲在线日韩| 国产精品无码一区二区在线| 国产福利一区二区| 日韩欧美国产成人精品免费| 在线中文字幕不卡| 青青国产在线| 国语自产精品视频在线看抢先版图片| 黄页免费欧美| 日韩精品国内| 校园春色综合网| 国产老熟女伦老熟妇露脸| 一区二区成人在线视频| 国产免费久久久| 久久好看免费视频| 日本精品网站| 日韩精品最新在线观看| 久久精品30| 蜜桃传媒一区二区亚洲av| 亚洲成a人片在线观看中文| 国产草草影院ccyycom| 久久精品久久久久电影| 欧美一区二区三区婷婷| 亚洲欧美在线网| 美女mm1313爽爽久久久蜜臀| 免费成人深夜天涯网站| 欧美综合亚洲图片综合区| 你懂的在线视频| 日韩免费av在线| 国产精品一线天粉嫩av| 少妇高清精品毛片在线视频| 久久精品人人做人人爽人人| 无码人妻精品一区二区50| 亚洲欧美一区二区三区在线| 韩日精品一区二区| 区一区二区三区中文字幕| 久久一二三四| 国产无遮挡在线观看| 欧美日韩国产综合一区二区| 日本美女高清在线观看免费| 成人福利在线观看| 在线精品国产| 国产综合内射日韩久| 午夜久久久久久| 免费人成在线观看网站| 国产精品视频999| 综合激情一区| 超碰caoprom| 色婷婷av久久久久久久| 1769在线观看| 亚洲永久免费观看| 99riav国产精品| 天天躁日日躁aaaa视频| 欧美日韩一区二区三区视频| av免费在线免费观看| 国产精品久久精品国产 | 91在线精品秘密一区二区| 在线视频一区二区三区四区| 色噜噜狠狠狠综合曰曰曰| 婷婷视频一区二区三区| 国模无码视频一区二区三区| 国产区在线观看成人精品 | 日韩精品免费看| 国产一区二区主播在线| 欧美a级黄色大片| 26uuu国产电影一区二区| 亚洲网站在线免费观看| 国产+人+亚洲| 欧美日韩性在线观看| 久久艹这里只有精品| 日韩欧美一区二区三区久久| 国产写真视频在线观看| 久久精品成人一区二区三区蜜臀| 免费观看在线色综合| 国产亚洲精品久久777777| 亚洲天堂2020| 网站一区二区| 色综合天天色综合| 亚洲午夜在线视频| 免费一级在线观看播放网址| 亚洲一区二区免费在线| 久久激情综合| 一区二区三区免费高清视频| 一本色道久久88综合亚洲精品ⅰ | 国产日韩欧美中文在线| 国产乱子夫妻xx黑人xyx真爽|