精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek、GPT-5都在嘗試的快慢思考切換,有了更智能版本,還是多模態

人工智能 新聞
從雙模退火訓練到 BPO 優化,R-4B 不僅解決了 MLLMs 的思考困境,更在小尺寸模型上探索了自適應思考的可行性 。

本研究由中科院自動化所和騰訊混元聯合研發,團隊成員包括 Qi Yang, Bolin Ni, Shiming Xiang, Han Hu, Houwen Peng,  Jie Jiang

背景:多模態大模型的思考困境

當前,業界頂尖的大模型正競相挑戰“過度思考”的難題,即無論問題簡單與否,它們都采用 “always-on thinking” 的詳細推理模式。無論是像 DeepSeek-V3.1 這種依賴混合推理架構提供需用戶“手動”介入的快慢思考切換,還是如 GPT-5 那樣通過依賴龐大而高成本的“專家路由”機制提供的自適應思考切換。它們距離真正意義上的“智能思考”仍有距離。這些方案或將判斷壓力轉移給用戶,或受限于復雜的系統架構和高昂的部署成本。因此,研發一款輕量化、支持多模態且能實現更智能自適應思考的大模型,將為用戶提供更加流暢的交互體驗。

近期,由騰訊混元團隊與中科院自動化所合作的一項最新研究推出 R-4B 多模態大模型,通過自適應思考(auto-thinking)機制,改變了這一現狀,它讓 AI 能像人類一樣 “智能切換” 思維模式。簡單問題直接響應,復雜問題深度推理,在最大化回答準確性的同時,最小化計算開銷。

  • 論文標題:R-4B: INCENTIVIZING GENERAL-PURPOSE AUTOTHINKING CAPABILITY IN MLLMS VIA BI-MODE ANNEALING AND REINFORCE LEARNING
  • 論文鏈接:https://arxiv.org/pdf/2508.21113

這一 “按需思考” 的核心能力,為 4B 量級的多模態模型樹立了全新的性能標桿,使其在評測性能指標上成功超越了 Keye-VL-8B、Kimi-VL-A3B-Thinking-2506 等更大規模的模型。

同時,R-4B 在權威基準 OpenCompass 榜單上取得了優異成績。

  • 登頂 OpenCompass 多模態學術榜單:在 20B 以內規模多模態大模型中,性能排名 Top 1!

  • 位列 OpenCompass 多模態推理榜單開源榜首:在開源模型中,推理性能拔得頭籌! 

目前,該模型已在 GitHub 和 HuggingFace 上線,且支持 vLLM 快速部署。「消費級顯卡即可運行,適用于筆記本電腦、智能座艙、智能家居等低功耗場景,支持垂直領域低成本微調。」截至目前下載量已破萬,歡迎大家體驗!

  • GitHub 代碼倉庫:https://github.com/yannqi/R-4B 
  • Hugging Face 模型下載:https://huggingface.co/YannQi/R-4B

突破:R-4B 的自適應思考引擎

R-4B 的智慧之處在于其自適應思考能力:

  • 遇到簡單問題(簡單實體識別、簡易問答),它選擇直接、高效地響應。
  • 面對復雜任務(如數學計算、圖表分析),它則自動切換到深度思考模式,生成詳細的思考過程。

R-4B 的核心創新在于其獨特的兩階段訓練策略。為實現模型在通用領域的自適應思考,研究團隊首先提出雙模退火(bi-mode annealing)訓練策略,促使模型同時掌握通用領域的思考與非思考能力。

該階段可以理解為對模型進行 “思考” 啟蒙,即同時喂給它兩種范式數據:一種需要直接回答(非思考模式,像日常對話),另一種需要詳細推理(思考模式,像解數學題)。通過這種訓練,模型同時掌握了思考和非思考這兩種響應模式,為后續的自適應思考模式訓練打下堅實基礎。該階段的核心是通用領域推理和非推理模式的數據構建策略:針對客觀題,用模型采樣的答案一致性來衡量題目的難易程度;針對主觀題目,用提示工程的方式去區分解決問題是否需要進一步思考。

  • 推理模式數據:涵蓋圖表分析、邏輯推理等需多步推理的任務(如科學圖解或數學問題)。
  • 非推理模式數據:針對直接事實響應的查詢(如實體識別或簡單問答)。

經過退火訓練,得到一個同時精通思考與非思考模式的基礎模型 R-4B-Base ,為后續自適應思考強化訓練奠定基礎。基于此,團隊開發了雙模策略優化(Bi-mode Policy Optimization, BPO)強化學習算法。它無需依賴精心設計的獎勵函數或特定數據,而是僅依賴基于規則的獎勵信號,從數學數據出發,并可泛化到通用領域。其核心是混合雙模 rollout 機制,通過強制模型在訓練中同時探索思考模式和非思考模式軌跡,從而避免模型陷入對單一模式的響應偏好。在此基礎上,通過同時獎勵兩種思考模式的策略,使模型自己學會判別何時應該思考。

性能表現:小模型,大能量

R-4B-RL 模型在多項公開基準測試中性能表現卓越,刷新了現有記錄,其性能超過 Keye-VL-8B、Kimi-VL-A3B-Thinking-2506 等更大規模的模型。 

更關鍵的是,R-4B-RL 在自適應思考模式下實現了推理效率的提升,在簡單任務下模型無需消耗更多的 Token。這證明了 BPO 算法的有效性,即無需通用領域的強化學習數據或額外的獎勵函數設計,模型也能實現自適應思考。

應用前景:從科研到產業的智能化浪潮

R-4B 的突破不止于技術,更開啟了廣闊應用場景:

  • 應用智能 :在日常問答分析中,自動切換簡單查詢(如文檔內容提取)和復雜推理(如圖表分析)的思維模式,提升自動化處理效率。
  • 科學研究 :在處理科學圖表時,R-4B 的深度推理模式可解析多步關系,精準解讀數據,提高研究效率。
  • 消費級 AI :邊緣設備部署中,R-4B 憑借更少的參數和自適應思考模式降低延遲和能耗,適用于即時問答系統。

(1) 文檔內容提取(簡單查詢)

(2) 圖表分析(復雜推理)

結語:自適應思考,探索 AI 發展新道路

從雙模退火訓練到 BPO 優化,R-4B 不僅解決了 MLLMs 的思考困境,更在小尺寸模型上探索了自適應思考的可行性 。自適應思考不僅是技術優化,更是對效率與普惠平衡的追求。在 AI 計算與推理成本飆升的今天,R-4B 的輕量化、智能化設計,為大模型可持續發展注入綠色動力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-11-09 12:41:04

AI模型

2024-02-19 00:00:00

OpenAIChatGPT功能

2025-08-14 09:31:24

GPT-5AI

2024-01-09 12:53:16

模型訓練

2025-06-27 15:48:34

2025-10-11 00:00:00

2025-08-08 06:39:22

2024-04-01 00:50:00

吳恩達智能體

2025-06-19 09:06:00

2023-09-19 12:45:36

2024-12-26 01:20:53

多模態大模型圖片

2024-01-22 13:57:00

模型訓練

2025-11-10 09:15:43

2025-02-05 10:26:23

2025-09-19 14:53:34

2025-08-19 08:08:05

2025-09-27 22:33:21

2025-08-13 08:50:00

OpenAI模型數據

2025-08-07 02:55:00

2025-09-01 08:59:00

點贊
收藏

51CTO技術棧公眾號

国产一区二区三区四区五区| 欧美日韩国产v| 粉嫩嫩av羞羞动漫久久久| 久久久免费电影| 亚洲国产欧美视频| 懂色aⅴ精品一区二区三区| 亚洲欧美福利一区二区| 久久久久成人精品免费播放动漫| 中文字幕久久久久| 国内精品久久久久久久97牛牛 | 国产精品99一区二区三区| 精品国产乱码久久久久久1区2区| 黄色av免费在线播放| 成人在线观看免费网站| av一本久道久久综合久久鬼色| 国产精品9999| 日韩伦理在线视频| 久久精品免费一区二区三区| 国产丝袜一区二区三区| 国产a√精品区二区三区四区| 午夜日韩成人影院| 亚洲一二三区不卡| 欧美 另类 交| 国产福利在线| 91亚洲午夜精品久久久久久| 91在线色戒在线| 欧美视频xxxx| 欧美一级二区| 97视频免费看| 久久网中文字幕| 欧美淫片网站| 日韩色av导航| 天堂久久精品忘忧草| 米奇精品关键词| 欧美一区二区三区在线电影| 成人免费在线观看视频网站| 天堂√8在线中文| 午夜亚洲国产au精品一区二区| 只有这里有精品| 99青草视频在线播放视| 国产亚洲成aⅴ人片在线观看| 国产三区精品| 人妻一区二区三区四区| 国产高清不卡一区| 亚洲xxxx做受欧美| 99在线小视频| 国产成人在线视频免费播放| 91影院在线免费观看视频| 97caocao| 国产一区二区免费在线| 国产视频观看一区| 91亚洲精品国偷拍自产在线观看| 日韩福利电影在线观看| 国产精品久久久久久久久借妻| 黄色av网站免费观看| 久久aⅴ乱码一区二区三区| 91精品国产高清久久久久久久久| 国产午夜精品无码| 亚洲欧洲日本mm| 91国产精品91| 久久久久久久久久成人| 日韩在线观看一区二区| 国产精品亚洲激情| 国产精品热久久| 国产精品一区二区久久精品爱涩| 亚洲综合社区网| 俄罗斯嫩小性bbwbbw| www.色综合.com| 免费成人av网站| 懂色av中文在线| 国产精品久久影院| 免费的av在线| 热色播在线视频| 欧美日韩一区二区精品| 成人在线观看a| 色成人综合网| 精品国产1区二区| 成人午夜福利一区二区| 日韩在线高清| 久久久久久亚洲精品不卡| 国产午夜性春猛交ⅹxxx| 日韩av网站在线观看| 成人美女av在线直播| 亚洲精品中文字幕成人片| 99re热这里只有精品免费视频| 欧美主播一区二区三区美女 久久精品人| melody高清在线观看| 亚洲九九爱视频| 成年人视频网站免费观看| 日韩欧美三区| 亚洲第一精品自拍| 欧美激情久久久久久久| 一区二区自拍| 国产欧美一区二区| 亚洲三区在线观看无套内射| 国产精品午夜久久| 亚洲精品蜜桃久久久久久| 国精产品一区一区三区四川| 日韩欧美成人一区二区| 欧洲女同同性吃奶| 黄色亚洲在线| 国产精品老女人精品视频| www日本在线| 国产三级精品三级| 给我免费播放片在线观看| a成人v在线| 亚洲精品美女在线观看| 色哟哟一一国产精品| 久久国产精品久久w女人spa| 97人人模人人爽人人少妇| 国产一级在线观看| 午夜天堂影视香蕉久久| 国产原创精品在线| 伊人成综合网伊人222| 欧美激情精品久久久久久黑人| 乱子伦一区二区三区| 成人app下载| 色一情一乱一乱一区91| 国精产品一区二区三区有限公司| 精品国产一区二区国模嫣然| 三级黄色片在线观看| 蜜桃视频一区| 麻豆成人小视频| av影片在线| 日韩欧美一级在线播放| 日韩av网站在线播放| 久久精品日产第一区二区| 国产伦视频一区二区三区| 高清免费电影在线观看| 欧美日韩一区久久| 日本xxxxxxxxx18| 毛片一区二区| 欧美综合激情| 综合在线影院| 亚洲日本中文字幕免费在线不卡| 成年人免费看毛片| 丁香天五香天堂综合| 波多野结衣 作品| 精品久久免费| 欧美成人剧情片在线观看| 国产精品国产av| 国产精品国产a级| 久久人人爽av| 91精品国偷自产在线电影 | 91麻豆swag| 18禁免费观看网站| 任你弄精品视频免费观看| 久久露脸国产精品| 殴美一级特黄aaaaaa| 亚洲已满18点击进入久久| 师生出轨h灌满了1v1| 欧美国产高清| 岛国视频一区| xxx.xxx欧美| 日韩电影大片中文字幕| 69成人免费视频| www一区二区| 黄色免费网址大全| 99精品在线观看| 亚洲综合国产精品| 2020国产在线| 亚洲欧美国产日韩天堂区| 无码视频一区二区三区| 日本一区二区三区四区| 怡红院亚洲色图| 午夜精品av| 精品无人区一区二区三区竹菊| 欧美在线极品| 在线日韩日本国产亚洲| 91片黄在线观看喷潮| 一区二区三区日韩在线观看| 国产a级黄色片| 久久精品网址| 亚洲美女自拍偷拍| 国产香蕉精品| 国产精品国产三级国产aⅴ浪潮 | 99精品欧美一区| 99精品在线免费视频| 精品少妇av| 亚洲va欧美va国产综合剧情| av今日在线| 中文字幕精品久久久久| 国内精品偷拍视频| 日韩欧美一区二区三区久久| 欧美美女性生活视频| 成人综合在线视频| 一女被多男玩喷潮视频| 久久精品亚洲人成影院| 国产日韩欧美亚洲一区| 欧美成人免费全部网站| 97久久精品人人澡人人爽缅北| 黄色在线网站| 精品国产亚洲在线| 无码人妻精品一区二区| 一区二区三区在线观看欧美| 国产男男chinese网站| 国内精品久久久久影院薰衣草| www.射射射| 亚洲不卡av不卡一区二区| 美女亚洲精品| 成人三级毛片| 成人有码在线播放| 成人免费看黄| 久久久久久久91| 在线免费看黄网站| 亚洲乱亚洲乱妇无码| а√中文在线资源库| 欧美在线短视频| 免费日韩一级片| 亚洲激情图片小说视频| 日本成人午夜影院| 91麻豆国产精品久久| 一区二区三区四区影院| 蜜臀av国产精品久久久久| 欧洲黄色一级视频| 欧美视频成人| 视频一区视频二区视频三区视频四区国产| 97人人澡人人爽91综合色| 日本久久久久久久久久久| sm在线观看| 欧美日韩xxxxx| 久热国产在线| 日韩在线视频一区| 国产一区二区三区福利| 亚洲精品资源在线| 少妇人妻精品一区二区三区| 日韩欧美一区在线| a天堂中文在线观看| 7777精品伊人久久久大香线蕉经典版下载| 久久精品视频2| 色综合久久久网| 国产精品视频久久久久久久| 亚洲成人tv网| 日韩成人免费在线视频| 亚洲一区成人在线| 免费在线一区二区三区| 亚洲免费伊人电影| 天天看片中文字幕| 亚洲欧美日本在线| 丝袜美腿小色网| 中文字幕综合网| 成人做爰视频网站| 亚洲日本在线观看| caoporn91| 亚洲另类色综合网站| 男女羞羞免费视频| 一区二区国产盗摄色噜噜| 国产精品20p| 国产精品伦理一区二区| 成人涩涩小片视频日本| 亚洲精品欧美综合四区| 劲爆欧美第一页| 亚洲自拍偷拍av| 在线观看精品国产| 色婷婷久久综合| 中国a一片一级一片| 欧美日韩一区二区三区在线 | 免费人成黄页网站在线一区二区| 久久久久狠狠高潮亚洲精品| 久久久久久婷| www.99av.com| 国产在线国偷精品免费看| 三级网站免费看| eeuss鲁片一区二区三区在线观看| 亚洲观看黄色网| 欧美国产亚洲另类动漫| 亚洲AV成人无码精电影在线| 樱桃国产成人精品视频| 国产一级片免费观看| 欧美日韩视频免费播放| 成人黄色免费网| 欧美一区二区三区视频在线 | 欧美国产成人精品一区二区三区| 一本色道a无线码一区v| 91精品国产乱码久久久| 欧美tk—视频vk| 女人偷人在线视频| 久久九九国产精品怡红院 | 国产成人中文字幕| 亚洲热av色在线播放| 国产伦精品一区二区三毛| 啪啪亚洲精品| 天堂av在线中文| 免播放器亚洲| www.日本久久| 91麻豆高清视频| 午夜免费激情视频| 日韩欧中文字幕| 99热这里只有精品在线| 国产婷婷色综合av蜜臀av | 亚洲婷婷综合色高清在线| 欧美亚洲天堂网| 在线不卡欧美精品一区二区三区| 黄色一级大片在线免费看国产一 | 涩涩在线视频| 成人黄色av播放免费| 女人抽搐喷水高潮国产精品| 亚洲欧美日韩精品综合在线观看| 亚洲无线视频| 色婷婷一区二区三区av免费看| 成人国产免费视频| 国产wwwwxxxx| 在线亚洲人成电影网站色www| www.精品久久| 中文在线资源观看视频网站免费不卡| 日本资源在线| 成人国内精品久久久久一区| 精品一区毛片| 精品少妇在线视频| 国产美女久久久久| 91香蕉国产视频| 色88888久久久久久影院野外| 丰满人妻av一区二区三区| 中文字幕av一区中文字幕天堂| 极品在线视频| http;//www.99re视频| 日韩精品2区| 亚洲精品中文字幕无码蜜桃| aaa亚洲精品一二三区| 国产大片免费看| 欧美伦理视频网站| 爱久久·www| 国产成人精品最新| 秋霞影视一区二区三区| 2018中文字幕第一页| 国产成人福利片| 日日骚一区二区三区| 欧美另类z0zxhd电影| av在线首页| 国产精品入口尤物| 日韩精品一区二区久久| 精品久久久久久久无码| 久久亚洲精品小早川怜子| 久久不卡免费视频| 亚洲福利视频网| 成全电影大全在线观看| 国产成人av一区二区三区| 国内精品久久久久久久97牛牛| 18深夜在线观看免费视频| 亚洲免费伊人电影| 不卡的日韩av| 欧美激情国内偷拍| 久久综合五月婷婷| 男女激情无遮挡| 久久婷婷国产综合国色天香| 五月婷婷开心网| 亚洲欧美激情在线视频| 三上悠亚激情av一区二区三区 | 亚洲一区国产精品| 亚洲澳门在线| 特级特黄刘亦菲aaa级| 亚洲成人www| 黄上黄在线观看| 国产欧美一区二区三区在线| 久久精品青草| 精人妻一区二区三区| 精品免费在线视频| 欧美zzoo| 国产在线一区二区三区| 欧美成熟视频| 国产精品第七页| 91久久国产综合久久| 三区四区在线视频| 97人人模人人爽人人喊38tv| 在线视频亚洲| 青青青视频在线播放| 欧美一区二区在线不卡| 波多野结依一区| 日韩av在线电影观看| 精品在线播放免费| 久久网一区二区| 亚洲午夜色婷婷在线| 精品国产一区二区三区2021| www国产精品内射老熟女| 欧美国产精品一区| 成人av免费播放| 热99精品里视频精品| 99精品美女| 在线免费播放av| 欧美日韩视频一区二区| 免费网站在线观看人| 日韩精品久久久免费观看 | 成人女人免费毛片| 亚洲欧美日韩国产| 国产又粗又硬又长又爽| 亚洲精品电影网| **日韩最新| 免费看黄在线看| 亚洲欧洲三级电影| 青草久久伊人| 91青青草免费在线看| 老司机午夜免费精品视频| 91成人福利视频| 最近2019中文字幕一页二页| 超碰成人免费| 中文字幕亚洲影院| 欧美亚洲自拍偷拍| а√天堂中文资源在线bt| 中文字幕av久久| 久久精品视频一区|