精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超越O4-mini,多模態大模型終于學會回頭「看」:中科院自動化所提出GThinker模型

人工智能 新聞
來自中科院自動化研究所紫東太初大模型研究中心的研究者提出 GThinker,一個旨在實現通用多模態推理的新型多模態大模型。

盡管多模態大模型在數學、科學等結構化任務中取得了長足進步,但在需要靈活解讀視覺信息的通用場景下,其性能提升瓶頸依然顯著。現有模型普遍依賴基于知識的思維模式,卻缺乏對視覺線索的深度校驗與再思考能力,導致在復雜場景下頻繁出錯。

為解決這一難題,來自中科院自動化研究所紫東太初大模型研究中心的研究者提出 GThinker,一個旨在實現通用多模態推理的新型多模態大模型。

GThinker 的核心在于其創新的「線索引導式反思(Cue-Guided Rethinking)」模式,它賦予了模型在推理過程中主動校驗、修正視覺理解的能力。

通過精心設計的兩階段訓練流程,GThinker 在極具挑戰性的 M3CoT 綜合推理基準上取得了超越了最新的 O4-mini 模型,并在多個數學及知識推理榜單上展現出 SOTA 性能,證明了該方法的有效性和泛化能力。目前,論文、數據及模型均已開源。

圖片

  • 論文鏈接:https://arxiv.org/abs/2506.01078
  • 項目地址:https://github.com/jefferyZhan/GThinker
  • 開源倉庫:https://huggingface.co/collections/JefferyZhan/gthinker-683e920eff706ead8fde3fc0

慢思考的瓶頸:當模型在通用場景「視而不見」

當前,無論是開源的 Qwen2.5-VL,還是閉源的 GPT-4o,多模態大模型的能力邊界正在被不斷拓寬。尤其在引入了思維鏈(CoT)等慢思考策略后,模型在數學、科學等邏輯密集型任務上的表現得到了顯著增強。

然而,這些進步并未完全轉化為在通用多模態場景下的推理能力。與擁有明確答案和嚴格邏輯結構的數理任務不同,通用場景(如理解一幅畫的寓意、分析復雜的日常情景)往往涉及:

  • 高度的視覺依賴:答案強依賴于對圖像中多個、甚至有歧義的視覺線索的正確解讀。
  • 復雜的推理路徑:沒有固定的解題范式,需要模型根據具體問題靈活組織推理步驟。

現有方法,無論是基于結構化 CoT 的,還是基于結果獎勵強化學習的,都存在明顯的局限性。它們在推理中一旦對某個視覺線索產生誤判,往往會「一條道走到黑」,缺乏中途 「回頭看」、修正認知偏差的機制。

圖片

現有主流多模態推理方法的特點與局限性

GThinker:從 「思維鏈」 到 「再思考鏈」

為了打破這一瓶頸,研究團隊提出了 GThinker,其核心是一種全新的推理模式 ——「線索引導式反思」(Cue-Guided Rethinking)。該模式將推理過程升級為一種更接近人類思維的 「思考 - 反思 - 修正」 閉環,它不強制規定僵化的推理結構,而是要求模型在自由推理后,對關鍵視覺線索進行一次系統性的回溯驗證。

圖片

Cue-Rethinking核心流程,虛線框代表可能進行

整個過程分為三個階段:

1. 自由初始推理:模型根據問題和圖像內容,自由地進行一步步推理,同時使用 <vcues_*> 標簽標記出其所依賴的關鍵視覺線索。

2. 反思觸發:在初步推理鏈完成后,一個反思提示(如 「Let's verify each visual cue and its reasoning before finalizing the answer.」)被觸發,引導模型進入基于再思考階段。

3. 基于視覺線索的反思:模型逐一回顧所有標記的視覺線索,檢查其解釋是否存在不一致、錯誤或遺漏。一旦發現問題,模型會修正或補充對該線索的理解,并基于新的理解重新進行推理,最終得出結論。

圖片

GThinker推理模式示例

以上圖為例,GThinker 在初步推理中可能將圖形誤判為 「螃蟹」。但在再思考階段,它會發現 「紅色三角形更像蝦頭而非蟹身」、「藍粉組合更像蝦尾而非蟹鉗」,從而修正整個推理路徑,最終得出正確答案 「蝦」。這種機制使得 GThinker 能夠有效處理有歧義或誤導性的視覺信息,極大地提升了推理的準確性。

兩階段訓練法:如何教會模型進行再思考?

為了讓模型內化這種強大的反思能力,GThinker 設計了一套環環相扣的兩階段訓練框架。

圖片

GThinker 整體訓練流程示例圖

模式引導冷啟動

不同于數理領域在預訓練后自然涌現的反思能力,單純依靠來結果獎勵強化學習 「探索」 出如此復雜的再思考行為,不僅成本高昂且效率低下。因此,GThinker 首先通過監督微調的方式,為模型 「冷啟動」 構建基于視覺線索的再思考能力。

為此,首先通過「多模態迭代式標注」構建了一個包含 7K 高質量冷啟動樣本數據集:利用 GPT-4o、O1、O3 等多個先進模型的互補優勢,對覆蓋通用、數學、科學三大領域的復雜問題進行迭代式地推理和標注,生成了包含高質量再思考路徑的訓練數據。

在訓練時,GThinker 采用「模式引導選擇性格式化」策略,僅對那些基座模型會產生視覺誤判的樣本應用完整的 「反思鏈」 格式,其余則保留為標準推理格式。這使得模型能夠學會在 「需要時」才進行反思,而非機械地執行。

激勵強化學習

在掌握 「如何思考」 以及基于視覺線索進行 「再思考」 的能力基礎上,GThinker 進一步引入基于可驗證獎勵的強化學習方法,設計混合獎勵機制并構建覆蓋多種推理類型的多場景訓練數據,以持續激勵模型在多樣化任務中進行主動探索,從而實現思維模式的跨場景泛化遷移。

  • 多場景數據構建:廣泛收集開源推理數據,并通過 embedding 聚類的方式進行均衡和多樣性采樣,從中精選包含約 4K 條多場景、多任務的強化學習訓練數據集,為泛化能力的提升提供數據保障。
  • DAPO 訓練:相較于 GRPO,DAPO 采用動態采樣的方式,保證 batch 樣本的有效性,并應用無 KL 和 clip higher 等策略,更適用于長鏈思考和探索,使模型學會在不同場景下選擇最優推理方式。

圖片

  • 混合獎勵計算:針對選擇題、數學題等常見任務類型,分別采用精確匹配、Math-Verify 工具校驗的方式計算獎勵,對于通用場景下常見的開放式簡答題,通過加入格式化響應讓模型回答歸納到短語或單詞的形式,以應用精確匹配的計算方式,從而確保了獎勵信號的準確性和進一步拓展支持任務的多樣性。

結果

在復雜、多步及多領域的多模態推理基準 M3CoT 上,GThinker 在多個場景的測試中超過當前先進的開源多模態推理模型及 O4-mini。

圖片

在通用場景(MMStar、RealWorldQA)、多學科場景(MMMU-Pro)及數學基準測試中,GThinker 實現了優于或不遜于現有先進模型的表現,證明了 GThinker 所學的再思考能力并未造成 「偏科」,而是實現了整體通用能力提升。

圖片

盡管 GThinker 的數據均為復雜推理任務構建,但經過這一方法及數據的訓練后,當前最領先的開源模型依然能夠在通用指標上進一步提升。研究團隊選取了 OpenCompass 閉源多模態榜單中 10B 規模下最新排名前三的開源模型,在學術榜單上進行測試。結果顯示,GThinker 在這三款模型上均帶來約 1 個百分點左右的平均性能提升,進一步印證了其方法的有效性與泛化能力。

圖片

Demo

圖片

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-11 09:20:13

2025-02-08 13:30:00

2023-04-18 10:12:06

模型解碼

2024-06-05 09:22:43

2025-07-02 08:43:00

數據訓練模型

2023-05-15 12:14:02

ChatGPT語音模型

2025-03-11 13:49:20

2025-04-23 08:30:05

2022-11-22 10:07:32

研究模型

2025-11-20 12:51:07

2025-02-26 13:00:00

2025-05-09 08:40:00

2021-12-20 10:03:01

自動化人工智能 人臉識別

2023-05-30 10:23:45

模型研究

2023-12-04 13:23:00

數據訓練

2025-01-08 08:21:16

2024-12-31 09:10:00

2025-09-22 09:25:08

2022-06-20 15:00:04

神經網絡CV模型
點贊
收藏

51CTO技術棧公眾號

超碰在线公开97| 麻豆成人小视频| 久久久久亚洲av无码专区体验| 成人国产电影在线观看| 91麻豆产精品久久久久久| 国产成人一区二| 欧美黄色aaa| 亚洲人成伊人成综合图片| 777精品伊人久久久久大香线蕉| 久久人人九九| 国产手机av在线| 免费在线亚洲欧美| 米奇精品一区二区三区在线观看| 天天操精品视频| 久草在线中文最新视频| 亚洲天堂av一区| 久久免费视频1| 成人av无码一区二区三区| 国产综合婷婷| 日韩在线视频观看| 91精品人妻一区二区| 亚洲国产中文在线| 欧美日韩三级一区二区| 成人免费在线小视频| 菠萝菠萝蜜在线观看| 国产欧美精品一区二区色综合朱莉| 国产精品嫩草视频| 日韩无码精品一区二区三区| 日韩电影不卡一区| 精品少妇一区二区| www,av在线| 国产精品4hu.www| 日本韩国精品在线| 浮妇高潮喷白浆视频| 青青久在线视频免费观看| 国产成人精品一区二| 国产在线高清精品| 在线免费观看高清视频| 久久亚洲电影| 欧美一级片一区| 日韩精品――中文字幕| 欧美日韩三级| 欧美成在线观看| 麻豆精品一区二区三区视频| 99久久久久久中文字幕一区| 一区二区三区美女xx视频| av噜噜在线观看| 日本黄色一区| 欧美性淫爽ww久久久久无| 播放灌醉水嫩大学生国内精品| 欧美激情黑人| 1000部国产精品成人观看| 午夜精品一区二区在线观看| 亚洲成人中文字幕在线| 成人免费黄色在线| 国产日韩亚洲精品| 人妻少妇精品无码专区久久| 99精品久久久久久| 欧美精品与人动性物交免费看| 国产女主播福利| 国产又粗又猛又爽又黄91精品| 91av在线播放| 欧美超碰在线观看| 琪琪一区二区三区| 国产免费一区二区三区在线能观看| 亚洲一区 视频| 夜夜嗨一区二区| 欧美另类在线播放| 国产精品第56页| 国产一区二区精品| 欧美国产高跟鞋裸体秀xxxhd| 五月天婷婷丁香网| 欧美在线国产| 韩日精品中文字幕| 中文字幕亚洲乱码熟女1区2区| 国产精品www.| 欧美亚洲激情在线| 中文字幕制服诱惑| 高清不卡一区二区| 久久综合一区二区三区| 亚洲乱色熟女一区二区三区| 不卡一区二区在线| 成人片在线免费看| 日韩一区av| 国产精品久久久久精k8| 日本人妻伦在线中文字幕| 国产色播av在线| 欧美自拍丝袜亚洲| 青青青在线播放| 日韩福利在线观看| 亚洲精品在线免费观看视频| 人妻体内射精一区二区| 99久久夜色精品国产亚洲狼| 国内精品久久久| www.久久网| 成人免费视频caoporn| 欧美激情专区| 在线免费观看污| 色婷婷av久久久久久久| 亚洲中文字幕无码不卡电影| 亚洲精品无播放器在线播放| 亚洲国产天堂久久综合| 亚洲精品一区二区三区在线播放| 日韩久久综合| 午夜精品一区二区三区在线视频 | 免费网站在线观看视频| 亚洲人体视频| 欧美成人免费网站| 性少妇xx生活| 欧美1区2区视频| 国产精品成人va在线观看| 亚洲国产精品欧美久久| 欧美激情一区不卡| 影音欧美亚洲| 日韩天堂在线| 日韩av在线一区二区| 永久免费看片直接| 日本午夜一区二区| 国产日韩亚洲精品| 日本一本在线免费福利| 午夜天堂影视香蕉久久| 一级黄色在线播放| 国产区精品区| 日本免费久久高清视频| 污视频网站在线播放| 一区二区三区四区中文字幕| 99国产精品久久久久久| 精品国产成人| 国产不卡av在线| 国产成人av免费| 99国产麻豆精品| 日本中文字幕在线视频观看| 精品一区二区三区免费看| 视频直播国产精品| 波多野结衣视频免费观看| 国产一区二区不卡| 亚洲视频小说| 看片一区二区| 色婷婷久久av| 一本色道久久综合无码人妻| 国产精品素人视频| 天堂一区在线观看| 久久日文中文字幕乱码| 国产乱肥老妇国产一区二| 9i精品一二三区| 欧美日韩在线播| jizzjizz日本少妇| 麻豆91精品91久久久的内涵| 亚洲成人自拍视频| 国产亚洲精彩久久| 久久精品成人欧美大片| 西西44rtwww国产精品| av在线不卡网| 欧美在线观看www| 日韩欧美影院| 日韩av色综合| 成人高清免费观看mv| 欧美视频中文字幕| 情侣偷拍对白清晰饥渴难耐| 激情综合色播激情啊| 糖心vlog在线免费观看| 91免费精品国偷自产在线在线| 在线观看日韩视频| 在线免费观看视频网站| 中文字幕一区二区三区在线播放 | 精品国产三级a在线观看| 黄色一级视频免费| 久草这里只有精品视频| 一本色道久久88亚洲精品综合| 免费成人美女女| 色噜噜亚洲精品中文字幕| 无码人妻丰满熟妇奶水区码| 国产精品拍天天在线| 精品露脸国产偷人在视频| 国产人妻精品久久久久野外| 亚洲视频一区| 欧美综合激情| 午夜激情在线播放| 在线精品高清中文字幕| 99国产精品久久久久99打野战| 久久久久国产一区二区三区四区 | 亚洲日本激情| 日韩欧美一区二区三区四区| 亚洲最大成人| 深夜福利亚洲导航| 日韩一区免费视频| 在线观看中文字幕不卡| 欧美交换国产一区内射| 久久亚区不卡日本| 日本r级电影在线观看| 亚洲欧美日韩国产一区| 日本特级黄色大片| 色愁久久久久久| 亚洲一区中文字幕| 日韩av中字| 欧美激情三级免费| 69久久夜色| 亚洲精品久久久久久下一站 | aaaaa级少妇高潮大片免费看| 日韩视频久久| 亚洲天堂电影网| 日韩精品免费一区二区夜夜嗨 | 成人在线观看免费视频| 欧美激情视频在线| 91高清在线| 日韩av在线高清| 国产ts变态重口人妖hd| 在线欧美日韩精品| wwwxxx亚洲| 亚洲一区二区视频在线| 波多野结衣家庭教师在线观看 | 国产福利资源在线| 亚洲综合视频在线观看| 卡一卡二卡三在线观看| 97se亚洲国产综合在线| 日韩视频在线免费看| 亚洲区国产区| 777久久精品一区二区三区无码 | 亚洲黄色在线看| 国产尤物在线观看| 欧美综合在线视频| 亚洲欧美偷拍视频| 中文字幕在线不卡| 一级黄色录像毛片| 久久久精品中文字幕麻豆发布| 日本成人在线免费视频| 亚洲精品看片| 黄色一级大片免费| 在线免费观看日本欧美爱情大片| 国产日韩精品久久| 超碰97成人| 成人av免费电影| 日韩精品一区二区三区中文字幕| 91大神在线播放精品| 波多野结衣视频一区二区| 欧美大片大片在线播放| 国产在线更新| 九九九久久久久久| 直接在线观看的三级网址| 日韩久久午夜影院| 国产又爽又黄网站亚洲视频123| 精品视频在线免费观看| a片在线免费观看| 亚洲一区二区三区爽爽爽爽爽 | 亚洲日本一区二区| 老司机精品免费视频| 亚洲欧洲成人自拍| 天天色影综合网| 亚洲人妖av一区二区| 欧美成欧美va| 性做久久久久久久免费看| 日本免费在线播放| 狠狠做深爱婷婷久久综合一区| 特级西西人体高清大胆| av电影在线观看一区| 超碰成人在线播放| 老司机免费视频久久 | 欧美日韩一区二区三区四区在线观看| 欧美日韩国产精品一卡| 久久av导航| 一区二区三区av| 欧美一区二区| 宅男一区二区三区| 综合久久综合| 少妇高潮毛片色欲ava片| 中文字幕亚洲精品乱码| 69精品丰满人妻无码视频a片| 日韩欧美字幕| 狠狠干视频网站| 夜夜嗨av一区二区三区网站四季av| 国产精品久久久影院| 亚洲激情成人| 国产熟人av一二三区| 久久99国产精品尤物| 日韩精品――色哟哟| 91美女蜜桃在线| 国产无遮挡在线观看| 国产亚洲短视频| 欧美一级片在线视频| 午夜国产精品一区| 中文字幕精品在线观看| 精品处破学生在线二十三| 99久久精品国产一区色| 亚洲福利视频在线| 国产精品视频二区三区| 亚洲开心激情网| 午夜国产福利在线| 68精品国产免费久久久久久婷婷| av福利在线导航| 国产精品国产三级国产专播精品人| 欧美一级大黄| 99国产视频在线| 不卡中文字幕| 成人性免费视频| 亚洲视频成人| 激情五月婷婷基地| 久久日韩粉嫩一区二区三区| 欧美黑人精品一区二区不卡| 在线观看中文字幕不卡| 神宫寺奈绪一区二区三区| 色爱精品视频一区| 天堂在线中文网官网| 2022国产精品| 久久中文视频| www.日日操| 99久久99久久精品免费观看| 97精品在线播放| 色婷婷久久99综合精品jk白丝| 狠狠人妻久久久久久综合| 日韩欧美国产一区二区在线播放 | 国产免费观看高清视频| 黑人巨大精品欧美一区| 波多野结衣电影免费观看| 国产欧美日本一区视频| 毛片毛片女人毛片毛片| 欧美v国产在线一区二区三区| 五月天婷婷在线观看| 久久国产精品久久久久久久久久| 国产色婷婷在线| 成人免费网站在线看| 日韩精品dvd| 国产精品69页| 久久亚洲欧美国产精品乐播| 日韩精品在线免费看| 欧美午夜寂寞影院| 九色视频在线播放| 欧美在线不卡区| 欧美午夜寂寞| a级黄色一级片| 久久福利资源站| 国产欧美小视频| 亚洲成人精品一区二区| 丰满大乳国产精品| 亚洲精品蜜桃久久久久久| 97色婷婷成人综合在线观看| 欧洲一区二区日韩在线视频观看免费| 欧美女王vk| 欧美日韩亚洲第一| 91亚洲精品久久久蜜桃| 亚洲欧美在线观看视频| 亚洲第一色中文字幕| 国产经典三级在线| 国产精品毛片va一区二区三区| 色综合综合网| mm1313亚洲国产精品无码试看| 国产美女主播视频一区| 青青草视频成人| 日韩欧美在线字幕| 国模吧精品人体gogo| 国产精品国语对白| 久久影院一区| 手机在线观看日韩av| 亚洲主播在线播放| 天天综合网在线观看| 国产91对白在线播放| 国产探花一区| 免费观看国产精品视频| 99国内精品久久| 久草资源在线视频| 亚洲精品av在线播放| 欧美成人影院| 中文字幕在线亚洲精品| 国产一本一道久久香蕉| 国产精品7777| 亚洲人成电影在线播放| av资源在线播放| 欧美精品一区在线| 久久99国产精品久久99| 18精品爽视频在线观看| 亚洲男女自偷自拍图片另类| 国产亚洲精彩久久| 日本一区免费在线观看| 麻豆91在线看| 国产亚洲精品女人久久久久久| 777午夜精品视频在线播放| 后进极品白嫩翘臀在线播放| 91精品国产综合久久久久久久久 | 久久伊人一区| 国内精品久久久久久久影视麻豆| 九九热99视频| 亚洲综合无码一区二区| 噜噜噜在线观看播放视频| 国产在线观看精品一区二区三区| 成人黄色小视频| 男人女人拔萝卜视频| 狠狠干狠狠久久| 国产黄色在线观看| 91色在线观看| 香蕉av777xxx色综合一区| 国产精品视频看看| 日韩黄色高清视频| 国产精品久一| 最近免费中文字幕中文高清百度| 国产午夜精品理论片a级大结局| jizz国产在线观看| 欧美激情图片区| 国产精品传媒精东影业在线| 久久人人爽人人爽人人片| 日韩欧美亚洲一区二区| 国产精品麻豆成人av电影艾秋|