精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1不是唯一路徑!MIT新研究:在測試時訓練,模型推理能力最高升至5.8倍

人工智能
不同于傳統的先訓練后測試模式,測試時訓練(Test-Time Training,TTT)在部署階段面對新的測試樣本時,不直接用訓練好的模型去推理。

o1不是通向大模型推理的唯一路徑!

MIT的新研究發現,在測試時對大模型進行訓練,可以讓推理水平大幅提升。

在挑戰超難的ARC任務時,準確率最高可提升至原來的5.83倍。

圖片圖片

這樣的表現不僅優于GPT-4和Claude,如果與其他推理方法相結合,還能超越人類的平均水準。

圖片圖片

OpenAI o1團隊成員Noam Brown表示,o1的大規模計算可能不是最好的方法,很高興看到有學者在提高推理能力上探索新的方法。

圖片圖片

在測試中訓練模型

不同于傳統的先訓練后測試模式,測試時訓練(Test-Time Training,TTT)在部署階段面對新的測試樣本時,不直接用訓練好的模型去推理

在推理之前,測試樣本自身攜帶的信息,會通過快速的訓練過程被用于調整模型參數。

總體來說,TTT過程中一共有三個關鍵階段——訓練數據生成、模型適應范式設計以及推理階段的策略

數據生成的核心是將測試任務中蘊含的輸入輸出對關系,通過數據增強的方式最大限度地利用,可具體分為兩個步驟。

首先是基于leave-one-out構造新的任務。

對于包含K個輸入輸出對的測試任務,依次將每個樣本留出作為測試樣本,其余K-1個作為訓練樣本,由此構造出K個新的TTT訓練任務。

這樣就可以從一個測試任務出發,構造出K個結構一致但內容互補的新任務,從而擴充了TTT訓練數據。

在此基礎上,作者還進行了數據增強,主要包括對輸入輸出施加各類幾何變換,以及打亂訓練樣本對的順序。

經過這一步,TTT訓練集的規模可以得到顯著擴大。

整個TTT數據構造過程可高度自動化,不依賴人工標注。

圖片圖片

利用構造好的TTT數據集,就可以對預訓練好的語言模型進行測試時訓練。

考慮到測試時的資源限制,作者采用了參數高效的LoRA,為每個測試任務學習一組獨立的adapter參數,附加在預訓練模型的每一層之上,通過一個低秩矩陣與原始權重相乘起到調節作用。

過程中還額外加入了對所有前綴序列的預測,目的是通過在各種長度的演示樣本上都計算損失,鼓勵模型盡早地從少量信息中總結出抽象規律,從而提高魯棒性。

圖片圖片

最后,為了實現TTT效果的最大化,作者在推理階段應用了數據增強和集成學習策略。

推理過程中,先利用一系列預定義的幾何變換算子(如旋轉、翻轉等)擴充原始輸入,生成若干等價視角下的輸入變體。

之后將每個變體輸入并行地送入LoRA-tuned模型,獨立完成預測,然后再對齊和還原到原始輸入空間,由此得到一組成對的預測。

在成對預測的基礎上,通過分兩層投票的方式完成集成融合:

  • 第一層在每種變換內部進行投票,選出置信度最高的Top-3個預測;
  • 第二層在不同變換的Top-3預測之間進行全局投票,選出最終的Top-2作為輸出。

這一推理策略,既通過數據增強引入了輸入的多樣性,又用分層投票的方式對不同來源的預測進行了結構化的組合,進一步提升了TTT方法的效果。

圖片圖片

ARC任務準確率最高升至6倍

為了評估TTT方法的效果,研究團隊以8B參數的GPT-3作為基礎模型進行了測試。

如果不使用TTT僅進行微調,模型在ARC數據集上的準確率只有18.3%,加入TTT后提升到47.1%,增長率達到了157%。

圖片圖片

另外,作者還從ARC數據集中隨機選擇了80個任務作為子集進行了測試。

測試發現,TTT方法對于1B模型的提升效果更加明顯,調整后模型的準確率接近調整前的6倍。

并且在調整前后,1B和8B兩個規模的模型之間的相對差距也在縮小。

圖片圖片

進一步地,作者還將TTT方法與之前在ARC任務上取得優異成績的BARC(Bootstrapping Approach for Reward model Construction)方法進行了比較和結合。

具體來說,作者首先獨立運行這兩個系統,得到它們在每個測試任務上的輸出。

如果兩者輸出完全一致,則直接認為推理結果是正確的;

如果輸出不一致,則看BARC是否能夠生成確定的、唯一覆蓋所有測試樣本的解題程序,若是則認為BARC的輸出更可靠;

反之,如果BARC生成了多個候選程序但無法確定最優解,或者干脆無法生成任何滿足約束的程序,則認為TTT的輸出更可靠。

兩種方式配合使用后,取得了61.9%的SOTA成績,已經超過了人類的平均水平

圖片圖片

One More Thing

根據作者在推文中的介紹,在這篇論文發布前,一個叫做MindsAI的團隊已經發現使用了相同的技術。

利用TTT技術,該團隊已經用58%的正確率取得了ARC挑戰的第一名。

作者的論文發布之后,MindsAI團隊領導者Jack Cole也發文進行了祝賀:

很高興,我們掀起了這場對TTT的興趣風暴。

圖片圖片

同時,Jack還推薦了另一名研究TTT的學者——斯坦福大學華人博士后Yu Sun,表示他的研究值得被關注。

圖片圖片

Sun的個人主頁顯示,他針對測試時訓練進行了大量研究,相關成果入選過ICML、NeurIPS、ICLR等多個頂級會議。

圖片圖片

論文地址:https://ekinakyurek.github.io/papers/ttt.pdf

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-09-24 11:01:03

2025-01-23 14:53:15

2024-10-05 00:00:00

2025-01-23 10:45:52

2025-01-13 12:30:58

2024-11-18 14:00:00

模型AI

2025-07-22 10:22:02

2025-01-20 13:08:25

2025-01-20 09:28:00

AI工具模型

2024-11-07 15:40:00

2025-04-18 09:13:00

2025-02-08 14:03:25

2024-06-17 13:34:54

2025-04-08 00:40:00

谷歌合成數據大模型

2025-02-03 14:17:27

2024-09-19 13:32:24

2024-10-05 15:30:00

LLM模型推理

2024-09-13 06:32:25

2011-03-28 10:52:51

戴爾高效企業

2024-10-10 13:01:43

點贊
收藏

51CTO技術棧公眾號

51精品在线观看| 日韩av一区在线观看| 天天做天天爱天天高潮| av在线免费在线观看| 影院欧美亚洲| 一区二区三区美女xx视频| 久久人人爽av| 成年男女免费视频网站不卡| 久久久www成人免费无遮挡大片| 国产一区二区在线免费| 国产午夜福利片| 成人精品视频| 精品国精品国产| 网站一区二区三区| 国产盗摄精品一区二区酒店| 日本一区二区视频在线观看| 粉嫩精品一区二区三区在线观看| 欧美一区免费看| 国内精品嫩模av私拍在线观看| 精品亚洲一区二区三区四区五区| 亚洲午夜激情影院| 综合日韩av| 亚洲色图在线看| 奇米视频888战线精品播放| 精品人妻一区二区三区日产乱码| 青青草国产成人av片免费| 欧美激情中文网| www.xx日本| 啪啪亚洲精品| 亚洲福利在线观看| 91av免费观看| 四虎精品在线观看| 欧美在线视频你懂得| 丰满少妇久久久| a毛片在线看免费观看| 欧美激情一二三区| 久久青青草原一区二区| 亚洲欧美国产高清va在线播放| 免费黄网站欧美| 国产v综合ⅴ日韩v欧美大片| 久久久久久国产精品视频| 水蜜桃久久夜色精品一区| 亚洲欧美日韩精品| 疯狂揉花蒂控制高潮h| 成人台湾亚洲精品一区二区| 欧美一级理论片| 五月花丁香婷婷| 久久免费影院| 在线欧美日韩国产| 国产精品亚洲αv天堂无码| 18video性欧美19sex高清| 一区二区在线观看免费| 亚洲最新免费视频| 色综合久久影院| 欧美激情在线看| 日韩免费电影一区二区| 国产主播福利在线| 久久久99精品久久| 欧美一区二区高清在线观看| 色猫av在线| 久久婷婷色综合| 欧美日韩在线一二三| 深夜福利在线看| 91老师国产黑色丝袜在线| 久久av一区二区三区亚洲| 天天干,夜夜操| 91美女精品福利| 青娱乐一区二区| av片在线看| 最新久久zyz资源站| 亚洲av首页在线| 四虎影视国产在线视频| 亚洲成av人片www| 久久久999视频| 欧美xxx视频| 欧美日韩一区在线| 熟妇无码乱子成人精品| 国产成人精品福利| 亚洲欧美视频在线| 九九热久久免费视频| 天天影视综合| 久久久久久12| 精品免费囯产一区二区三区| 免费在线观看不卡| 亚洲www在线| 色网站免费观看| 久久精品视频网| 日韩一区二区三区资源| 成人video亚洲精品| 亚洲国产一区视频| 国产三级三级三级看三级| 日韩第二十一页| 亚洲精品久久久久久久久| 日韩乱码人妻无码中文字幕久久| 999精品视频| 欧美精品videos| 无码久久精品国产亚洲av影片| 国产在线乱码一区二区三区| 久久99影院| 国产一二区在线观看| 精品二区三区线观看| 黄色片视频在线| 久久精品国产亚洲5555| 中文字幕日韩欧美在线| 日韩 国产 在线| 另类成人小视频在线| 韩国成人动漫在线观看| 女女色综合影院| 欧美日韩亚洲高清| 97超碰免费在线观看| 精品午夜久久| 97婷婷涩涩精品一区| 国产一区二区在线视频观看| 91亚洲国产成人精品一区二区三 | av中文字幕免费| 久久久久久97三级| 免费拍拍拍网站| 精品一区二区三区中文字幕 | 黄色国产小视频| 日本免费一区二区三区视频| 亚洲视频在线观看| 日本熟女一区二区| 日本色综合中文字幕| 国产精品国产精品国产专区蜜臀ah | 性欧美疯狂xxxxbbbb| jizz大全欧美jizzcom| 国产精品qvod| 在线亚洲午夜片av大片| 国产又黄又爽又色| 国产99久久久国产精品潘金 | 亚洲视频资源在线| 男人操女人免费软件| 亚洲精品福利| 中文字幕亚洲激情| 日本中文在线播放| 国产精品18久久久久久久久久久久| 欧美激情一区二区三区在线视频| 97caopron在线视频| 欧美特级www| 性色av蜜臀av浪潮av老女人| 五月天综合网站| 日本久久91av| 五月婷婷丁香六月| 亚洲一线二线三线久久久| 99sesese| 日本欧美国产| 国产精品99久久久久久www| 隣の若妻さん波多野结衣| 亚洲色图都市小说| 精品久久久久久中文字幕2017| 牛牛影视久久网| 51久久精品夜色国产麻豆| 亚洲男人天堂久久| 亚洲自拍偷拍图区| 亚洲熟女乱综合一区二区| 羞羞答答成人影院www| 国产精品亚洲第一区| 青青国产在线| 欧美性黄网官网| 香港三级日本三级| 国产亚洲永久域名| 精品乱码一区二区三区| 无码小电影在线观看网站免费| 日韩精品视频在线观看免费| 日韩免费不卡视频| 成人的网站免费观看| 三级影片在线观看欧美日韩一区二区| 久久久免费av| 亚洲精品国产手机| 日韩美女视频19| 久久久久久久久久久久久久久国产| 久久资源中文字幕| 亚洲综合色av| 羞羞视频在线观看不卡| 欧美日韩精品一区二区三区四区| 91麻豆精品国产91久久综合| 久久精品一区二区国产| 亚洲a∨一区二区三区| 成人毛片免费| 日韩视频在线观看免费| 国产手机视频在线| 精品国产乱码久久久久久虫虫漫画 | 国产精品美女高潮无套| 精品一区二区三区蜜桃| 黑人巨茎大战欧美白妇| 中文字幕av一区二区三区四区| 欧美成人免费在线视频| 亚洲爱爱综合网| 一本色道综合亚洲| 国精产品视频一二二区| 国产精品一区免费视频| 分分操这里只有精品| 亚洲a级精品| 国产精品无av码在线观看| a级网站在线播放| 亚洲国产精品人久久电影| 中文字幕视频网站| 国产情人综合久久777777| 爱爱爱爱免费视频| 欧美视频官网| 国外成人在线视频网站| 99久久伊人| 欧美日本中文字幕| 天天在线女人的天堂视频| 欧美视频日韩视频在线观看| 中文字幕在线2021| 久久精品无码一区二区三区| 免费网站在线观看黄| 亚洲精品黄色| 一区二区高清视频| 六月丁香久久丫| 成人福利视频在线观看| 人人草在线视频| 久久精品国产清自在天天线| 天天综合永久入口| 欧美日韩不卡一区| 久久免费小视频| 亚洲欧美综合网| 天天插天天射天天干| 韩国三级电影一区二区| 中文字幕日本最新乱码视频| 精品一区av| 欧美日韩亚洲在线| ccyy激情综合| 成人www视频在线观看| 色在线免费观看| 久久精品91久久香蕉加勒比| 国产一区二区三区不卡在线| 精品国产成人系列| 91 中文字幕| 色丁香久综合在线久综合在线观看| 日本熟女一区二区| 亚洲乱码中文字幕| 91狠狠综合久久久久久| xnxx国产精品| 69亚洲乱人伦| a在线播放不卡| 亚欧精品在线视频| 蜜桃在线一区二区三区| 99热成人精品热久久66| 亚洲国产一区二区三区a毛片| 欧美少妇一级片| 久久精品亚洲欧美日韩精品中文字幕| 欧美日韩一区二区视频在线| 国产精品tv| 91在线在线观看| 成人国产精选| 国产日韩欧美电影在线观看| 在线免费av资源| 午夜精品久久久久久久99黑人 | 欧美在线观看视频| 亚洲男同gay网站| 久热在线中文字幕色999舞| 2017亚洲天堂1024| 中文国产成人精品| 麻豆传媒视频在线观看| 在线播放亚洲激情| 国产系列在线观看| 亚洲午夜精品视频| 色综合久久久久久| 精品香蕉在线观看视频一| 可以免费看毛片的网站| 精品国产91九色蝌蚪| 亚洲国产精品成人久久蜜臀| 精品久久五月天| 亚洲精品视频网| 欧美本精品男人aⅴ天堂| 国产激情视频在线播放| 日韩一区二区三区四区| 天堂av手机版| 亚洲精品视频免费在线观看| 你懂的视频在线免费| 亚洲午夜精品久久久久久久久久久久 | 欧美日韩免费| 2019日韩中文字幕mv| 亚洲精品人人| 欧美成人黑人猛交| 日本在线播放一区二区三区| 日本超碰在线观看| 污污的网站在线免费观看| 91丝袜美腿高跟国产极品老师| 精人妻一区二区三区| 久久夜色精品一区| 免费黄色在线网址| 亚洲欧美成aⅴ人在线观看| 青青操国产视频| 日韩欧美国产激情| 啪啪小视频网站| 日韩欧美中文一区| 先锋av资源站| 亚洲片av在线| 日本天码aⅴ片在线电影网站| 欧美极品少妇全裸体| 欧美香蕉视频| 成人在线视频网站| 久久伊人影院| 日韩精品福利视频| 亚洲精品va| 国产91xxx| 日本中文字幕一区二区视频 | 日精品一区二区三区| 亚洲18在线看污www麻豆| 白白色亚洲国产精品| 91麻豆精品国产91久久综合| 亚洲国产aⅴ成人精品无吗| 天天干,天天干| 日韩精品一区二区三区四区 | 国产成人在线看| 右手影院亚洲欧美| 中文字幕一区二区在线播放| 欧美精品亚洲精品日韩精品| 777午夜精品免费视频| 日本免费一区视频| 最近2019中文字幕一页二页| 欧美人与性动交α欧美精品济南到| 97人人做人人爱| 日韩精品一区二区三区中文字幕| 麻豆久久久av免费| 欧美日本三区| 天天爽人人爽夜夜爽| 久久蜜桃一区二区| 久久久精品人妻一区二区三区四| 欧美亚洲国产一区二区三区| 神马久久久久久久久久| 欧美高清视频一区二区| 国产精品成人国产| 久久精品久久精品国产大片| 一区二区在线| 久久久久久久久久一区| 国产欧美日韩精品在线| 国产精品18p| 亚洲日本成人| 久久手机视频| 欧美久久视频| xxww在线观看| 国产精品久久久久影院老司| 二区视频在线观看| 精品国产一区二区亚洲人成毛片 | 亚洲视频三区| 26uuu成人| 另类人妖一区二区av| 三级黄色录像视频| 欧美亚洲国产一区在线观看网站| 艳母动漫在线看| 美女福利精品视频| 久久久久久亚洲精品美女| 美女黄色片网站| 美女脱光内衣内裤视频久久网站 | 国产精品色眯眯| 天天操天天干天天摸| 一区二区三区回区在观看免费视频| xx欧美视频| 蜜桃久久精品乱码一区二区 | 国产成人精品www牛牛影视| 亚洲日本精品视频| 黑丝美女久久久| 日本高清视频网站| 性日韩欧美在线视频| 伊人久久大香线蕉综合网站| 人妻少妇精品无码专区二区| 不卡一区二区在线| 日韩三级av在线| 亚洲人成五月天| 欧美日韩精品一区二区三区视频| 欧美深深色噜噜狠狠yyy| 久久资源在线| 国产精品视频一区二区在线观看| 欧美日韩电影在线| 日p在线观看| 国产精品香蕉国产| 欧美日韩a区| 最近日本中文字幕| 欧美日韩亚洲一区二区三区| 成人在线免费看| 91精品久久久久久久| 一区二区三区网站 | 蜜臀99久久精品久久久久小说 | 色综合久久中文综合久久牛| 欧美美女搞黄| 91久久精品美女高潮| 欧美精品导航| 色婷婷免费视频| 日韩欧美亚洲成人| 麻豆tv在线| 豆国产97在线| 老鸭窝91久久精品色噜噜导演| 激情五月深爱五月| 欧美一级夜夜爽| 中文不卡1区2区3区| 黑人另类av| 精一区二区三区| 亚洲国产精品午夜在线观看| 亚洲理论在线a中文字幕| 一区在线不卡| 日韩免费视频播放| 国产精品久久影院| 性欧美8khd高清极品| 国产精品第一页在线| 欧美在线观看天堂一区二区三区| 国产麻豆xxxvideo实拍|