精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率 原創 精華

發布于 2025-10-17 08:30
瀏覽
0收藏

一、AI 模型訓練的“數據幻覺”

在人工智能領域,有一個近乎鐵律的共識:數據越多,模型越聰明。這條邏輯支撐了過去十年的 AI 爆發——從 GPT 到 Claude,再到 DeepSeek,所有巨頭都在堆算力、卷數據、拼參數。

但當 DeepSeek 以 1/30 成本訓練出高性能模型后,這條鐵律開始動搖。 如今,一篇來自 LIMI 團隊的新論文再次顛覆認知——他們僅用 78 個高質量訓練樣本,就讓模型在智能體評測中超越了使用 10,000 個樣本訓練的對手

是的,你沒看錯:128 倍更少的數據,性能反而高出 53.7%。

這個研究的名字叫——LIMI:Less Is More for Intelligent Agency(少即是多的智能體訓練)。 而它提出的核心原則,或許將成為未來 AI 訓練的新范式:

“真正的智能,不源于數據的堆砌,而源于高質量的任務體驗。”

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

二、什么是“智能體”?

在深入 LIMI 之前,我們得先搞清楚“智能體(Agentic AI)”到底意味著什么。

過去的語言模型,只能“說”,不能“做”。 它們接收提示詞、生成回答,像是一個被動的智囊。

但智能體不同。它會主動思考、規劃、行動。 正如論文中定義的那樣:智能體是一種具備自主行動能力的 AI,可以主動發現問題、制定計劃、調用工具并與環境交互完成任務。

這意味著,它不再只是回答問題,而是能:

  • 主動調試代碼;
  • 自動完成數據分析任務;
  • 自行規劃科研流程;
  • 在遇到錯誤時進行自我修復。

舉個例子: 傳統模型像學生,等老師提問再作答; 智能體像工程師,能獨立接項目、寫代碼、調工具、修 bug,一條龍完成任務。

這正是當下 AI 從“對話型”向“執行型”演化的關鍵拐點。 而 LIMI,正是要解決——如何高效訓練出這樣的智能體?

三、為什么“更少的數據”反而更有效?

十幾年來,AI 領域一直信奉“Scaling Law”:模型參數越大、數據越多、性能越強。 但近幾年開始出現反例——尤其是在復雜推理與多步驟任務上,“更多”反而拖慢了模型學習的關鍵能力。

比如:

  • LIMA (2023)表明,只需 1000 個高質量示例即可實現模型對齊;
  • LIMO (2025)證明,用 817 個精心挑選的數學樣本,就能讓模型在復雜推理中提升 45.8%。

LIMI 則把這一理念推向極致。 它認為:學習“智能行為”不是記憶,而是體驗。

想象你學做菜。 看 10,000 個視頻,也許能背下每個菜譜; 但跟廚師實操一次,切菜、調味、試錯、修正,你才能真正“會做”。

AI 訓練也是如此。 LIMI 沒有用成千上萬條重復樣本,而是精挑出 78 條高質量的“完整任務體驗”——每條都涵蓋了從計劃、執行、到修正的全過程。 這讓模型學到的,不是孤立知識點,而是完整的解決問題思維鏈

四、LIMI 的三大創新:用結構化體驗替代大規模樣本

LIMI 的突破,來自三個關鍵方法。

1. Agentic Query Synthesis:讓訓練任務更像真實協作

傳統訓練樣本通常是單輪問答或簡單任務。 LIMI 反其道而行,它模擬了真實開發者與研究者的協作場景。

  • 從專業開發者與科學家的真實問題中采樣 60 條;
  • 再利用 GPT-5 從 GitHub Pull Request 自動生成 18 條“偽真實”任務;
  • 每個任務都要求模型進行多輪推理、工具調用與環境交互

這讓訓練過程不再是填鴨式學習,而像在真實工作中積累經驗。

2. Trajectory Collection Protocol:記錄“全過程”的學習軌跡

每個任務不僅包括輸入與輸出,還完整記錄了模型思考、行動、反饋的全過程

  • 推理步驟(思維鏈)
  • 工具調用(如代碼編輯、API 請求)
  • 環境反饋(如報錯、用戶修改)

平均每條任務記錄 4.2 萬個 token,最長超過 15 萬。 這讓模型真正理解“行動邏輯”——什么時候思考、什么時候動手、遇錯如何修復。

3. Focus on High-Impact Domains:聚焦真實高價值場景

LIMI 并非泛化采樣,而是聚焦兩大高密度領域:

  • Vibe Coding:多人協作開發、調試與測試;
  • Research Workflows:科研任務,如論文檢索、實驗設計與數據分析。

這兩個領域的共性是:復雜度高、反饋密集、需要多步行動。因此每個樣本都極具信息密度,相當于一場高質量的“項目實戰”。

五、從 GitHub 到協作智能:數據集是怎么煉成的?

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

LIMI 數據集的構建過程堪稱“工藝級”:

  1. 任務池創建:從 GitHub 熱門項目中抽取真實 Pull Request,再經 GPT-5 轉化為結構化問題。
  2. 嚴格篩選:由 4 位博士級專家人工審核,確保語義完整與任務真實度。
  3. 交互生成:使用具備代碼執行與網頁訪問功能的 SII CLI 環境,讓 GPT-5 與人工協作完成任務,全程錄制交互軌跡。

最終留下的 78 個樣本,每一個都像一個完整的“項目案例庫”。 每條記錄濃縮了數小時的真實問題解決過程,信息密度遠超常規訓練樣本。

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

六、測試結果:78 個樣本干翻 10,000 個樣本的模型

在全新評測集 AgencyBench 上,LIMI 展現了驚人的性能:

模型

樣本量

性能分數

GLM-4.5

10,000

45.1%

DeepSeek-V3.1

10,000

11.9%

Kimi-K2

10,000

24.1%

LIMI (78 樣本)

78

73.5%

在子指標上同樣碾壓:

  • 首輪任務完成率:71.7% vs 37.8%
  • 三輪內成功率:74.6% vs 47.4%
  • 執行效率:74.2% vs 50.0%

更令人驚訝的是,LIMI 的泛化能力也極強—— 在代碼生成(HumanEval)、工具使用(TAU2-bench)、科研計算(SciCode)等多項任務中,LIMI 都刷新了記錄。

這說明,它學到的并非某類任務的套路,而是真正的“通用行動智能”。

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

七、案例對比:智能體的“實戰智商”

研究團隊還在論文中展示了幾個鮮明的案例:

  • 五子棋游戲開發任務:傳統模型 GLM-4.5 無法完成棋盤渲染與勝負判斷;LIMI 一次性完成所有模塊。
  • 數據集發現任務:LIMI 在 Hugging Face 上能精確找到最相關的數據集;而 GLM 輸出了無關內容。
  • 科學函數擬合任務:GLM 需要多次提示才能達到誤差 1.14e-6,LIMI 首次嘗試就達到 5.95e-7。
  • NBA 交易推理任務:LIMI 僅用一次提示即可得出正確推理路徑。

這些結果充分證明——LIMI 不僅“知道”,還“會做”。

少即是多:LIMI 用 78 個樣本,重新定義智能體訓練效率-AI.x社區

八、“智能體效率原理”:AI 自主性的本質

LIMI 團隊在論文中提出了一個新概念:Agency Efficiency Principle(智能體效率原理)。 它指出:

“機器自主性,不是由數據量堆出來的,而是來自高質量行動演示的戰略性設計。”

這句話的意義深遠。 它告訴我們: 與其追求更多的樣本,不如去設計更有代表性的任務; 與其擴充數據規模,不如提升數據的“行動價值密度”。

換句話說,AI 的未來競爭,不再是誰爬取更多網頁,而是誰更懂“教模型做事”。

九、從“堆料”到“調味”:AI 訓練的新范式

LIMI 的出現,預示著 AI 訓練的一個重要拐點。

過去十年,AI 的進步靠“堆料”:堆數據、堆顯卡、堆參數。 但未來十年,將更像“調味”:精準選擇素材,合理設計任務,優化模型體驗。

這意味著:

  • AI 開發的重心將從算力轉向認知設計
  • 高質量任務數據將成為新型競爭壁壘
  • 中小企業也能以低成本訓練高性能模型。

這是一場從“量”到“質”的范式轉移,可能徹底改變 AI 的生態格局。

十、寫在最后:AI,不需要“更大”,而需要“更聰明”

LIMI 的研究,用 78 個樣本告訴我們一個簡單卻深刻的道理——AI 不需要更多數據,它需要更好的學習體驗。

當模型從“被動輸出”變成“主動行動”, 當訓練從“堆疊樣本”變成“設計體驗”, 我們或許才真正踏上了“通用人工智能”的道路。

未來的 AI,不屬于擁有最多數據的公司, 而屬于那些最懂如何教機器思考和行動的人。


本文轉載自??Halo咯咯??    作者:基咯咯

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-10-17 08:30:52修改
收藏
回復
舉報
回復
相關推薦
国产国语亲子伦亲子| 免费不卡的av| 日本蜜桃在线观看| 久久狠狠亚洲综合| 久久国产精品久久久| 91人妻一区二区三区| 污污的网站在线看| 99久久国产综合精品色伊| 日本欧美一级片| b站大片免费直播| 成人在线免费| 久久婷婷综合激情| 成人激情春色网| 精品无码av在线| 欧美美乳视频| 91精品国产入口| 免费无码不卡视频在线观看| 国产乱理伦片a级在线观看| 狠狠色丁香婷综合久久| 久久久之久亚州精品露出| 91亚洲一线产区二线产区| 看黄在线观看| 亚洲视频一二区| 国产精品一区二区三区在线| 亚洲无码精品一区二区三区| 欧美a级片网站| 亚洲天堂成人在线视频| 国产性生交xxxxx免费| 日本小视频在线免费观看| 久久精品日产第一区二区三区高清版| 国产原创欧美精品| 国产成人精品av久久| 凹凸成人精品亚洲精品密奴| 精品久久五月天| 自拍偷拍 国产| av福利在线导航| 1024成人网| 日产精品一线二线三线芒果| 亚洲精品综合网| 青青青爽久久午夜综合久久午夜 | 中文字幕亚洲欧洲| 97超碰在线免费| 日韩久久一区二区| 欧美一区二区三区四区五区六区 | 欧美精品乱码久久久久久| 无码精品a∨在线观看中文| 免费在线观看黄| 国产三级精品在线| 久久久久久一区| 国产成人自拍一区| 成人一区二区三区中文字幕| 99r国产精品视频| 国产999久久久| 国产激情一区二区三区| 91夜夜未满十八勿入爽爽影院| 最新在线中文字幕| 日本成人在线一区| 国产精品日韩专区| 97精品久久人人爽人人爽| 美女一区二区久久| 成人福利网站在线观看| 国产精品国产三级国产普通话对白| 免费成人在线影院| 成人中心免费视频| 精品国自产在线观看| 高潮精品一区videoshd| 国产欧美日韩一区| 完全免费av在线播放| 日日夜夜一区| 日韩欧美一级片| 免费不卡的av| 欧美欧美黄在线二区| 国产一区二区三区视频| 日本猛少妇色xxxxx免费网站| 99视频精品全国免费| 欧美高清在线观看| 性无码专区无码| 青青草97国产精品免费观看无弹窗版| 国产精品免费久久久久久| 国产理论片在线观看| 福利91精品一区二区三区| 久草精品电影| 91网页在线观看| 伊人夜夜躁av伊人久久| 欧美 日韩 国产在线观看| 亚洲www啪成人一区二区| 欧美日韩成人一区二区| 野花视频免费在线观看| 校花撩起jk露出白色内裤国产精品| 亚洲少妇中文在线| 加勒比婷婷色综合久久| 欧美亚洲三级| 亚洲综合色av| 国产午夜在线视频| 一区二区三区加勒比av| 国产视频九色蝌蚪| 亚洲福利影视| 亚洲精品一区二区在线| 国产三级国产精品国产国在线观看| 中文亚洲欧美| 91久久久精品| 黄色在线视频观看网站| 亚洲自拍另类综合| 亚洲老女人av| 日韩大片在线免费观看| 久久精品成人欧美大片| 啦啦啦免费高清视频在线观看| 久久99日本精品| 久久久久高清| 日本性爱视频在线观看| 欧美日韩美女一区二区| 加勒比精品视频| 亚洲乱码精品| 国产精品欧美日韩久久| 五月婷婷开心中文字幕| 亚洲精品自拍动漫在线| www.天天射.com| 日韩人体视频| 欧美精品电影在线| 国产精品久久久久久免费| 久久这里只精品最新地址| 成人在线播放网址| www.久久久久爱免| 在线播放亚洲激情| 免费黄色网址在线| www.欧美色图| 日本人妻伦在线中文字幕| 日本电影久久久| 一区二区三区四区视频| 国产乱国产乱老熟| 成人福利视频网站| www.av蜜桃| 亚洲国产欧美在线观看| 操日韩av在线电影| 91丨九色丨蝌蚪丨对白| 国产日韩欧美高清在线| 日批视频在线免费看| 国产主播性色av福利精品一区| 北条麻妃一区二区三区中文字幕| 在线视频播放大全| 久久久精品影视| 成人在线激情网| 国产精品一在线观看| 日本久久精品视频| 日本中文字幕电影在线观看| 黄色成人av网| 黄色片视频免费观看| 亚洲激情自拍| 精品国产乱码久久久久久久软件| 999av小视频在线| 亚洲黄色av女优在线观看| 久久精品视频6| www.成人网.com| 国产亚洲欧美在线视频| 亚洲成人一品| 国产成人亚洲综合| 亚洲图片88| 欧美一区二区视频免费观看| 青草草在线视频| 懂色av中文一区二区三区 | 亚洲小说区图片区都市| 日韩精品一区二区三区在线 | 国产情侣一区| 日本亚洲欧洲精品| 日韩精品第二页| 欧美精品一区三区| 日韩中文字幕综合| 欧美日韩亚洲激情| 国产精品国产三级国产专业不| 青娱乐精品在线视频| 日本免费黄色小视频| 超碰一区二区三区| 国产第一区电影| 欧美96在线| 精品va天堂亚洲国产| 欧美日韩综合在线观看| 国产色一区二区| 中文字幕55页| 99精品视频网| 亚洲欧美日韩国产yyy| 欧洲精品99毛片免费高清观看| 97久久精品在线| 一区二区三区视频在线观看视频| 欧美大片拔萝卜| 日韩精品一区不卡| 亚洲美女免费在线| 一级片视频免费看| 国产毛片精品一区| 欧美黄网站在线观看| 999国产精品| 国产乱码精品一区二区三区卡 | 懂色一区二区三区av片| 成人福利视频| 久久成年人免费电影| 天堂av网在线| 91精品国产品国语在线不卡| av大全在线观看| 亚洲精品视频观看| 亚洲一区视频在线播放| 国产99精品国产| 男女男精品视频站| 最新亚洲一区| 中国黄色录像片| 久久爱www成人| 粉嫩av一区二区三区免费观看| 成人天堂yy6080亚洲高清| 欧美乱妇40p| 在线观看麻豆蜜桃| 精品视频久久久久久| 亚洲av无码一区二区乱子伦| 欧美亚洲国产一区二区三区va| 日本在线视频中文字幕| 亚洲欧洲国产专区| av电影在线不卡| av在线一区二区| 色哟哟网站在线观看| 激情综合色丁香一区二区| 成人小视频在线看| 亚洲精品社区| 青青在线视频免费观看| 欧美3p在线观看| 日韩欧美99| 久久91精品| 国产在线精品一区二区中文| 视频亚洲一区二区| 成人亲热视频网站| 国产精品麻豆成人av电影艾秋| 97在线观看视频| 2021中文字幕在线| 欧美高清视频免费观看| 影音先锋中文在线视频| 久久精品99久久香蕉国产色戒| 亚洲欧美视频一区二区| 国产亚洲免费的视频看| 国产一二三区在线视频| 亚洲人成网7777777国产| 天堂91在线| 日韩精品极品毛片系列视频| 少妇一区二区三区四区| 亚洲韩国青草视频| 无码精品视频一区二区三区| 精品国产一区二区在线观看| 亚洲精品人妻无码| 精品国产制服丝袜高跟| 精品人妻一区二区三区换脸明星 | 天堂在线视频观看| 亚洲第一视频网| 亚洲av成人精品毛片| 日韩理论片久久| 激情福利在线| 中文字幕亚洲欧美一区二区三区| a视频网址在线观看| 色av中文字幕一区| 老司机午夜在线视频| 久久亚洲私人国产精品va| 黄页视频在线播放| 美女撒尿一区二区三区| 欧美xxxxhdvideosex| 久久久久久久久久av| 久热在线观看视频| 国产精品第三页| 自拍偷拍欧美日韩| 亚洲自拍在线观看| a看欧美黄色女同性恋| 国产98在线|日韩| 性人久久久久| 一区二区91美女张开腿让人桶| 亚洲国产日韩欧美在线| 黄色大片中文字幕| 久久综合九色| 捷克做爰xxxⅹ性视频| 成人精品国产免费网站| jizz日本免费| 欧美激情一区在线| 男人操女人的视频网站| 精品国产91久久久| 天天天天天天天干| 日韩欧美一级精品久久| 免费a级毛片在线观看| 久久精品小视频| av免费在线视| 国产精品入口福利| 试看120秒一区二区三区| 欧美男人的天堂| 这里只有精品在线| 国产无套内射久久久国产| 精品一区二区三区在线观看国产| 国产国语老龄妇女a片| 国产日韩欧美不卡在线| 91精品国产高清一区二区三蜜臀| 欧美日韩在线另类| 国产精品一品二区三区的使用体验| 精品精品国产高清a毛片牛牛| yjizz视频网站在线播放| 欧美高清自拍一区| 韩国成人在线| 国内成+人亚洲| 欧美国产小视频| 黄色网页免费在线观看| 国产剧情一区二区三区| 天天躁日日躁aaaa视频| 樱花影视一区二区| 中文字幕一区二区三区四区视频| 精品国产网站在线观看| 黄色免费在线看| 日韩美女主播视频| 成人黄色av网址| 一区二区三区av| 久久久噜噜噜| 国产精品扒开腿做爽爽爽a片唱戏| 国产精品三级视频| 欧美 日韩 精品| 精品国内二区三区| 黄色网页在线播放| 国产精品美女久久久久av超清| 精品亚洲自拍| 国产一区 在线播放| 老司机免费视频一区二区| 97伦伦午夜电影理伦片| 一区二区国产视频| 99国产揄拍国产精品| 在线精品国产成人综合| 97se综合| 久久国产精品久久| 亚洲大胆在线| 人妻互换一二三区激情视频| 亚洲婷婷在线视频| 91亚洲国产成人久久精品麻豆 | 91麻豆一二三四在线| 国产情人节一区| 欧美理论在线播放| 粉嫩虎白女毛片人体| 久久久精品国产免大香伊| 成年人午夜视频| 亚洲国产第一页| 91超碰在线播放| 国产美女99p| 亚洲看片免费| 精品中文字幕在线播放| 亚洲午夜久久久久久久久电影院| 国产suv一区二区| 色综合91久久精品中文字幕 | 国产午夜精品理论片在线| 精品视频1区2区| 香蕉视频在线免费看| 国产精品稀缺呦系列在线| 日韩精品一区二区三区免费观看| 欧美精品性生活| 国产精品久久久久久亚洲毛片| 中文字幕欧美人妻精品| xx视频.9999.com| 精品久久国产一区| 日韩国产小视频| 成人国产免费视频| 欧美 日韩 精品| 伊人青青综合网站| **国产精品| 日韩精品一区二区在线视频| 国产成a人亚洲| 超碰超碰超碰超碰| 中文字幕精品视频| 国产免费区一区二区三视频免费| 中国女人做爰视频| 不卡一区中文字幕| 精品视频一二三区| 日韩中文在线视频| 亚洲一区二区三区四区电影| 日本十八禁视频无遮挡| 久久久国产精品麻豆| 一区二区自拍偷拍| 欧美国产第一页| 国产a久久精品一区二区三区| 在线观看的毛片| 一区二区三区在线影院| 天天舔天天干天天操| 国产成人精品久久二区二区91| 欧美电影《睫毛膏》| 国产精品19p| 欧美日韩中文字幕在线视频| 尤物视频在线免费观看| 99久久99久久| 日韩激情av在线| 校园春色 亚洲| 亚洲毛茸茸少妇高潮呻吟| 国产91精品在线| 六月婷婷激情综合| 26uuu国产电影一区二区| 一本久道久久综合无码中文| 午夜精品久久久久久久男人的天堂 | 精品免费视频一区二区| 欧美大电影免费观看| 欧美精品一区二区性色a+v| 91在线视频播放地址| 国产露脸91国语对白| 欧美亚洲午夜视频在线观看| 久久久久久久久久久9不雅视频 | 国内自拍视频一区| 一区二区三区四区不卡在线| eeuss影院www在线观看| 国精产品99永久一区一区|