精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型調優無需標注數據!將Llama 3.3 70B直接提升到GPT-4o水平

人工智能 新聞
最近,AI 公司 Databricks 推出了一種新的調優方法 TAO,只需要輸入數據,無需標注數據即可完成。

現階段,微調大型語言模型(LLMs)的難點在于,人們通常沒有高質量的標注數據。

最近,AI 公司 Databricks 推出了一種新的調優方法 TAO,只需要輸入數據,無需標注數據即可完成。更令人驚喜的是,TAO 在性能上甚至超過了基于標注數據的監督微調。

圖片

眾所周知,LLM 很難適應新的企業級任務。提示(prompting)的方式容易出錯,且質量提升有限,而微調(fine-tuning)則需要大量的標注數據,而這些數據在大多數企業任務中是不可用的。

Databricks 提出的模型調優方法,只需要未標注數據,企業就可以利用現有的數據來提升 AI 的質量并降低成本。

TAO(全稱 Test-time Adaptive Optimization)利用測試時計算(由 o1 和 R1 推廣)和強化學習(RL)算法,僅基于過去的輸入示例來教導模型更好地完成任務。

至關重要的是,盡管 TAO 使用了測試時計算,但它將其作為訓練模型過程的一部分;然后,該模型以較低的推理成本(即在推理時不需要額外的計算)直接執行任務。

更令人驚訝的是,即使沒有標注數據,TAO 也能實現比傳統調優模型更好的質量,并且它可以將像 Llama 這樣的開源模型提升到與專有模型(如 GPT-4o 和 o3-mini)相當的質量水平。

借助 TAO,Databricks 已經取得了三項突破性成果:

  • 在文檔問答和 SQL 生成等專業企業任務中,TAO 的表現優于需要數千標注樣本的傳統微調方法。它讓 Llama 8B/70B 等高效開源模型達到了 GPT-4o/o3-mini1 等商業模型的同等水平,且無需任何標注數據;
  • 在零標注數據條件下,TAO 將 Llama 3.3 70B 模型在企業綜合基準測試中的表現提升了 2.4%;
  • 增加 TAO 訓練階段的算力投入,可以在相同數據條件下獲得更優模型質量,且不會增加推理階段的成本消耗。

圖 1 展示了 TAO 在三個企業級任務中對 Llama 模型的提升效果:盡管僅使用原始輸入數據,TAO 不僅超越了需要數千標注樣本的傳統微調 (FT) 方法,更讓 Llama 系列模型達到了商業模型的性能水準。

圖片

圖片

圖 1:Llama 3.1 8B 與 Llama 3.3 70B 在三大企業級基準測試中應用 TAO 的效果對比。TAO 帶來顯著的性能提升,不僅超越傳統微調方法,更直指高價商業大語言模型的性能水平

TAO 工作原理

基于測試時計算與強化學習的模型調優

TAO 的核心創新在于摒棄了人工標注數據,轉而利用測試時計算引導模型探索任務的可能響應,再通過強化學習根據響應評估結果更新模型參數。

該流程通過可擴展的測試時計算(而非昂貴的人工標注)實現質量提升,并能靈活融入領域知識(如定制規則)。令人驚訝的是,在高質量開源模型上應用該方法時,其效果往往優于依賴人工標注的傳統方案。

圖片

TAO pipeline

TAO 包含四個核心階段:

  • 響應生成:該階段首先收集任務相關的輸入提示或查詢樣本。在 Databricks 平臺上,這些提示可通過 AI Gateway 自動采集;
  • 響應評分:系統化評估生成響應的階段。評分方法包含多種策略,例如基于獎勵模型、偏好評分,或利用 LLM 評判器及定制規則進行任務特異性驗證,確保每個響應都做到最優;
  • 強化學習(RL)訓練:最終階段采用基于強化學習的方法更新大語言模型,引導模型生成與高分響應高度契合的輸出。通過這一自適應學習過程,模型持續優化預測能力以提升質量;
  • 持續改進:TAO 僅需 LLM 輸入樣本作為數據源。用戶與 LLM 的日常交互自然形成該數據 —— 一旦模型部署使用,即可自動生成下一輪 TAO 訓練數據。在 Databricks 平臺上,借助 TAO 機制,模型會隨著使用頻次增加而持續進化。

雖然 TAO 在訓練階段使用了測試時計算,但最終產出的模型在執行任務時仍保持低推理成本。這意味著經過 TAO 調優的模型在推理階段 —— 與原版模型相比 —— 具有完全相同的計算開銷和響應速度,顯著優于 o1、o3 和 R1 等依賴測試時計算的模型。實驗表明:采用 TAO 訓練的高效開源模型,在質量上足以比肩頂尖的商業閉源模型。

TAO 為 AI 模型調優提供了一種突破性方法:

  • 不同于耗時且易出錯的提示工程;
  • 也區別于需要昂貴人工標注數據的傳統微調;
  • TAO 僅需工程師提供任務相關的典型輸入樣本,即可實現卓越性能。

圖片

LLM 不同調優方法比較

實驗及結果

接下來,文章深入探討了如何使用 TAO 針對專門的企業任務調優 LLM。本文選擇了三個具有代表性的基準。

圖片

表 2:該研究使用的基準測試概覽

如表 3 所示,在所有三個基準測試和兩種 Llama 模型中,TAO 顯著提升了基礎 Llama 的性能,甚至超過了微調的效果。

圖片

表 3:在三個企業級基準測試中使用 TAO 的 Llama 3.1 8B 和 Llama 3.3 70B 實驗結果

與經典的測試時計算類似,當 TAO 能夠使用更多的計算資源時,它會產生更高質量的結果(見圖 3 中的示例)。然而,與測試時計算不同的是,這種額外的計算資源僅在調優階段使用;最終的語言模型的推理成本與原始語言模型相同。例如,o3-mini 生成的輸出 token 數量比其他模型多 5-10 倍,因此其推理成本也相應更高,而 TAO 的推理成本與原始 Llama 模型相同。

圖片

利用 TAO 提高模型多任務性能

到目前為止,該研究已經使用 TAO 來提升語言模型在單一任務(例如 SQL 生成)上的表現。接下來,該研究展示了 TAO 如何廣泛提升模型在一系列企業任務中的性能。

結果如下,TAO 顯著提升了兩個模型的性能,將 Llama 3.3 70B 和 Llama 3.1 70B 分別提升了 2.4 和 4.0 個百分點。TAO 使 Llama 3.3 70B 在企業級任務上的表現顯著接近 GPT-4o,所有這些改進都沒有產生人工標注成本。

圖片


責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-30 12:50:05

2023-07-21 12:51:32

2024-10-17 13:30:00

2020-12-09 22:15:40

物聯網IOT客戶關系

2024-05-17 17:25:44

2023-04-11 16:28:31

人工智能AI

2025-04-08 02:26:00

2024-08-26 10:00:00

模型數據

2016-07-19 09:35:34

云計算

2023-11-27 15:41:16

物聯網數字孿生

2024-08-15 15:45:00

AI訓練

2024-12-13 14:03:44

模型訓練AI

2024-06-05 08:33:29

2024-09-14 09:31:00

2024-04-30 08:28:44

開源大模型Llama

2021-05-28 11:02:11

VR

2025-03-12 10:38:05

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-21 12:23:17

2024-06-05 08:29:35

點贊
收藏

51CTO技術棧公眾號

亚洲成人性视频| 日产国产欧美视频一区精品| 欧美一级高清大全免费观看| www.国产在线视频| 无码国精品一区二区免费蜜桃| 久久国产日韩| 久久在线免费视频| 久久福利小视频| 成人国产精品一区二区免费麻豆| 中文字幕一区二区三区乱码在线| 黑人中文字幕一区二区三区| 高潮无码精品色欲av午夜福利| 亚洲国产一成人久久精品| 亚洲精品乱码久久久久久金桔影视| av在线无限看| www.色在线| 亚洲欧洲美洲综合色网| 你懂的网址一区二区三区| av男人天堂av| 日本va欧美va精品发布| 久久青草福利网站| 99精品中文字幕| 亚洲女娇小黑人粗硬| 日韩欧美高清dvd碟片| 中文字幕第80页| 欧美在线极品| 亚洲精品高清在线| 亚洲v欧美v另类v综合v日韩v| 日韩中文字幕观看| 韩国女主播成人在线| 国产精品久久久久久久美男| 日韩精品久久久久久久酒店| 亚洲一区色图| 色噜噜久久综合伊人一本| 成人网站免费观看| 国产精品白丝一区二区三区| 欧美一区2区视频在线观看| 三年中国国语在线播放免费| 最新中文字幕在线播放| 亚洲成a人片在线观看中文| 日日噜噜噜夜夜爽爽| 在线a人片免费观看视频| 久久久99久久| 欧美午夜视频在线| 色一情一乱一区二区三区| 国产在线播精品第三| 国产欧美一区二区三区久久人妖| 神马久久久久久久 | 日韩av在线免费看| 日批视频免费看| 一区二区中文字幕在线观看| 91精品国产高清一区二区三区 | 亚洲国产精品电影在线观看| 色哟哟网站在线观看| 精品午夜视频| 日韩视频中午一区| 四虎成人在线播放| 日韩在线视频一区二区三区| 日韩一级大片在线观看| 色哟哟在线观看视频| 精品国产乱码久久久久久樱花| 欧美精品丝袜久久久中文字幕| 黄色小视频免费网站| 国产视频一区二| 日韩欧美一级二级三级| 无码人妻丰满熟妇啪啪网站| 国产精品极品| 亚洲理论在线a中文字幕| 野花社区视频在线观看| 自拍自偷一区二区三区| 一本一本久久a久久精品综合小说| 国产成人福利在线| 久久综合av| 久久国产精品网站| 国产又大又黑又粗免费视频| 久久精品麻豆| 成人激情黄色网| 性中国xxx极品hd| av亚洲精华国产精华精| 欧美久久久久久久| 香蕉视频在线播放| 一区二区三区四区激情| 日韩欧美一区二| 忘忧草在线www成人影院| 欧美午夜免费电影| 无套白嫩进入乌克兰美女| 国产精品毛片av| 在线播放日韩av| 暗呦丨小u女国产精品| 影音先锋亚洲电影| 国产成人jvid在线播放| 国产乱码一区二区| 99久久久久免费精品国产| 午夜精品视频在线观看一区二区 | 国产日韩欧美亚洲| 免费国产成人看片在线| 女人让男人操自己视频在线观看| 欧美性色黄大片| 免费高清视频在线观看| 香蕉久久夜色精品国产使用方法 | 久久青青草原| 9色在线视频| 亚洲动漫第一页| 黄色手机在线视频| 国产精品xxx在线观看| 伊人久久精品视频| 日本少妇久久久| 日本伊人精品一区二区三区观看方式| 亚洲bt天天射| 国产乱理伦片a级在线观看| 亚洲综合丁香婷婷六月香| 久久综合伊人77777麻豆最新章节| 亚洲精品aⅴ| 中文字幕在线精品| 国产手机在线视频| 国产成人午夜高潮毛片| 婷婷久久五月天| 校园春色亚洲| 精品国产一区二区精华| 午夜精品一区二区三级视频| 日韩电影在线观看一区| 精品午夜一区二区三区| 欧洲成人综合网| 91精品婷婷国产综合久久性色 | 一区二区三区蜜桃网| 少妇激情一区二区三区| 麻豆一区二区麻豆免费观看| 欧美精品性视频| 97人人爽人人爽人人爽| 国产免费成人在线视频| 男人用嘴添女人下身免费视频| 国产视频一区二| 深夜福利国产精品| 日本欧美www| 久久久夜色精品亚洲| 亚欧无线一线二线三线区别| 精品福利一区| 欧美激情亚洲国产| 国产福利视频导航| 亚洲视频在线一区| 国内自拍第二页| 国产精品毛片久久| 国产免费亚洲高清| 日韩免费啪啪| 欧美日韩不卡视频| 欧美a级片免费看| 麻豆中文一区二区| 亚洲日本无吗高清不卡| 狠狠久久伊人中文字幕| 最近2019年手机中文字幕| 在线观看视频二区| 国产精品国产三级国产aⅴ原创| 五月婷婷之综合激情| 97人人精品| 亚洲一区二区三区乱码aⅴ蜜桃女| 久久精品视频观看| 欧美一级理论性理论a| 久久免费看少妇高潮v片特黄| 国产一区在线不卡| 91视频国产观看| 亚洲欧美在线网| 天然素人一区二区视频| 亚洲香蕉成人av网站在线观看| www.国产com| 久久精品这里都是精品| 天天操天天爽天天射| 色呦哟—国产精品| 3d动漫啪啪精品一区二区免费| 在线观看午夜av| 亚洲精品一区在线观看| 欧美一区二区三区四| 国产日韩欧美亚洲| 在线免费看v片| 欧美日韩影院| 蜜桃视频在线观看成人| 91精品国产66| 美女精品视频一区| 欧美亚洲精品在线观看| 欧美日韩中文字幕| 亚洲av熟女国产一区二区性色| 麻豆视频一区二区| 国产美女作爱全过程免费视频| 玖玖玖免费嫩草在线影院一区| 青青草精品毛片| 国产二区三区在线| 亚洲第一福利视频| 成人黄色片在线观看| 亚洲视频在线一区观看| 亚洲一区二区乱码| 美日韩一区二区| 日韩伦理在线免费观看| 免费欧美激情| 99久久精品久久久久久ai换脸| 色是在线视频| 久久久av网站| 天堂av中文在线资源库| 欧美少妇bbb| 丰满少妇乱子伦精品看片| 国产精品久久久久一区二区三区| 四虎精品一区二区| 久久精品国产99国产| 日本免费不卡一区二区| 国产精品毛片一区二区在线看| 久久精品国产理论片免费| а天堂中文最新一区二区三区| 欧美一级电影久久| 在线观看操人| 中文字幕精品在线视频| 视频一区二区免费| 91麻豆精品国产无毒不卡在线观看| 亚洲精品1区2区3区| 亚洲图片激情小说| 国产精品国产三级国产专业不 | 国产51自产区| 久久99久国产精品黄毛片色诱| 久久亚洲中文字幕无码| 小小影院久久| 午夜精品电影在线观看| 希岛爱理av免费一区二区| 亚洲综合色激情五月| 福利精品一区| 国产成人精品免高潮费视频| av在线小说| 欧美激情免费视频| www视频在线免费观看| 最近2019中文字幕大全第二页| 五月色婷婷综合| 日韩欧美国产一区在线观看| 亚洲天堂中文在线| 在线观看国产精品网站| 免费视频久久久| 狠狠躁天天躁日日躁欧美| 久久久精品国产sm调教| 亚洲精品伦理在线| 日韩欧美123区| 中文字幕一区二区三区四区不卡 | 日韩中文字幕免费观看| 欧美xxxxx牲另类人与| 99草在线视频| 这里是久久伊人| 999免费视频| 欧美一级精品大片| a毛片在线免费观看| 欧美一区二区网站| 国产免费高清视频| 91精品国产欧美一区二区| 97在线公开视频| 69堂精品视频| 国产视频aaa| 欧美成人免费网站| 亚洲国产日韩在线观看| 精品美女一区二区| 人妻偷人精品一区二区三区| 精品成人佐山爱一区二区| 亚洲精品喷潮一区二区三区| 精品国产第一区二区三区观看体验| 超碰福利在线观看| 亚洲国产一区二区三区四区| 色哟哟中文字幕| 亚洲欧美国产日韩中文字幕| 狠狠色伊人亚洲综合网站l| 亚洲一级黄色片| 中文字幕日本在线| 萌白酱国产一区二区| 日韩成人伦理| 欧美一级片在线播放| 日本在线中文字幕一区二区三区| 国产精品视频成人| 日韩中文字幕无砖| 激情欧美一区二区三区中文字幕| 妖精视频一区二区三区免费观看| 日本一区二区高清视频| 一区二区三区午夜探花| 女人帮男人橹视频播放| 久久精品麻豆| 在线一区二区不卡| 成人av资源在线| 国产又黄又粗的视频| 亚洲精选在线视频| 日本一区二区三区精品| 欧美视频在线一区| a天堂在线视频| 亚洲男女性事视频| 九七电影韩国女主播在线观看| 久久久久久97| av在线一区不卡| 国产精品久久久久av福利动漫| 美女久久99| 国产在线无码精品| 亚洲欧美大片| 日本美女久久久| 91视频国产资源| 国产女人被狂躁到高潮小说| 岛国av一区二区三区| 亚洲天堂网在线视频| 亚洲国产精品人人爽夜夜爽| 免费黄色在线观看| 欧美一区在线直播| 国产一区二区高清在线| 秋霞久久久久久一区二区| 欧美在线日韩| 91色国产在线| 99视频精品在线| 精品国产视频在线观看| 色吊一区二区三区| 国产成人三级在线观看视频| 最近2019中文字幕mv免费看| 三级在线观看视频| 91色精品视频在线| 加勒比久久综合| 人人干视频在线| 国产自产视频一区二区三区| 欧美做受高潮6| 亚洲国产精品久久人人爱蜜臀| 在线观看免费观看在线| 精品呦交小u女在线| 欧洲黄色一区| 亚洲精品欧美日韩专区| 欧美日韩在线观看视频小说| 欧美国产亚洲一区| 高清日韩电视剧大全免费| 日本女人性生活视频| 日韩欧美高清在线视频| 日韩一级在线播放| 欧美高跟鞋交xxxxhd| 99久久久国产| 一本久道久久综合| 奇米综合一区二区三区精品视频| 欧美一区二区三区成人精品| 亚洲午夜久久久久久久久电影院| a级片在线播放| 久久精品国产91精品亚洲| 久久91视频| 亚洲欧洲日韩精品| 六月丁香婷婷色狠狠久久| 少妇精品无码一区二区免费视频| 精品久久久视频| 天堂av一区二区三区| 国语对白做受69| 国产伦精品一区二区三区免费优势| 国风产精品一区二区| 国产精品中文字幕欧美| www.99re7| 日韩一级精品视频在线观看| av中文字幕在线观看| 91啪国产在线| 欧美在线网址| 中文字幕人妻熟女人妻a片| 一区二区三区四区不卡在线| 亚洲成人中文字幕在线| 久久久久久美女| 国产成人精品福利| 日本人体一区二区| 91麻豆文化传媒在线观看| 亚洲欧美综合自拍| 一道本无吗dⅴd在线播放一区| 日韩av一级| 中文字幕一区综合| 国产福利一区在线观看| 成人免费看片98| 亚洲国产99精品国自产| 午夜久久中文| 日韩欧美第二区在线观看| 麻豆成人91精品二区三区| 视频国产一区二区| 欧美成人bangbros| 欧美sm一区| 亚洲欧美日韩精品久久久| 国产一区二区三区在线观看免费视频 | 欧美成人午夜剧场免费观看| 911亚洲精品| 国产最新免费视频| 国产精品热久久久久夜色精品三区 | 色婷婷狠狠综合| 在线免费观看黄色| 5566中文字幕一区二区| 影音先锋一区| 精品人妻无码一区| 欧美精品在线观看播放| 青草在线视频| 欧美日韩国产三区| 精品一区二区三区免费毛片爱| 18精品爽视频在线观看| 亚洲人成网7777777国产| 国产一区二区三区黄网站| 国产成人无码a区在线观看视频| 国产欧美日韩麻豆91| 精品人妻久久久久一区二区三区| 7m精品福利视频导航| 欧美xxxx中国| 国产视频久久久久久| 欧美日韩激情一区二区| 9999在线视频| 亚洲自拍偷拍二区| 北岛玲一区二区三区四区| 一区二区视频网| 欧美在线视频播放| 欧美黄色一区| 极品蜜桃臀肥臀-x88av| 欧美精品一区二区三区久久久 |