精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從少樣本到千樣本!MachineLearningLM給大模型上下文學習裝上「機器學習引擎」

人工智能 新聞
這項名為 MachineLearningLM 的新研究提出了一種輕量且可移植的「繼續預訓練」框架,無需下游微調即可直接通過上下文學習上千條示例,在金融、健康、生物信息、物理等等多個領域的二分類 / 多分類任務中的準確率顯著超越基準模型(Qwen-2.5-7B-Instruct)以及最新發布的 GPT-5-mini。

盡管大型語言模型(LLM)擁有廣泛的世界知識和強大的推理能力,被廣泛視為優秀的少樣本學習者,但在處理需要大量示例的上下文學習(ICL)時仍存在明顯局限。

已有工作表明,即使提供多達上百甚至上千條示例,LLM 仍難以從中有效學習規律,其表現往往很快進入平臺期,甚至對示例的順序、標簽偏差等較為敏感。在利用上下文學習解決新任務時,LLM 往往更依賴于自身的強先驗以及示例的表面特征,而難以真正挖掘出示例中潛在的因果機制或統計依賴。

這項名為 MachineLearningLM 的新研究突破了這一瓶頸。該研究提出了一種輕量且可移植的「繼續預訓練」框架,無需下游微調即可直接通過上下文學習上千條示例,在金融、健康、生物信息、物理等等多個領域的二分類 / 多分類任務中的準確率顯著超越基準模型(Qwen-2.5-7B-Instruct)以及最新發布的 GPT-5-mini。

相比于已有的用于表格數據的機器學習方法,MachineLearningLM 幾乎完全保留了 LLM 通用能力,這意味著它可以無縫集成到更復雜的對話工作流中。

  • 論文鏈接: https://arxiv.org/abs/2509.06806
  • 模型和數據集: https://huggingface.co/MachineLearningLM
  • 代碼: https://github.com/HaoAreYuDong/MachineLearningLM

核心創新一:百萬級合成任務「授人以漁」

研究團隊旨在賦予 LLM 一種「舉一反三」的元能力 —— 不依賴對真實任務數據的機械記憶,而是通過海量且多樣化的合成任務,從根本上訓練模型在大量上下文示例中挖掘規律并進行預測的能力。

傳統的指令微調方法通?;谟邢抟幠#s為千數量級)的真實任務數據,這在很大程度上限制了模型向新任務的泛化能力。與之相比,MachineLearningLM 構建了一個超過 300 萬合成任務的大規模預訓練語料庫。

任務生成器基于結構因果模型(Structural Causal Model, SCM)來采樣生成二分類及多分類任務。SCM 通過有向無環圖(DAG)和結構方程(采用神經網絡與樹模型實現)明確定義變量間的因果關系,能夠精確控制特征的邊際分布、類型(如數值型或類別型)以及標簽生成機制。

該方法確保預訓練數據與下游真實評估集沒有任何重疊,從而保證評估過程對模型泛化能力的檢驗具備充分公平性。同時,通過控制示例數量從數個到 1024 個不等,該機制能夠專門訓練模型處理「多示例」場景的推理能力。

 核心創新二:隨機森林模型「循循善誘」

在海量合成任務上直接訓練大型語言模型(LLM)容易因任務質量不一致 —— 例如存在信號微弱或類別極度不平衡等情況 —— 而導致訓練崩潰或陷入局部最優。為解決這一問題,本研究引入隨機森林(Random Forest)模型,利用其強大且穩健的建模能力,設計了如下兩級過濾機制:

  • 樣本級共識過濾(熱身訓練階段):在熱身訓練中,為每個合成任務訓練一個隨機森林模型,并引導 LLM 學習模仿其預測行為。具體而言,僅保留隨機森林預測結果與真實標簽一致的那些樣本用于 LLM 的訓練。該方法通過提供清晰且高置信度的監督信號,使 LLM 初步建立起準確的上下文建模能力,尤其是數值建模能力,為后續過渡到自主上下文學習奠定基礎。
  • 任務級過濾(全程訓練階段):在整個訓練過程中,除為每個任務構建隨機森林模型外,還引入保守隨機基線(如隨機猜測或坍塌到多數類的預測方法),以剔除那些隨機森林表現未顯著優于基線的無效任務。評估指標包括機會校正一致性、失衡魯棒準確率、宏平均準確率以及避免預測坍塌等指標。

為何選擇隨機森林?除了強大且穩健的建模能力,隨機森林具有高度透明的決策過程,可分解為清晰的規則路徑與特征重要性評估,這種可解釋性與 LLM 的思維鏈(Chain-of-Thought, CoT)推理模式天然契合,有助于后續推進思維鏈預測及解釋性預測任務。

同時,隨機森林能夠提供預測置信度,為進一步減少 LLM 幻覺問題引入置信度機制提供了可能。

核心創新三:高效上下文示例編碼「多維擴容」

在大模型時代,如何高效地在上下文學習中處理海量表格數據,是一項重要挑戰。傳統的「自然語言描述」方式(例如:「收入是 29370,職業是博士,年增長率是 - 12.34% → 標簽:1」),占用 token 多、計算開銷大,嚴重限制了實際應用中可支持的示例數量;數值型特征經分詞器處理時,一個小數可能被拆成多個 token,既浪費長度又可能導致數值比較錯誤,如模型容易誤認為「1.11」(1|.|11)比「1.9」(1|.|9)大。

為此,作者提出了三項核心優化策略,顯著提升了上下文學習的數據容納能力與推理效率:

  • 告別「小作文」,樣本用表格來組織: SpreadsheetLLM 等研究已廣泛證明,LLM 能很好地理解結構化表格,因此作者放棄相關工作將結構化數據展開成冗長自然語句的做法,轉而采用緊湊的表格編碼格式。

  • 把數字「打包」成整數,告別 token 碎片化:先遵循機器學習工程的常見操作,將所有數值基于訓練集數據分布逐列進行 z-score 標準化;然后將 z-norm 下 ±4.17(絕大多數情況)的浮點數區間整體線性映射到 [0, 999] 的整數區間。這樣,每個數值在 GPT 和 LLaMA 3 的詞表中僅需 1 個 token 表示(Qwen 分詞器也僅需 1 到 3 個 token),既節省空間,還避免了小數點和正負號單獨切詞帶來的數值理解錯誤。該流程只是改進了傳統機器學習中的數值標準化,而沒有改變 LLM 原生分詞器,因此模型的數值推理能力可以全部繼承。

  • 推理也要「團購」:序列級批量預測——傳統上下文學習一次只處理一個查詢,在多樣本學習時效率極低。作者將多個查詢(如 50 條)拼成一條序列,統一前向推理,一次性輸出所有預測結果。這不僅大幅提升推理速度,還能在訓練階段提高自回歸穩定性。

驚艷效果:多項能力突破

MachineLearningLM 的繼續預訓練方案無需改變模型架構或分詞器,只使用了 Qwen2.5-7B 基座模型和低秩適配(LoRA rank=8)這種輕量級配置,MachineLearningLM 展現出了前所未有的上下文樣本利用能力:

  • 「千示例」上下文學習:模型性能隨著提供的示例數量增加而持續穩定提升,從 8 條示例到 1024 條示例,準確率單調增長。這樣的上下文樣本效率是已有 LLM 都難以做到的。 
  • 遠超 GPT-5-mini 等強大基準模型:在金融、生物信息、物理信號和醫療健康等領域的表格分類任務上,其純上下文學習的準確率平均超越 GPT-5-mini 等強大基準模型約 13 到 16 個百分點。
  • 在無需任何任務特定訓練的情況下,其準確率已能達到與需要任務級參數更新的隨機森林模型相差無幾的水平(平均相對差距在 2% 以內),并顯著優于 K 近鄰(kNN)算法。
  • 通用能力無損:最關鍵的是,注入 ML 能力后,模型原有的對話、知識和推理能力幾乎完好無損。在 MMLU 基準測試中,其零樣本準確率達 73.2%,50 樣本設置下達 75.4%,與基準通用 LLM(Qwen-2.5-7B-Instruct)持平,甚至在特定領域(如統計和物理)有一定提升,這意味著它可以無縫集成到更復雜的對話工作流中。

  • 實證研究表明,MachineLearningLM 能夠同時處理數值特征與自然語言描述,無需像傳統方法那樣對文本進行分桶或轉換為嵌入向量,實現了真正的異構(多模態)輸入推理。然而,該模型仍存在一定局限,例如在面對非獨立同分布的時間序列數據以及類別數量極其龐大的數據集時,性能尚有待提升,這也為后續研究指明了改進方向。

應用領域

基于大幅提升的多樣本上下文學習和數值建模能力,MachineLearningLM 有望在金融、醫療健康與科學計算等廣泛場景中擴展大型語言模型的實際應用邊界。

未來展望

MachineLearningLM 為未來研究開辟了多個充滿潛力的方向。以下是論文里列出的幾個重點方向:

  1. 超越文本與數字:合成多模態分類任務,使 MachineLearningLM 能夠直接在海量合成數據上練習處理異構信號的多模態上下文預測,這依然可以建立在表格預測的框架之上,例如利用 HTML 表格來嵌入圖像。
  2. 通過系統優化突破上下文長度限制:例如采用張量 / 流水線并行、高效內存注意力與 KV 緩存等系統優化技術。
  3. 不確定性預測 (Uncertainty):預測的同時輸出置信度(比如利用隨機森林的置信度做熱身訓練),以減少模型 OpenAI 近期提出的由于缺乏承認不確定性(Honesty about uncertainty)引發的幻覺(Hallucination)。
  4. 提升可解釋性 (Interpretability):敘事蒸餾與推理增強學習,既可以利用底層的 SCM(變量、關系與機制)作為預測任務的輔助目標,也可以從集成模型中蒸餾規則,形成緊湊、人類可讀的推理鏈條。
  5. 集成檢索增強方法(RAG):為 MachineLearningLM 集成一個檢索模塊,使其能在預訓練和推理時動態注入最相關的示例。
  6. 賦能智能體(Agent):與 Agent 記憶機制(Memory)深度融合,提升其在復雜環境中利用多樣本的上下文學習,賦予智能體強大的從大量經驗記憶中挖掘和學習的能力。

作者介紹

本文作者:董浩宇(中國科學院大學)、張鵬昆(華南理工大學)、陸明哲(中國科學院大學)、沈言禎(斯坦福大學)、柯國霖(個人貢獻者)

董浩宇:中國科學院大學在讀博士(預計 2025 年底畢業)。研究方向涵蓋表格與半結構化數據理解與推理、LLM 后訓練與強化學習、數據集與評測基準等。曾提出 SpreadsheetLLM 并獲得 Hugging Face Paper of the Day、聯合發起并持續共同組織 NeurIPS 2022–2024 表格表征學習(TRL)系列研討會,推動表格智能社區發展。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-15 15:45:42

自然語言語言模型

2023-03-13 14:41:22

機器學習算法

2025-02-06 11:25:50

2023-09-16 13:47:47

人工智能數據

2024-06-19 12:50:39

2023-07-09 15:09:18

機器學習能力

2023-03-31 13:37:34

研究

2023-11-24 17:01:30

模型推理

2025-02-06 10:21:51

2024-09-12 08:00:00

2022-04-29 15:51:16

模型自然語言人工智能

2024-03-14 08:11:45

模型RoPELlama

2025-02-07 10:10:05

MusicMagus擴散模型音樂編輯

2024-06-25 09:35:04

模型訓練

2024-02-29 12:23:54

AI數據

2024-07-17 16:59:51

AI訓練

2021-10-25 09:06:29

模型人工智能計算

2025-03-18 08:14:05

2023-11-28 09:00:00

機器學習少樣本學習SetFit

2025-01-27 00:57:43

點贊
收藏

51CTO技術棧公眾號

亚洲精品理论电影| 国产精品区一区二区三| 欧美伦理91i| 911亚洲精选| www.综合| 国产三区在线成人av| 国产在线日韩在线| 日本一级黄色录像| 精品freesex老太交| 欧美久久久影院| 91免费黄视频| 第一视频专区在线| 波多野结衣视频一区| 国产精品久久久久久久9999| 1024手机在线视频| 欧美男gay| 欧美大片一区二区| 欧美午夜性生活| 国产美女福利在线观看| 中文字幕不卡一区| 国产在线一区二区三区播放| 中文字幕永久免费视频| 在线日韩电影| 久久精品免费电影| 制服 丝袜 综合 日韩 欧美| 涩涩屋成人免费视频软件| 色综合网站在线| www.激情网| 9191在线观看| 久久久亚洲国产美女国产盗摄| 亚洲v日韩v综合v精品v| 亚洲精品国产欧美在线观看| 日韩亚洲在线| 欧美日韩爱爱视频| 天天鲁一鲁摸一摸爽一爽| 亚洲深夜福利在线观看| 精品国内片67194| 亚洲欧美天堂在线| 国产麻豆一区| 欧美性xxxxx极品娇小| 真实国产乱子伦对白视频| 黄网站免费在线观看| 久久久精品日韩欧美| 国产呦系列欧美呦日韩呦| 国产三级三级在线观看| 看国产成人h片视频| 国产精品国内视频| 无码人妻一区二区三区线| 亚洲美女毛片| 98精品在线视频| 国产特黄大片aaaa毛片| 国产精品www.| 欧美国产日本在线| 免费一级片视频| 国产精品vip| 久久久久久有精品国产| 国产性猛交普通话对白| 欧美午夜一区| 久久男人的天堂| 精品肉丝脚一区二区三区| 国模 一区 二区 三区| 久久99久久99精品中文字幕| 久久婷婷综合国产| 伊人久久婷婷| 97av在线播放| 国产精品男女视频| 久久久www| 国产精品视频一区国模私拍 | 超碰97人人人人人蜜桃| www.成人精品| av不卡在线观看| 欧美精品成人一区二区在线观看| 激情视频在线观看免费| 国产精品欧美久久久久一区二区| 一区二区在线不卡| 性xxxxfjsxxxxx欧美| 亚洲国产aⅴ成人精品无吗| 老太脱裤子让老头玩xxxxx| 中文字幕在线官网| 欧美日韩国产天堂| 激情小说欧美色图| 欧美爱爱网站| 中文字幕欧美国内| 欧美精品一区二区成人| 香蕉久久久久久久av网站| 国产精品久久久久久久久| 99热这里只有精品1| 成人avav影音| 亚洲视频欧美在线| av电影在线免费| 欧亚一区二区三区| 秋霞午夜鲁丝一区二区| 伊甸园亚洲一区| xx视频.9999.com| 免费日韩一级片| 免费在线一区观看| 国产伦精品一区| 91网页在线观看| 亚洲国产另类av| 成人亚洲视频在线观看| 亚洲精品在线a| 国产一区二区三区精品久久久| 操她视频在线观看| 中文欧美日韩| 亚洲在线第一页| 国产乱子伦三级在线播放| 亚洲欧美日韩系列| 香蕉视频网站入口| 农村少妇一区二区三区四区五区| 中文字幕在线看视频国产欧美| 久久久久亚洲av片无码下载蜜桃| 日本在线播放一区二区三区| 国产精品日韩一区二区三区| aaa在线观看| 精品久久久久久久久久久| 亚洲天堂伊人网| 黑人操亚洲人| 欧美亚洲第一区| 国产黄a三级三级三级| 久久精品人人做人人综合| 天堂8在线天堂资源bt| 午夜不卡一区| 国产亚洲免费的视频看| 天天爽夜夜爽夜夜爽精品| 国产成人免费高清| 中文字幕日韩精品久久| 日韩新的三级电影| 日韩成人在线免费观看| 国产亚洲色婷婷久久99精品| 久久 天天综合| 性欧美精品一区二区三区在线播放 | 久久丝袜视频| 欧美精品情趣视频| 91禁在线观看| 国产精品久久久久久久岛一牛影视| 欧美三级一级片| 欧美男男freegayvideosroom| 九九热视频这里只有精品| 国产区精品在线| 亚洲欧美影音先锋| 日本不卡一区二区在线观看| 成人av资源电影网站| 日本国产高清不卡| 牛牛热在线视频| 色综合久久久久久久久| 中文字幕av观看| 中文日韩欧美| 麻豆av一区二区| 巨茎人妖videos另类| 亚洲精品一区二区三区婷婷月| 激情五月色婷婷| 91丨porny丨国产| av动漫在线看| 国产成人ay| 国产精品视频久久| 黄色免费网站在线观看| 欧美一区二区三区视频在线观看| 殴美一级黄色片| 国产乱子伦一区二区三区国色天香| 欧美少妇一级片| 日本精品在线观看| 国内精品久久久久久影视8| 欧美 日韩 国产 精品| 亚洲18色成人| 久久美女免费视频| 久久99精品久久久久久动态图| 一区二区在线观| 日韩欧美中文在线观看| 久久久影视精品| 亚洲欧美一区二区三| 色狠狠桃花综合| 日韩亚洲欧美中文字幕| 国产盗摄精品一区二区三区在线 | 亚洲欧美日韩国产| 日本黄网免费一区二区精品| 99久久亚洲国产日韩美女 | 国产探花在线免费观看| 国产成人综合网| 69堂免费视频| 久久精品高清| 国产精品美女黄网| av电影一区| 精品国产一区二区三区久久久狼| 精品久久久久久亚洲综合网站| 精品美女国产在线| 人妻互换一区二区激情偷拍| 国产精品一区二区久久不卡| 免费在线观看的av网站| 国产电影一区二区在线观看| 国产91视觉| yy6080久久伦理一区二区| 欧美福利小视频| 国产最新视频在线| 91精品国产高清一区二区三区蜜臀 | 婷婷亚洲综合| 精品国产乱码久久久久久久软件 | 欧美日韩一区二区在线观看| 久久免费播放视频| 国产精品久久久久三级| 国产日韩视频一区| 理论片日本一区| 无码人妻丰满熟妇区96| 天天影视欧美综合在线观看| 国产亚洲精品自在久久| 亚洲男人在线| 国产成人精品久久二区二区| 午夜小视频在线观看| 国产亚洲精品va在线观看| 成人午夜福利视频| 欧美群妇大交群中文字幕| 日韩欧美高清在线观看| 亚洲天堂免费看| 亚洲第一综合网| bt欧美亚洲午夜电影天堂| 欧美视频亚洲图片| 日本欧美一区二区三区乱码| 久激情内射婷内射蜜桃| 欧美片第1页综合| 杨幂一区欧美专区| 精品日韩毛片| 免费av在线一区二区| 视频一区国产| 91老司机在线| 久久久久久一区二区三区四区别墅| 国产91成人在在线播放| 欧美日韩经典丝袜| 操日韩av在线电影| 嫩草在线视频| 色妞久久福利网| 国产高清在线观看| 亚洲欧美日韩第一区| 亚欧在线观看视频| 精品国产一区二区在线观看| 国产免费一区二区三区最新不卡 | 丰满少妇被猛烈进入| 欧美日韩成人一区| 中文文字幕一区二区三三| 色综合天天综合网天天狠天天| 亚洲国产精一区二区三区性色| 亚洲精品水蜜桃| 亚洲天堂黄色片| 亚洲色图在线视频| 顶臀精品视频www| 国产日韩欧美高清在线| 强伦人妻一区二区三区| 久久青草国产手机看片福利盒子| 免费的av网站| 91蝌蚪porny| 在线免费观看日韩av| 久久久久久久久免费| 欧美 日韩 国产 成人 在线观看 | 久久婷婷国产麻豆91| 亚洲愉拍自拍另类高清精品| 黄色在线观看免费| 午夜a成v人精品| 999这里只有精品| 欧美午夜精品久久久久久超碰| 艳妇乳肉豪妇荡乳av无码福利| 欧美视频在线观看一区二区| 中文字幕+乱码+中文字幕明步| 欧美日韩在线一区二区| 国产一区二区网站| 精品国产区一区| 蜜桃视频在线观看网站| 在线观看国产成人av片| 欧美jizzhd欧美| 欧美激情久久久久| 深夜在线视频| 国产拍精品一二三| 亚洲成人影音| 免费av一区二区三区| 999国产精品永久免费视频app| 麻豆一区二区三区在线观看| 在线欧美不卡| 中文字幕欧美人妻精品一区| 极品少妇xxxx精品少妇偷拍| av不卡中文字幕| 久久综合色婷婷| 999精品视频在线观看播放| 亚洲国产色一区| 一级黄色av片| 欧美一区二区三区影视| 五月天婷婷在线观看| 永久免费毛片在线播放不卡| 在线观看免费视频你懂的| 91精品国产91| 偷拍自拍亚洲| 久久久久se| 亚洲欧美色图| 日本wwww视频| 国产麻豆9l精品三级站| 亚洲精品国产一区黑色丝袜| 亚洲人成在线观看一区二区| 日韩免费视频一区二区视频在线观看| 欧美亚州韩日在线看免费版国语版| h片在线免费看| 亚洲人在线观看| 四虎影视国产在线视频| 国产精品国产三级国产aⅴ9色| 视频一区日韩| 中文字幕日韩精品一区二区| 欧美综合二区| 欧美一级片在线免费观看| 日本一区二区三区久久久久久久久不| 久久久久久久极品内射| 欧美日韩精品一区二区三区蜜桃| 黄色片一区二区| 久久精品国产2020观看福利| 亚洲永久av| 国产精品高清一区二区三区| 久久国产成人精品| 成年人免费在线播放| 国产aⅴ精品一区二区三区色成熟| 人成免费在线视频| 狠狠躁夜夜躁人人躁婷婷91| www日本视频| 久久精品99久久久香蕉| 欧美三区四区| 久久一区二区精品| 亚洲经典三级| 国产sm在线观看| 亚洲女子a中天字幕| 亚洲永久精品一区| 精品亚洲一区二区三区在线观看 | 一本大道av一区二区在线播放| 99热这里只有精品在线| 色偷偷av亚洲男人的天堂| 国模冰冰炮一区二区| 精品人伦一区二区三区 | 欧美一级裸体视频| 91麻豆福利精品推荐| 国产精品7777| 亚洲精品一区二区三区99| 天天色天天射天天综合网| 国产视频观看一区| 青青草91久久久久久久久| 成人在线激情网| 久久久久亚洲蜜桃| 欧美精品一二三四区| 精品一区二区电影| 日本黄色免费在线| 欧美国产二区| 免费永久网站黄欧美| 国产精品久久不卡| 狠狠色噜噜狠狠狠狠97| 色中色在线视频| 热草久综合在线| 久久av免费看| 爱情岛论坛vip永久入口| 欧美经典一区二区| 艳妇乳肉豪妇荡乳av| 久久精品久久久久久国产 免费| 日本免费成人| 老司机午夜网站| 国产福利一区二区三区视频| 国产一级av毛片| 亚洲第一精品久久忘忧草社区| www欧美xxxx| 蜜桃麻豆91| 蜜桃一区二区三区四区| 国产激情无码一区二区三区| 91精品国产高清一区二区三区 | 无码人妻一区二区三区在线| 亚洲国产一区二区在线播放| 色窝窝无码一区二区三区成人网站 | 波多野结衣不卡视频| 欧美成人三级电影在线| 不卡专区在线| 欧美在线播放一区二区| 免费欧美日韩国产三级电影| 久久久精品少妇| 亚洲成人免费网站| 日韩pacopacomama| 99精品视频网站| 国产成人在线视频播放| 西西44rtwww国产精品| 一区二区三区亚洲| 中文字幕区一区二区三| av黄色在线网站| 国产精品福利av | 国产亚洲欧美日韩美女| 精品国产亚洲一区二区在线观看| 久久这里只有精品18| 久久精品一区二区三区四区| 国产又粗又黄又爽的视频| 久久久久中文字幕2018| av亚洲免费| 日本人妻一区二区三区| 91久久久免费一区二区| 怡红院av在线| 日本亚洲导航| 懂色一区二区三区免费观看| 日韩三级一区二区| 欧美高清视频在线| 欧美日韩一区二区三区视频播放| 亚洲综合中文网| 在线免费av一区| www.综合网.com| 在线视频91| 久久精品夜色噜噜亚洲aⅴ|