破解人機協作密碼:工作技能拆成兩層,AI執行人類決策成功率狂飆 | ICML 2025
人類和AI在工作中如何協作?耶魯和南大的研究人員合作的這篇論文講清楚了。
這篇論文提出了一個數學框架,通過把工作技能拆分成兩個層次來解釋這個問題,具體包括:
- 決策層子技能(decision-level subskill):確立目標、界定問題、權衡取舍的認知工作。
- 執行層子技能(action-level subskill):實施計劃、運用工具達成具體結果的操作行為。
結果發現,人類和AI在這兩個層面各有所長,當不同主體的優勢互補時,整體成功率就會遠高于單打獨斗。

同時,這種拆分也揭示了人類價值優勢所在,以及AI重塑人類工作的具體路徑。
目前,該論文已被ICML 2025接收。
人工智能時代的工作新視角
關于AI與人類工作關系,公眾討論仍困在一個簡單化的問題上:AI會取代人類還是幫助人類?
這種說法將工作視為單一集成塊。真正的挑戰不在于猜測哪些工作會消失,而在于理解工作價值正如何被根本性重塑。
大量先前研究已將討論維度從工作層面推進至任務(task)層面。任務導向經濟學(源于Autor、Levy、Murnane及Acemoglu、Restrep等學者)表明,技術替代或補充的是具體任務而非整個工作。
Brynjolfsson、Mitchell和Rock等學者則繪制了“適合機器學習”的任務圖譜,而Frey和Osborne的研究聚焦于工作層面的自動化影響程度。
然而即便是這種任務中心視角,也常常忽略每種能力內部的關鍵分野:即構建與驗證任務的判斷框架,以及實際執行任務的實施過程。
基于此,這篇論文的作者在ICML 2025發表的新研究提出創新框架:將工作解構為技能單元(skill),再將每項技能拆解為兩個核心構件——決策判斷(decision-making)與執行實施(execution)。
以軟件工程師張三為例展開分析。幾年前,他的價值由產出衡量:編寫的代碼、修復的缺陷、撰寫的文檔。
如今,GitHub Copilot和GPT等AI工具接管了大部分執行環節,加速甚至自動化了他工作中的“實施”部分。
然而他的價值不降反升——他的角色已從實施轉向監督,核心競爭力不再體現于執行計劃的能力,而在于制定方案的判斷力:決定開發內容、論證項目價值、核驗AI產出是否符合復雜且常具隱性的戰略目標。
執行可委托,判斷不可代勞。
這個案例揭示了現代工作的深層結構。作者的研究在任務經濟學(如Autor-Levy-Murnane理論;Acemoglu-Restrep框架)和“機器學習適配性”評估(Brynjolfsso-Mitchell-Rock模型)基礎上,提出了更精準的分析工具。
具體來說,論文將每項技能解構成了開頭提到的兩個層級:
- 決策層子技能(decision-level subskill):確立目標、界定問題、權衡取舍的認知工作。
- 執行層子技能(action-level subskill):實施計劃、運用工具達成具體結果的操作行為。
這種決策與執行的分離正成為勞動力市場的新分水嶺,并且這一趨勢在各類高技能工作中清晰可見:
即便AI標記出掃描影像中的異常,醫生仍需敲定診斷方案;即便AI草擬了分析報告,分析師仍需確定敘事框架。
在此新興范式下,AI充當著強大的執行引擎,而人類則掌控著不可替代的判斷方向。
正是這種分野,最終將決定誰能創造獨特價值。
用數學方法看人機協作
這一數學模型框架不僅詮釋了新型分工現實,更使其變得可量化、可預測。
通過將崗位解構為任務與技能的集合(每項均包含特定決策難度與執行難度),同時為人類與AI建立對應的“能力圖譜”(ability profile),該框架能測算任意勞動力-崗位組合的成功概率(job success probability)。由此衍生出若干深刻洞見。
該框架提供了量化工具,可精準評估勞動者能力與崗位需求的匹配度。通過剝離決策貢獻度與執行貢獻度,它超越了傳統績效指標,構建出更精準公平的評估機制。

該模型最顯著的發現,是揭示了工作成功中存在相變現象(phase transition)。
研究表明,成功概率并非隨能力提升而線性增長。當勞動者能力——尤其是決策層技能——出現微小進步時,可能觸發成功概率的非線性躍升,使其從幾近必然失敗轉向幾近必然成功。
△P:成功概率,a_1:決策層能力參數,σ:能力方差
同時,該框架理論證實,技能互補的勞動者組合——或人類與AI的協作——能顯著提升崗位成功率。
當強于決策的人類與擅于執行的AI配對時,其協同效能將超越個體能力。這為設計高效人機團隊提供了數學基礎。
研究同時闡釋了近期觀測到的“生產力壓縮”效應:生成式AI通過補足低技能勞動者的執行短板,使其成功概率獲得巨大的提升,從而縮小與高技能勞動者的能力差值。

此外,本研究還通過應用真實世界數據驗證了框架的實用性,從O*NET綜合數據庫提取崗位結構,通過評估人類與AI表現的基準測試Big-bench Lite獲取勞動者能力數據。
借助大語言模型構建數據橋梁,研究證實理論預測成立,該模型對理解當今勞動力市場具有現實指導意義。

新型工作體系實用指南
本研究蘊含了深遠而迫切的現實意義,為機構適應新型工作體系提供了實用指南:
一是重塑技能升級路徑。
當前多數技能培訓聚焦工具使用——這類執行層技能極易因AI進化而淘汰。
本框架揭示,最持久的競爭力源于提升決策層能力:精準定義問題、權衡沖突目標、在不確定性中調整策略。
技能再造(upskilling)應推動勞動者轉向人類判斷不可替代的崗位,因為目標不是超越AI的編碼能力,而是實現決策制勝。
二是招聘互補者,而非全能者。
傳統招聘依賴學歷等粗放指標,將人才壓縮為單一參數,迫使機構雇傭“綜合全能者”。
通過區分決策層與執行層能力,本框架可識別互補優勢:企業可發掘“高決策力但執行欠佳”的人才,輔以工具穩定其產出,釋放當前被埋沒的潛能。
招聘不再需要押寶全能型人才,而是精準配置能力拼圖。
最后,要為人類判斷而設計。
AI浪潮正將執行與決策剝離,迫使我們重新定義人類獨特價值。
若繼續基于執行層產出培訓、招聘和評估人才,我們將誤判潛力、錯配資源,最終將未來的工作拱手相讓——并非因AI更強,而是我們遺失了衡量人類獨特貢獻的標尺。
本框架為機構提供實用工具,構建能識別決策層卓越能力(判斷力、驗證力、戰略推演)的體系。問題不再是人類在工作中的定位,關鍵在于我們是否為此而設計。
作者簡介
本論文由南京大學黃棱瀟與耶魯大學的L. Elisa Celis和Nisheeth K. Vishnoi合作完成。
黃棱瀟,現任南京大學副教授、博士生導師。
他本科與博士畢業于清華大學交叉信息研究院,并先后在瑞士洛桑聯邦理工(EPFL)、耶魯大學擔任從事博士后研究,以及在上海華為理論計算機實驗室擔任高級研究員。
他的研究領域為理論計算機科學,主要研究興趣包括:數據壓縮、計算社會學與機器學習理論,入選國家青年高層次人才。
其論文陸續發表于理論計算機科學國際一流會議(STOC/FOCS/SODA)和人工智能國際一流會議(ICML/NeurIPS/ICLR)。
論文地址:
https://arxiv.org/abs/2505.23432
相關博客:
https://nisheethvishnoi.substack.com/p/the-anatomy-of-work-in-the-age-of






























