Andrej Karpathy 提出判斷什么工作會被 AI 替代的新標準

Syrupup

發布于 2025-11-19 00:09

瀏覽

0收藏

Andrej Karpathy 最近提出了一個判斷哪些工作會被 AI 替代的新標準：不看復雜度，看可驗證性。

Andrej Karpathy 提出判斷什么工作會被 AI 替代的新標準-AI.x社區

這個觀點顛覆了很多人的直覺。按照傳統想法，越復雜的工作越難被替代，越簡單的工作越容易被自動化。但 Karpathy 發現，真正的分界線在于任務是否可以快速驗證對錯。

Software 2.0 的核心邏輯

Karpathy 把這個現象放在 Software 2.0 的框架下解釋。他認為 AI 就是一種新的編程范式：

Software 1.0 時代：程序員的價值在于把規則寫清楚，告訴計算機該做什么。那時候能被自動化的，主要是那些有固定算法、按既定規則機械處理信息的任務，比如打字、記賬、人工計算。

Software 2.0 時代：我們通過指定目標（比如分類準確率、獎勵函數），讓神經網絡通過梯度下降在程序空間中搜索，找到能很好完成任務的解決方案。

關鍵變化是：Software 1.0 自動化你能定義的，Software 2.0 自動化你能驗證的。

驗證性的三個條件

對于一個任務要被 AI 很好地自動化，環境需要滿足三個條件：

可重置：可以重新開始嘗試
高效：可以進行大量嘗試
可獎勵：有自動化的過程來評價每次嘗試的效果

這就是為什么數學、編程這些看起來復雜的任務進展飛快。那是因為它們有明確的對錯標準，AI 可以"練習"無數遍。而創意、戰略規劃這些看似簡單的任務反而進展緩慢，因為很難快速驗證結果的好壞。

實際應用中的思考

這個框架在實際工作中已經有了體現。有開發者提到，現在更注重單測的書寫，確保 AI 給出的代碼能夠滿足審閱的單測。只要驗證通過了，具體實現流程用了什么算法什么框架什么語言都不重要。

另一個有趣的觀察是，代碼產量增加一個量級后，人腦無論如何也跟不上。但可以增加防線：通過各種自動化驗證程序來把關，這些驗證程序本身也可以用 AI 來構建。

框架的局限性

當然，這個框架也有局限性。幾個值得注意的點：

驗證性無法區分偶然復雜性和本質復雜性。編碼代理即使完成任務，也可能產生大量不必要的代碼。

臨床實驗是個反例。在人類身上進行臨床試驗耗時很長，AI 假設無法快速驗證。即使頂級科學家也無法高度準確地預測結果。

驗證成本是關鍵。幾乎所有事情最終都是可驗證的（比如是否產生積極的經濟價值，是否獲得好評），關鍵問題在于驗證任務需要多少資源。

小結

在這個邏輯框架下，未來最值錢的技能可能是如何將"業務目標"表達為"可驗證目標"。測什么如何測比如何做更重要，就像illya 關注的“超級對齊”一樣，怎么去管理和驗證比自己更強大的AI才是關鍵難題。當自己信心滿滿愿意使用AI的產出時，自己就該被替代了。。。

本文轉載自????AI工程化????，作者：ully

標簽

Software 2.0

Karpathy

贊

回復

舉報

回復

相關推薦

能否在追問中堅持判斷？揭秘大語言模型的判斷一致性挑戰

zhangyannni ? 7458瀏覽 ? 0回復
AI Agent：人類工作范式的顛覆者還是人機協作新范式？

Baihai_IDP ? 6670瀏覽 ? 0回復
Meta AI的首席執行官LeCun：不要從事LLM工作

51CTO技術棧 ? 3464瀏覽 ? 0回復
上交聯合OPPO發布新標準和新方法

angel ? 4078瀏覽 ? 0回復
顛覆虛擬試衣行業標準！阿里發布OutfitAnyone：任意服裝+任意人！

angel ? 4956瀏覽 ? 0回復
初創AI公司瘋狂吸金4億美元！Karpathy大佬預言：未來編程只需狂按tab鍵，我們整理了風頭正盛的5家初創

51CTO技術棧 ? 3914瀏覽 ? 1回復
Google 最新推出的RAG替代方案--RIP

玄姐聊AGI ? 5233瀏覽 ? 0回復
AI Agent 智能體開發工作手冊詳細指南

玄姐聊AGI ? 7627瀏覽 ? 0回復
AI大神Andrej Karpathy：OpenAI Operator預示著AI智能體的未來，但仍需突破！

草臺AI ? 3565瀏覽 ? 0回復
Andrej Karpathy 提出"Vibe Coding":AI 時代的新型編程范式

Syrupup ? 7279瀏覽 ? 0回復
超越 RAG：構建增強而非替代思維的知識管理系統

ermulong ? 3786瀏覽 ? 0回復
詳解AI代理的內部工作機理

51CTO內容精選 ? 3364瀏覽 ? 0回復
什么是工作流？如何創建和編排AI智能體工作流

數智飛輪 ? 1.2w瀏覽 ? 0回復
測試工程師會被淘汰嗎？

mb67d4200f74d5e ? 2753瀏覽 ? 0回復
MCP協議：AI工具交互新標準，最新綜述

恰似驚鴻 ? 2992瀏覽 ? 0回復
AI大神Andrej Karpathy力推上下文工程！

草臺AI ? 2355瀏覽 ? 0回復
為什么它能成為強化學習的“黃金標準”？深扒 Proximal Policy Optimization (PPO) 的核心奧秘

Halo咯咯 ? 4040瀏覽 ? 0回復
Andrej Karpathy 2小時訪談：我們召喚的是幽靈，不是造動物 | AGI 還有十年路

老蛀蟲 ? 717瀏覽 ? 0回復
AGI仍需十年：Andrej Karpathy播客回應與深度解析

chengganfei ? 882瀏覽 ? 0回復

Syrupup

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂

Andrej Karpathy 提出判斷什么工作會被 AI 替代的新標準

Software 2.0 的核心邏輯

驗證性的三個條件

實際應用中的思考

框架的局限性

小結

目錄