AI Coding 的新征途
圍繞 Windsurf 的收購,OpenAI 與 Google 上演商戰大戲。
類似Cursor,Windsurf 也是“AI 編碼助手”。作為 GenAI 潛在的殺手級應用,“AI 編碼助手” 被行業寄予厚望:
將深刻影響開發效率、重新定義開發方式。
AI 編碼助手拖累資深開發者
然而近期非盈利機構 METR的研究【文獻1】卻發現,AI并沒有讓資深開發者更高效。
METR 基于隨機對照試驗設計,對 16 位經驗豐富的開源項目開發者進行測試,每人需完成 246 個任務。
開發者預估AI 有助提效?20?%,但客觀數據顯示:使用如 Cursor Pro + Claude 3.5/3.7 時,平均完成時間反而延長19%。

主要原因梳理如下:
AI 的建議僅有約 44% 被采納,且大多數代碼需要逐行復查與重構(約 9% 的總時間);
在熟悉的復雜項目中,AI 隨意修改可能引入額外錯誤與上下文沖突。
啟發是,對資深工程師而言,AI編程助手在處理部分小問題時有些價值;
但并未帶來整體效率提升,反而引入更多校對時間和認知干擾。
哈佛商業評論團隊的實驗
對于 AI 能否重塑軟件開發工作中的角色和任務結構,哈佛商業評論團隊也基于 GitHub Copilot 做過實驗分析【文獻2】。

研究表明:
接入 Copilot 后開發者減少協作頻率,更傾向于獨自完成任務,組織扁平化趨勢顯現;
開發者側重進行高度探索性思考(如嘗試新框架、實驗新方法),而將具體編碼任務交由 AI 輔助;
Copilot 對技術經驗較少的開發者幫助顯著,有助于縮小與資深開發者之間的能力差距;
原本耗費在項目管理、資料搜集、協調溝通上的時間,更多被用到“核心開發”與“創新思考”上。
研究給出這樣的務實建議:為開發者提供更多“AI?輔助自主塊”,可以讓他們將腦力資源更聚焦在核心設計與創新上,提升工作滿意度與創造力。
多Agent協作開發模式
來自清華、悉尼大學等機構的團隊,則針對多 Agent 協作開發的模式做了系統化的探索【文獻 3】。
研究構建了 ChatDev:一個協同工作的“虛擬軟件公司”,由代表多種常見角色的Agent構成。
他們通過 Chat Chain 持續對話協作,覆蓋從需求到設計、編碼、測試與文檔的完整開發流程。

ChatDev具備如下特征:
- 所有 Agent 均基于自然語言通信,避免多模型不一致問題;
- 將大任務拆分成許多子任務,通過對話鏈協作推進;
- 交流降低幻覺設計,Agent 在執行前會主動提問、澄清需求。
ChatDev 可在少于 7 分鐘、低于 1 美元成本內完成一個五子棋游戲的開發。
ChatDev 展示了多 Agent 分工協作遠超單一 AI 工具的潛力,能顯著改善任務的連貫性與質量;
但其明顯的缺點在于成本高——持續運營多模型 Agent 面臨資源與費用挑戰。
機遇與風險并存
METR強調,當前 AI 尚不足以替代專家,但其認知緩沖仍深受青睞。
哈佛團隊指出,AI 效果與策略使用關系緊密,若設計得當,能夠釋放研發潛力。
ChatDev 則顯示,AI 群體合作可提升結構化任務效率,但需克服資源瓶頸。
從單一 AI 輔助到 AI 改變工作方式,再到 AI Agent 協作,各具挑戰與適用場景。
這里,筆者看到一條AI Coding 的新征途:任務原子化,把“寫代碼”拆成“說話”;認知外包,用 AI 代理擴展“個人帶寬”;多代理協作,讓 AI 之間先“吵”出共識。總結一句話,語言即編譯器,自然語言成為最高抽象,把軟件工程變成一場多代理的“語言游戲”。
文獻1, Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity, https://arxiv.org/abs/2507.09089
文獻 2, Generative AI and the Nature of Work,https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5007084
文獻 3, ChatDev: Communicative Agents for Software Development ,https://arxiv.org/html/2307.07924v5
本文轉載自?????????????清熙?????????,作者:王慶法

















