從寫代碼到寫規則:SASE框架下,人類如何成為AI智能體的“教練”

大家好,我是肆〇柒。今天我們要探討的,是來自加拿大皇后大學(Queen’s University)Ahmed E. Hassan教授團隊的一項前沿研究。他們提出的SASE框架,正在定義人類在軟件工程中的角色——從親力親為的“碼農”,轉變為運籌帷幄的“智能體教練”。這不僅關乎技術,更是一場深刻的人才與教育革命。

SASE框架概覽:人類與智能體的雙域結構
生產力神話背后的真相
在軟件工程領域,"100x"甚至"1000x工程師"的討論正日益熱烈。這些開發者通過高效指揮AI智能體,實現了令人難以置信的生產力提升。然而,行業觀察顯示,這些"超級開發者"的核心能力并非編碼本身,而是與AI智能體協作的能力——清晰表達意圖、精準提供上下文、有效進行指導和審查。
據研究數據表明,GitHub Copilot生成的Pull Request中位完成時間僅為13.2分鐘,使得個人開發者能夠在幾天內完成相當于數年的工作量。然而,這種超高的生產力也帶來了嚴峻挑戰:超過68%的智能體生成Pull Request面臨長時間延遲或未被審查,形成了一個關鍵瓶頸。
這一現象揭示了當前自動化與驗證之間的根本矛盾——"速度vs信任"的鴻溝。大量智能體生成的代碼雖然通過了測試,但往往在更嚴格的審查中暴露出問題:29.6%的"看似合理"的修復引入了行為回歸或在嚴格重測中被證明不正確;GPT-4生成的補丁在詳細人工審核后,真實解決率從12.47%驟降至3.97%。這些數據表明,通過測試遠不足以達到"可合并"的標準。
SASE(Structured Agentic Software Engineering)框架的設計,正是為了將這種協作能力系統化、工程化、可復制化。在SE 3.0時代,軟件工程的核心已從編寫代碼轉向指導智能體,人類角色的根本性重塑成為決定未來軟件工程成敗的關鍵。

Agentic SE工作流程:從任務指定到合并準備的完整閉環
SASE框架中的人類:從"執行者"到"戰略家"
在傳統軟件工程中,開發者的主要職責是將想法轉化為代碼。而在SASE框架下,人類角色發生了根本性轉變,從執行者進化為戰略家和智能體教練(Agent Coach)。
這一角色轉變體現在核心技能的變化上:從算法、語法、調試等編碼技能,轉向系統思考、架構設計、需求工程(BriefingEng)和流程編排(ALE)等戰略能力。人類的核心價值不再在于實現細節,而在于提供AI無法替代的"戰略意圖"、"倫理判斷"和"領域專家知識"。
SASE框架將這一轉變結構化為幾個關鍵維度:
- 從"寫代碼"到"寫BriefingScript":工程師的主要創造性產出不再是實現邏輯,而是對無歧義意圖和指導的闡述。BriefingScript作為結構化、版本控制的文檔,成為與源代碼同等重要的工程產物。
- 從"修復bug"到"制定MentorScript":指導不再是隱式的、短暫的活動(如代碼審查中的評論),而是被轉化為明確的、不斷發展的、編碼化的學科。MentorScript作為結構化的機器可讀規則手冊,使指導成為可審查、可測試、持續演進的工程實踐。
- 從"獨立工作"到"管理智能體團隊":單個開發者現在可以指揮多個智能體并行工作,處理復雜的任務分解和協調。這要求人類具備團隊管理和任務編排的新技能。
這一轉變不是對傳統軟件工程技能的否定,而是對其的擴展和提升。正如論文中指出的,SASE優先考慮適應性解決方案,認為能夠快速融入特定團隊、項目或組織上下文的AI隊友,比在狹窄領域外表現不佳的天才但脆弱的專家智能體更有價值。
雙向協作:當AI成為主動的"咨詢者"
SASE框架中最具革命性的創新之一是Consultation Request Pack (CRP)機制。這不僅是人類干預的渠道,更是智能體成熟的標志——表明智能體能夠識別自身認知邊界,主動尋求人類的"部落知識"(tribal knowledge)和戰略判斷。
Consultation Request Pack (CRP):當智能體面臨復雜權衡或模糊地帶時生成的結構化請求包。CRP不是人類的失誤,而是智能體成熟的標志,表明智能體能夠識別自身認知邊界,主動尋求人類的"部落知識"(tribal knowledge)和戰略判斷。在SASE框架中,CRP作為核心產物,使智能體能夠將咨詢請求路由到適當的人類專家,實現了"humans-as-MCP-tools"的創新理念。
CRP機制的工作原理是:當智能體面臨復雜權衡或模糊地帶時,它會生成結構化的CRP,Agent Command Environment (ACE)將此請求路由到適當的專家人類。這種設計實現了"humans-as-MCP-tools"(人類作為MCP工具)的創新理念,將人類視為可調用的端點。
CRP機制的價值體現在多個層面:
首先,它使人類從被動的審核者轉變為按需調用的專家顧問,實現了人力資源的最優配置。智能體無法推斷任務的期望或"風險",它們可能對簡單請求"過度思考",或在關鍵任務上交付不足。CRP機制確保人類在關鍵時刻介入,提供智能體無法獨立完成的戰略判斷。
其次,每一次CRP及其對應的Version Controlled Resolution (VCR)都成為組織知識庫的新條目,不斷豐富MentorScript。這種機制使指導過程從隱式、臨時的互動轉變為顯式、持久的工程實踐。
最后,CRP機制透明化了AI的決策過程,讓管理者可以觀察到智能體何時需要幫助,從而建立對系統可靠性的信心。這種雙向協作模式將傳統的單向"人類指導AI"轉變為真正的"人類-AI伙伴關系",為軟件工程帶來了全新的協作范式。
SASE框架明確區分了三種協作模式,使N-to-N協作成為可能:
- 1-to-N Human-Agent Collaboration:單個開發者指揮多個智能體并行工作,例如一位工程師通過BriefingScript觸發智能體團隊生成28個Pull Request(7個任務,每個任務4個候選方案)
- 1-to-N Agent-Human Collaboration:智能體將咨詢請求包(CRP)路由到適當的人類專家,例如當智能體在重構過程中遇到高圈復雜度(超過20)的函數時,根據預定義的MentorScript規則,它會生成CRP并路由給'Tech Lead'角色
- N-to-N Hybrid Collaboration:多個人類共同監督和指導共享的智能體池,例如當智能體面臨數據庫架構問題時,會將CRP路由到指定的數據庫架構師,而該"架構師"角色本身可能由另一個專業智能體擔任
沒有像CRP這樣的顯式、持久的產物,這些復雜的多參與者工作流將變得短暫、不可追蹤且最終無法管理。SASE確保這些互動留下結構化、可審計的記錄,將臨時的"agentic coding"轉變為嚴格的工程實踐。
SASE的"雙環境"與"雙產物":賦能新角色的基石
SASE框架通過兩個專門設計的工作環境和結構化產物,為人類角色的轉變提供了堅實的技術基礎。
Agent Command Environment (ACE):教練的駕駛艙
傳統的集成開發環境(IDE)已無法滿足智能體時代的協作需求。ACE作為人類"智能體教練"的指揮中心,專為人類認知優化,支持戰略任務如指定意圖、編排復雜工作流和審查基于證據的結果。
ACE的關鍵能力包括:
- 智能體狀態可視化:提供對智能體活動和相關成本的全面可觀察性,使管理者能夠清晰看到每個智能體的工作狀態和資源消耗
- N版本編程支持:讓開發者能夠輕松可視化、比較和混合來自多個智能體解決方案的組件,實現"合成最佳方案"的工作流
- 上下文管理工具:提供專門工具來管理智能體所需的復雜上下文,這通常與人類開發者所需的內容顯著不同
ACE的演進方向
隨著技術發展,ACE將采用更先進的交互模式。語音有望成為主要交互方式,因為它比打字更快,減少了軟件開發工作流中的上下文切換?,F代基礎模型ASR系統(如OpenAI的Whisper)已經能準確轉錄各種口音、背景噪音和技術詞匯,使語音驅動的ACE工作流變得實用。這將使人類能夠進行流暢、高帶寬的對話來發出命令、口述規格說明并提供指導。
ACE的設計理念是讓人類能夠高效地"指揮"而非"執行",將認知資源集中在高價值的戰略決策上。
Merge-Readiness Pack (MRP):可信交付的新標準
MRP是SASE框架中最具創新性的概念之一。它不是簡單的Pull Request,而是包含五大證據維度的"證據包",確保智能體的工作達到真正的"可合并"標準:
1. 功能完整性:提供端到端測試結果,證明功能在現實場景中按規格完整工作
2. 可靠驗證:不僅包含通過的測試日志,還包括智能體的測試計劃和新生成的測試用例
3. 優秀工程規范:包含靜態分析、linting和復雜度檢查報告,證明代碼干凈、可讀且不引入技術債務
4. 清晰理由與溝通:將低級、冗長的軌跡文件合成為清晰、人類可讀的摘要,解釋所采取的方法和考慮的權衡
5. 完整可審計性:提供"凍結的"審計線索,包括指向確切BriefingScript/MentorScript版本的鏈接、工具和使用的智能體軌跡
MRP機制解決了"速度vs信任"的核心矛盾。評審員不再需要在海量代碼中"狩獵"錯誤,而是可以基于結構化的證據進行高效決策。通過"漸進式披露"設計,評審員可以先查看高級摘要,然后根據需要深入查看特定證據(如測試日志或執行軌跡)。例如,對于常規bug修復,評審員可能只需檢查功能完整性和工程規范;而對于關鍵安全補丁,他們可能會深入驗證測試計劃和推理過程。
結構化產物:組織知識的數字化傳承
SASE框架中的結構化產物不僅是任務指令,更是企業寶貴的數字資產和組織記憶。Briefing Pack必須是活文檔,而非靜態文檔。人類和智能體之間的后續反饋和澄清必須作為版本化更新合并回Briefing Pack中。
這些產物構成了組織知識的數字化傳承機制:
- BriefingScript:記錄任務的目標、范圍、上下文和驗證策略
- MentorScript:編碼團隊規范和最佳實踐,成為"AI隊友的員工手冊"
- LoopScript:定義智能體工作流的標準操作程序(SOP)
隨著團隊的發展,這些產物不斷進化,形成持續學習和改進的良性循環。它們使得新員工和新智能體能夠快速學習和復用組織積累的知識,加速團隊整體能力的提升。
苦澀教訓的適用邊界與工程原則的重構
SASE框架的提出并非否定"苦澀教訓"(Bitter Lesson)的價值,而是明確了其在Agentic SE時代的適用邊界。"苦澀教訓"指出,隨著計算和數據的擴展,通用方法通常會勝出,而非依賴人類知識的方法。然而,這一原則在數據稀缺的新任務或專業領域中存在明顯局限。
在智能體時代,傳統軟件工程原則可能需要重新審視。例如,"Don't Repeat Yourself (DRY)"原則通常被反轉——對人類開發者而言的維護債務(比如代碼克?。?,對智能體來說可能是一種可行策略,因為它簡化了推理過程,而缺點(更新所有實例)對智能體來說微不足道。GitClear報告顯示,自從GitHub Copilot出現以來,GitHub上的代碼重復率急劇上升,這正是這一理論轉變的行業觀察證據。
同時,SE for Humans歷史上關注小K值的精確度(precision@K),因為人類時間寶貴;而在以智能體為中心的世界中,如果從屬智能體可以后處理結果,precision@100完全可以接受。Rust工具鏈提供了重要啟示:其豐富的、建設性的編譯器消息使智能體能夠快速從失敗中學習,這正是未來Agent-Native MCP服務器應追求的目標。例如,Anthropic團隊已經通過優化MCP描述來適應智能體而非人類,這種自我改進的工具鏈循環對于使Agentic SE變得穩健、可擴展和容錯至關重要。
BMAD框架:SASE理念的實踐案例
BMAD(Breakthrough Method for Agile AI-Driven Development)框架作為SASE理念的實踐案例,將AI智能體組織成產品負責人、架構師、開發者和測試員等角色,通過任務分解和角色專業化,以高度結構化和并行化的方式處理復雜項目。
BMAD從"Agentic Planning"階段開始,智能體協作生成詳細的產品需求文檔(PRD)和架構設計;隨后,Scrum Master智能體將工作"分片"為離散的"故事文件",每個文件包含開發智能體實現功能片段所需的特定上下文。這種任務分解和角色專業化是BMAD的關鍵優勢,使其能夠以高度結構化和并行化的方式處理復雜項目。
BMAD與SASE的關聯在于,它不僅實現了N版本編程和編排,還將評審反饋轉化為持久的MentorScript規則(即"mentorship-as-code"),并指定了環境和學科(ACE用于人類指導和協調,AEE用于智能體執行)。BMAD框架證明了SASE框架在實際項目中的可行性和價值,展示了如何將理論轉化為實踐。
對軟件工程教育的顛覆性影響
當前的軟件工程教育正面臨嚴峻挑戰:高校課程仍在大量培養"如何成為AI"的技能(寫代碼、創建測試、執行低級實現),而非"如何管理AI"的技能。這種脫節將導致畢業生無法適應SE 3.0時代的需求。
SASE框架為軟件工程教育提供了明確的方向:必須將"人-AI協作"作為核心能力納入課程體系。教學重點應從實現轉向設計和指導。
課程體系重構
需求工程課程升級:將傳統需求工程(RE)和敏捷/Scrum課程與BriefingEng相結合,教授學生如何編寫機器可讀的BriefingScript。這包括如何定義"目標與原因"、"什么與成功標準"、"所有所需上下文"和"實現藍圖"等關鍵部分,確保學生能夠創建既不過度指定實現細節又能提供足夠指導的簡報。
DevOps課程進化:將Agentic Loop Engineering(ALE)融入DevOps教學,教授學生如何定義任務分解、并行執行策略和證據收集標準。學生應學習如何使用LoopScript語言來指定工作流策略,從為簡單bug修復授予完全自主權,到為關鍵安全補丁強制執行嚴格的多階段審查過程。
軟件架構課程革新:融入AI Teammate Mentorship Engineering(ATME)內容,教授學生如何制定可測試、可版本化的MentorScript規則。課程應涵蓋如何將團隊規范轉化為結構化規則,以及如何確保這些規則是原子的、確定性的,并能有效指導智能體行為。
實踐環境模擬:創建模擬ACE環境的實驗室,讓學生練習處理MRP和CRP,培養作為"教練"的綜合能力。這種實踐環境應模擬真實世界中的挑戰,如處理多個智能體生成的N版本解決方案,或在有限時間內做出戰略決策。
培養"人-AI共思"能力
SASE框架與瑞士提出的"人-AI共思"(Human-AI Co-Thinking)教育戰略高度一致。該戰略倡導將共思作為從基礎教育開始的核心能力,學生學習如何放大自己的智力,同時保持作為驗證者的關鍵角色。
在軟件工程教育中,這意味著培養學生的"第六感"——識別AI的認知失調,學會與AI進行結構化、負責任和有效的思考。未來的軟件工程師不僅需要知道"如何使用AI",更需要知道"如何與AI思考",理解何時應該干預,何時應該放手讓智能體自主工作。
對組織和人才戰略的啟示
SASE框架不僅改變了技術實踐,更對組織結構和人才戰略提出了全新要求。
招聘標準革命
未來最搶手的人才,是那些擅長"寫BriefingScript"和"制定MentorScript"的人,而非單純算法能力強的人。招聘應評估候選人的"意圖表達能力"、"上下文提供能力"和"指導能力"。例如,可以要求候選人創建一個針對特定任務的BriefingScript,評估其清晰度、全面性和可執行性。
團隊結構演進
團隊將演變為"人類教練 + 專業化智能體艦隊"的混合模式。管理者需要學會管理"數字員工",包括實施"評估過程"——表現不佳的智能體可能被"解雇"、"再培訓"或"降級"。這種管理方式類似于管理人類團隊,但需要適應智能體的特性和局限。
績效評估轉型
評估標準應從"寫了多少行代碼"轉變為:
- "指揮智能體團隊交付了多少價值"
- "沉淀了多少可復用的指導規則"
- "創建了多少高質量的BriefingScript和MentorScript"
- "如何有效處理CRP和MRP"
這種轉變將績效評估從關注個人產出轉向關注團隊效能和知識積累。
組織知識管理
將BriefingScript、MentorScript和VCR納入組織知識管理體系,形成持續學習和改進的良性循環。這些結構化產物不僅支持當前項目,還成為新項目和新團隊的起點,加速組織整體能力的提升。
基礎設施投資
組織需要投資構建支持SASE框架的ACE和AEE環境,為團隊提供必要的工具支持。這包括開發或采購支持結構化產物創作、智能體管理和證據審查的工具鏈。早期采用者將在生產力和質量方面獲得顯著優勢。

SASE框架的雙域結構:工具、活動、參與者與產出物的完整映射
SE 3.0的終極挑戰與機遇
SE 3.0的終極挑戰不是技術,而是人。技術瓶頸會隨時間解決,但人才和組織轉型才是決定性因素。正如SASE框架所展示的,軟件工程的未來不在于構建更強大的AI,而在于建立更有效的"人類-AI交互關系"。
SASE框架的精髓在于認識到軟件工程已進入一個需要雙重關注的時代:既要關注"SE for Humans"(為人類的軟件工程),也要關注"SE for Agents"(為智能體的軟件工程)。在這個雙重領域中,人類的角色已從直接實施者轉變為戰略"智能體教練和指揮官"。
這一轉變不僅關乎技術,更關乎思維方式的革命。正如論文中所指出的,"苦澀教訓"(Bitter Lesson)在Agentic SE時代有其適用邊界——雖然通用方法隨著計算和數據擴展通常會勝出,但在數據稀缺的新任務或專業領域中,人類提供的總體結構和連接點仍然是不可或缺的。SASE提出的結構不是試圖編碼人類知識,而是認識到人類-AI伙伴關系必須圍繞互補角色設計:人類提供戰略和倫理護欄("為什么"),而AI處理執行細節("怎么做")。
隨著AI Teammate Lifecycle Engineering(ATLE)的發展,智能體將從一次性承包商轉變為終身伙伴。它們將獲得持久記憶,能夠在空閑計算周期中主動執行有價值的維護任務,如掃描技術債務、識別文檔缺口或提出代碼重構。這些提議將作為新的BriefingScript進入標準SASE工作流,最終推動SE 3.0向SE 4.0演進——在這個階段,我們可能不再需要人類批準這些優化活動。
誰能率先完成人才和教育的轉型,誰就能在智能體時代贏得未來。這不僅是技術變革,更是組織文化和人才戰略的全面升級。軟件工程教育必須重新思考其使命:不再培養"碼農",而是培養能夠指揮AI智能體艦隊的"1000x教練"。
在這個新時代,最大的生產力提升將來自于那些能夠將人類的戰略智慧與AI的執行能力完美結合的組織。SASE框架為我們提供了實現這一愿景的路線圖,而真正的挑戰在于如何將這一框架轉化為實際的教育和組織實踐。這是軟件工程領域面臨的最大機遇,也是我們必須抓住的歷史性時刻。






























