設計師大解放!清華發布「建筑平面圖」自動生成模型 | ACL'25
建筑平面圖是AEC(建筑、工程、施工)領域的核心 「語言」,貫穿設計思想草繪、方案交流與落地執行全流程。而住宅作為人們日常生活的基本空間載體,其平面圖更是在建筑設計早期發揮著核心作用。
然而,傳統平面圖設計流程高度依賴建筑師個人經驗,存在效率低、反饋慢、缺乏智能輔助等問題。
針對這一挑戰,平面圖自動生成模型(如GAN、擴散模型)不斷涌現,但現有研究忽略了一個關鍵矛盾:
傳統評估依賴FID、PSNR、GED等統計指標,僅衡量圖像質量或結構相似性,完全未融入建筑專業知識——即便模型在這些指標上表現優異,生成的平面圖仍可能存在 「功能分區混亂、流線低效、空間比例失衡」 等致命問題,難以應用于實際設計。
此外,已有研究方案還存在三重局限:
1. 數據集缺乏建筑師專業反饋,無法為模型提供 「何為合理設計」 的指導;
2. 是評估標準與建筑實際需求脫節,無法篩選出真正可行的方案;
3. 是生成模型未整合人類反饋優化,難以對齊建筑師的設計偏好。
針對上述痛點,清華大學深圳國際研究生院副教授呂帥團隊提出FloorPlan-LLaMa模型,采用自回歸生成架構,并創新性地引入「基于人類反饋的強化學習(RLHF)」機制,使模型在自動生成建筑平面圖時,能夠有效實現住宅功能區域分布的合理性與空間布局的清晰性,同時具備良好的房間輪廓表達與形式美感。

論文地址:https://aclanthology.org/2025.acl-long.331/
模型不僅學習建筑師在功能分區與空間流線組織方面的專業偏好,還能夠把握整體構圖的協調性與設計邏輯。
該方法實現設計生成與專家判斷之間的深度協同,提升了生成式平面圖在實際使用場景中的設計質量與實用價值。

FloorPlan-LLaMa模型的優勢
該論文近日被自然語言處理與人工智能領域的國際頂級學術會議ACL錄用,并獲得領域主席獎。
ACL大會是自然語言處理與人工智能領域的國際頂級學術會議。
本屆大會共收到超過8000篇投稿,243篇論文被遴選為口頭報告,47篇論文獲得高級領域主席推薦獎(SAC Highlights)。
FP-LLaMa模型的成功入選,充分體現了該研究在跨學科創新和應用實踐方面的領先性和影響力。
第一作者為清華大學博士生殷俊,共同第一作者為清華大學博士生曾鵬宇,通訊作者為該校副教授呂帥,團隊其它成員還包括孫浩源,張淼,戴語琴,鄭涵,張亞超。
技術核心
FloorPlan-LLaMa 模型圍繞「讓 AI 理解建筑專業需求」的理念設計,其包含數據集、評分模型和生成模型三大核心組件:
研究人員提出了ArchiMetricsNet數據集,這是第一個包含三個專業評估維度(功能性、流線和整體評估)以及詳細文本分析的平面圖數據集。

ArchiMetricsNet數據集內容示意
研究人員使用ArchiMetricsNet數據集,訓練了一個專為平面圖多維度評估設計的模型FloorPlan-MPS(多維度偏好分數),將該模型生成的分數稱為ARS(建筑合理性分數)。
研究人員開發了FP-LLaMa生成模型,一個基于自回歸框架的平面圖生成模型。
為了整合建筑師的專業知識和偏好,FloorPlan-MPS在RLHF過程中被用作獎勵模型,使FP-LLaMa的輸出與社區需求保持一致。
該方法采用了自回歸生成機制,巧妙地消除了RLHF階段反向擴散過程中對噪聲預測的需要。
具體來說,使用FloorPlan Tokenizer將平面圖轉換為離散的詞元序列,并使用Next-Token Prediction順序生成平面圖。
此外,為了提高效率,研究人員還結合了類條件機制和無分類器指導。

FP-LLaMa的三大階段框架
FloorPlan Tokenizer:采用與VQGAN類似的編碼器-量化器-解碼器框架,可將連續的樓層平面圖數據轉換為離散標記,且訓練時會同時采用重建損失、基于LPIPS的感知損失及來自PatchGAN判別器的對抗損失:

Next-Token Prediction:在推理時,FP-LLaMa使用自回歸框架按順序生成詞元。對于樓層平面圖詞元序列帶有自回歸預測的Next-Token。
當For到達推理層時,計劃詞元FP-LLaMa序列生成
,下一個詞元的概率由下式給出:

作為一個融合了建筑學專業知識的模型,該方法實現設計生成與專家判斷之間的深度協同,提升了生成式平面圖在實際使用場景中的設計質量與實用價值。
實驗結果
研究人員在提出的建筑指標網絡(ArchiMetricsNet)數據集上進行實驗,采用四個關鍵評估指標:
FID(弗雷歇初始距離)、SSIM(結構相似性指數測量)、PSNR(峰值信噪比)以及新提出的ARS(建筑合理性得分,FloorPlan - MPS模型的評估結果)。
研究人員測試了兩種不同的生成任務:類別條件生成和文本條件生成。
對比時選擇了以下基線方法:HouseGAN 、HouseGAN++、HouseDiffusion 、FloorPlanDiffusion 、Tell2Design、Obj-GAN、Qwen2.5-7B-Instruct、ChatGLM4V。
定性實驗
類條件生成
生成中HouseGAN 等現有先進模型或基于圖形、或用輸入房間塊生成布局,為公平比較,每種方法均采樣500張圖像并選建筑合理性得分中位數示例,按FloorPlanDiffusion顏色配置展示。

不同方法在Text-Conditional task上生成的平面圖的定性結果

ClassConditional任務上的平均人工評估分數

ClassConditional任務上的人工評估勝率
文本條件生成
受Tell2Design啟發,研究人員將大語言模型用于 「隔壁房間序列預測」任務,以 Llama-3.2-11B-Vision-Instruct 為主干,對比 ChatGLM4V 等模型;
現有方法雖能生成高質量圖像,但建筑師視角下次優,而帶RLHF的FP-LLaMa布局更實用。
定量實驗
為公平比較,研究人員計算不同方法生成平面圖的度量時采用FloorPlanDiffusion配色方案,下表展現傳統指標性能。

不同方法間類條件生成結果

不同方法在文本條件生成中的結果

下表則使用建筑合理性得分(ARS)評估;

不同方法在類條件生成中的建筑合理些得分(ARS)

不同方法在文本條件生成中的建筑合理些得分(ARS)
結果表現為FP-LLaMa傳統指標最佳,加RLHF后傳統指標略降,但ARS比次優方法高8.54%且貼合建筑師偏好,未加RLHF的FP-LLaMa評分近傳統方法,這說明清晰度和與真實值相似性不代表設計合理,因原始數據集含不合理布局且有偏差。
總結
研究人員試圖通過引入ArchiMetricsNet(一個具有人類反饋的數據集)來解決現有建筑平面圖生成和評估方法的局限性;
FP-LLaMa,一個微調的自回歸模型,與專業建筑師保持一致。
這項工作推進了人類專業知識在建筑平面圖生成技術中的整合,并展示了大型自回歸生成模型在「建筑、工程與施工」領域的潛力。






























