論文秒變PPT!西湖大學AGI Lab推出Auto-Slides,科研匯報難度驟降
還在為寫完論文后,制作一份高質量的匯報PPT而焦頭爛額嗎?
西湖大學AGI Lab的最新力作——Auto-Slides,只需輸入論文PDF,系統即可自動生成結構清晰、邏輯流暢的演示文稿,并支持用戶用自然語言進行交互式修改。

除“一鍵變PPT”外,Auto-Slides還能實現高保真解析、認知驅動重組。經過三項用戶研究和自動化評估,其不僅兼顧理解性、教學友好度和科學準確性,還能大幅提升學術交流效率,展示出AI在學術傳播和教育中的巨大潛力。

Auto-Slides:多智能體協作,打造專業級演示文稿
近年來,大模型(LLM)正在深刻改變科研人員與學術內容的互動方式。然而,現有的LLM學習助手在將學術論文轉化為演示文稿時,仍存在三大痛點:
1、碎片化輸出: 論文本身結構嚴謹,但對話式問答往往缺乏全局組織,導致學習體驗割裂。
2、模態單一: 缺少圖表和公式,難以有效支撐復雜概念的理解與傳達。
3、缺乏教學邏輯: 學術寫作面向專家讀者,直接用于教學和匯報,內容可能過于晦澀。
要真正實現“從論文到演示”的轉化,系統不僅要能精準解析論文,更要能重組邏輯、補充多模態信息,并保證可交互性。Auto-Slides正是為此而生。
Auto-Slides的核心創新在于引入了多智能體協作框架,讓論文轉化為演示文稿的過程更專業、更貼近真實教學需求。系統整體分為四大核心環節:

△Auto-Slides的多智能體協作框架概覽
1. 高保真解析(Parser Agent):告別亂碼,精準還原論文精髓
學術論文不僅有文字,還包含公式、表格、圖示等多模態元素。Auto-Slides的解析模塊基于高精度PDF→Markdown轉換和LLM抽取策略,能夠完整保留這些信息。
這意味著,復雜的公式不會被打散成亂碼,表格也能被單獨識別和結構化存儲,為后續處理奠定了準確的基礎。
2. 認知驅動的邏輯重組(Planner Agent):讓演講更像“講故事”
傳統論文采用IMRaD(引言-方法-結果-討論)結構,雖然嚴謹,但并不適合快速教學或演講。Auto-Slides結合教育心理學理論(如認知負荷理論、雙通道理論),將其重組為PMRC(問題-動機-結果-結論)。
這種敘事邏輯更符合聽眾的理解節奏,讓一篇論文更像是一場引人入勝的“故事化”演講。
3. 質量保障(Verification & Adjustment Agents):杜絕“幻覺”,確保學術嚴謹
大模型在生成內容時可能出現遺漏或“幻覺”。為此,Auto-Slides引入了驗證-修正環節:由驗證智能體對比幻燈片與原論文,發現關鍵信息缺失或表述不當時,再由修正智能體進行補全。
這一機制保證了輸出的學術準確性和完整性,不會因為自動化而犧牲嚴謹性。
4. 生成與交互優化(Generator & Editor Agents):人機協作,持續改進
最終生成環節基于LaTeX Beamer,產出結構專業、視覺規范的幻燈片。更重要的是,用戶可以通過自然語言與Editor Agent交互,例如說“幫我增加一頁解釋Attention機制”,系統就會自動更新并重新編譯。
這樣,Auto-Slides不只是“一次性生成”,而是支持人機協作的持續改進。
這一獨特的框架,讓Auto-Slides既能自動化生成,又能按需調整,最終讓論文真正變成教學友好、演講就緒的多模態材料。

△Editor Agent可交換功能概覽
實驗驗證:用戶與專家共同見證優異表現
為了驗證Auto-Slides的價值,團隊設計了三項用戶研究和一次自動化評估,從不同角度考察系統的可用性與優勢。
1、User Study 1(學習者交互體驗)

參與者為跨學科的本科生群體,他們首先瀏覽Auto-Slides自動生成的幻燈片,然后通過交互功能按需修改。
結果發現,交互式功能顯著提升了理解力和學習掌控感。學生普遍表示“更快抓住重點”,并且“能按照自己的需求組織內容”。這說明系統不僅降低了學習門檻,還增強了學習者的主動性。
2、User Study 2(與LLM聊天式學習對比)

直接對比LLM對話學習與使用Auto-Slides學習,結果發現,Auto-Slides在結構清晰度、視覺直觀性、支持理解與記憶上明顯優于對話式學習,而聊天方式則在個性化探索方面表現更好。
此外,研究還發現學生的偏好是先用Auto-Slides 快速建立全局框架,再通過LLM對話進行深入提問,形成互補工作流。
3、User Study 3(專家評估)

研究邀請有豐富科研經驗的專家,對比了兩類幻燈片:一種采用 PMRC 敘事優化,另一種保留原始 IMRaD 順序。
結果發現,經過敘事優化的版本在內容準確性和邏輯流暢性上顯著更優,更接近真實演講需要。專家反饋認為“聽眾更容易跟上思路,也能更好把握關鍵信息”。
4、自動化評估(LLM-as-Judge)

通過大模型作為裁判,評估Auto-Slides在表格、公式保真度以及整體內容完整性上的表現。
結果發現,增強解析模塊顯著提升了復雜多模態內容的保真度,驗證–修正機制則提升了內容的準確性和覆蓋率。整體魯棒性優于系統的簡化版本。
應用展望:AI賦能學術交流新范式
Auto-Slides系統展示了一種全新的AI輔助學術傳播范式。它將繁瑣的論文轉化為簡潔直觀的多模態演示材料,并允許用戶與系統共同塑造最終的匯報文稿。
這一框架未來有望廣泛應用于學術會議演講、課堂教學、跨學科學習等場景,為全球的科研工作者和學生解鎖更高效、更智能的知識傳遞方式。
Auto-Slides不僅僅是一個工具,它更是一個真正經過驗證的學術演示助手,在理解性、教學友好度和科學準確性三方面實現了完美平衡,并支持交互優化,展示出巨大的落地潛力。
本文第一作者為西湖大學本科生楊宇恒,通訊作者為西湖大學AGI實驗室助理教授張馳。該工作由楊宇恒在西湖大學AGI實驗室完成。
論文鏈接: https://arxiv.org/abs/2509.11062
項目地址: https://auto-slides.github.io/

































