GPT-5遭用戶吐槽 “垃圾”:縮放定律失效,AGI夢漸行漸遠?

2025 年 8 月,OpenAI 終于推出備受期待的 GPT-5,但其表現并未如市場預期般帶來 “革命性突破”,反而讓 “AI 進步失速”“縮放定律失效” 的討論再度升溫。
GPT-5 實測:亮點有限,失望聲四起
YouTube 播主 Mrwhosetheboss 的實測顯示,GPT-5 并非全面領先:在創建象棋游戲時優于 GPT-4o-mini-high,撰寫視頻腳本時強于 GPT-4o,且能根據任務自動匹配最優模型;但在生成 YouTube 縮略圖、生日派對邀請函等場景中,反而不及 GPT-4o,甚至更易被誘導編造事實。
這份 “喜憂參半” 的答卷很快引發不滿。有付費用戶直言其 “是垃圾”,人工智能學者 Gary Marcus 更是直接批評 GPT-5 “過度炒作且令人失望”—— 對比 2023 年 GPT-4 相對 GPT-3 的 “飛躍式進步”,GPT-5 的提升僅停留在 “基準測試分數更高、文字表達更流暢” 的細節層面,毫無突破性進展。
大模型進步 “踩剎車”:從 “造汽車” 到 “修汽車”
曾有行業比喻:預訓練大模型是 “生產汽車本身”,訓練后優化是 “給汽車升級性能”。此前,OpenAI 通過擴大預訓練規模,不斷推出性能更強的 “新車”;但如今,這種 “造新車” 的速度明顯放緩。
2024 年春季,OpenAI CEO 山姆?奧特曼曾向工程師承諾 “下一代模型遠超 GPT-4”,但 2025 年秋季落地的 GPT-5 未能兌現。亞利桑那州立大學研究人員進一步指出,大模型所謂的 “推理能力” 本質是 “脆弱的幻影”—— 僅在訓練數據范圍內有效,一旦超出邊界便失效,其基準測試成績與解決真實日常問題的能力并非同一回事。
Gary Marcus 的觀察更直白:“2025 年的大模型分數更高,但沒有哪家 AI 公司敢說,它比 2024 年的模型‘實用得多’。” 行業關注點已從 “造更強的模型” 轉向 “優化現有模型”,工程師的角色也從 “汽車制造商” 悄然變為 “汽車修理工”。
縮放定律的興衰:從 “圭臬” 到 “失效”
AI 行業曾將 “縮放定律” 奉為核心邏輯。2020 年 1 月,OpenAI 發布《神經語言模型的縮放定律》報告(Anthropic CEO Dario Amodei 參與撰寫),提出 “只要擴大模型規模、增強訓練強度,性能就會持續提升”。
隨后的 GPT-3 印證了這一觀點 —— 規模是 GPT-2 的 10 倍,性能實現飛躍;2023 年 GPT-4 再次大幅進步,疊加 ChatGPT 用戶破億的熱度,風險資本大規模涌入,AI 行業迎來 “大躍進”。山姆?奧特曼甚至在《萬物的摩爾定律》博文中斷言,AI 將 “迅猛改變世界”,AGI(通用人工智能)觸手可及。
但反對聲從未消失。紐約大學教授 Gary Marcus 曾直言 “縮放定律只是觀測結果,非普適規律”,這一觀點不僅遭到 Greg Brockton、Yann LeCun、馬斯克等行業大佬的反駁,他本人甚至被貼上 “機器學習產業異類” 的標簽。
如今,反對者的聲音得到驗證。TechCrunch 指出,行業已普遍承認 “僅靠堆算力、堆數據,無法讓大模型變成‘全知數字神靈’”—— 自 GPT-4 發布兩年多來,OpenAI 再無重磅模型,“縮放定律失效” 已成越來越多人的共識。
進步失速沖擊 AI 經濟:萬億夢碎,風險浮現
若縮放定律徹底失效,AI 行業的 “經濟泡沫” 或將破裂。科技分析師 Ed Zitron 與 Gary Marcus 觀點一致:“生成式 AI 市場規模約 500 億美元,最多 1000 億,遠達不到此前炒作的‘萬億級別’。”
這意味著未來幾年,AI 工具只會有 “穩定但漸進” 的進步 —— 雖會被定期使用,但用途有限,既不會大規模沖擊就業市場,AGI 的實現也將更不切實際。
更嚴峻的風險在資本市場。美國股市中,35% 的市值集中于七大科技巨頭,過去 18 個月,這些企業在 AI 領域投入高達 5600 億美元,但其 AI 相關收入僅 350 億美元,“高投入、低回報” 的矛盾若持續,可能引發連鎖反應。
當然,樂觀視角仍存:21 世紀 30 年代仍有可能孕育 AGI,即便無法實現 “人類工作自動化”,也能推動 AI 行業探索更復雜的解決方案,倒逼技術從 “規模驅動” 轉向 “效率驅動”。

























