GPT-5 發明了新數學:這是通用人工智能嗎?
山姆·奧特曼一直在大肆宣稱GPT-5具備博士級智能,如今初步跡象已經顯現。一位推特用戶稱,GPT-5展示了一些前所未見的新數學內容,互聯網上找不到相關信息,且它能用新的數學算法和方法給出正確證明。
實際情況是怎樣的

“
塞巴斯蒂安·布貝克是微軟的正統數學家,他給GPT-5-Pro出了一道凸優化領域的題目。

這不是教科書上的題,也不在arXiv學術預印本平臺上,不是自動補全的內容,而是一道開放性難題。具體來說:
任務是改進優化領域中與光滑凸函數相關的已知收斂界,將下限從?
?1/L??提升到更優的數值。
GPT-5-Pro用了17分鐘處理這道題(可能是在借助工具的提示工程環境中),并給出了正確證明,將收斂界從??1/L??收緊到了??1.5/L??。
我再強調一遍:這個模型發現了一個新的、更嚴格的不等式。
而且這不是幻覺。布貝克驗證了這一數學內容。
這只是博眼球的熱門噱頭,還是確有其事?
確有其事。布貝克已證實此事,他不是那種為博轉推的網絡紅人,而是有著扎實學術履歷的理論計算機科學家。

此外,數學推導也站得住腳。第二張圖片中的幻燈片是基于余強制性和布雷格曼散度界等已知定理的形式化推導。
“
這篇博文的目的不是解釋數學原理,而是要表明人工智能不僅能證明數學定理,還能創造新的數學內容。
這不是魔法,而是對已知知識的整合——但這種整合就連人類都沒能利落完成。
所以沒錯,GPT-5沒有死記硬背。它為一個部分開放性問題創造了新證明。這并非最終結論——人類后來將收斂界進一步改進到了??1.75/L??,但GPT-5確實獨立推動了進展。
這不是博眼球的無稽之談,而是研究成果。
這有多重要?
意義重大。但并非因為這個證明會給凸優化領域帶來革命。

意義重大的原因在于:
- 這是研究級別的工作。
- 它不是暴力破解,涉及符號推理、不等式運算和概念性數學。
- 這暗示著大語言模型正從機械復述和檢索,邁向主動探索。
打個比方:這就像給研究生出一道稍超其能力范圍的數學題,而他們最終給出了一個通過同行評審的全新證明。
只不過這個“研究生”是硅基的,從不睡覺,也并不真正理解“理解”是什么意思。
這帶來的影響
短期影響
- 預計所有研究實驗室都會開始用GPT模型測試未解決或部分解決的問題,尤其是數學、物理和形式邏輯領域的問題。
- Lean和Coq等證明輔助工具可能會與大語言模型整合,實現形式化證明生成的自動化。
- 人工智能可能會開始被列為數學論文的合著者(這在其他領域已出現,而此事會讓這一做法合法化)。
長期影響
- 這可能會重塑理論研究的方式:人類可能成為問題提出者,人工智能則成為初步求解者。
- 最終可能在人類直覺受限的領域(如高維幾何、代數拓撲)帶來新發現。
- 若順著這一趨勢推測:理論上,經過充分訓練和合理范圍設定,人工智能或許能發現新的物理學理論。
喧囂背后被掩蓋的風險

1. 過度炒作等同于錯誤信任
人們會開始過度信任大語言模型,期望每個答案都是“經驗證的天才之作”。但大多數時候,GPT仍會出現幻覺或過擬合。一次成功無法抵消上千次失敗。
2. 無法驗證的進展
除了布貝克這類人手動驗證輸出的情況,許多人工智能生成的“證明”會未經檢驗就流傳開來。哪怕其中一個包含細微缺陷,也會融入未來的研究中,悄然損害數學領域的嚴謹性。
3. 數學直覺的喪失
如果機器開始解決我們解決不了的問題,或使用我們無法完全理解的技術,我們可能會把數學變成黑箱——諷刺的是,這正是數學一直試圖避免的。
4. 稱其為通用人工智能的誘惑
這不是通用人工智能。它仍然是模式匹配,只是規模大得驚人。GPT-5并沒有“理解”問題,只是通過大量嵌入和推理步驟進行強力模式匹配。算智能嗎?或許算。但有意識的理解?算不上。

這不是奇點,但卻是一個分水嶺。
我們剛剛見證了一臺機器:
- 讀取一道從未見過的題
- 用17分鐘推理
- 提出新的不等式界
- 寫出簡潔的證明
- 并得到頂尖人類研究者的驗證
如果你沒有絲毫觸動,至少沒有深深好奇,那可能是沒認真關注。但別輕信“機器已經解決數學問題”的幻想。更恰當的說法是:
本文轉載自?????AIGC深一度??

















