前兩天剛被群嘲,ChatGPT轉頭就解決了一個數學難題
前些天,OpenAI 研究員宣稱 GPT-5 「發現」了 10 個懸賞數學難題的解決方法,輿論誤以為是 GPT-5 給出了解題方法,結果被發現只是檢索到了早已存在的文獻,引發了學界大佬的群嘲以及對于 AI 領域夸大宣傳和 AI 檢索能力的激烈討論。參閱報道《OpenAI「解決」10 道數學難題?哈薩比斯直呼「尷尬」,LeCun 辛辣點評》。
然而,諷刺的是,當人們還在辯論 AI 是不是一個合格的「文獻檢索員」時,真正的數學發現已經悄然發生。
AI 取得研究突破
加州大學洛杉磯分校(UCLA)數學教授 Ernest Ryu 發推稱:「我使用 ChatGPT 解決了凸優化中的一個未曾被解決的問題。」

隨后,他通過一系列推文介紹了自己與 ChatGPT 的聯合成果。
首先來看一下他所研究的問題本身:

呃,看不懂,但我們可以讓 AI 來幫助我們理解(AI 再立大功!):
這個數學問題探討的是一個在最優化理論中非常著名的動態系統,我們可以用一個生動的物理比喻來理解它:一個球在碗里的滾動過程。在這個比喻中,被稱為「凸函數」的 f 就代表一個形狀完美的碗,它內部光滑,從碗邊到碗底的坡度是逐漸下降的,沒有任何凹陷或小山丘。這個碗的碗底可能是一個尖銳的點,也可能是一片寬廣的平坦區域,這片最低的區域在數學上被稱為 argmin f。而 X (t) 則描述了在時間 t 時,一個球在這個碗中所處的位置。截圖中的那個核心微分方程,?(t) + (3/t)?(t) + ?f (X (t)) = 0,就是控制這個球如何滾動的「物理定律」。其中,?f (X (t)) 扮演了「重力」的角色,時刻將球往坡度最陡峭的下方拉扯;而 (3/t)?(t) 則是一個非常特殊的「摩擦力」,它的奇特之處在于會隨著時間的流逝而逐漸減弱。一開始摩擦力很強,能有效減速,但隨著時間 t 變得越來越大,這個摩擦效應會變得越來越微弱。整個問題就是從碗壁的某個初始位置 X? 將球從靜止狀態釋放,然后觀察它在這套獨特的物理規則下將如何運動。
這個問題的真正核心與挑戰,在于需要嚴格證明:這個滾動的球最終不僅會到達碗底,而且會完全靜止在碗底的某一個確切的點上。表面上看,這似乎是理所當然的,但在數學上卻是一個深刻的難題。數學家們早已證明,球的「高度」 f (X (t)) 隨著時間的推移,必然會無限趨近于碗底的最低高度。換言之,我們 100% 確定這個球最終會進入碗底的最低區域,而不會停在半山腰。但這僅僅是「函數值收斂」。真正的「懸而未決的難題」在于球的「位置」 X (t) 是否也會收斂。如果碗底是一個寬廣的平坦區域,球在到達這個區域后,會不會因為慣性而永無止境地滑行、振蕩或者兜圈子,就像一個陀螺在光滑的地面上不停旋轉一樣?這個問題要求證明,恰恰是由于那個 3/t 的特殊時變摩擦力,它能以一種恰到好處的方式耗盡球的所有動能,最終引導它停泊在一個固定的位置上,而不是在最低能量狀態下進行永恒的漂移。這在很長一段時間里都是一個吸引了眾多研究的公開問題,因為它觸及了優化算法收斂性理論的基石。
下面則是 ChatGPT 的證明,但也經過了 Ernest Ryu 教授的整理:


他也分享了原始的交互記錄:https://chatgpt.com/share/68f805f2-b8fc-8010-8df6-20a46bc1df44
從這份記錄可以看到,他使用的模型是 GPT-5 Pro,而該模型為該問題執行了 22 分鐘的推理。

同樣,AI 基于此給出的分析是:Nesterov ODE (常微分方程) 的解 X (t) 最終會收斂到函數 f 的某一個最小值點 X∞。
我們也能在證明中看到 z? 和 z? 距離為 0,意味著這兩者必須是同一個點。這與最初「假設存在兩個不同的點」相矛盾。因此,最初的假設是錯誤的,所以這個球只能停在一個點上。
Ernest Ryu 還介紹了自己的歷程和想法:「我的反應:ChatGPT 確實有效地加速了我的進度。這項工作花了大約 12 個小時,分 3 天進行。現在回想起來,證明過程其實很簡單。」
他繼續介紹說:「但我嘗試了許多其他策略,但都沒有成功,而 ChatGPT 至關重要地幫助我快速探索并消除了這些死胡同。此外,關鍵的成功步驟也是由 ChatGPT 提出的。」
不過他也指出,ChatGPT 的成功并不是一蹴而就的:「ChatGPT 并非一次性給出證明。整個過程高度互動。它提出了許多論點,其中大約 80% 都是錯誤的。但有些想法對我來說確實很新穎。每當我意識到一個新奇的想法,無論正確與否,我都會提煉出其中的關鍵洞見,并促使 ChatGPT 對其進行進一步的開發。」
Ryu 還總結了自己與 ChatGPT 各自的貢獻:

最后,他指出:「在我看來,這個結果已經可以在權威的優化理論期刊上發表。不過,我還想進一步完善它。」未來他還計劃將該證明泛化到 r>0 的 ODE 以及嘗試「將這個論證轉化為證明離散時間對應方法(即 Nesterov 加速梯度法)的收斂性」。
他總結說:「ChatGPT 現在已經處于能解決一些數學研究問題的水平,但確實需要一位專家來指導它。」
有意思的是,他提到自己研究過程中最大的障礙是「用完 ChatGPT Pro 查詢」,而他使用的已經是「昂貴的 Pro 計劃」,只能等下個月刷新了。
當然,這是個相當不錯的宣傳機會,已經有 OpenAI 工作人員聯系他,并提供了更多積分。

AI 成為論文第一作者
無獨有偶,加州大學歐文分校(UCI)數學教授 Paata Ivanisvili 前些時日也宣稱 GPT-5 Pro 助其發現了一個命題的反例。

更有趣的是,他剛剛還宣布要將 ChatGPT 列為他這篇論文的合著者,并且還是第一作者!

當然,這早已不是 AI 首次以作者身份登上嚴肅的學術論文,早在 2023 年 ChatGPT 就已經當作論文第三作者,參閱報道《一位論文作者火了,ChatGPT 等大型語言模型何時能成為論文合著者?》不過,值得注意的是,該論文的最新版本的作者名單中已經沒有 ChatGPT 的身影。

2023 年的截圖,現如今該論文的作者名單中已經沒有 ChatGPT
AI 輔助證明,成為第二作者
而在前些天的所謂「OpenAI『解決〗10 道數學難題?」事件之后,有兩位人類研究者遭遇了類似的尷尬。他們在宣布成功解決了 #707 Erdos 問題之后發現這個問題其實 30 年前就已經被解決了!
不過他們也并未止步于此,而是繼續讓 GPT-5 編寫了一個 Lean 形式化證明,并成功進行了驗證。當然,他們也強調了專家指導和反饋的重要性。
總之,我們看到,在其論文的作者列表中,ChatGPT 與 Lean 都躋身其中。

當然,將 AI 列為論文作者的做法依然存在巨大爭議。




結語
順帶一提,在前述相關推文的評論區,我們也能看到其它一些使用 AI 取得研究進展的信息:

Ernest Ryu 教授的故事,連同其他研究者的經歷,共同揭示了一個正在到來的新時代:AI 或許不再僅僅是工具,它正在成為研究伙伴。
這意味著,未來頂尖的科研,或許將不再是單打獨斗的英雄主義,而是人類專家與強大 AI 之間的深度對話與協作。
那么,屏幕前的你呢?你有在自己的研究工作中使用 AI 嗎?體驗如何?歡迎分享你的故事。






























