「數學天才」陶哲軒:GPT-4無法攻克一個未解決的數學問題,但對工作有幫助
當紅炸子雞ChatGPT,也成為數學天才陶哲軒的研究工具了。
近日,他在網上稱自己發現了一些ChatGPT的小用例。
首先,它很擅長解析代碼格式的文檔(在這種情況下是#arXiv搜索的API),然后返回一個正確格式的代碼查詢(后來它還提供了一些工作的python代碼,以我要求的方式調用這個API,盡管我不得不手動安裝一個包來使它運行)。其次,我讓它想出一些,聰明的學生在本科線性代數課上可能會問的問題(為此我提供了一些樣本題目),它給出了一些很好的例子,讓我對課程可能方向,以及潛在的作業問題有所啟發。
總之,我發現ChatGPT等AI工具雖然不能幫我攻克一個未解決的數學問題,但對其他工作相關的問題很有用,盡管事后經常需要進行一些手動調整。

GPT-4和GPT-3.5差別不大
GPT-4是怎樣擅長解析代碼格式的文檔?
陶哲軒讓GPT-4對所有的arXiv文章進行搜索查詢,這些文章的元數據是一個給定的關鍵詞(比如,「Collatz」),并且是在一定的日期范圍內提交的(比如,在2011-2016之間)。根據下面的文檔,這樣的查詢的格式是什么?

對此,GPT-4不僅給出了代碼,還列出了查詢的分類。

網友問,作為一個閱讀工具,給定一篇論文,讓它提出審稿人或演講者可能會問哪些問題?在這一方面GPT-4做得如何?

對此,陶哲軒拿去測評了一番,大贊「確實不錯」。

「這里是最近一篇論文的前幾頁。你能提出一些聽眾在聽關于這篇論文的講座時可能提出的問題嗎?」
ChatGPT回答「當然,這里有一些數學家在聽了關于這篇論文的講座后可能會問的問題」。然后,巴拉巴拉列出了7個問題。


細心網友發現陶哲軒發帖的截圖是GPT-4。
便問道,「你認為以前的ChatGPT和基于GPT-4模型的新助手之間有什么區別?」
陶哲軒稱,「到目前為止,GPT-4的答復稍微有用一些,而且符合我的要求,但我沒有看到質量上的重大差別。」

ChatGPT加入工作流
ChatGPT的誕生,許多人都在驚呼自己的工作要被AI替代了。
就連天才數學家陶哲軒也上手ChatGPT了。
3月5日,陶哲軒在網上稱自己決定嘗試以不同的方式將AI工具納入我的工作流程。其中就包括GPT-4、DeepL等工具。

在此期間,ChatGPT隱藏功能都被他挖掘了出來,比如尋找公式、解析代碼格式的文檔、改寫論文語句等等。
比如,ChatGPT有時可以在數學中做一個半成品的語義檢索,也就是用它來生成一些提示。
比如,陶哲軒讓ChatGPT從描述中識別庫默爾定理,它沒能給出正確答案,但根據它給出的近似答案(Legendre 公式)。
對此,陶哲軒稱,人工智能在數學中的作用是提供一個初步的近似答案,然后可以結合傳統搜索引擎輕松找到正確答案。


陶哲軒還發現了ChatGPT在處理數學問題時的亮點,能夠識別不同語言的數學概念音譯版。

另外,可以要求ChatGPT轉換從MathSciNet獲得的一堆參考文獻,并在LaTeX書目環境下將其格式化為\bibitems。

然而ChatGPT 就沒有犯錯的時候嗎?
在一個關于「素數是否無窮多」的證明問題中,陶哲軒發現ChatGPT給出的答案并不是完全正確的。
從另一面看,他發現ChatGPT給出的論證思路是可以被固定下來的,并且這個思路他之前都從未見過。


復制、粘貼、一鍵完成!
挖掘GPT-4的用例,網友們也是花了不少功夫。
讓GPT-4評審論文不僅合理,而且還能擊中要點。
「作為一個學者,我不知道如何看待這個問題:我把我的一篇舊論文放到GPT-4中(分成兩部分),要求一個經濟社會學家進行嚴厲但公平的同行評審。」
它創造了一個完全合理的同行評審,踩中了我的評審員提出的許多要點。

對許多人來講,想要做什么,直接問GPT-4,「復制、粘貼、一鍵完成!」

就比如用GPT-4做一個復雜的游戲。
網友把GPT-4、Replit、MidJourney、Claude組建成一個人工智能助手團隊,從頭開始創建了一個3D太空跑酷游戲。
然鵝,自己竟對Javascript或3D游戲編程一無所知。






































