地理學(xué)的AlphaEvolve?MIT斯坦福讓AI自我生長(zhǎng)、懂地理、懂世界
以下或許是一位地理科研工作者的日常:為了讓所需的地理模型表現(xiàn)得更好,他不斷和大模型(如ChatGPT)對(duì)話(huà),嘗試改進(jìn)代碼或修復(fù)bug。
大模型給出的初版答案往往并不完美,于是研究者又會(huì)根據(jù)結(jié)果提出新的修改意見(jiàn)。就這樣一來(lái)一回,經(jīng)過(guò)不斷交互,代碼逐漸被打磨得完善。
這種「和大模型互動(dòng)、改進(jìn)算法」的方式,已經(jīng)成為地理研究的常見(jiàn)操作。
那問(wèn)題來(lái)了:能不能更進(jìn)一步?——讓這種交互—改進(jìn)的過(guò)程自動(dòng)發(fā)生,讓AI不再只是幫手,而是真正像科學(xué)家一樣,自己去進(jìn)化地理模型?
MIT和斯坦福學(xué)者提出了GeoEvolve,嘗試了這樣一種探索:
??把地理知識(shí)「嵌入」AI,讓它的進(jìn)化更靠譜、更接近地理學(xué)原理;
??讓大模型不只是輔助工具,而是成為能夠自主改進(jìn)算法的「科研合作者」。

傳送門(mén):https://arxiv.org/abs/2509.21593
項(xiàng)目地址:https://vezarachan.github.io/GeoEvolveWebPage/
GeoEvolve 已經(jīng)開(kāi)源為 Python 包,可直接安裝使用(pip install geoevolve)。
研究背景
地理空間建模是理解氣候變化、推動(dòng)城市可持續(xù)發(fā)展的關(guān)鍵工具。
但傳統(tǒng)方法往往依賴(lài)專(zhuān)家經(jīng)驗(yàn):提出假設(shè)、設(shè)計(jì)算法、不斷調(diào)參改進(jìn)。
近年來(lái),大語(yǔ)言模型(LLMs)展現(xiàn)了自動(dòng)進(jìn)化代碼的潛力。比如Google最新推出的AlphaEvolve,就能讓AI自己嘗試、變異、優(yōu)化算法。
然而,這類(lèi)系統(tǒng)有一個(gè)天然短板——它們并不懂地理。如果完全放任AI去進(jìn)化,很容易「跑偏」,生成的模型缺乏地理學(xué)上的合理性。
正因如此,GeoEvolve的提出構(gòu)建了一個(gè)結(jié)合AI自主進(jìn)化與地理知識(shí)引導(dǎo)的新框架。
GeoEvolve框架
如圖1所示,可以把GeoEvolve想象成一個(gè)「由導(dǎo)師和博士生組成的GeoAI研究團(tuán)隊(duì)」:
- 內(nèi)循環(huán):AI扮演博士生,基于初始代碼,互相交流,不斷試錯(cuò)、生成和改進(jìn)算法;
- 外循環(huán):一個(gè)「導(dǎo)師」——地理知識(shí)庫(kù)(GeoKnowRAG)在旁提醒,確保演化方向符合空間理論。
GeoEvolve的四個(gè)核心模塊分別是:
- 代碼進(jìn)化器(自動(dòng)生成和變異候選算法)
- 代碼分析器(診斷問(wèn)題、提出改進(jìn)思路)
- 地理知識(shí)檢索器(GeoKnowRAG,提供空間學(xué)理論與經(jīng)典方法)
- 知識(shí)驅(qū)動(dòng)提示生成器(把復(fù)雜的地理知識(shí)轉(zhuǎn)化為AI能理解的優(yōu)化指令)
通過(guò)這套雙循環(huán)機(jī)制,GeoEvolve不僅能寫(xiě)代碼,更能逐漸學(xué)會(huì)像地理學(xué)家一樣思考。
整個(gè)GeoEvolve的輸入,只有三樣:
- 原始模型——需要改進(jìn)的地理模型(甚至可以是一張「白紙」的空白模型);
- 評(píng)價(jià)指標(biāo)——衡量模型優(yōu)劣的標(biāo)準(zhǔn)(比如RMSE、MAE);
- 提示語(yǔ)——給大模型的一句話(huà)任務(wù)說(shuō)明(例如:「請(qǐng)幫我改進(jìn)這個(gè)Kriging模型」)。
圖片
圖1.GeoEvolve所依賴(lài)的基本思想,地理知識(shí)引導(dǎo)下的算法進(jìn)化。虛線(xiàn)框表示通用的算法生成引擎(例如AlphaEvolve)。外部流程展示了本文提出的知識(shí)引導(dǎo)型算法生成方法,專(zhuān)門(mén)面向地理空間建模場(chǎng)景。
圖2展示了GeoEvolve詳細(xì)的框架。
GeoEvolve旨在通過(guò)結(jié)合進(jìn)化式代碼生成與結(jié)構(gòu)化地理空間知識(shí),實(shí)現(xiàn)地理空間模型的自動(dòng)發(fā)現(xiàn)。
與通用的代碼智能體不同,GeoEvolve融合了來(lái)自空間建模文獻(xiàn)與經(jīng)典算法的領(lǐng)域知識(shí),從而能夠探索并發(fā)現(xiàn)新的地理空間算法。
它由四個(gè)主要部分組成:(1)代碼進(jìn)化器,(2)演化代碼分析器,(3)地理知識(shí)檢索器,以及(4)知識(shí)驅(qū)動(dòng)提示生成器。
這些組件共同構(gòu)成了一個(gè)閉環(huán)的代碼生成、評(píng)估與改進(jìn)過(guò)程,從而推動(dòng)地理空間模型的自動(dòng)化發(fā)現(xiàn)。
圖2.GeoEvolve的框架
如圖3所示,為了避免AI在進(jìn)化過(guò)程中「跑偏」,GeoEvolve引入了一個(gè)專(zhuān)門(mén)的地理知識(shí)檢索模塊(GeoKnowRAG)。
它相當(dāng)于一個(gè)「地理知識(shí)庫(kù)」,收集了來(lái)自Wikipedia、arXiv和GitHub的核心資料,包括空間自相關(guān)、異質(zhì)性、Kriging、地理加權(quán)回歸等經(jīng)典概念與算法。
系統(tǒng)會(huì)把這些知識(shí)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)庫(kù),并在AI進(jìn)化時(shí)調(diào)用,通過(guò)智能檢索與融合(RAG-Fusion),為代碼生成提供有理論支撐的提示。
這樣,AI就能在「懂地理」的前提下進(jìn)行算法改進(jìn),確保進(jìn)化出的模型既聰明又可靠。
圖3.GeoKnowRAG的框架
案例研究:對(duì)Kriging的自動(dòng)化改進(jìn)
Ordinary Kriging是地質(zhì)統(tǒng)計(jì)學(xué)中最經(jīng)典的空間插值方法,被廣泛應(yīng)用于環(huán)境監(jiān)測(cè)、氣候分析和資源勘探。
但它的核心算法提出已久,后續(xù)研究更多是「外掛式」的結(jié)合,比如與回歸模型結(jié)合形成regression kriging,而對(duì)Kriging本身結(jié)構(gòu)的改進(jìn)幾乎沒(méi)有新的突破。
GeoEvolve得到的全新Kriging model
在實(shí)驗(yàn)中,GeoEvolve在保留Kriging核心的基礎(chǔ)上,通過(guò)進(jìn)化和知識(shí)引導(dǎo)自動(dòng)注入了多項(xiàng)改進(jìn),僅選取幾個(gè)為例展示:
- 自適應(yīng)經(jīng)驗(yàn)變差圖估計(jì)
- 原始方法用固定分箱,容易受異常值影響。
- GeoEvolve借鑒統(tǒng)計(jì)學(xué)方法,引入Silverman分箱規(guī)則、分位數(shù)分箱和截尾均值,自動(dòng)確定合適的區(qū)間數(shù)量。
- 多起點(diǎn)全局?jǐn)M合
- 傳統(tǒng)擬合容易陷入局部最優(yōu)。
- GeoEvolve用多起點(diǎn)優(yōu)化+L1或加權(quán)最小二乘,保證參數(shù)物理意義合理(如變程不為負(fù))。
- 自適應(yīng)數(shù)據(jù)變換
- 在數(shù)據(jù)偏態(tài)嚴(yán)重時(shí),GeoEvolve會(huì)自動(dòng)選擇合適的對(duì)數(shù)變換+偏移量,保證殘差分布更合理,預(yù)測(cè)更穩(wěn)定。
上述改進(jìn)如果單獨(dú)來(lái)看,也許只是一些「漸進(jìn)式增強(qiáng)」;但當(dāng)它們被GeoEvolve自動(dòng)組合、進(jìn)化,并在真實(shí)實(shí)驗(yàn)中顯著提升預(yù)測(cè)精度時(shí),就展現(xiàn)出強(qiáng)大的效果。

將GeoEvolve-Kriging與其他自動(dòng)化算法發(fā)現(xiàn)的Kriging模型進(jìn)行對(duì)比,選取澳大利亞某礦區(qū)的銅(Cu)、鉛(Pb)、鋅(Zn)預(yù)測(cè)作為實(shí)驗(yàn)場(chǎng)景。
如表格所示,結(jié)果差異十分明顯:
圖片
原始Kriging:表現(xiàn)最差,預(yù)測(cè)誤差最高;
OpenEvolve-Kriging:在部分指標(biāo)上有所改善,但在鋅元素預(yù)測(cè)中反而退步;
加入地理知識(shí)提示的OpenEvolve:并沒(méi)有帶來(lái)額外提升,說(shuō)明缺乏針對(duì)性的知識(shí)很難真正幫助算法演化;
GeoEvolve(無(wú)知識(shí)庫(kù)版本):已經(jīng)顯著優(yōu)于OpenEvolve,但仍不及完整版本;
完整GeoEvolve-Kriging:始終表現(xiàn)最佳,在三種金屬元素的預(yù)測(cè)中都取得了最低RMSE和MAE。
具體來(lái)說(shuō),GeoEvolve相比OpenEvolve-Kriging,RMSE分別降低了11.3%(Cu)、20.9%(Pb)、13.5%(Zn);相較于原始Kriging,降低幅度更是達(dá)到15.4%、21.2%、13.0%。
這清楚地表明,結(jié)構(gòu)化的地理知識(shí)庫(kù)(GeoKnowRAG)在算法進(jìn)化中起到了關(guān)鍵作用,讓AI不僅能寫(xiě)出代碼,更能在「懂地理」的前提下進(jìn)化出更強(qiáng)的插值模型。
總結(jié)
GeoEvolve的實(shí)驗(yàn)結(jié)果告訴我們:AI不只是會(huì)修改代碼,它還可以在地理學(xué)知識(shí)的引導(dǎo)下,自主進(jìn)化出更強(qiáng)的經(jīng)典模型。這意味著:
- 未來(lái)的地理建模,不一定總是研究人員「手工設(shè)計(jì)」,然后基于LLMs進(jìn)行修改;
- 我們可以讓算法開(kāi)發(fā)過(guò)程完全自動(dòng)化,讓AI不斷試錯(cuò)、吸收知識(shí),最終學(xué)會(huì)像地理學(xué)家一樣思考;
- GeoEvolve展示了一條通向可信賴(lài)的GeoAI的新道路,也為AI-for-Science在地理科學(xué)和可持續(xù)發(fā)展中的應(yīng)用打開(kāi)了可能。
- 或許在不久的將來(lái),AI將不僅是工具,更是科研合作者。
參考資料:
Luo,P.,Lou,X.,Zheng,Y.,Zheng,Z.andErmon,S.,2025.GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models. arXiv preprint arXiv:2509.21593
































