大規(guī)模高精度量子化學(xué)模擬新范式:字節(jié)最新成果入選Nature子刊
我們對世界的理解,越來越依賴計算。
從藥物、蛋白質(zhì)設(shè)計到新材料發(fā)現(xiàn),科學(xué)家們希望在計算機(jī)里「虛擬實(shí)驗(yàn)」出物質(zhì)的性質(zhì)。要做到這一點(diǎn),就必須準(zhǔn)確地模擬原子中,核、電子之間的相互作用。如果計算的精度不夠,一種催化劑可能被誤判為無效,一種材料的性能預(yù)測也會南轅北轍——這意味著數(shù)年的實(shí)驗(yàn)與投資都可能白費(fèi)。
問題是,真正能給出「實(shí)驗(yàn)級」答案的高精度算法——比如量子化學(xué)的「金標(biāo)準(zhǔn)」CCSD(T)——雖然在小分子上表現(xiàn)完美,卻在遇到真實(shí)材料時幾乎寸步難行。原因在于,真實(shí)材料體系過大,而這類方法需要同時考慮體系中成千上萬電子的關(guān)聯(lián)效應(yīng),計算量會隨著體系規(guī)模急劇爆炸。因此,過去科學(xué)家只能在極小的模型上試驗(yàn)這些方法,而無法直接研究諸如催化、電化學(xué)、電池界面等真實(shí)材料體系。
近期,字節(jié)跳動 Seed AI for Science 團(tuán)隊(duì)與北京大學(xué)物理學(xué)院的陳基教授、倫敦大學(xué)國王學(xué)院的 George H. Booth 教授合作,提出了新的與「金標(biāo)準(zhǔn)」CCSD(T) 相結(jié)合的量子嵌入框架 SIE+CCSD(T),輔以自下而上全流程優(yōu)化的 GPU 計算框架設(shè)計,首次讓「金標(biāo)準(zhǔn)」方法運(yùn)行在上萬軌道、數(shù)百原子的真實(shí)材料體系中。
這意味著,科學(xué)家終于可以在計算機(jī)上,以實(shí)驗(yàn)級精度研究復(fù)雜的表面性質(zhì),從而為催化設(shè)計、清潔能源與新材料開發(fā)提供可信的理論基石。論文已于 2025 年 10 月 21 日發(fā)表在 Nature Communications,文章與代碼均可被開放獲取。

- 文章標(biāo)題:A multi-resolution systematically improvable quantum embedding scheme for large-scale surface chemistry calculations
- 文章鏈接:https://www.nature.com/articles/s41467-025-64374-2
- 代碼鏈接:https://github.com/bytedance/byteqc/tree/main/embyte
亮點(diǎn)速覽
大規(guī)模高精度: 在包含 392 個碳原子、約 1.1 萬個軌道的石墨烯體系中,SIE+CCSD(T) 實(shí)現(xiàn)了「金標(biāo)準(zhǔn)」CCSD(T) 級別的計算,并在 GPU 上表現(xiàn)出接近線性的計算效率,真正讓高精度計算走向?qū)嵱谩?/span>
精度可控、可系統(tǒng)改進(jìn): SIE 框架可以自由結(jié)合不同層次的高精度算法,并且通過一種獨(dú)特的篩選方式,只保留最重要的軌道與電子,從而在不犧牲精度的前提下,大幅減少計算量。科學(xué)家可以像「旋鈕」一樣,按需調(diào)節(jié)計算精度與速度。
跨體系驗(yàn)證化學(xué)精度: 從固體氧化鎂表面(MgO)到多孔金屬有機(jī)框架(CPO-27-Mg),再到二維材料石墨烯,SIE+CCSD(T) 在多種真實(shí)體系中都達(dá)到了與實(shí)驗(yàn)一致的結(jié)果,誤差控制在 ±1 kcal/mol 以內(nèi),達(dá)到實(shí)驗(yàn)級精度。
消除模型局限,首次實(shí)現(xiàn)「握手」: 在研究水分子吸附在石墨烯表面的體系時,SIE+CCSD(T) 首次讓兩種常見的模擬方式——開放性邊界(OBC)與周期性邊界(PBC)——在大體系下計算出一致結(jié)果。吸附能最終收斂至約 100 meV,顯示水分子在石墨烯上并沒有明顯的取向偏好。
表面高精度模擬的困難
表面化學(xué)是材料科學(xué)中最復(fù)雜的領(lǐng)域之一。
想象一個水分子落在石墨烯表面,它與下方數(shù)百個原子之間的吸引力可能會跨越十幾個原子距離——這種超長程的相互作用意味著模型必須足夠大,否則模擬就會失真。
傳統(tǒng)的量子化學(xué)方法(如 CCSD(T))雖然精度極高,但一旦體系包含數(shù)百個原子,就會因?yàn)橛嬎懔勘ㄔ鲩L而幾乎無法運(yùn)行。而密度泛函理論(DFT)雖然計算快,但其結(jié)果依賴于選取的泛函,無法系統(tǒng)提升精度。SIE+CCSD(T) 的出現(xiàn),正是為了打破這種「速度與精度不可兼得」的瓶頸。
SIE 核心設(shè)計理念:
「分而治之」
SIE,全稱 Systematically Improvable Quantum Embedding,是一種能夠「分而治之」的多分辨率計算思路。
它的核心理念是:
- 先用較快、低復(fù)雜度的方法在全體系上做初步計算;
- 再將整個系統(tǒng)按照初步計算的結(jié)果給出的重要性分割成多個小的「區(qū)域」;
- 最后,對這些「區(qū)域」進(jìn)行更高精度的計算,并把結(jié)果再拼接回整體。
這樣一來,研究者可以在同一框架內(nèi)按需平衡速度與精度。
性能測試:
SIE+CCSD(T) 可在 1.1 萬軌道的系統(tǒng)中高效運(yùn)行
SIE+CCSD(T) 通過全面的 GPU 優(yōu)化實(shí)現(xiàn)了計算性能的跨越式提升。
每個「區(qū)域」都可以被分配到獨(dú)立的 GPU 上并行運(yùn)行,這讓整個體系的計算復(fù)雜度隨系統(tǒng)規(guī)模近似線性增長——體系增大一倍,計算時間也僅約翻倍。
在實(shí)際測試中,SIE+CCSD(T) 在包含 1.1 萬個軌道的系統(tǒng)中依然保持高效運(yùn)行,而傳統(tǒng) CCSD(T) 在這種規(guī)模下早已無法計算。

圖a為SIE算法整體框架。圖b展示了各個算法的在單張A100上,隨著系統(tǒng)尺寸增長的時間消耗情況。
多結(jié)構(gòu)跨體系的驗(yàn)證:
SIE+CCSD(T) 計算結(jié)果與實(shí)驗(yàn)吻合

圖a為CO+MgO(001)結(jié)構(gòu),圖b為CO/CO2+CPO-27-Mg,圖c為有機(jī)分子+石墨烯。圖d展示了SIE+CCSD(T) 與實(shí)驗(yàn)普遍在 ±1 kcal/mol 的化學(xué)精度檔;同時展示了與其他方法在體系規(guī)模與實(shí)現(xiàn)細(xì)節(jié)變化下的對比與穩(wěn)健性。
在不同類型的真實(shí)體系上,團(tuán)隊(duì)用同一套 SIE+CCSD(T) 工作流做了多組測試。這些體系的結(jié)構(gòu)、化學(xué)環(huán)境差別很大,但 SIE+CCSD(T) 計算結(jié)果與公開實(shí)驗(yàn)數(shù)據(jù)整體落在 ±1 kcal/mol 的誤差范圍內(nèi)。更重要的是,團(tuán)隊(duì)并沒有「按體系微調(diào)方法」,而是通過統(tǒng)一的策略,在成本可控的情況下把精度穩(wěn)定地推廣到不同材料。這一跨體系的一致性,表明 SIE+CCSD(T) 具備成為「通用工具」的潛力。
首次揭示:
石墨烯上水分子取向不「挑剔」
水分子與石墨烯的相互作用長期以來是表面科學(xué)的一個懸而未決的問題——不同研究報告得出完全相反的結(jié)論:有的認(rèn)為水傾向「趴著」更加穩(wěn)定,有的認(rèn)為「豎著」吸附更加穩(wěn)定。
借助 SIE+CCSD(T),研究團(tuán)隊(duì)系統(tǒng)地比較了不同水分子取向下的吸附能,發(fā)現(xiàn):
- 在小體系下,模擬結(jié)果會因邊界條件不同而出現(xiàn)巨大差異,而前人的工作中因?yàn)槿狈τ行в嬎愎ぞ邿o法再進(jìn)一步擴(kuò)大體系尺寸來消除「小體系」的影響;
- 得益于 SIE+CCSD(T) 的高效性,團(tuán)隊(duì)發(fā)現(xiàn)當(dāng)體系擴(kuò)大到數(shù)百原子級別時,開放性與周期性模型的結(jié)果逐漸趨同,差距縮小到僅幾 meV。
最終,一個意料之外的答案出現(xiàn)了:不同取向下的吸附能幾乎相同,約為 100 meV。
這宣告了單個水分子在石墨烯上吸附的基態(tài)構(gòu)型的爭論基本結(jié)束,并首次揭示,在石墨烯上,水分子取向并不「挑剔」。這將對研究水在石墨烯表面的流動等行為提供重要的理論參考,這對于藍(lán)色能源、水淡化等石墨烯工業(yè)應(yīng)用場景至關(guān)重要。


圖a與b,使用SIE+CCSD計算得到的不同水分子取向構(gòu)型的吸附能以及y軸方向的相對極化率。圖c與d展示了2-leg、0-leg與60°三種構(gòu)型的表面電子密度變化情況。不同旋轉(zhuǎn)角度構(gòu)型的吸附能都處在0-leg與2-leg之間,這意味著不同構(gòu)型之間的吸附能差距不會超過 10 meV。
總結(jié)
從算法理念到工程落地,SIE+CCSD(T) 展示了一個清晰的方向:讓量子化學(xué)的「金標(biāo)準(zhǔn)」可用于真實(shí)材料世界。
這項(xiàng)工作不僅在性能上跨越了 CCSD(T) 的傳統(tǒng)規(guī)模限制,也在方法論上實(shí)現(xiàn)了從理論到可系統(tǒng)改進(jìn)框架的閉環(huán)。通過 GPU 全鏈路加速,SIE G 成功地在上萬軌道體系中保持近線性擴(kuò)展,并在多類表面體系上重現(xiàn)了實(shí)驗(yàn)級精度。
通過展示 SIE+CCSD(T) 的算法框架,希望它的意義不止于一次計算的提速,而是為未來的材料設(shè)計、表面機(jī)理探索、乃至高精度高通量計算工作流打開了新的可能性。




































