逆向搜索知識(shí)"暗物質(zhì)":300萬(wàn)個(gè)推理鏈重構(gòu)科學(xué)百科全書(shū)
大多數(shù)科學(xué)知識(shí)將推理過(guò)程壓縮成了結(jié)論。你得到了"是什么",卻看不到"為什么"。這種極端壓縮創(chuàng)造了研究人員所說(shuō)的知識(shí)"暗物質(zhì)"——連接每個(gè)科學(xué)概念的不可見(jiàn)推導(dǎo)鏈條。
圖片
論文的解決方案堪稱(chēng)瘋狂:一個(gè)蘇格拉底agent,在200門(mén)課程中生成了300萬(wàn)個(gè)第一性原理問(wèn)題。每個(gè)問(wèn)題都由多個(gè)獨(dú)立的大語(yǔ)言模型求解,然后交叉驗(yàn)證正確性。一個(gè)經(jīng)過(guò)驗(yàn)證的長(zhǎng)鏈?zhǔn)剿季S(LCoT)知識(shí)庫(kù),其中每個(gè)概念都能追溯到基本原理。
論文構(gòu)建了"頭腦風(fēng)暴搜索引擎",實(shí)現(xiàn)"逆向知識(shí)搜索"。與其問(wèn)"瞬子是什么",你能檢索到推導(dǎo)它的所有推理鏈:從雙阱勢(shì)中的量子隧穿到QCD真空結(jié)構(gòu),再到引力霍金輻射,直至四維流形的突破。他們稱(chēng)之為知識(shí)"暗物質(zhì)"的首次可視化。
SciencePedia現(xiàn)在包含20萬(wàn)條條目,涵蓋數(shù)學(xué)、物理、化學(xué)、生物和工程。由這些LCoT鏈條合成的文章,幻覺(jué)率比GPT-4基線降低50%,知識(shí)密度顯著更高。最厲害的是每個(gè)連接都可驗(yàn)證。每條推理鏈都經(jīng)過(guò)檢查。不再需要盲目信任維基百科的引用——你能看到從第一性原理出發(fā)的實(shí)際推導(dǎo)過(guò)程。這不僅僅是更好的搜索。這是將支撐整個(gè)科學(xué)的不可見(jiàn)推理網(wǎng)絡(luò)外化了。人類(lèi)知識(shí)的"暗物質(zhì)"剛剛變得可見(jiàn)。
這套流程設(shè)計(jì)堪稱(chēng)天才。規(guī)劃器生成問(wèn)題縮略圖。生成器將其擴(kuò)展為具有可驗(yàn)證答案的具體問(wèn)題。然后多個(gè)獨(dú)立的求解器agent(不同的LLM)攻克同一問(wèn)題。只有達(dá)成共識(shí)的答案才能存活。幻覺(jué)自動(dòng)被過(guò)濾掉。
圖片
這就是改變一切的架構(gòu)。用戶查詢 → 關(guān)鍵詞提取 → LCoT知識(shí)庫(kù)檢索 → 按跨學(xué)科相關(guān)性排序 → LLM合成器將驗(yàn)證過(guò)的鏈條編織成連貫文章。"逆向知識(shí)搜索"發(fā)現(xiàn)概念如何連接,而不僅僅是它們是什么。
結(jié)果對(duì)傳統(tǒng)方法簡(jiǎn)直是碾壓。Plato合成的文章在所有測(cè)試領(lǐng)域——數(shù)學(xué)分析、材料化學(xué)、量子力學(xué)、深度學(xué)習(xí)、免疫學(xué)——都持續(xù)性地包含更多獨(dú)特的、可學(xué)習(xí)的知識(shí)點(diǎn),超越基線LLM。更多實(shí)質(zhì),零水分。
圖片
幻覺(jué)率減半。沒(méi)有檢索上下文的基線LLM:約20%事實(shí)錯(cuò)誤率。基于驗(yàn)證過(guò)的LCoT鏈條的Plato:約10%錯(cuò)誤率。基于預(yù)先驗(yàn)證的推理不僅提升質(zhì)量——它從根本上改變了可靠性。
圖片
圖片
知識(shí)圖譜揭示了"暗物質(zhì)"。120,226個(gè)關(guān)鍵詞節(jié)點(diǎn)聚類(lèi)成7,454個(gè)基礎(chǔ)社區(qū),跨越21個(gè)層級(jí)。數(shù)學(xué)滲透進(jìn)物理學(xué)。物理學(xué)連接到化學(xué)。生物學(xué)橋接到工程學(xué)。傳統(tǒng)百科全書(shū)完全遺漏的跨領(lǐng)域連接,現(xiàn)在清晰可見(jiàn)。
論文標(biāo)題: Inverse Knowledge Search over Verifiable Reasoning: Synthesizing a Scientific Encyclopedia from a Long Chains-of-Thought Knowledge Base
論文鏈接:???https://arxiv.org/abs/2510.26854??
本文轉(zhuǎn)載自??AI帝國(guó)??,作者:無(wú)影寺

















