精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OmniThink:如何讓 LLM 寫出有更有深度的文章

發布于 2025-1-22 13:22
瀏覽
0收藏

摘要

機器寫作通常依賴檢索增強生成技術,但這些方法受限于模型預定義的范圍,難以生成信息豐富的內容。普通檢索的信息往往缺乏深度、實用性,且冗余問題嚴重,導致生成的文章內容淺顯、重復且缺乏原創性。為此,我們提出了 OmniThink 框架,它模擬了人類迭代擴展和反思的認知過程。OmniThink 的核心在于模擬學習者逐步深化對主題理解的認知行為。實驗表明,OmniThink 在不犧牲連貫性和深度的前提下,顯著提升了生成文章的知識密度。人類評估和專家反饋進一步證實了 OmniThink 在生成長篇文章中的實際應用潛力。

??https://arxiv.org/abs/2501.09751??

1. 機器寫作的現狀

由于手動寫作成本高昂,機器寫作(Machine Writing)的關注度越來越高。隨著 LLM 和檢索增強生成(RAG)的興起,機器寫作也迎來了新的機遇。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

為確保內容的真實性和實時性,當前基于 RAG 的自動化寫作系統主要依賴檢索內容生成文章(如上圖)。例如:

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

? STORM 通過角色扮演的問答方式撰寫維基百科式文章,上圖展示了 STORM 使用 GPT4o 生成的關于 AlphaFold 主題的案例:文章中關于“AlphaFold 是由 DeepMind 開發的” 出現重復表達。

? Co-STORM 引入了用戶參與的信息檢索模式

? AutoSurvey 將該框架應用于學術論文寫作

然而,這些方法仍局限于角色自身的范圍,難以生成深度內容并突破知識邊界。檢索到的信息往往缺乏深度、實用性和冗余性,直接影響生成文章的質量,導致輸出內容淺顯、重復且缺乏原創性。

人類在寫作過程中可以自然地避免這些陷阱,通過反思實踐理論(the Theory of Reflective Practice)可以解釋該現象。

根據該理論,人類作者會不斷反思之前收集的信息和個人經驗,重新組織、篩選和優化認知框架。使作者迭代調整寫作方向和思維路徑,最終生成更深刻、細致和原創的內容。

受此啟發,本文作者提出了 OmniThink,一種新的機器寫作框架,模擬人類迭代擴展和反思的認知過程。

2. 什么是 OmniThink 框架?

OmniThink 的核心思想是模擬學習者在逐漸加深對復雜主題理解時的認知行為,以擴展知識邊界。通過不斷反思之前檢索到的信息,OmniThink 可以確定進一步擴展的最佳步驟。

這種 擴展-反思機制(Expansion Reflection Mechanism) 使得檢索策略能夠動態調整,從而促進對相關信息的更深入和全面的探索。一旦收集到多樣化的信息,OmniThink 將進入大綱構建和文章生成的階段。這種迭代的思維過程最終生成更高質量的文章,其中包含更高密度的有用、深刻和原創的內容。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

如上圖,OmniThink 分為三步:信息獲取、大綱構建和文章撰寫。但是在信息獲取階段,通過擴展和反思形成信息樹和概念池,為后續提綱和文章撰寫奠定基礎。

2.1 信息獲取(Information Acquisition)

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

如上圖,擴展和反思的迭代過程最終構建了一個信息樹和一個概念池。

2.1.1 擴展(Expansion)

OmniThink 分析信息樹的所有葉節點,每個節點都會被評估以確定是否需要進一步擴展。

對于需要擴展的節點,OmniThink 使用當前的概念池來確定需要深入擴展的領域或合適的擴展方向

2.1.2 反思(Reflection)

OmniThink 對所有葉子節點中的新信息進行反思。從每個葉子節點提取的信息經過分析、過濾和綜合,提煉出核心見解。這些見解隨后被整合到概念池中,并在整個過程中不斷更新和豐富。

擴展與反思的迭代循環將持續進行,直到 OmniThink 確定已獲取足夠的信息或達到預定義的最大檢索深度。確保獲取的信息是相關、詳細且多樣化的,為生成結構化和信息豐富的文章提供了堅實的基礎。

2.2 大綱構建

大綱是文章的核心,決定了內容方向、結構層次和邏輯推進。要構建一個結構清晰、邏輯連貫的大綱,必須對主題有深入理解。

OmniThink 維護了一個與主題緊密相關的概念池,這代表了 LLM 對主題理解的邊界和深度。

在生成大綱時,首先創建草稿大綱,然后讓 LLM 從概念池中提煉并鏈接內容,最終形成最終大綱。

通過這種方式,LLM 能夠在大綱中全面覆蓋主題要點,并確保文章的邏輯一致性和內容連貫性。

2.3 文章撰寫

完成大綱后,開始為每個部分撰寫內容。

撰寫時,利用部分標題及其子標題,通過計算語義相似度從信息樹中檢索最相關的 K 個文檔。LLM 會根據這些信息生成帶有引用的內容。

所有部分生成后,將被拼接成完整的草稿文章。由于各部分并行生成,其他部分內容尚不明確,會提示 LLM 處理拼接后的文章,刪除冗余信息,最終形成文章。

3. 效果評估方法

通過自動和人工評估相結合的方式來評估生成的長篇文章。

3.1 自動評估

使用 Prometheus 2 對文章進行 0 到 5 分的評分,評估其相關性、廣度、深度和新穎性。還通過信息多樣性和知識密度來衡量信息豐富度。

** 什么是知識密度? **

以往的研究大多關注文章的相關性和正確性,卻忽略了文章的深度。許多生成的文章充斥著冗余信息,與人類的寫作風格相去甚遠。為此,引入了知識密度(KD)的概念,定義為有意義內容與文本總量的比率,公式如下:

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

其中,N 是文檔中原子知識單元的總數,U(ki) 表示第 i 個單元信息 ki 是否唯一,L 為文本總長度。分子表示從長篇文章中提取的獨特知識單元總和,分母則是文章的長度。

知識密度的價值在于它能從信息獲取的角度衡量生成文本的閱讀成本。低 KD 內容往往因冗余或不相關細節讓讀者感到疲勞或失去興趣,而高密度內容則能提供簡潔高效的閱讀體驗。

以往的方法在 KD 上表現有限,因為開放域長文本生成依賴于檢索信息。當檢索信息不夠多樣化時,生成的文章往往包含大量重復和冗余內容。這為優化知識密度提供了空間。

3.2 人工評估

隨機選取 20 個主題,將生成的文章與 Co-STORM(基于自動評估的最佳基線)生成的文章進行對比,并在相同的四個方面進行評分。

4. 效果怎么樣?

4.1 自動評估

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

上圖展示了使用 GPT-4o 和 Qwen-Plus 作為骨干的評估結果。

在四個關鍵評分標準(相關性、廣度、深度和新穎性)的框架下,OmniThink 在所有方面都表現出色,特別是在新穎性指標上,以 GPT-4o 為骨干時尤為突出。

在知識密度方面,OmniThink 采用了一種連續且動態的檢索策略來收集廣泛的信息,這使其在內容生成階段能夠利用更廣泛的資源。這一戰略優勢使 OmniThink 在知識密度指標上優于現有的基準方法。

從結構合理性、邏輯一致性和生成指導性三個方面評估大綱質量。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

從上圖中可以看出,OmniThink 在結構合理性和邏輯一致性方面表現優異。歸功于 OmniThink 概念池的獨特設計,使 LLMs 在大綱生成過程中對目標主題有更全面和多樣化的理解。

有助于更好地指導內容生產,并增強生成內容的整體結構連貫性。然而,模型的邏輯一致性僅比基線略有改善。

4.2 人工評估

邀請了 15 位高學歷志愿者進行人工評估。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

上圖展示了評估結果,OmniThink 在多個維度上的平均表現均優于當前最強的基線模型,尤其在廣度指標上比 Co-STORM 高出 11%。

然而,在創新性指標上,自動化評估顯示 11% 的提升,但人工評估僅發現微弱優勢。表明當前的自動化評估與人類判斷尚未完全一致,為未來長文本評估的改進提供了方向。

盡管 OmniThink 在多個維度上表現優異,但仍有約 30% 的文章被評估者認為與基線模型不相上下。這可能是因為隨著大模型寫作能力的提升,人類越來越難以察覺細微差異。

5. 消融分析

OmniThink 的核心之一是動態擴展與反思機制。對比了 OmniThink 與其簡化版本(無動態擴展與反思機制)。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

如上圖所示,簡化版在文章質量的多個指標上表現遜色,尤其在信息多樣性和新穎性方面。證明了動態擴展與反思機制在提升信息多樣性和文章新穎性上的重要作用。

5.1 擴展與反思分析

深入探討了擴展和反思過程如何影響最終文章的各個方面及其整體質量。

由于擴展和反思在 OmniThink 中相互依賴,單獨評估它們的影響是不現實的。為此,采用了一種間接但系統的方法來評估它們對文章質量的綜合影響。

在信息獲取階段,用性能較低的模型替換擴展模型,并測量生成文章指標的性能下降,以此作為擴展過程影響的指標。同樣,采用相同的方法評估反思過程的影響。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

持續反思擴展知識邊界:反思在新穎性和信息多樣性方面比擴展更為重要。反思不僅讓模型能夠重新評估和內省現有知識,還能以激發更多樣化和廣泛思想的方式整合信息。這種深度內省過程至關重要,因為它通過多樣化的見解豐富了敘述,為創新和多樣化的寫作奠定了基礎。本質上,反思模塊是創造力的關鍵加速器,使模型能夠超越簡單信息增強的限制,構建出獨特且信息豐富的敘述。

擴展增強知識深度并提高信息相關性:擴展在廣度和深度方面比反思更為重要。因為擴展為模型的后續信息檢索設定了方向。通過為檢索過程建立更精確和有效的方向,模型能夠更好地利用檢索到的信息,并將其無縫整合到文本中,從而以更大的深度和廣度豐富內容。這種整合不僅增強了內容的相關性,還提高了知識密度,使文本更加全面和細致。因此,更好的擴展策略能夠打造出更復雜的規劃者,使其能夠更巧妙地應對信息檢索和利用的復雜性。

5.2 思考深度分析

OmniThink 在提升信息檢索方面進行了多次嘗試,本質上是擴展了檢索信息的規模。

OmniThink:如何讓 LLM 寫出有更有深度的文章-AI.x社區圖片

從上圖可以看到,隨著深度從 1 增至 3,生成文章的知識密度和信息多樣性迅速提升。

隨著深度增加,OmniThink 能夠在網絡上搜索到更多樣化的信息,并將其應用于文章生成。

然而,當深度增至 4 時,知識密度和信息多樣性的增長顯著放緩。這可能是因為該主題的可用信息接近搜索極限,難以檢索到更多有用信息。

6. 局限性

? 當前研究僅涉及搜索和文本生成,開放領域中的大量多模態信息尚未被充分利用。

? 文本生成中未考慮個性化語言風格,導致生成的文本偏向學術化,可能不符合普通用戶的閱讀習慣。

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2025-1-22 18:31:44修改
收藏
回復
舉報
回復
相關推薦
国产亚洲综合性久久久影院| 国户精品久久久久久久久久久不卡| 色久综合一二码| 欧洲一区二区在线| 国产精品一区二区免费视频| 欧美精品国产| 精品亚洲一区二区| 日本黄色的视频| 国产网红在线观看| 久久精品在这里| av一区二区三区在线观看| 日本在线播放视频| 亚洲有吗中文字幕| 亚洲欧洲日韩国产| 欧美一级片在线免费观看| 亚洲www.| 亚洲无线码一区二区三区| 日本在线观看一区| 蜜桃久久一区二区三区| 久久国产精品区| 欧美在线精品免播放器视频| 久久久久亚洲av无码专区体验| 同性恋视频一区| 欧美一区二区三区视频免费播放| 麻豆av免费在线| 久草在线视频福利| 亚洲色图欧美偷拍| 日韩三级电影免费观看| 午夜视频www| 国产毛片精品一区| 国产精品丝袜视频| 亚洲黄色免费观看| 亚洲精品三级| 欧美另类极品videosbest最新版本| www.av天天| 欧美一级全黄| 欧美精品一区二区精品网| 婷婷激情5月天| a成人v在线| 色噜噜夜夜夜综合网| 国精产品一区一区三区视频| 怡红院在线播放| 亚洲天堂精品在线观看| 亚洲精品电影在线一区| 国产日产精品久久久久久婷婷| jiyouzz国产精品久久| av成人观看| 精品国产无码一区二区| 精品在线一区二区三区| 国产精品久久久久福利| 天天干天天操天天操| 久久国产日本精品| 日产精品久久久一区二区福利 | 中文字幕一区二区三区在线观看 | 亚洲欧美日韩精品永久在线| 高清成人免费视频| 国产高清不卡av| 亚洲天堂2021av| 久久超碰97人人做人人爱| 国产乱人伦真实精品视频| 亚洲天堂视频网| 九九视频精品免费| 性欧美激情精品| 国产成人亚洲欧洲在线| 亚洲综合激情| 日韩免费观看网站| 依依成人在线视频| 国产一区91精品张津瑜| 99国产视频| 天天干天天干天天干| 91网上在线视频| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 欧美激情视频网站| 四虎成人精品永久免费av| 欧美国产专区| 91精品国产91久久久久久| 国产无人区码熟妇毛片多| 亚洲欧美春色| 国产精品亚洲自拍| aa视频在线免费观看| 高清shemale亚洲人妖| 国新精品乱码一区二区三区18| 性xxxxbbbb| 中文字幕乱码一区二区免费| 大地资源网在线观看免费官网| 成人免费一区二区三区牛牛| 日韩欧中文字幕| 亚洲 国产 图片| 136福利精品导航| 亚洲少妇激情视频| 亚洲最大的黄色网址| 亚洲国产婷婷| 国产精品久久国产精品99gif| 国产老女人乱淫免费| 成人免费黄色大片| 视频一区视频二区视频三区视频四区国产| 男人的天堂在线视频免费观看 | 国产精品30p| 日本美女一区二区三区视频| 成人免费在线视频网站| 色呦呦中文字幕| 国产精品第五页| 国产美女在线一区| 欧美爱爱视频| 日韩黄色在线免费观看| 中文字幕无码日韩专区免费| 国产午夜久久| 亚洲最大的免费| 黄色片在线播放| 一区二区三区在线观看网站| www日韩在线观看| 亚洲经典视频| www.久久久久久.com| 羞羞影院体验区| 国产真实乱子伦精品视频| 欧美不卡三区| 超碰中文在线| 91精品国产麻豆| 夜夜春很很躁夜夜躁| 日本美女视频网站| 鲁片一区二区三区| 性生活免费网站| 中文字幕av资源一区| 日韩五码在线观看| 精品中文视频| 日韩在线欧美在线国产在线| 国产精品男女视频| 成人高清伦理免费影院在线观看| 一本久道久久综合| av在线不卡精品| 亚洲老头老太hd| 五月天婷婷网站| 国产精品性做久久久久久| 五月天婷亚洲天综合网鲁鲁鲁| 九色porny视频在线观看| 制服丝袜亚洲播放| 永久av免费网站| 免费在线观看不卡| 日本精品视频一区| 亚洲最大成人| 日韩理论片久久| 日本在线观看视频网站| 成人手机在线视频| 成人免费播放器| 97久久综合精品久久久综合| 久久精品视频中文字幕| 一二三区在线播放| 国产精品理论片| 制服丝袜综合网| 成人女性视频| 国产精品私拍pans大尺度在线| 成人免费一区二区三区视频网站| 日韩欧美国产网站| 在线不卡av电影| 狂野欧美一区| 先锋影音欧美| 欧美成人毛片| 久久久av一区| 亚洲第一页视频| 亚洲一区在线视频观看| 成人午夜精品无码区| 日韩图片一区| 欧美另类视频在线| 伊人久久综合一区二区| 亚洲视频axxx| 一级特黄色大片| 亚洲精品国产一区二区三区四区在线| 五月天六月丁香| 国一区二区在线观看| 国产视频一区二区不卡| 中文字幕 在线观看| 国产亚洲欧美日韩美女| 中文字幕在线视频第一页| 中文字幕中文字幕一区二区| 成人在线短视频| 亚洲第一在线| 日韩欧美一区二区在线观看| 亚洲欧洲一二区| 欧美—级a级欧美特级ar全黄| 无码精品一区二区三区在线| 色综合久久久久| 久久精品亚洲a| 成人免费高清在线| 国产成人精品视频ⅴa片软件竹菊| 超碰成人久久| 99在线高清视频在线播放| 国产美女精品写真福利视频| 在线成人免费网站| 精品人妻一区二区三区日产乱码| 欧美日韩国产色| 女女互磨互喷水高潮les呻吟| 国产最新精品免费| 国产淫片免费看| 国产精品国产一区| 国产一区二区三区高清视频| yiren22亚洲综合| 欧美精品18videos性欧| 九色在线视频蝌蚪| 欧美成人精品3d动漫h| 激情五月色婷婷| 国产视频一区二区三区在线观看| 亚洲国产午夜精品| 久久精品盗摄| 免费看日本黄色| 日韩理论电影大全| 亚洲最大的网站| 自拍视频在线看| 欧美成人精品在线视频| 免费人成在线观看网站| 日韩欧美综合在线| 亚洲中文无码av在线| 午夜私人影院久久久久| 肉色超薄丝袜脚交69xx图片| 91网上在线视频| 2018国产精品| 久久av老司机精品网站导航| 国产亚洲精品网站| 极品少妇一区二区三区| 亚洲一区二区在线观| 欧美激情在线精品一区二区三区| 波多野结衣一区二区三区在线观看| 老司机精品视频网| 国产91在线播放| 8x8ⅹ拨牐拨牐拨牐在线观看| 久久中文字幕国产| av一区在线观看| 精品五月天久久| 免费观看国产精品| 欧美一三区三区四区免费在线看| jizz国产在线观看| 欧美日韩国产中文字幕| 久久久久久久久99| 一区二区三区四区亚洲| 国产女片a归国片aa| 亚洲欧洲精品一区二区三区 | 欧美a一级片| 国产精品xxx视频| 成人av免费电影网站| 91国内精品久久| www在线看| 久久久久久久久久久91| 羞羞电影在线观看www| 美女啪啪无遮挡免费久久网站| 午夜在线观看视频| 色妞久久福利网| av网站在线免费观看| 最新69国产成人精品视频免费| 亚洲三区在线播放| 亚洲欧美国产精品| 极品白浆推特女神在线观看| 亚洲精品综合精品自拍| 你懂的好爽在线观看| 国产一区二区三区精品久久久| 黄色av网站在线看| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 97精品国产| 一道本在线观看视频| 亚洲一区二区三区无吗| 国产一级大片免费看| 黄色日韩在线| 欧美亚洲国产成人| 日韩av一二三| 一个色综合久久| 国产精品一区二区黑丝| 日本泡妞xxxx免费视频软件| 成人免费视频caoporn| 日本少妇色视频| 欧美激情中文不卡| 国产女片a归国片aa| 精品久久久久久中文字幕一区奶水 | 伊人影院综合在线| 国产久卡久卡久卡久卡视频精品| 一区二区三区四区影院| 久久久久久久久久美女| 貂蝉被到爽流白浆在线观看| 亚洲精品乱码久久久久| 精品国产免费观看| 欧美日韩日本视频| 亚洲黄色片视频| 亚洲欧美另类国产| av中文字幕在线观看| 97超碰蝌蚪网人人做人人爽| 91大神在线观看线路一区| 亚洲综合在线小说| 自拍自偷一区二区三区| 一区二区三区三区在线| 亚洲美女黄网| 婷婷免费在线观看| 成人国产在线观看| 久久一级免费视频| 图片区小说区国产精品视频 | 日韩免费电影一区| 久久久久久青草| 欧美高跟鞋交xxxxxhd| 亚洲第一影院| 99精彩视频在线观看免费| 国产成人手机高清在线观看网站| 欧美性视频在线播放| 国产亚洲综合精品| 中文字幕第10页| 国产午夜精品久久久久久免费视| 免费在线观看av网址| 欧洲av一区二区嗯嗯嗯啊| 免费看av毛片| 久久视频这里只有精品| 中文另类视频| 国内精品久久久久久久果冻传媒| 久久亚洲国产| 国产裸体舞一区二区三区| 国产精品主播直播| 日韩精品在线视频| 性xxxx视频播放免费| 久热精品视频在线免费观看| 激情亚洲影院在线观看| 国产精品免费一区二区三区| 999国产精品| 免费看黄色一级大片| 99视频一区二区三区| 欧美国产日韩综合| 欧美精品一二三四| av一区在线观看| 国产成人精品午夜| 激情小说亚洲图片| www.国产亚洲| 紧缚捆绑精品一区二区| 又嫩又硬又黄又爽的视频| 日韩欧美精品免费在线| 五月婷婷久久久| 欧美激情久久久久| 999国产精品一区| 欧美三级午夜理伦三级老人| 蜜桃视频在线观看一区二区| 国产真实乱人偷精品人妻| 欧美日韩另类字幕中文| 色婷婷激情五月| 羞羞色国产精品| 国内毛片久久| 国产精彩视频一区二区| 国产成人免费视频一区| 日本福利片在线观看| 欧美一区二区三区的| 精品国产丝袜高跟鞋| 国产精品自拍视频| 欧美疯狂party性派对| 777视频在线| 成人欧美一区二区三区黑人麻豆| 欧美激情一区二区三区在线视频| 国产精品毛片一区二区在线看| 日韩高清第一页| 日韩美女精品在线| 国产黄色片免费观看| 久久夜色精品国产亚洲aⅴ| 四虎精品在线观看| 一区二区三区日韩视频| 国产一区二区三区四区在线观看| 国产成人免费在线观看视频| 欧美日产国产精品| 老司机av在线免费看| 91在线观看免费网站| 国产一区二区三区四区老人| 国产国语老龄妇女a片| 香港成人在线视频| 久久伊伊香蕉| 国产精品主播视频| 在线精品视频在线观看高清| av漫画在线观看| 狠狠色狠色综合曰曰| 成人免费黄色网页| 成人中文字幕+乱码+中文字幕| 欧美在线影院| 污污污www精品国产网站| 欧美性少妇18aaaa视频| 成人p站proumb入口| 95av在线视频| 亚洲伦理一区| 波多野结衣一二三四区| 51精品视频一区二区三区| av电影在线免费| 欧美一区1区三区3区公司| 久久av资源网| 日韩免费不卡视频| 国产一区二区三区精品久久久| 精品国产18久久久久久二百| 成人一级生活片| 国产欧美一区二区精品久导航| 国产精品伦理一区| 性欧美暴力猛交69hd| 日韩精品久久久久久久电影99爱| 色婷婷狠狠18禁久久| 日本久久精品电影| 在线中文字幕电影| 欧美理论一区二区| 狠狠色综合播放一区二区| 国产精品男女视频| 大量国产精品视频| 亚洲传媒在线| 91香蕉视频在线观看视频| 色综合久久久久综合体| 欧美日韩经典丝袜| 水蜜桃亚洲精品|