精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT性能最多提升214%,刷新七個榜單!IDEA、港科大廣州等提出ToG思維圖譜

人工智能
與IO、CoT、CoT-SC等不同prompting策略下的ChatGPT(GPT-3.5)相比,Think-on-Graph在所有數據集上的表現都顯著更優。以Zeroshot-RE數據集中的對比為例,基于CoT的ChatGPT精度為28.8%,而同底座的Think-on-Graph精度為88%。

大模型雖好,但「一本正經的胡說八道」的問題該怎么解?

在金融、法律、醫療等嚴肅領域,幻覺問題一直是制約大模型落地應用的主要瓶頸。

如何彌補這部分缺陷,使更多行業能快速加入對新一輪生產力變革的探索,是當下AI研究的重要課題,其中,大模型(LLM)與知識圖譜(KG)的融合來彌補前者的能力短板,是頗受關注的研究方向。

最近,來自IDEA研究院、微軟亞洲研究院、香港科技大學、香港科技大學(廣州)、廈門大學和美國南加州大學的研究團隊推出Think-on-Graph(思維圖譜)技術,通過LLM與KG的緊耦合交互,驅動LLM agent在知識圖譜上「思考」,逐步搜索推理出最優答案。

圖片圖片

論文地址:https://arxiv.org/abs/2307.07697

代碼鏈接:https://github.com/IDEA-FinAI/ToG

下面,我們先用一個刁鉆的問題來認識Think-on-Graph的「腦回路」:如何客觀評價段譽和洪七公誰的武功更高強?(段譽出自《天龍八部》,洪七公出自《射雕英雄傳》,兩者未在同一部作品中出現。)

首先看看地表最強大模型GPT-4是怎么說的:

圖片圖片

由于LLM是經由海量碎片化語料訓練而成,此類線索分析型的推理問題確實對其挑戰很大。從回答中不難看出,除了幻覺現象的出現之外,在比較兩位人物的武功水平時,GPT-4著重羅列表象事實,缺乏深度的邏輯分析。那么, Think-on-Graph是怎樣解題的呢?

圖片圖片

首先,圖譜知識顯示,六脈神劍是大理段氏最強武功,而一陽指是大理段氏常用武功,大模型由此判斷「六脈神劍」強于「一陽指」;繼而推理出段譽武功強于以一陽指冠絕江湖的一燈大師。然后,又根據圖譜上的「一燈大師與洪七公同屬『華山四絕』」,推理出兩者武功相當。最終,段譽>一燈大師,而一燈大師=洪七公,于是得出結論:段譽武功更高。可見,融合了結構化知識與大模型推理能力的Think-on-Graph,不僅條理清晰,還提供了可追溯的推理鏈條。LLM從「翻譯官」變「跑腿」,與KG緊耦合實現深度推理眾所周之,大模型擅長理解、推理、生成與學習;知識圖譜則因其結構化的知識存儲方式,在邏輯鏈條推理上表現更佳,且具備更好的推理透明度與可信度。兩者是互補度極高的好拍檔,關鍵在于能否找到好的結合方式,據研究人員介紹,目前主流的方法有兩類。第一類是在模型預訓練或微調階段,將知識圖譜嵌入到一個高維向量空間,并與大模型的嵌入向量相融合。但此類方法不僅耗時、耗算力,也無法發揮知識圖譜的許多天然優勢(如:實時知識更新、可解釋性、推理可追溯等)。第二類路徑則利用知識圖譜的知識結構,通過prompt engineering來進行兩者的融合,這之中又分松耦合、緊耦合兩種范式。

圖片圖片

 松耦合范式中的LLM相當于「翻譯官」,理解用戶的自然語言輸入后,將其翻譯成知識圖譜中的查詢語言,將KG上的搜索結果反向翻譯給用戶,這種范式對知識圖譜本身的質量與完整度要求極高,忽略了大模型的內在知識與推理能力。

圖片圖片

 在Think-on-Graph所代表的緊耦合范式中,LLM變身「跑腿」,作為agent在KG的關聯實體上一步一步搜索推理出最優答案。因此,在每一步推理中,LLM都親自參與,與知識圖譜取長補短。在研究中,團隊用以下例子展示了緊耦合范式的優勢:堪培拉所在國家當前的多數黨是哪個黨派?

圖片圖片

 從上面例子中可以看出,ChatGPT由于信息滯后,給出了錯誤答案。松耦合范式下,盡管引入了包含最新信息的KG,但由于缺少「多數黨」信息,導致推理無法完成;而在緊耦合范式中,LLM自行推理出「議會制國家的政府首腦通常也是多數黨領袖」,彌補了KG中的信息缺失,繞道推理出正確答案。Think-on-Graph,高效的緊耦合新范式據研究團隊介紹,Think-on-Graph借鑒了Transformer的beam-search算法思路。該算法為一個可循環的迭代過程,每次循環需先后完成搜索剪枝、推理決策兩個任務。搜索剪枝用于找出最有希望成為正確答案的推理路徑,推理決策任務則通過LLM來判斷已有的候選推理路徑是否足以回答問題——如果判斷結果為否,則繼續迭代到下個循環。我們依然以「堪培拉所在國當前的多數黨是哪個黨派?」為例來解釋。 

圖片圖片

案例:用搜索寬度N=2的beam-search實現Think-on-Graph推理在搜索剪枝任務中,大模型從關鍵詞Canberra出發,匹配到知識圖譜中最接近(或一致)的實體,分別搜索了5個「關系→實體」對,并為它們打分(得分越高,則代表此新實體加入推理路徑中,可正確回答問題的能力越高)。       

圖片圖片

將分數從高到低排序后,LLM保留了得分最高的2個,形成兩條候選推理路徑:接下來,LLM對候選推理路徑進行評估,并將結果以Yes/No的形式反饋給算法。在案例中可見,LLM連續兩輪否決了候選路徑,直到完成第三輪迭代時,LLM才判斷已獲取回答問題的充分信息,因此停止算法迭代,向用戶輸出答案(該答案確為正確答案)。 

圖片圖片

大模型推理如何更可信?可解釋、可追溯、可修正研究團隊表示,Think-on-Graph算法還有效提升了大模型推理的可解釋性,并實現知識的可追溯、可糾錯與可修正。尤其是借助人工反饋與LLM推理能力,發現并修正知識圖譜中的錯誤信息,彌補LLM訓練時間長、知識更新慢的缺點。為測試此能力,我們設計了一個實驗:在前述「段譽與洪七公武功對比」案例的知識圖譜中,故意摻入錯誤信息「大理段氏的最強武功是一陽指,一般武功是六脈神劍」。

圖片圖片

   可見,盡管Think-on-Graph根據錯誤知識得出了錯誤答案,但由于算法內置的「自我反思」能力,當判斷答案可信度不足時,會自動回溯在知識圖譜上的推理路徑,檢查路徑中的所有三元組。此時,LLM將利用自有知識,將疑似有誤的三元組挑選出來,并向用戶反饋分析與糾錯建議。 

圖片圖片

7個新SOTA,深度推理較ChatGPT最多提升214%研究在四類知識密集型任務(KBQA, Open-Domain QA, Slot Filling, Fact Checking)的共9個數據集上,對Think-on-Graph的表現進行了評估。

圖片圖片

與IO、CoT、CoT-SC等不同prompting策略下的ChatGPT(GPT-3.5)相比,Think-on-Graph在所有數據集上的表現都顯著更優。以Zeroshot-RE數據集中的對比為例,基于CoT的ChatGPT精度為28.8%,而同底座的Think-on-Graph精度為88%。當底座模型升級為GPT-4后,Think-on-Graph的推理精度也明顯提升,在7個數據集上取得了SOTA,剩余數據集中的CWQ上也十分接近SOTA。值得注意的是,Think-on-Graph未在上述任何測試數據集上進行過監督學習性質的增量訓練或增量微調,體現出超強的即插即用能力。此外,研究者還發現,即便替換小規模的底座模型(如LLAMA2-70B),Think-on-Graph依然可在多個數據集上超越ChatGPT,這或可為大模型使用者提供一條低算力需求的技術路線選擇。

參考資料:

https://arxiv.org/abs/2307.07697

https://github.com/IDEA-FinAI/ToG

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-03-14 13:25:24

ChatGPT人工智能

2022-10-08 13:13:14

Python程序性能

2023-11-01 18:01:02

改進WakaTime編程

2022-08-17 09:54:57

Java性能優化

2023-04-13 15:40:59

模型論文

2024-07-01 18:04:57

2023-11-09 15:10:00

訓練數據

2025-11-20 08:52:48

2023-03-13 10:49:30

ChatGPT人力資源

2025-06-12 11:56:30

模型框架開源

2024-09-26 06:21:59

Python代碼

2024-09-25 08:00:00

Python文件處理

2025-01-10 08:38:16

2025-01-17 11:07:28

2023-09-05 12:35:47

2024-06-04 00:00:02

實用插件IDEA

2025-02-19 12:00:00

JavaScript代碼數組方法

2024-10-07 10:00:00

Python代碼編碼

2024-09-20 09:37:31

2024-05-21 00:00:00

點贊
收藏

51CTO技術棧公眾號

亚洲黄色大片| 国产区美女在线| 老鸭窝毛片一区二区三区| 欧美色视频日本高清在线观看| 精品粉嫩超白一线天av| 亚洲精品一区二区三区福利| 久久精品视频16| 一区二区黄色片| 国产精品一区二区美女视频免费看 | 国产精品一级在线| 亚洲精品美女网站| 日韩欧美在线免费观看视频| av软件在线观看| 99久久国产综合精品女不卡| 国产va免费精品高清在线观看| 国产免费黄色av| 黄色一级大片在线免费看国产| 久久99伊人| 欧美日韩福利电影| 精品人伦一区二区| 成人黄色av网址| 亚洲mmav| 国产欧美日韩综合一区在线播放| 亚洲日本中文字幕免费在线不卡| 国产91aaa| 欧美日韩在线视频免费播放| 日本加勒比一区| 欧美久久亚洲| 欧美日韩精品一区二区在线播放| 91精品国产综合久久香蕉的用户体验| 久久亚洲精品大全| 亚州国产精品| 天天操天天综合网| 国产一区二区四区| 国产黄色小视频在线| 国产日韩影视精品| 欧美凹凸一区二区三区视频| 51国偷自产一区二区三区| 久久免费视频3| 精品成人一区二区三区免费视频| 欧美理论电影大全| 91精品国产品国语在线不卡| 欧美精品99久久| 蜜桃传媒在线观看免费进入| 韩国三级中文字幕hd久久精品| 久久久久久久激情视频| 欧美成人精品欧美一| 色天天综合网| 亚洲视频欧美视频| 午夜精产品一区二区在线观看的| 成人影院入口| 欧美性猛交xxxx富婆弯腰| 缅甸午夜性猛交xxxx| 人交獸av完整版在线观看| 一区二区三区在线观看欧美| 亚洲黄色网址在线观看| 国模精品娜娜一二三区| 成人一级片免费看| 欧美日韩伦理在线免费| 国产亚洲精品久久久久久| 久久精品成人av| 国产一区二区三区91| 亚洲综合在线免费观看| 国产精品va在线播放我和闺蜜| 日本少妇激情舌吻| 综合激情婷婷| 欧美一区二区三区免费视频| 99中文字幕在线| 国产精品久久久久久久久久久久久久久| 51午夜精品国产| 麻豆短视频在线观看| 国产精品毛片久久久| 亚洲国模精品一区| 亚洲色成人网站www永久四虎| 久久精品黄色| 欧美一区二区视频在线观看2020 | 青青草原在线免费观看| 亚洲精品国产嫩草在线观看| 日韩欧美亚洲成人| 极品美女扒开粉嫩小泬| 成人在线黄色电影| 色综合天天综合网国产成人综合天 | 亚洲三区在线观看无套内射| 国产成人精品aa毛片| 国产伦精品一区| 性少妇videosexfreexxx片| 国产在线国偷精品产拍免费yy| 成人国内精品久久久久一区| 亚洲精品中文字幕成人片 | 久久久高清一区二区三区| 亚洲精品女av网站| 三区在线视频| 天天爽夜夜爽夜夜爽| 日韩在线一区二区| 国产精品久久97| 国产精品久久久久久久久毛片 | 国产精品视频一| 国产精品无码AV| 亚洲精华一区二区三区| 欧美无乱码久久久免费午夜一区 | 美国毛片一区二区| 草莓视频一区| 国产精品黄色网| 精品综合免费视频观看| 精品国产一区二区三区免费 | 成人乱码一区二区三区| 午夜一区二区三区四区| 国产综合精品| 日韩欧美一区中文| 91视频啊啊啊| 成人vr资源| 九九热这里只有在线精品视| 无码人妻精品一区二区三区蜜桃91 | 久久综合中文字幕| 先锋影音一区二区三区| av资源在线看片| 伊人开心综合网| 动漫av免费观看| 都市激情久久| 免费91在线视频| 中文字幕人妻精品一区| 91免费视频网址| 六月婷婷激情综合| 五月婷婷之婷婷| 国产永久免费高清在线观看| 国产精品嫩草99a| 中文字幕久久一区| 亚洲一区站长工具| 日韩欧美在线综合网| 最新中文字幕2018| 一区二区三区伦理| 成人精品国产一区二区4080| 精品国产免费人成电影在线观... 精品国产免费久久久久久尖叫 | 深夜成人在线| 欧美一区二区免费| 男女一区二区三区| 影音先锋亚洲电影| 91传媒视频免费| а√天堂官网中文在线| 在线成人免费视频| 青青操在线视频观看| 日韩国产欧美在线观看| 欧美日韩精品久久| 欧美啪啪免费视频| 免费观看国产视频| 亚洲人午夜精品天堂一二香蕉| 久久精品香蕉视频| 亚洲人成网www| 米奇精品一区二区三区在线观看| 中国女人真人一级毛片| 91网上在线视频| 少妇高潮毛片色欲ava片| av影院在线免费观看| 亚洲成年人在线播放| 国产精品白浆一区二小说| 另类激情亚洲| 任我爽在线视频精品一| 625成人欧美午夜电影| 精品香蕉一区二区三区| 五月天丁香激情| 国产一区二区91| 正在播放精油久久| 裤袜国产欧美精品一区| 欧美一三区三区四区免费在线看 | 一区二区三区四区视频精品免费| 午夜影院免费观看视频| 亚洲综合中文| 99久久精品免费看国产四区| 97电影在线| 亚洲综合精品久久| 91人妻一区二区| 天天色棕合合合合合合合| 1769在线观看| 欧美成人三区| 99精品人妻无码专区在线视频区| 国产精品美女一区| 国产在线不卡av| 9999在线观看| 黄色免费视频大全| 亚洲啪av永久无码精品放毛片 | 亚洲高清视频免费观看| 国产精品区在线观看| 污污网站在线免费观看| 免费看黄网站在线观看| 三级中文字幕在线观看| jizz内谢中国亚洲jizz| 亚洲网一区二区三区| 无人区乱码一区二区三区| 精品国产乱码久久久| 亚洲精品97| 久久综合伊人| 播五月开心婷婷综合| 国产精品传媒在线| 欧美精品自拍偷拍动漫精品| 免费激情视频在线观看| 中文字幕在线观看不卡视频| 91精品啪在线观看国产18| 久久99最新地址| 麻豆精品一区二区综合av| 国产一区在线看| 日本一区二区免费在线| 久草精品视频在线观看| 免费看av毛片| www成人在线观看| 午夜不卡av免费| 91丝袜国产在线播放| 亚洲午夜羞羞片| 韩国三级在线一区| 久久久久久久久97黄色工厂| 亚洲狠狠丁香婷婷综合久久久| 亚洲欧美在线视频观看| 亚洲综合视频网| 亚洲伊人伊色伊影伊综合网| 婷婷丁香激情综合| 欧美色手机在线观看| 在线中文字幕一区二区| 亚洲欧洲在线视频| 日韩av有码在线| 国产成人精品免费视频| 91成人免费看| 99久久99久久精品| 老女人性生活视频| 中国特黄一级片| 在线免费黄色av| 污视频网站免费观看| 亚洲按摩av| 精品一区二区三区中文字幕视频| 美女视频久久久| 国产一区二区三区四区视频 | 久久影视电视剧免费网站| 国产美女久久精品| 少妇高潮喷水久久久久久久久久| 一区二区成人网| 正在播放木下凛凛xv99| 免费看91的网站| 日韩资源av在线| 国产性生交xxxxx免费| 国产在线精品播放| 日本黄色播放器| 国产精品自拍首页| 91九色露脸| 亚洲成年人av| 久久人人爽人人爽人人片av免费| 免费av网站在线播放| 搞黄视频免费在线观看| 日韩va在线观看| 妺妺窝人体色www在线观看| 国产成人精品无码片区在线| 青青草华人在线视频| 国产一区二区三区三州| heyzo在线| 最新精品国偷自产在线| 欧美第一精品| 美腿丝袜在线亚洲一区 | 日本高清不卡aⅴ免费网站| 日韩一级成人av| 91高潮在线观看| 久久精品久久精品国产大片| 国产一区二区视频免费在线观看| 丁香六月激情综合| 天天摸夜夜添狠狠添婷婷| 91麻豆精品国产综合久久久 | 激情综合激情五月| 日本爱爱免费视频| 成人免费视频国产免费观看| 久久夜色精品亚洲| 女人天堂av在线播放| 深爱激情综合网| 成人久久综合| 91在线观看地址| 中文字幕佐山爱一区二区免费| 日本韩国一区二区三区视频| 久久久国产影院| 国产乱子伦精品| 中文字幕乱妇无码av在线| 欧美一区二区三区网站| 久久一卡二卡| 欧美高清在线| 久久影院电视剧免费观看| 欧美成人激情免费网| 国产精品视频自在线| 久久久亚洲精选| 国产999在线观看| 自拍日韩亚洲一区在线| 欧美性xxxxhd| 欧美一区第一页| 久久国产成人精品国产成人亚洲| 欧美日韩亚洲国产另类| 91精品国产91久久久久游泳池 | 亚洲综合99| 亚洲综合免费观看高清在线观看| 深夜福利一区二区| 亚洲一区二区高清视频| 中文字幕久久综合| 亚洲 欧美 日韩 在线| 超碰在线cao| 久久电影网电视剧免费观看| 亚洲一卡二卡三卡四卡| 免费永久网站黄欧美| 97精品国产97久久久久久久久久久久| 日韩一区二区中文字幕| 成人免费看片视频| 97免费公开视频| 成人免费公开视频| 国产成人在线中文字幕| 91网站最新网址| yellow中文字幕久久| 国产精品18久久久久久首页狼| 99福利在线观看| 国产乱色精品成人免费视频 | 国产成人ay| 不卡的电视剧免费网站有什么| 亚洲欧美日韩天堂| 免费成人进口网站| 日日夜夜狠狠操| 盗摄牛牛av影视一区二区| 久久久天堂av| 午夜剧场成人观在线视频免费观看| 国外色69视频在线观看| 超碰97在线人人| 亚洲精品国产精品国自| 国产传媒在线播放| 国产亚洲一区二区三区不卡| 国产精品网站一区| 亚洲va韩国va欧美va精品 | 福利一区二区在线| 精品日韩成人av| 97人人干人人| 91精品国自产在线| 在线网址91| 午夜亚洲视频| 亚洲精品国产精品国自产观看浪潮 | av亚洲产国偷v产偷v自拍| 亚洲欧洲在线视频| 欧美 丝袜 自拍 制服 另类| 免费av网站在线播放| 亚洲国产二区| 日韩高清a**址| 国产免费黄视频| av女优在线| 日韩精品欧美精品| 一本色道久久| 精品少妇一区二区| 国产精品久久久久7777| 99久久国产热无码精品免费| 亚洲国产老妈| 久久国产亚洲| 欧美三级电影网| 自拍偷拍一区二区三区| 亚洲一区二区影视| 91精品国产福利在线观看麻豆| 国产欧美一区二区在线观看| 国产成人在线一区二区| 日本中文字幕免费在线观看| 亚洲三级av| 91久久人澡人人添人人爽欧美| 国产一级精品aaaaa看| 妺妺窝人体色www婷婷| 日日天天久久| 日韩视频在线永久播放| 久久人人爽人人爽人人av| 黄色在线免费观看大全| 国产一区999| 秋霞成人午夜鲁丝一区二区三区| 久久久亚洲精选| 免费观看一级一片| 亚洲欧美在线综合| 欧美偷拍一区二区| 97在线免费视频观看| 黄色在线免费观看大全| 国产寡妇亲子伦一区二区| 欧美一区在线直播| 天天干天天插天天射| 久久亚洲二区三区| av不卡在线免费观看| 精品影院一区| 国产精品亚洲一区二区三区妖精 | 五月天色一区| 青青草视频在线观看| 国产亚洲精品aa| 欧美日韩在线精品一区二区三区| 国产模特av私拍大尺度| 蜜桃久久av| 美女福利视频一区| 无码黑人精品一区二区| 视频免费一区二区| 欧美日韩亚洲国产综合| 精品久久久久久久无码| 粉嫩av一区二区三区四区五区 | 91久久久久久久久久久| 999国产在线视频| 一区二区在线观看视频| 777久久精品一区二区三区无码| 国产丝袜在线观看视频| 亚洲成av人片一区二区三区| 无码毛片aaa在线| 91高清在线| 中文字幕亚洲综合久久菠萝蜜| 免费日韩av电影| 欧美黄色三级|