精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2024|杜克大學(xué)&谷歌提出SLED解碼框架,無需外部數(shù)據(jù)與額外訓(xùn)練,有效緩解大語言模型幻覺,提高事實準(zhǔn)確性

人工智能 新聞
本研究通過引入自驅(qū)動 Logits 進(jìn)化解碼(SLED)方法,成功地提升 LLM 在多種任務(wù)中的事實準(zhǔn)確性。

此項研究成果已被 NeurIPS 2024 錄用。該論文的第一作者是杜克大學(xué)電子計算機(jī)工程系的博士生張健一,其主要研究領(lǐng)域為生成式 AI 的概率建模與可信機(jī)器學(xué)習(xí),導(dǎo)師為陳怡然教授。

大語言模型(LLM)在各種任務(wù)上展示了卓越的性能。然而,受到幻覺(hallucination)的影響,LLM 生成的內(nèi)容有時會出現(xiàn)錯誤或與事實不符,這限制了其在實際應(yīng)用中的可靠性。

針對這一問題,來自杜克大學(xué)和 Google Research 的研究團(tuán)隊提出了一種新的解碼框架 —— 自驅(qū)動 Logits 進(jìn)化解碼(SLED),旨在提升大語言模型的事實準(zhǔn)確性,且無需依賴外部知識庫,也無需進(jìn)行額外的微調(diào)。

圖片

  • 論文地址:https://arxiv.org/pdf/2411.02433
  • 項目主頁:https://jayzhang42.github.io/sled_page/
  • Github地址:https://github.com/JayZhang42/SLED
  • 作者主頁:https://jayzhang42.github.io

研究背景與思路總結(jié)

近期相關(guān)研究顯示,盡管用戶在訪問大語言模型(LLM)時可能無法得到正確的答案,但 LLM 實際上可能已經(jīng)基于海量的訓(xùn)練數(shù)據(jù)和漫長的訓(xùn)練周期學(xué)到了正確的答案,并將其存儲于模型內(nèi)部某處。

研究者將這類無法直觀從模型輸出中獲得的信息稱為 “潛在知識”,并用圖一精煉出了對應(yīng)的 “三體問題”。

圖片圖一:Factuality Decoding 的 “三體問題”

圖一中,考慮到每條問題的標(biāo)準(zhǔn)答案都已包含訓(xùn)練數(shù)據(jù)集中,因此可以說訓(xùn)練時,真實世界的事實分布是已知的。LLM 的訓(xùn)練正是為了縮小 LLM 輸出分布 圖片和真實事實分布圖片 之間的差距。

然而,在 LLM 的推理階段(inference time),真實的事實分布是未知的,因此這項研究的重點便是如何挖掘模型的潛在知識分布,并利用其進(jìn)一步增強(qiáng)模型的輸出。

概括來說, SLED 方法通過對比最后一層的圖片和前面幾層的圖片,有效地挖掘了 LLMs 內(nèi)部的潛在知識。

同時,研究者也指出 LLM 中的潛在知識雖然有價值,但可能并不完美。因此,SLED 不是簡單地使用這些潛在知識替換原始輸出,而是通過類似于對輸出 圖片 進(jìn)行 “梯度下降” 的操作,將其整合到原始輸出圖片中,從而有效地平衡了兩者,避免了過擬合等潛在的風(fēng)險。

圖片

圖二:SLED 框架的主要流程

方法設(shè)計

為了提高事實準(zhǔn)確性,需要確保正確的 token圖片, 在輸出分布圖片中獲得更高的概率。這一過程可以通過優(yōu)化以下?lián)p失函數(shù) L 來描述圖片其中圖片

研究者將這一優(yōu)化過程稱為 Logits 進(jìn)化。有趣的是,這同時也為理解 LLM 的訓(xùn)練提供了新的視角 —— 不同于之前只關(guān)注訓(xùn)練中模型參數(shù)的更新,可以看到:

  • LLM 的訓(xùn)練實際上一個是由訓(xùn)練數(shù)據(jù)集作為外部驅(qū)動的 Logits 進(jìn)化過程;
  • LLM 的訓(xùn)練為這個優(yōu)化過程找到的解就是最后一層的輸出 圖片

從上面的理解出發(fā),可以預(yù)期最后一層的輸出的圖片對應(yīng)的圖片,通常要比前面幾層的輸出 圖片對應(yīng)的圖片要更接近訓(xùn)練時的圖片。這一點也在圖三中得到了驗證。

圖片

圖三:研究者對三個不同規(guī)模的 LLaMA-2 模型計算了每一層對應(yīng)的交叉熵?fù)p失。結(jié)果證實,就 KL 散度而言,最終層的 Logits 輸出分布比所有早期層更接近真實世界的分布

因此,受到經(jīng)典梯度下降算法的啟發(fā),研究者通過如下的近似來反向估計圖片 

圖片

這里對 圖片 的估計,實際上也就是之前提到的潛在知識,因此用圖片來表示。在此基礎(chǔ)上,研究者通過類似梯度下降的方式,用估計出來的潛在知識圖片,實現(xiàn)了對 圖片 自驅(qū)動進(jìn)化,

圖片

從而得到了一個更接近事實分布的最終輸出圖片。更細(xì)節(jié)的方法設(shè)計和討論,請參考原文。

實驗驗證

作為一種新型的層間對比解碼架構(gòu),研究者首先將 SLED 與當(dāng)前最先進(jìn)的方法 DoLa 進(jìn)行了比較。實驗覆蓋了多種 LLM families(LLaMA 2, LLaMA 3, Gemma)和不同模型規(guī)模(從 2B 到 70B),還有當(dāng)前備受關(guān)注的混合專家(MoE)架構(gòu)。

結(jié)果表明,SLED 在多種任務(wù)(包括多選、開放式生成和思維鏈推理任務(wù)的適應(yīng)性)上均展現(xiàn)出明顯的事實準(zhǔn)確性提升。

圖片

此外 SLED 與其他常見的解碼方式(如 contrastive decoding,ITI)具有良好的兼容性,能夠進(jìn)一步提升性能。

圖片

最后,研究者發(fā)現(xiàn),與以往的算法相比,SLED 在計算上幾乎沒有明顯的額外開銷。同時,在生成質(zhì)量方面,SLED 顯著抑制了以往方法中的重復(fù)性問題,進(jìn)一步優(yōu)化了輸出結(jié)果。

圖片

引申思考:與目前流行的 inference-time 算法的聯(lián)系

實際上,不難看出,SLED 為后續(xù)的推理時(inference-time )算法提供了一個新的框架。與目前大多數(shù) inference-time computing 方法主要集中于 sentence level 的輸出或 logits 進(jìn)行啟發(fā)式修改不同,SLED 與經(jīng)典優(yōu)化算法銜接,如梯度下降法的結(jié)合更為緊密自然。

因此,SLED 不僅優(yōu)化效率更高,同時有很多的潛在的研究方向可以嘗試;另一方面,與 inference time training 方法相比,SLED 不涉及模型參數(shù)層面的修改,因此優(yōu)化效率上開銷更小,同時更能保持模型原有性能。

總結(jié)

本研究通過引入自驅(qū)動 Logits 進(jìn)化解碼(SLED)方法,成功地提升 LLM 在多種任務(wù)中的事實準(zhǔn)確性。展望未來,可以探索將 SLED 與監(jiān)督式微調(diào)方法結(jié)合,以適應(yīng)其他領(lǐng)域的特定需求如醫(yī)療和教育領(lǐng)域。同時,改進(jìn)框架設(shè)計也將是持續(xù)關(guān)注的方向。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2020-06-18 11:10:16

AI人工智能神經(jīng)網(wǎng)絡(luò)

2025-09-10 09:15:00

AI模型數(shù)據(jù)

2025-02-10 08:40:00

訓(xùn)練數(shù)據(jù)模型

2024-12-23 13:28:22

2024-12-11 08:12:24

2021-01-29 09:17:00

深度學(xué)習(xí)AI人工智能

2024-01-04 16:41:29

大型語言模型自然語言處理

2024-12-09 13:20:50

2024-01-12 10:29:26

2022-08-19 09:53:20

人工智能大數(shù)據(jù)風(fēng)險

2025-11-20 08:38:46

2025-09-28 09:10:00

2024-10-10 14:10:00

AI模型

2024-10-25 14:00:00

AI語言模型

2014-08-25 13:39:29

光纜故障

2025-06-03 09:08:00

2024-12-18 13:24:30

谷歌AI大語言模型

2019-12-30 09:41:59

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2024-09-13 12:31:21

谷歌DataGemmaAI

2024-11-27 13:36:10

點贊
收藏

51CTO技術(shù)棧公眾號

欧美韩日一区| 天堂网在线最新版www中文网| 国产原创一区二区| 性欧美办公室18xxxxhd| 欧美丰满美乳xxⅹ高潮www| 免费一区二区三区四区| 亚洲一区av在线| 欧洲国产精品| 性欧美一区二区三区| 久久成人免费| 久久久噜噜噜久久中文字免| 国产成人免费观看网站| 成人在线tv视频| 欧美久久高跟鞋激| 国模吧无码一区二区三区| 国产精品一区二区三区视频网站| 99国产欧美另类久久久精品| 亚洲一区二区三区sesese| 亚洲视频 欧美视频| 欧美成人首页| 色黄久久久久久| 亚洲一区二区三区四区五区六区| 高清一区二区中文字幕| 日本韩国欧美一区二区三区| 国产婷婷一区二区三区| 国产网友自拍视频导航网站在线观看| 国产亚洲午夜高清国产拍精品| 国产精品免费视频一区二区| 国产伦精品一区二区三区免.费| 亚洲欧美日本日韩| 国外色69视频在线观看| 久久99久久久| 亚洲一级淫片| www.亚洲人.com| 男人舔女人下部高潮全视频| 宅男在线一区| 日韩激情片免费| 无码国产精品一区二区免费式直播| 成人豆花视频| 56国语精品自产拍在线观看| 久久久久久香蕉| 97成人资源| 色综合久久天天| 苍井空浴缸大战猛男120分钟| 涩涩涩视频在线观看| 精品国产91乱高清在线观看 | 国产一级片中文字幕| 欧美一区=区三区| 欧美日韩精品一区二区三区| www欧美激情| 国产乱子精品一区二区在线观看| 欧美亚洲免费在线一区| 韩国视频一区二区三区| 国产综合色在线观看| 欧美日韩一区二区欧美激情| 男女视频在线看| 精品久久毛片| 91精品国产美女浴室洗澡无遮挡| 欧美视频亚洲图片| 免费观看亚洲天堂| 精品91自产拍在线观看一区| 亚洲av无码一区二区三区观看| 色哟哟精品丝袜一区二区| 亚洲精品资源美女情侣酒店| 91视频免费观看网站| 精品av一区二区| 最好看的2019的中文字幕视频| 成人黄色短视频| 欧美喷水视频| 66m—66摸成人免费视频| 中文字幕视频网站| 免费观看在线综合| 91精品国产高清久久久久久91裸体| 亚洲精品无码久久久| 97久久精品人人澡人人爽| 欧美韩国日本精品一区二区三区| 9i精品一二三区| 亚洲日本va在线观看| www.激情网| 黑人巨大精品| 69av一区二区三区| 成年人的黄色片| 日韩高清欧美| 久久91精品国产91久久久| 亚洲精品视频在线观看免费视频| 日日夜夜精品视频天天综合网| 91成人免费视频| 日韩a级作爱片一二三区免费观看| 国产日韩欧美a| 欧美日韩激情四射| 国产亚洲一区二区手机在线观看| 日韩欧美一区电影| 亚洲精品色午夜无码专区日韩| 欧美国产三级| 国产aⅴ夜夜欢一区二区三区| 国产精品嫩草影院精东| 91亚洲国产成人精品一区二区三| 一区二区三区国产福利| 国产精品一区二区日韩| 欧美精品1区2区3区| 五十路六十路七十路熟婆| 99精品全国免费观看视频软件| 性色av一区二区三区| 国产一区二区视频免费观看| xfplay精品久久| 日本免费黄色小视频| 亚洲一区二区三区四区| 亚洲精品黄网在线观看| 一级片一级片一级片| 久久午夜精品一区二区| 国产日韩一区欧美| 成人免费在线| 精品视频资源站| 久久美女免费视频| 一区二区动漫| 国产久一道中文一区| 久久77777| 欧美日韩一区在线| 丰腴饱满的极品熟妇| 精品99视频| www 成人av com| 麻豆传媒在线完整视频| 日本乱人伦aⅴ精品| 在线观看日韩精品视频| 在线观看一区| 亚洲www视频| 麻豆网站在线| 欧美精品777| 麻豆精品国产免费| 久草精品在线观看| 一区二区三区在线视频111| 日韩精选视频| 一道本无吗dⅴd在线播放一区| 国产专区第一页| 91在线观看地址| 国产精品裸体瑜伽视频| 久久99国产精品久久99大师| 久久久免费在线观看| 亚洲男人天堂久久| 亚洲一区二区三区在线播放| 亚洲熟女乱综合一区二区| 亚洲综合五月| 亚洲一区中文字幕| 91国内在线| 成人高清在线视频| 日韩你懂的在线播放| 亚洲波多野结衣| 国产做a爰片久久毛片| 中文字幕一区二区三区在线乱码| 一区二区三区无毛| 欧美成人剧情片在线观看| 国产视频手机在线观看| 亚洲综合成人在线| 加勒比精品视频| 麻豆九一精品爱看视频在线观看免费| 另类视频在线观看+1080p| 国产欧美一区二区三区精品酒店| 亚洲性夜色噜噜噜7777| 中文字幕免费视频观看| 国产精品夫妻自拍| 欧美激情第四页| 精品福利av| 欧美性大战久久久久| 91精品店在线| 欧美成人精品三级在线观看| 日本加勒比一区| 在线观看网站黄不卡| 日韩一区二区三区四区视频| 国产精品自拍毛片| 日韩在线视频在线观看| 不卡一区2区| 51成人做爰www免费看网站| www视频在线观看| 亚洲人精品午夜在线观看| 91av久久久| 亚洲福利电影网| 免费看的黄色录像| 国产成人久久精品77777最新版本| 日本www在线视频| 日本精品黄色| 粉嫩av免费一区二区三区| 国偷自产一区二区免费视频| 久久成人国产精品| 你懂的在线视频| 日韩亚洲欧美成人一区| 7799精品视频天天看| 亚洲色图一区二区三区| 亚洲最大免费视频| 精东粉嫩av免费一区二区三区| 可以看毛片的网址| 久久视频在线| 欧美精品欧美精品系列c| 精品国产亚洲一区二区三区大结局| 欧美最猛性xxxxx(亚洲精品)| 国产精品一区二区三区视频网站| 国产视频精品xxxx| 精品人妻少妇嫩草av无码专区| 欧美午夜丰满在线18影院| 久草手机视频在线观看| 2020国产精品自拍| 久久综合桃花网| 日本欧美大码aⅴ在线播放| 日韩精品一区二区在线视频 | 日韩av在线天堂| 国产精品高潮久久久久无| wwwwxxxx国产| 成人免费va视频| 欧美美女一级片| 久久综合婷婷| av免费观看网| 韩日在线一区| 中国 免费 av| 久久久综合色| 日本成人黄色免费看| 精品亚洲自拍| 成人av免费电影| 久久av网站| 国产日本欧美在线观看| 成人va天堂| 日本精品视频在线播放| a毛片不卡免费看片| 欧美老少配视频| 中文字幕在线观看日本| 亚洲一二在线观看| 黄色片视频在线观看| 亚洲美女av在线| 你懂的在线看| 亚洲美女www午夜| 天天操天天干天天干| 欧美mv日韩mv亚洲| 国产成人三级一区二区在线观看一| 欧美精选午夜久久久乱码6080| 伊人免费在线观看| 欧美日韩免费不卡视频一区二区三区| 中文字幕一区二区人妻视频| 色综合久久久久久久| 天堂网中文字幕| 日本丶国产丶欧美色综合| 国产真人无遮挡作爱免费视频| 91久久精品网| 五月天中文字幕| 欧美性猛交xxxx乱大交退制版| 中文字幕免费视频观看| 欧美系列一区二区| 国产精品久久久久久久成人午夜| 欧美另类videos死尸| 国产女同91疯狂高潮互磨| 日韩午夜三级在线| 人妻视频一区二区三区| 日韩av一区二区在线| 日韩porn| 中文字幕自拍vr一区二区三区| 国产精品视频二区三区| 日韩亚洲精品电影| av网站在线看| 国模精品系列视频| 粉嫩一区二区| 国产精品自产拍在线观看中文| 亚洲精品乱码日韩| 亚洲精品免费在线视频| 国产欧美啪啪| 欧美婷婷久久| 888久久久| www.成年人视频| 天堂精品中文字幕在线| 182午夜在线观看| 国产麻豆精品一区二区| 国产性生活毛片| 久久久蜜桃精品| 一级片久久久久| 亚洲欧美日韩系列| 国内自拍视频在线播放| 欧美美女黄视频| 亚洲 欧美 激情 小说 另类| 日韩中文字幕免费看| 色www永久免费视频首页在线 | 国产精品黄色片| 91丨九色丨国产| 少妇精品久久久| 97精品国产97久久久久久粉红| 一本色道久久综合亚洲精品不| 中文字幕第36页| 国产69精品久久久久777| 偷拍女澡堂一区二区三区| 国产精品国产自产拍在线| 国产系列精品av| 欧美亚洲一区二区在线| 亚洲欧美强伦一区二区| 色妞一区二区三区| 久久久男人天堂| 91在线视频一区| 国产一区二区精品福利地址| 久久久久久久免费视频| 丝袜亚洲另类欧美| 国产麻豆剧传媒精品国产av| 国产精品乱码人人做人人爱| 日韩三级小视频| 日韩一区二区免费视频| 在线观看a视频| 91av在线播放| 试看120秒一区二区三区| 亚洲日本无吗高清不卡| 国产精品亚洲产品| 韩国一区二区三区四区| 中文字幕中文字幕在线一区| 久久中文字幕免费| 精品久久久久99| 黄色在线论坛| 国产精品中文在线| 精品日韩在线| 欧美在线观看成人| 成人小视频免费观看| xxxx日本少妇| 欧美日韩精品一区二区三区蜜桃 | 国产精品丝袜一区二区三区| 视频小说一区二区| 国内少妇毛片视频| 国内成+人亚洲+欧美+综合在线| 国产伦理片在线观看| 福利微拍一区二区| 国产91免费看| 久久久久久久久久久人体| 国产麻豆一区二区三区| 一区二区视频在线播放| 免费在线观看成人| 四虎国产成人精品免费一女五男| 色综合天天做天天爱| 亚洲三区在线播放| 91高清在线免费观看| 欧美1区二区| 免费看日本毛片| 91丨porny丨在线| 亚洲久久在线观看| 日韩大片免费观看视频播放| 日韩伦理精品| 欧美一区1区三区3区公司 | 色婷婷精品久久二区二区密| 亚洲一区二区成人在线观看| 丰满人妻一区二区| 欧美国产日韩精品| 狠狠久久伊人| 国产一区二区网| 久久综合九色综合欧美98| 韩国av中文字幕| 亚洲欧洲一区二区三区在线观看| 欧美黑人一区| 午夜久久资源| 精品无人码麻豆乱码1区2区| 天天看片中文字幕| 欧美大片顶级少妇| 狠狠操一区二区三区| 久久精品国产精品青草色艺| 久久久精品五月天| 青青草华人在线视频| 欧美一区二区久久久| 91超碰在线播放| 欧美精品二区三区四区免费看视频| 首页欧美精品中文字幕| 婷婷国产成人精品视频| 91精品免费观看| 超碰资源在线| 欧美亚洲免费高清在线观看| 久久精品国产精品亚洲综合| 中文字幕影音先锋| 亚洲精品美女久久久久| 户外露出一区二区三区| 99re99热| caoporm超碰国产精品| 无码人妻精品一区二| 毛片精品免费在线观看| 日韩电影在线观看完整免费观看| 在线视频日韩一区| 一区二区日韩av| 噜噜噜在线观看播放视频| 成人午夜高潮视频| 99在线精品视频在线观看| x88av在线| 精品噜噜噜噜久久久久久久久试看| 欧美日韩视频网站| 欧美 国产 精品| 久久综合久久综合久久| 91亚洲国产成人精品一区| 久久欧美在线电影| 久久人人99| 手机在线成人av| 欧美区在线观看| 999福利在线视频| 亚洲欧美日韩在线综合| 99麻豆久久久国产精品免费优播| 中文字幕a级片| 国产69精品久久久久久| 亚洲精品午夜av福利久久蜜桃| 无码人妻精品一区二区三区温州| 欧美猛男gaygay网站| 亚洲私拍视频| 中文字幕在线中文| 国产欧美日韩另类一区| 粉嫩小泬无遮挡久久久久久| 91精品国产综合久久香蕉922| 亚洲一区网站|