精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌蘋果曝出LLM驚人內幕,自主識別錯誤卻裝糊涂!AI幻覺背后藏著更大秘密

人工智能 新聞
大模型幻覺,究竟是怎么來的?谷歌、蘋果等機構研究人員發現,大模型知道的遠比表現的要多。它們能夠在內部編碼正確答案,卻依舊輸出了錯誤內容。

到現在為止,我們仍舊對大模型「幻覺」如何、為何產生,知之甚少。

圖片

最近,來自Technion、谷歌和蘋果的研究人員發現,LLM「真實性」的信息集中在特定的token,而且并得均勻分布。

正如論文標題所示,「LLM知道的往往要比表現出來的更多」。

圖片

論文地址:https://arxiv.org/pdf/2410.02707

不僅如此,他們還發現,內部表征可以用來預測LLM可能會犯錯的錯誤類型。

它的優勢在于,未來有助于開發出針對性的解決方案。

最后,研究團隊還解釋了,大模型內部編碼和外部行為之間存在的差異:

它們可能在內部編碼了正確答案,卻持續生成錯誤答案。

幻覺,如何定義?

事實錯誤、偏見,以及推理失誤,這些統稱為「幻覺」。

以往,大多數關于幻覺的研究,都集中在分析大模型的外部行為,并檢查用戶如何感知這些錯誤。

然而,這些方法對模型本身如何編碼、處理錯誤提供了有限的見解。

近期另有一些研究表明,LLM內部狀態其實「知道」那些輸出可能是錯誤的,而且這種「知識」被編碼在模型內部狀態中。

這一發現可以幫助提高錯誤檢測的性能,并進一步緩解這些問題。

不過其中一個缺陷是,這些研究主要集中了檢驗模型生成最后一個token、或提示符中最后一個token。

由于LLM通常會生成長篇的相應,因此這一做法可能會錯過關鍵細節。

在最新研究中,研究團隊采取了不同的方法:

不只是看最終的輸出,而是分析「確切的答案token」,如若修改,將會改變答案的正確性的相應token。

最終證明了,LLM內部表征所包含的真實性信息,比以往要多得多。

但這種錯誤檢測器難以在不同數據集之間泛化,這說明真實性編碼并非統一的,而是多方面的。

更好的錯誤檢測

給定一個大模型M,輸入提示p、模型生成的響應?,任務預測?是正確還是錯誤的。

假設可以訪問LLM內部狀態(即白盒設置),但不能訪問任何外部資源(如搜索引擎或其他LLM)。

數據集使用的是圖片,包含N個問題-標簽對,圖片代表著一系列問題,圖片代表著對應的真實答案。

對于每個問題q_i,作者讓模型M生成響應y_i,得到預測答案集圖片

接下來, 研究人員構建了錯誤檢測數據集,通過將每個生成的響應?_i與真實標簽y_i比較,以評估其正確性。

比較結果會產生出一個正確的標簽z_i ∈ {0, 1}(1表示正確,0表示錯誤)。

這種比較可以通過自動啟發式方法,在指令型LLM的協助下完成。

最終的錯誤檢測數據集為圖片。其排除了LLM拒絕回答的情況,因為這些可以輕易地被分類為錯誤。

接下來,研究人員在Mistral 7B和Llama 2模型的四個變體上進行了實驗。

這些模型跨越了十個數據集,涵蓋了各種任務。

其中包括問答、自然語言推理、數學問題解決、情感分析。

他們允許模型生成不受限制的響應,來模擬真實世界的使用情況。

這里,一共用到了三種錯誤檢測方法:Aggregated probabilities / logits、P(True)、Probing。

精確答案token

現有的方法經常忽略一個關鍵的細微差別:用于錯誤檢測的token選擇,通常關注最后生成的token或取平均值。

然而,由于大模型通常會生成長篇回復,這種做法可能會錯過關鍵細節。

還有一些方法使用提示最后的一個token,但本質上是不正確的,因為大模型的單向性,未能考慮生成響應和丟失的情況,其中同一模型的不同采樣答案在不同情況下,有所不同正確性。

對此,研究人員檢查了以往未經檢查的token位置:確切的答案token,代表生成響應中最有意義的部分。

他們將精確答案token定義為那些修改會改變答案的正確性token,而忽略了后續生成的內容。

如下圖圖1,說明了不同的token位置。

圖片

實驗結果

真實性編碼模式

研究人員首先專注于探索分類器,以了解LLM的內部表征。

具體來說,廣泛分析了層和token選擇對這些分類器激活提取的影響。這是通過系統地探測模型的所有層來完成的,從最后一個問題token開始,一直到最終生成的token。

下圖2顯示了Mistral-7b-Instruct各個層和token中經過訓練的探測器的AUC指標。

雖然,某些數據似乎更容易進行錯誤預測,但所有數據集都表現出一致的真實性編碼模式。

圖片

對于token來說,提示后立即出現了強烈的真實性信號,表明這種表征編碼了有關模型正確回答問題的一般能力的信息。

對著文本生成的進行,該信號會減弱,但在確切的答案token處,再次達到峰值。

再生成過程即將結束時,信號強度再次上升,表明了該表征編碼了整個生成過程的特征,盡管它仍弱于確切答案token。

錯誤檢測結果

接下來,研究人員通過比較使用、不使用精確答案token的性能,來評估各種錯誤檢測方法。

表1比較了三個代表性數據集的AUC。

在這里,他們展示了最后一個精確答案token的結果,它的性能優于第一個精確答案token及其前面的token,而最后一個精確答案token之后的token性能類似。

合并精確答案token,有助于改進幾乎所有數據集中的不同錯誤檢測方法。

圖片

任務之間的泛化

以上,探測分類器在檢測錯誤方面有效性,表明了大模型對其輸出的真實性進行了編碼。

但目前仍不清楚的是,它們跨任務的通用性。

然而,理解這一點對于實際應用至關重要,因為錯誤檢測器可能會遇到與訓練時完全不同的示例。

因此,研究人員探討在一個數據集上訓練的探測器,是否可以檢測其他數據集的錯誤。

如下圖3顯示了Mistral-7b-Instruct的泛化結果。在這種情況下,高于0.5的值表明泛化成功。

乍一看,結果似乎與之前的研究一致:大多數熱圖值超過0.5,這意味著跨任務具有一定程度的泛化性。

然而,再仔細檢查,發現大部分性能可以通過基于logit的真實性檢測來實現,該檢測僅觀察輸出logits。

圖片

圖3b顯示了從最強的基于Logit的基線(Logit-min-exact)中減去結果后的相同熱圖。

這張 調整后的熱圖揭示了探測器的泛化能力很少超過單獨檢查 logits所能達到的效果。

這意味著明顯的概括并非源于真實性的普遍內部編碼,而是反映了已經可以通過邏 輯等外部特征獲取的信息。

調查錯誤類型

在確定了錯誤檢測的局限性后,研究人員轉向錯誤分析。

錯誤分類

圖4說明了,三種代表性的錯誤類型。

在其中一個(圖4a)中,模型通常會給出正確的答案,但偶爾會出錯,這意味著存在正確的信息,但采樣可能會導致錯誤。

在第二種類型中(圖4b),模型經常做出錯誤的響應,盡管它能夠提供正確的答案,這表明盡管不斷犯同樣的錯誤,但仍然保留了一些知識。

在第三種類型中(圖4c),模型生成了大多數答案都是錯誤的,反映出對任何生成的答案的信心較低。

圖片

研究人員通過記錄每個示例的三個特定特征來對錯誤進行分類:(a)生成的不同答案的數量;(b) 正確答案的頻率;(c) 最常見的錯誤答案的頻率。

預測錯誤類型

表2列出了所有模型的測試集結果。

圖片

檢測正確答案

最后,在確定模型編碼各種與真實性相關的信息后,作者又研究了這種內部真實性,如何在響應生成過程中,與外部行為保持一致。

為此,他們使用了探測器(5個經過錯誤檢測訓練),從針對同一問題生成的30個響應中,選擇一個答案。

然后,根據所選答案來衡量模型的準確性。

Mistral-7b-instruct的結果如下圖5所示,總體而言,使用探測器選擇答案可以提高大模型在所有檢查任務中的準確性。

圖片

總之,這項研究的發現,可以幫助未來研究人員去設計更好的幻覺環節系統。

遺憾的是,它使用的技術需要訪問內部LLM表征,這也主要適用于開源模型的使用。

責任編輯:張燕妮 來源: 新智元
相關推薦

2015-06-23 11:04:44

京東物流

2024-09-02 09:15:00

英特爾半導體

2024-12-27 13:40:00

2023-09-26 11:39:07

2023-11-28 13:31:40

2025-08-19 08:58:17

2017-04-24 15:06:32

今目標

2023-03-06 16:12:59

ChatGPT人工智能

2014-11-04 14:48:09

普元

2009-08-12 09:51:56

李開復跳槽

2024-08-15 13:40:00

模型訓練

2009-12-04 10:20:53

2024-06-11 00:04:00

GPT-4PNASLLM

2024-01-15 11:45:27

2021-03-18 11:09:13

比特幣加密貨幣區塊鏈

2014-07-10 15:02:37

蘋果谷歌隱私安全

2009-11-26 10:57:27

2024-07-29 09:47:00

2009-07-23 21:25:55

2019-02-18 08:17:40

工業物聯網IIOT物聯網
點贊
收藏

51CTO技術棧公眾號

久久99久久亚洲国产| 欧美性猛片xxxx免费看久爱| 51国偷自产一区二区三区| 亚洲色图综合区| 盗摄系列偷拍视频精品tp| 欧美午夜精品伦理| 欧美精品一区二区性色a+v| www.成人免费视频| 久久久久久久尹人综合网亚洲| 色噜噜国产精品视频一区二区 | 99视频精品免费观看| 亚洲午夜未满十八勿入免费观看全集| 三级性生活视频| 性国裸体高清亚洲| 亚洲男同性恋视频| 免费成人av网站| jlzzjlzzjlzz亚洲人| 久久影院亚洲| 久久久久久久爱| 1024手机在线观看你懂的| 综合激情网...| 欧美亚洲愉拍一区二区| 久久久久免费看黄a片app| melody高清在线观看| 国产麻豆欧美日韩一区| 国产国语videosex另类| 欧美日韩在线视频免费| 成人羞羞网站| 日韩av一区二区在线观看| 日韩成人av免费| 午夜欧美巨大性欧美巨大| 亚洲国产你懂的| 亚洲一区二区三区午夜| 青青久草在线| av午夜精品一区二区三区| 国产精品麻豆va在线播放| 一区二区三区福利视频| 国产一区久久| 久久综合电影一区| 久久精品色妇熟妇丰满人妻| 日韩影视高清在线观看| 精品日韩一区二区三区 | 国产在线一二区| 91超碰成人| 在线看日韩欧美| 亚洲成人网在线播放| 极品束缚调教一区二区网站| 日韩三级高清在线| 亚洲一级片免费观看| 亚洲三级在线| 欧美日韩国产电影| 宅男噜噜噜66国产免费观看| 特黄毛片在线观看| 精品国产户外野外| 国产91美女视频| 夜鲁夜鲁夜鲁视频在线播放| 欧美日韩综合视频网址| 精品视频免费在线播放| 极品av在线| 欧美日韩国产精品一区| 很污的网站在线观看| 免费男女羞羞的视频网站在线观看| 亚洲素人一区二区| wwwjizzjizzcom| 欧美野外wwwxxx| 亚洲国产日产av| 久久久一本二本三本| 免费成人在线电影| 色综合久久综合中文综合网| 999精品网站| 欧美成人黑人| 在线欧美小视频| 成 人 黄 色 小说网站 s色| 免费视频观看成人| 91精品国产欧美日韩| 免费看的av网站| 国产精品qvod| 精品视频—区二区三区免费| 中文字幕国产专区| 日韩精品一卡| 日韩视频在线免费| 波多野结衣在线网址| 激情综合网址| 人人澡人人澡人人看欧美| 五月婷婷激情五月| 激情久久五月天| 国产精品久久久久久久久久久久冷| 黄色av小说在线观看| 91在线观看视频| 婷婷久久伊人| 欧美日韩在线视频免费观看| 岛国av一区二区三区| 无人在线观看的免费高清视频 | 国产字幕视频一区二区| 97人人做人人爱| 人妻av中文系列| 在线观看免费视频a| 精品综合免费视频观看| 成人91免费视频| 国产一二三区在线| 亚洲精品综合在线| 丰满人妻中伦妇伦精品app| 国产精品久久久久久久久免费高清| 日韩欧美国产高清| 中文字幕免费在线看线人动作大片| 亚洲精品a级片| 69av视频在线播放| 国产一区二区女内射| www.性欧美| 黄色免费高清视频| 欧美男女交配| 日韩欧美第一区| 无码人妻aⅴ一区二区三区69岛| 你懂的视频一区二区| 国产91露脸中文字幕在线| av老司机久久| 日本一区二区三区免费乱视频| 成年丰满熟妇午夜免费视频| 免费观看成人性生生活片 | 樱桃视频在线观看一区| 成人精品视频一区二区| 盗摄牛牛av影视一区二区| 日韩中文字幕精品视频| 精品人妻无码一区二区性色| 夫妻av一区二区| 日本久久高清视频| 福利视频亚洲| 亚洲欧洲日产国产网站| 久久免费少妇高潮99精品| 久久国产精品无码网站| 欧美久久综合性欧美| 中文字幕欧美国内| 日本久久综合网| 91蝌蚪porny成人天涯| 日韩一级性生活片| 亚洲欧洲国产精品一区| 久久精品99久久久久久久久 | www.久久爱.cn| 国产精品久久麻豆| 欧美日韩国产一级| 国产在线综合视频| 丝袜美腿亚洲一区| 日本成人看片网址| 日本成人三级电影| 亚洲视频日韩精品| 国产一区二区视频网站| 久久久99精品免费观看不卡| 国产a级一级片| 啪啪国产精品| 4438全国亚洲精品在线观看视频| 俄罗斯嫩小性bbwbbw| 亚洲一区二区三区视频在线播放| 超碰在线超碰在线| 欧美~级网站不卡| 亚洲a在线观看| 18加网站在线| 欧美mv日韩mv亚洲| 久久精品欧美一区二区| 成人av片在线观看| 久久国产亚洲精品无码| 青青久久av| 日韩av免费在线| 国产69久久| 欧美日韩激情在线| 紧身裙女教师波多野结衣| 黑人巨大精品欧美一区| 老司机午夜网站| 亚洲一二av| 97精品久久久| 久久综合九色综合久| 欧美亚洲一区二区在线| 潘金莲一级黄色片| 国产91精品在线观看| 久久久精品网| 51成人做爰www免费看网站| 成人看av片| 精品国产区一区| 圆产精品久久久久久久久久久| 不卡视频一二三四| 日韩手机在线观看视频| 欧美韩国日本在线观看| 亚洲一区精品电影| 成年人国产在线观看| 亚洲欧美在线一区| 一级片免费网站| 夜夜嗨av一区二区三区中文字幕| 少妇一级淫片免费放播放| 老司机精品久久| 熟女熟妇伦久久影院毛片一区二区| 亚洲经典视频| 日韩美女av在线免费观看| 久操视频在线播放| 亚洲爱爱爱爱爱| 中文字幕第31页| 亚洲最色的网站| 久久美女免费视频| 国产一区二区三区视频在线播放| 中文字幕无码精品亚洲资源网久久| 国产精品欧美在线观看| 亚洲va欧美va国产综合剧情| 午夜伦理福利在线| 久久精品免费播放| 四虎成人免费在线| 91麻豆精品国产91久久久资源速度| jizz国产免费| 国产精品美女www爽爽爽| zjzjzjzjzj亚洲女人| 日本成人中文字幕在线视频 | 欧美一区二区三区在线观看免费| 精品日韩av一区二区| 亚洲午夜无码久久久久| 欧美人与动牲性行为| 色婷婷国产精品| 免费一级片在线观看| 国产农村妇女精品| 国产大学生视频| 国内国产精品久久| 粗暴91大变态调教| 在线成人h网| 91大学生片黄在线观看| av中文字幕一区二区| 国产精品国模大尺度私拍| 六九午夜精品视频| 国产精品高清免费在线观看| segui88久久综合9999| 久久久久北条麻妃免费看| 久草在线免费福利资源| 亚洲国产成人精品女人久久久| 国产精品无码天天爽视频| 色视频欧美一区二区三区| 日本中文字幕免费| 一区二区欧美视频| 麻豆明星ai换脸视频| 中文字幕在线观看不卡视频| wwwwww日本| 97成人超碰视| 波多野结衣办公室双飞| 国产成人综合亚洲网站| 一二三av在线| 老司机免费视频一区二区| 亚洲精品高清无码视频| 香蕉亚洲视频| 欧美大片在线播放| 亚洲高清在线| 日本人体一区二区| 亚洲成人直播| 日韩欧美一区二| 亚洲一卡久久| 国产黄色一级网站| 在线亚洲精品| 国产中文字幕视频在线观看| 亚洲人体大胆视频| 欧美视频在线免费播放| 亚洲激情午夜| www.日本在线播放| 亚洲精品国产日韩| 狠狠干 狠狠操| 性8sex亚洲区入口| 成人在线观看a| 日本91福利区| 最新天堂在线视频| 国产自产视频一区二区三区| 在线视频一二区| 国产精品一区三区| 亚洲色图欧美另类| 久久综合色天天久久综合图片| 黄色工厂在线观看| 国产欧美精品一区aⅴ影院| 俄罗斯毛片基地| 国产福利电影在线| 亚洲高清不卡av| 五月婷婷深深爱| 亚洲午夜精品视频| 欧美猛烈性xbxbxbxb| 免费91麻豆精品国产自产在线观看| a黄色片在线观看| 国内精品一区二区三区四区| 亚洲风情在线资源| 国产精品www色诱视频| 自拍偷拍欧美日韩| 国产精品久久九九| 免费短视频成人日韩| 性欧美精品一区二区三区在线播放 | 中文字幕一区二区三区视频| 国产盗摄一区二区三区在线| 亚洲综合999| 亚洲精品男人的天堂| 欧美日韩亚洲综合一区二区三区| 国产农村老头老太视频| 精品国产一二三| 男同在线观看| 久久天天躁狠狠躁老女人| xxxx另类黑人| 国产精品视频地址| a看欧美黄色女同性恋| 日本不卡久久| 亚洲无线视频| 亚洲福利精品视频| 成人av电影在线| 国产精品一区二区亚洲| 亚洲成国产人片在线观看| 亚洲成熟少妇视频在线观看| 欧美成人精品福利| 国产一二三在线观看| 久久久久久中文字幕| 中文字幕系列一区| 国产一区二区不卡视频| 日韩夫妻性生活xx| 日韩中文字幕在线视频观看| 久久国产免费看| 好吊一区二区三区视频| 亚洲免费av高清| 秋霞精品一区二区三区| 日韩美女天天操| 成年午夜在线| 2018日韩中文字幕| 欧美午夜在线播放| 色噜噜一区二区| 99精品国产在热久久| 成年人看片网站| 国产精品三级电影| 中文字幕精品视频在线观看| 精品sm捆绑视频| 成人免费观看视频大全| 国产欧美在线视频| 日韩丝袜视频| 大伊香蕉精品视频在线| 国产一区免费电影| 国产三级aaa| 在线亚洲一区二区| 亚洲欧美日韩动漫| 久久久久久网址| 国产美女亚洲精品7777| 偷拍视频一区二区| 日韩精品色哟哟| ass精品国模裸体欣赏pics| 亚洲成av人片在线观看| 性猛交富婆╳xxx乱大交天津| 精品国产网站地址| 国产精品xxx| 日韩欧美一区二区视频在线播放 | 国产精品系列视频| 正在播放国产一区| 成人不卡视频| 日韩av电影免费观看| 美女久久一区| 亚欧洲乱码视频| 黑人巨大精品欧美一区二区| 四虎免费在线观看| 久久免费国产视频| 91综合精品国产丝袜长腿久久| 日韩video| 国产精品亚洲综合一区在线观看| 内射一区二区三区| 欧美一级日韩不卡播放免费| h片在线播放| 懂色一区二区三区av片| 伊人久久婷婷| 亚洲av网址在线| 懂色aⅴ精品一区二区三区蜜月| 五月婷婷在线播放| 国产91精品久久久久久久| 亚洲免费专区| 国产精彩免费视频| 成人免费在线观看入口| 国产乱码精品一区二区三区精东| 久久视频在线看| av综合网址| 欧美成人xxxxx| 日本一区二区视频在线| 一本到在线视频| 欧美xxxx做受欧美.88| 999在线精品| aaa毛片在线观看| 国产精品欧美极品| 国产夫绿帽单男3p精品视频| 欧美劲爆第一页| 国产欧美日韩免费观看| 九九热精品在线播放| 亚洲欧美日韩国产综合在线| 99热这里只有精品9| 午夜精品一区二区三区在线视 | 亚洲精美色品网站| 精品国产免费人成网站| 一区二区在线高清视频| 国产盗摄女厕一区二区三区 | 国产视频一区在线观看一区免费| 日本黄色特级片| 欧美男生操女生| av中文在线资源库| 日韩中文一区| 国产福利精品一区二区| 国产91国语对白在线| 精品国产一区二区三区久久狼黑人| 亚洲精品在线a| 国产视频一区二区三区在线播放| 亚洲日本一区二区| 久久伊伊香蕉| 97超级在线观看免费高清完整版电视剧| 日韩一级欧洲|