精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型在裝傻!谷歌蘋果最新發現:LLM知道但不告訴你,掌握知識比表現出來的多

人工智能 新聞
近日,來自谷歌和蘋果的研究表明:AI模型掌握的知識比表現出來的要多得多!這些真實性信息集中在特定的token中,利用這一屬性可以顯著提高檢測LLM錯誤輸出的能力。

大模型的應用歷來受幻覺所擾。

這個幻覺可以指代LLM產生的任何類型的錯誤:事實不準確、偏見、常識推理失敗等等。

——是因為大模型學半天白學了嗎?并不是。

近日,來自谷歌和蘋果的研究表明:AI模型掌握的知識比表現出來的更多!

圖片

論文地址:https://arxiv.org/pdf/2410.02707

研究人員在LLM內部表示上訓練分類器,以預測與生成輸出的真實性相關的各種特征。

結果表明LLM的內部狀態編碼反映出的真實性信息,比以前認識到的要多得多。

這些真實性信息集中在特定的token中,利用這一屬性可以顯著提高檢測LLM錯誤輸出的能力。

雖說這種錯誤檢測無法在數據集中泛化,但好處是,模型的內部表示可用于預測模型可能犯的錯誤類型,從而幫助我們制定緩解錯誤的策略。

研究揭示了LLM內部編碼和外部行為之間的差異:可能編碼了正確的答案,卻生成了不正確的答案。

——簡單來說就是,LLM它知道,但它不想告訴你!

LLM在裝傻

作者建議將重點從以人類為中心的幻覺解釋轉移到以模型為中心的視角,檢查模型的中間激活。

不同于使用RAG或者依賴更強大的LLM judge,本文工作的重點是僅依賴于模型輸出的logits、softmax后的概率和隱藏狀態的計算。

錯誤檢測器

第一步是確定真實性信號在LLM中的編碼位置。

假設我們可以訪問LLM的內部狀態(白盒),但不能訪問任何外部資源(搜索引擎或其他LLM)。

建立一個數據集D,由N個問題標簽對組成,對于每個問題,提示模型生成響應,從而得到一組預測答案。

接下來,比較LLM生成的回答與正確答案,從而構建錯誤檢測數據集(這一部可由AI代勞)。

實驗選擇了四個LLM:Mistral-7b,Mistral-7b-instruct-v0.2,Llama3-8b和Llama3-8b-instruct。

作者選取了10個跨越不同領域和任務的數據集:TriviaQA、HotpotQA(with/without context)、Natural Questions、Winobias、Winogrande、MNLI、Math、IMDB review sentiment analysis和另一個自制的電影角色數據集。

實驗允許無限制地生成響應以模擬現實世界LLM的用法,并貪婪地解碼答案。

性能指標

測量ROC曲線下面積以評估錯誤檢測器,這能夠反映模型在多個閾值中區分陽性和陰性情況的能力,平衡靈敏度(真陽性率)和特異性(假陽性率)。

錯誤檢測方法

Majority:始終預測訓練數據中最頻繁的標簽。

聚合概率/logits:從之前的研究中選取幾種方法,包括計算這些值的最小值、最大值或平均值。

P(True):通過提示要求LLM評估其生成的正確性時。

Probing:在模型的中間激活上訓練一個小分類器,以預測已處理文本的特征,這里使用線性探測分類器對靜態token進行錯誤檢測。

作者認為,現有方法忽略了一個關鍵的細節:用于錯誤檢測token的選擇。

研究者通常只關注最后生成的token或取平均值,然而,由于LLM一般會生成長格式響應,這種做法可能會錯過重要的部分。

本文中,作者關注表示確切答案的token(EXACT ANSWER TOKENS),它代表了生成的響應中最有意義的部分。

圖片

這里將EXACT ANSWER TOKENS定義為,如果修改則會改變答案正確性的token。

實踐中,作者使用設置好的instruct模型代勞,來提取確切答案。之后,通過簡單的搜索過程確定對應的token。

重點關注4個特定token:第一個確切答案的token及其前一個token、最后一個確切答案token及其后一個token。

圖片

作者廣泛分析了層和token選擇對分類器的激活提取的影響,通過系統地探測模型的所有層,從最后一個問題token開始,一直到最終生成的token。

上圖顯示了Mistral-7b-Struct中各個層和token關于探測的AUC指標。雖然一些數據集似乎更容易進行錯誤預測,但所有數據集都表現出一致的真實性編碼模式,中后期層通常會產生最有效的探測結果。

圖片

通過比較使用和不使用EXACT ANSWER TOKENS的性能,來評估各種錯誤檢測方法,上表展示了三個代表性數據集上的AUC。

不同任務中的泛化

了解錯誤檢測器在不同任務中的泛化能力,對于實際應用程序至關重要。

圖片

上圖(a)顯示了Mistral-7b-instruct的泛化結果,大于0.5的值表示泛化成功。乍一看,大多數熱圖值超過了0.5,似乎任務之間存在一定程度的泛化。

然而事實上,大部分性能可以通過基于logit的真度檢測來實現。圖(b)顯示了從最強的基于Logit的基線(Logit-min-exact)中減去結果后的相同熱圖。

這表示檢測器的泛化程度很少超過僅依賴Logit所能達到的效果。所以,泛化并不源于真實性的內部編碼,而是反映了已經通過logits等外部特征訪問的信息。

圖片

經過訓練的探測分類器可以預測錯誤,但其泛化能力只發生在需要相似技能的任務(如事實檢索)中。

對于涉及不同技能的任務,例如情感分析,探測分類器與基于logit的不確定性預測器效果差不多。

錯誤類型研究

在確定了錯誤檢測的局限性,并研究了不同任務的錯誤編碼有何不同之后,作者深入研究了單個任務中的錯誤,根據模型對重復樣本的響應對其錯誤進行分類。

比如,持續生成的相同錯誤與偶爾生成的錯誤屬于不同類別。

研究人員在T = 30的溫度設置下,對數據集中的每個樣本進行采樣,然后分析答案的結果分布。

圖片

上圖展示了三種代表性的錯誤類型:

圖(4a)中,模型通常會給出正確的答案,但偶爾會出錯,這意味著存在正確的信息,但采樣可能會導致錯誤。

圖(4b)中,模型經常犯同樣的錯誤,但仍保留了一些知識。

圖(4c)中,模型生成了大量錯誤的答案,整體置信度較低。

分類的標準有三個:生成的不同答案的數量,正確答案的頻率,以及最常見的錯誤答案的頻率。

圖片

上表顯示了所有模型的測試集結果。結果表明,可以從貪婪解碼的中間表示中預測錯誤類型。

檢測正確答案

模型的這種內部真實性如何在響應生成過程中與其外部行為保持一致?

作者使用經過錯誤檢測訓練的探測器,從同一問題的30個響應中選擇一個答案,根據所選答案衡量模型的準確性。

如果這種準確性與傳統解碼方法(如貪婪解碼)沒有顯著差異,則表明LLM的真實性內部表示與其外部行為一致。

實驗在TriviaQA、Winobias和Math上進行,選擇probe評估的正確性概率最高的答案。這里比較了三個基線:貪婪解碼;從30個候選答案中隨機選擇;選擇生成的最頻繁的答案。

圖片

結果如上圖所示,總體而言,使用探針選擇答案可以提高LLM所有檢查任務的準確性。但是,改進的程度因錯誤類型而異。

探針可以有效地識別正確答案的事實表明,LLM的內部編碼與其外部行為之間存在重大脫節:即使模型編碼了哪個答案是正確的信息,它在實踐中仍然可能生成錯誤的答案。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-03-03 10:18:46

2025-06-04 13:56:51

模型AI數據

2012-06-20 09:39:02

惡意網站

2013-02-28 10:24:18

2022-08-16 08:35:45

Black Hat網絡安全

2016-10-09 13:19:43

2011-11-24 14:39:15

惠普大幅面打印機

2010-03-12 08:55:48

Windows 7企業部署

2025-02-20 09:21:51

2019-04-04 13:00:19

Linuxshell命令

2025-10-31 08:55:00

2018-07-19 15:07:16

OPPO

2024-09-02 07:50:00

模型預測

2014-09-25 09:59:00

2021-10-11 14:30:50

人工智能數據技術

2016-07-06 11:38:10

移動 出海

2023-11-26 00:26:00

2024-01-19 10:04:21

半導體芯片Gartner

2011-10-06 16:05:19

惠普激光打印機

2021-10-15 10:11:00

遠程管理監控數據中心
點贊
收藏

51CTO技術棧公眾號

欧美韩日亚洲| 国产又粗又猛视频免费| 天堂99x99es久久精品免费| 午夜av一区二区三区| 久久久久久欧美精品色一二三四| 国产精品视频一区在线观看| 日韩一区二区在线| 精品毛片乱码1区2区3区| 乱妇乱女熟妇熟女网站| a天堂在线资源| 国产精品一二三四| 国产91亚洲精品| 成人免费毛片东京热| 里番精品3d一二三区| 欧美影院精品一区| 欧美黄色免费网址| 1769在线观看| av网站免费线看精品| 国产精品午夜视频| 日本一区二区三区四区五区 | 蜜桃传媒视频麻豆一区| 一级特黄aaa大片| 一区二区三区福利| 久久艹在线视频| 亚洲黄色免费视频| 精品国产午夜肉伦伦影院| 欧美妇女性影城| 人妻有码中文字幕| 国产在线xxx| 中文字幕一区二区三区四区 | 无码国产精品一区二区免费16| 日本欧美一区二区在线观看| 国语自产精品视频在线看| 日韩在线不卡av| 国产99亚洲| 亚洲国产精品成人av| theporn国产精品| 视频在线日韩| 欧美日韩国产中文精品字幕自在自线 | 男人天堂网视频| 肉肉视频在线观看| 亚洲天天做日日做天天谢日日欢| 日韩av电影免费在线观看| 五月天婷婷激情网| 白白色 亚洲乱淫| 91丨九色丨国产| 国产精品久久无码一三区| 日韩二区三区四区| 国产精品草莓在线免费观看| www..com国产| 伊人久久亚洲影院| 久久97精品久久久久久久不卡| 日本黄区免费视频观看| 九九精品在线| 亚洲乱码一区二区| 亚洲第一香蕉网| 人人香蕉久久| 日韩av在线精品| 蜜臀aⅴ国产精品久久久国产老师| 年轻的保姆91精品| 日韩欧美一级片| xxxx视频在线观看| 中文无码日韩欧| 日韩精品一区二区三区在线播放 | 日韩一区二区欧美| 网爆门在线观看| 日韩欧美精品一区| 精品国产区一区二区三区在线观看 | 丁香花在线影院观看在线播放| 性欧美ⅴideo另类hd| 一区二区三区久久久| 又大又硬又爽免费视频| 9999精品成人免费毛片在线看| 亚洲一级在线观看| 日韩精品 欧美| 欧美18—19sex性hd| 色狠狠av一区二区三区| 日韩不卡一二三| 精品国产第一国产综合精品| 欧美成人a视频| 久久久久9999| 波多野结衣在线观看一区二区三区| 在线播放国产精品| 男女做暖暖视频| 亚洲国产裸拍裸体视频在线观看乱了中文 | 永久久久久久久| 在线视频观看日韩| 国产成人综合精品在线| 一区二区三区精| 成人一区二区三区视频在线观看 | 国产精品成av人在线视午夜片 | 在线观看免费91| 羞羞视频在线免费国产| 欧美日韩国产精品专区| 污污动漫在线观看| av成人资源网| 国产一区二区美女视频| 麻豆成人在线视频| 久久精品123| 69174成人网| 欧美伦理影视网| 亚洲精品自拍动漫在线| 亚欧无线一线二线三线区别| 日韩美女在线| 亚洲乱亚洲乱妇无码| 破处女黄色一级片| 久久久人人人| 国产精品免费一区二区三区四区| 国产精品99999| 五月综合激情网| 日本在线观看视频一区| 欧美女优在线视频| 欧美激情女人20p| 91久久国语露脸精品国产高跟| a在线欧美一区| 今天免费高清在线观看国语| 97久久香蕉国产线看观看| 欧美r级在线观看| 狂野欧美性猛交| 三级影片在线观看欧美日韩一区二区| 91免费观看| 毛片免费不卡| 精品露脸国产偷人在视频| 日本黄色www| 日韩精品首页| 国产精品96久久久久久| 色久视频在线播放| 亚洲v日本v欧美v久久精品| 午夜久久福利视频| 成人亚洲一区| 欧美中文字幕精品| 狠狠综合久久av一区二区| 欧美国产丝袜视频| 97国产精东麻豆人妻电影| 成人在线视频区| 久久精品99久久香蕉国产色戒| 久久久久久久久黄色| 成人av网址在线| 国产激情在线看| 一区二区三区日本视频| 欧美一区二区三区免费在线看 | 国产精品免费免费| 欧美成人免费在线观看视频| 国产专区精品| 日韩最新在线视频| 波多野结衣爱爱| 高清视频一区二区| 欧美一级视频在线播放| 97色婷婷成人综合在线观看| 亚洲色图偷窥自拍| 99热在线观看免费精品| 高清视频一区二区| 国产精品无码乱伦| 欧美日韩黄网站| 不卡av电影院| 国产乱淫a∨片免费观看| 欧美国产一区二区| 黄色国产小视频| 久久中文字幕av| 国产精品日韩一区| av网站无病毒在线| 欧美日本在线播放| 色婷婷粉嫩av| 日韩国产欧美在线播放| 亚洲精品中文综合第一页| 欧美韩国亚洲| 一区二区欧美久久| 中文字幕在线播放av| 国产欧美精品日韩区二区麻豆天美| 色悠悠久久综合网| 日韩国产一区二区三区| 国产精品免费久久久久影院| 丁香婷婷在线| 欧美日韩国产另类一区| 91在线无精精品白丝| 国模无码大尺度一区二区三区| 亚洲三级一区| 国产成人免费av一区二区午夜| 日韩有码在线播放| 国产精品毛片一区二区在线看舒淇 | 欧洲视频在线免费观看| 丁香五六月婷婷久久激情| 亚洲欧美日本一区| 麻豆国产精品777777在线| 亚洲精品8mav| 91精品国产一区二区在线观看| 久久九九亚洲综合| 亚洲欧美激情国产综合久久久| 亚洲啪啪综合av一区二区三区| 国产原创剧情av| 亚洲欧美网站| 亚洲国产欧美日韩| 欧美影院精品| 91精品国产高清久久久久久久久| 国产二区视频在线观看| 制服丝袜成人动漫| 久久精品99国产精| 91亚洲男人天堂| 国产主播中文字幕| 四季av在线一区二区三区| 国产九色91| 欧美黑人一区| 久久亚洲私人国产精品va| 亚洲老妇色熟女老太| 欧美性猛xxx| 久久久久无码国产精品| 久久免费精品国产久精品久久久久| 日韩一级片播放| 国产精品第十页| 日韩av一级大片| 清纯唯美激情亚洲| 国产女人精品视频| 黄频免费在线观看| 久久精品国亚洲| 色网站在线免费观看| 欧美巨大另类极品videosbest| 国产一级淫片免费| 中文字幕不卡在线播放| 欧美日韩一区二区区别是什么 | 99热这里只有精品66| 亚洲国产综合视频在线观看| 在线观看黄网址| www国产成人免费观看视频 深夜成人网| 九九九在线观看视频| 亚洲青色在线| 手机成人av在线| 久久精品高清| 久久综合九九| www.神马久久| 国产日韩欧美日韩| 最新中文字幕在线播放| 国内精品视频在线| 含羞草www国产在线视频| 亚洲欧洲日韩国产| 欧美一级淫片aaaaaa| 欧美精品自拍偷拍动漫精品| а中文在线天堂| 午夜激情一区二区三区| 99久久99久久精品国产| 国产日韩欧美亚洲| 成人性生活免费看| 不卡视频免费播放| 交换做爰国语对白| 美日韩一级片在线观看| 国产v亚洲v天堂无码久久久| 亚洲国产精品第一区二区| 91丨porny丨探花| 欧美日韩精品| 成人在线观看www| 久久国产电影| 午夜精品福利一区二区| 国产在线日韩精品| 欧美日韩亚洲一区二区三区在线观看 | 亚洲精品成人精品456| 国产精品夜夜夜爽阿娇| 日韩毛片一二三区| 91香蕉视频污在线观看| 国产精品久久久久一区| 五月婷六月丁香| 欧美国产禁国产网站cc| 熟女少妇a性色生活片毛片| 国产精品理伦片| 人与动物性xxxx| 中文字幕在线不卡一区| 三上悠亚在线观看视频| 亚洲特级片在线| 久久国产在线观看| 亚洲一区二区欧美| 国产精品 欧美 日韩| 亚洲福利一区二区| 国产一国产二国产三| 午夜精品久久久久久不卡8050| 久久久一二三区| 亚洲超碰97人人做人人爱| 国产极品美女高潮无套嗷嗷叫酒店| 欧美日韩性视频| 亚洲第一网站在线观看| 欧洲另类一二三四区| 中文字幕久久久久| 日韩午夜激情视频| 黄色a在线观看| 亚洲老头同性xxxxx| 高清av在线| 在线中文字幕日韩| 污污视频在线看| 97视频网站入口| 韩国成人在线| 亚洲aⅴ男人的天堂在线观看 | 呻吟揉丰满对白91乃国产区| 国产精品素人视频| 欧美日韩激情在线观看| 欧美日韩国产影院| 天天爱天天做天天爽| 日韩一区二区在线看| 人妻va精品va欧美va| 亚洲美女av网站| 欧美人xxx| 欧美洲成人男女午夜视频| 国产69精品久久久久按摩| 91九色偷拍| 久草成人资源| av女优在线播放| 日韩国产精品久久| 精品人妻人人做人人爽夜夜爽| 99视频一区二区| 日本黄色免费片| 五月天一区二区| 中文字幕在线观看国产| 精品99一区二区| 美州a亚洲一视本频v色道| 国产69精品久久久久9999| 在线国产成人影院| 高清国产在线一区| 色天天久久综合婷婷女18| 大陆极品少妇内射aaaaa| 激情丁香综合五月| 精品人妻一区二区三区香蕉| 亚洲三级电影网站| 亚洲天堂视频在线播放| 精品国产乱码久久久久久1区2区| 蜜桃成人在线视频| 久久久视频在线| 成人精品在线| 欧美日韩亚洲在线| 激情欧美丁香| 午夜视频在线观| 国产午夜精品一区二区三区视频 | 日韩欧美一区二区一幕| 欧美色老头old∨ideo| 天天av综合网| 欧美黄色性视频| 亚洲精品777| 欧美人xxxxx| 国产精品视频| 制服丝袜av在线| 亚洲婷婷国产精品电影人久久| 亚洲午夜18毛片在线看| 欧美v日韩v国产v| 黄a在线观看| 国产97色在线| 国产精品一在线观看| 六月丁香激情网| 高清在线不卡av| 亚洲人做受高潮| 欧美一区二区三区性视频| avtt在线播放| 国产成人综合av| 综合亚洲自拍| 男人舔女人下面高潮视频| 99精品一区二区三区| 国产极品在线播放| 欧美一级国产精品| 欧美理论片在线播放| 亚洲综合日韩在线| 91成人影院| 欧美高清精品一区二区| 《视频一区视频二区| 97精品人妻一区二区三区| 中文字幕欧美亚洲| 韩国一区二区三区视频| 特级黄色录像片| 久久99精品一区二区三区三区| 欧美精品日韩在线| 538在线一区二区精品国产| 婷婷激情在线| 成人欧美在线观看 | 天堂精品一区二区三区| 日本sm残虐另类| 美国美女黄色片| 欧美日韩精品一区二区三区蜜桃| 久久99精品久久| 91久久久一线二线三线品牌| 欧美精品成人| 俄罗斯女人裸体性做爰| 精品久久在线播放| 黄色在线视频观看网站| 国产精品igao视频| 亚洲欧美日韩高清在线| 午夜影院免费版| 亚洲国产成人tv| 亚洲色欧美另类| 国产中文日韩欧美| 国产精品mm| theav精尽人亡av| 欧美高清视频不卡网| 少妇视频在线| 精品乱子伦一区二区三区| 在线亚洲观看| youjizz亚洲女人| 精品第一国产综合精品aⅴ| 午夜裸体女人视频网站在线观看| 欧美日韩一区二区三区免费| 激情久久五月天| 亚洲另类欧美日韩| 色综合伊人色综合网站| 欧美高清xxx| 国模吧无码一区二区三区| 国产精品污污网站在线观看| 不卡av中文字幕| 国产美女扒开尿口久久久|