精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

你理解的控制LLM幻覺的方法可能是錯的

發布于 2025-5-14 00:30
瀏覽
0收藏

那什么是粗暴的控制LLM的幻覺的方法呢?

正常你們大家學到的應該是

temperature=0

top_k=1

top_p=0.1類似這種的但是這種是不是能解決幻覺呢?很顯然在做的各位試過,應該是沒什么效果的。為什么呢?

正常來講,我們不是把生成next token的概率放到最大的那個token上了嗎?

今天先回憶個概念LLM是靠什么來決定next_token生成的,

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區

就是Logit,就是softmax你的前向計算的最后一層(這么表達不精確,但是你可以認為就算最后一層了)

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區

過了output之后呢?要和詞表做一個矩陣乘,得到一個logit,但是這個不能直接用,需要給softmax轉換為對應詞的概率,就是我剛才的公式

(不理解transformer架構的兄弟可以參考我以前的博文,草履蟲也能學懂得Transformer系列

??https://mp.weixin.qq.com/s/Qi9-SqTGk5yHkF0WQ1CdYQ?token=1866303267&lang=en_US??

如果志在玩大模型,至少目前Transformer還是繞不開的基礎)

1- 為什么temperature要設置低

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區

溫度采樣是一種基本技術,可控制 token 選擇的隨機性。它的工作原理是在應用 softmax 函數之前縮放 logits(未歸一化的預測分數)。

其中:P(xi)是選擇 token ii的概率,Z i是選擇token ii的 logit,T就是溫度參數了

較低的溫度(T < 1)使分布更加尖銳,傾向于高概率 token。較高的溫度(T > 1)會使分布變平,增加選擇較低概率 token 的機會。

2- TOP P 和K 呢?

這就不仔細講了,TOP是核采樣,就是排序計算累加概率,知道累加概率超過p剩下的就不要了,然后歸一化,從里面選出來TOPK 不用說了把,選K個歸一化。

一般的理解認為,如果把上述的設置都設置為最嚴格的,比如設置topK=0,TOP_P=1, 先把這兩個參數廢掉,然后temperature=0.0 就應該是絕對無幻覺的答案了,如文章開頭說的,事實上是不行的,下面講一下為什么?因為LLM還有兩個比較關鍵的概念,當然你也可以說這倆概念是人為加上的,引入這些概念的就是entropix采樣:

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區


第一個注意力熵entropy:

理解語言模型中的熵

在語言模型的上下文中,熵衡量模型預測中的不確定性或隨機性。它量化了概率分布在可能的下一個 token 上的分散程度。

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區

其中 pi是第 i 個 token 的概率。

較高的熵值表示模型對下一個 token 不確定,概率分布在許多選項上。相反,較低的熵表示模型更有信心,概率集中在較少的 token 上。

注意力熵方差 (Varentropy)

熵方差(Varentropy),或熵的方差,衡量了在單個位置上,不同可能的 token 之間的信息內容(驚奇度)變化有多大。它提供了對模型不確定性和其對給定上下文的預測多樣性的洞察。

熵方差的計算涉及以下步驟:

步驟 1:計算概率和對數概率

使用 softmax 計算當前位置上每個可能的 token 的概率,并計算它們的對數概率。

步驟 2:計算熵

計算當前位置概率分布的熵。

步驟 3:計算熵方差

對于每個可能的 token,計算其信息內容(負對數概率)與平均信息內容(熵)之間的平方差。用它們的概率加權這些差異并將它們加總。

熵方差在識別模型正在考慮驚奇度水平非常不同的 token 的情況時特別有用。高熵方差可能表明上下文復雜或模糊,模型的預測更加多樣化或不確定。

在采樣決策中的意義

熵和熵方差的組合在 Entropix 的采樣策略中起著至關重要的作用。以下是它們如何影響決策過程:

  1. 低熵,低熵方差:表示高置信度和一致性。Entropix 在這些情況下可能會使用貪婪采樣。
  2. 高熵,低熵方差:表明一致的不確定性。這可能會觸發插入澄清(clarification insertion)或增加探索。
  3. 低熵,高熵方差:表示不同程度的置信度。Entropix 可能會采用探索采樣來調查不同的可能性。
  4. 高熵,高熵方差:代表高度不確定性和不一致性。這種情況通常會導致使用調整參數的高不確定性采樣。

在 Transformer 模型中,注意力通常以多頭注意力(multi-head attention)的形式實現。這意味著注意力機制并行應用多次,允許模型同時關注輸入的各個不同方面。

Transformer 模型中的每個注意力頭計算一組注意力分數,確定在生成每個輸出 token 時,要將多少注意力放在輸入的不同部分。

注意力熵用于量化注意力在不同 token 上的不確定性或分散程度。

較高的注意力熵表示模型的注意力分散在許多 token 上,而較低的熵表示模型專注于少數特定的 token。

而如果分散在許多token上,也就是所謂的熵分散,代表模型此時根本不知道哪個token更合適

這個時候你比如temperature=0.0,你是選擇了一個所謂概率最高的,但是你其實也限制了模型探索的能力,這也是幻覺可能產生的開始

注意力一致性 (Agreement)

注意力一致性衡量不同注意力頭之間的注意力模式的一致程度。它通過將每個頭的注意力分布與平均注意力分布進行比較來計算

較低的一致性表明不同的頭正在關注輸入的各個不同方面,這可能表明上下文復雜或模糊。

這是第二個引入幻覺的可能性,因為上下文的理解不確認

我們今天介紹的Entropix 使用這些基于注意力的指標來指導其采樣決策。例如:

  • 較高的注意力熵可能導致采樣中增加探索。
  • 較低的注意力一致性可能導致溫度或 top-k 參數的調整。

所以大家基本就能看明白了,如果模型不確認哪個token最優,那就增加一些探索的可能性,比如對上下文模糊,那就動態調整模型的配置參數

交互強度 (Interaction Strength)

交互強度定義為 Transformer 模型中所有層、頭和位置的注意力分數的絕對值的平均值。在數學上,它可以表示為:

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區

L代表層數,H是注意力頭,N是序列長度,Alhji就是第l層第h頭種從位置i到位置j的注意力分數

較高的交互強度值表示序列中 token 之間存在更強的關系

交互強度在 Entropix 的自適應采樣過程中起著至關重要的作用。它影響采樣策略的幾個關鍵方面:

  1. 溫度調整:較高的交互強度可能導致溫度升高,當 token 之間連接緊密時,促進更多樣化的輸出。
  2. Top-k 參數:交互強度用于動態調整 top-k 參數,從而根據 token 關系的強度允許更多或更少的候選 token。
  3. 探索與利用:在交互強度較高的場景中,采樣策略可能會傾向于更具探索性的行為,以捕獲 token 之間復雜的聯系。

說白了,我token之間交互強度高,證明我們之間的注意力更高,需要輸出更多元化,人話說就是更多探索路徑,來捕捉復雜的注意力

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區


下面是entropix的完整采樣過程:

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區


如上圖所示

數據流和決策過程

Entropix 系統在文本生成過程中遵循特定的流程:

步驟 1:Token 生成

語言模型處理輸入 token 并生成 logits 和注意力分數。

步驟 2:指標計算

指標計算器基于模型輸出計算熵、熵方差、注意力熵、注意力一致性和交互強度。

步驟 3:策略選擇

自適應采樣器分析計算出的指標,并選擇最合適的采樣策略。

步驟 4:參數調整

根據選擇的策略和指標,動態調整采樣參數(溫度、top-k、top-p、min-p)。

步驟 5:Token 采樣

應用選擇的采樣策略來選擇下一個 token。

步驟 6:迭代

從步驟 1 開始重復該過程,并加入新生成的 token。

采樣策略

Entropix 采樣方法的核心是其策略選擇邏輯。該系統持續評估模型的輸出指標,并為每個 token 生成步驟選擇最合適的采樣方法。

你理解的控制LLM幻覺的方法可能是錯的-AI.x社區


自適應采樣

當 logits 的熵和熵方差沒有落入極端類別時(與觸發專門采樣技術的場景不同),自適應采樣策略就會啟動。它旨在平衡探索和利用,適應當前的上下文和模型狀態。

自適應采樣過程

步驟 1:計算指標

首先,模型的 logits 和注意力分數中計算各種指標:

  • Logits 熵和熵方差
  • 注意力熵和熵方差
  • 注意力一致性
  • 交互強度

步驟 2:調整采樣參數

基于這些指標,動態調整采樣參數:

  • 溫度
  • Top-p(核采樣閾值)
  • Top-k
  • 最小概率閾值 (min_p)

步驟 3:生成多個樣本

使用調整后的參數生成多個候選 token。樣本數量是可配置的,默認為 12。(現在不是流行帶搜索的中間過程嗎,你可以理解為帶搜索的token生成)。

步驟 4:樣本評分

每個樣本都根據兩個因素評分:

  1. 來自模型 logits 的對數概率
  2. 從計算出的指標導出的置信度分數

步驟 5:選擇最佳樣本

得分最高的樣本被選為最終輸出 token。

生成多個樣本后,每個樣本都使用對數概率和置信度分數的組合進行評分:

def score_sample(sample):
    log_prob = jnp.sum(jax.nn.log_softmax(logits) * jax.nn.one_hot(sample, logits.shape[-1]))
    confidence_score = (
        (1 - metrics["logits_entropy"]) * 0.1 +
        (1 - metrics["attn_entropy"]) * 0.2 +
        (1 - metrics["logits_varentropy"]) * 0.3 +
        (1 - metrics["attn_varentropy"]) * 0.4 +
        metrics["agreement"] * 0.5 +
        metrics["interaction_strength"] * 0.6
    )
    return log_prob + confidence_score

此評分函數平衡了 token 的可能性(log_prob)和從各種指標導出的置信度度量。置信度分數中每個組件的權重可以根據經驗結果進行調整。

現在回到最開始我們說的集中情況來分析:

1-如果熵和熵方差都非常低時,模型對其預測非常有信心。在這種情況下,使用貪婪采樣,說白了模型知道它在干什么,它對自己的答案也足夠確認,那就選擇概率最高的,就是標準的logit。

2- 如果熵高,但是熵方差低,證明模型是不確定的,但是其不確定性是一致的,所以需要澄清,這個澄清就是以特殊token的形式。

如果插入了澄清token,那么下一個token就會動態調整temperature,用更高的溫度拿到更大的多樣性,來進行采樣,找到最合理的token!

其實某種程度上有點像李飛飛的S1的wait token。

3- 另外如果,模型熵很低,證明它很確認,但是熵的方差高,就證明它本身就看到了很多不同的可能性,那采樣的temperature就直接升高(基于交互強度指標)就可以了,top k當然也順手就給升了。

4- 如果熵和熵方差都高,記憶是又不確定,又看到了好多的可能性,那就直接下猛藥,但是其實和3的請款一樣,也是升temperature,但是是基于熵方差的強度來調整temperature,而不是注意力一致性,另外此時因為熵升高,所以要降低top-p的參數來讓它收斂。


你理解的控制LLM幻覺的方法可能是錯的-AI.x社區

這就是entropix的思路,通過動態的采樣參數和澄清token來實現fitting化的采樣保證模型的輸出更合理化,更少幻覺,其實entropix的思路在OAI的o系列是有引入類似的概念的。

比如你們使用o系列api就會發現一個申請的問題,temperature和top p k都不允許設置

原因就是來自于這,所以大家理解了為什么temperature=0.0和有沒有幻覺并沒有本質聯系的原因了嗎?

本文轉載自????熵減AI????,作者:周博洋

收藏
回復
舉報
回復
相關推薦
午夜精品久久久久影视| 韩国女主播成人在线观看| 亚洲国产成人av在线| 人妻夜夜添夜夜无码av| 亚洲国产精品久久人人爱潘金莲| 91精品天堂福利在线观看| 日韩欧美三级在线| 久草资源站在线观看| 视频在线观看你懂的| 久久久亚洲一区| 伊人精品在线观看| www.51色.com| 波多野结衣在线高清| 久久亚洲精精品中文字幕早川悠里 | 国产精品无码一区二区在线| 四虎影院在线播放| 青青青爽久久午夜综合久久午夜| 日韩在线小视频| 肉丝美足丝袜一区二区三区四| 成人在线免费看片| 成人av网站大全| 欧美最近摘花xxxx摘花| 免费黄色国产视频| 欧美巨大xxxx| 91精品国产黑色紧身裤美女| 无码人妻丰满熟妇区96| 99riav在线| 岛国精品在线播放| 国产欧美日韩免费| 日本中文字幕在线免费观看| 成人写真视频| 亚洲精品99久久久久中文字幕| 不卡av免费在线| 亚洲图区一区| 中文字幕欧美激情| 国产综合第一页| 在线观看亚洲国产| 久久精品午夜| 欧美猛交免费看| 国产7777777| 精品国产18久久久久久洗澡| 欧美精品丝袜久久久中文字幕| 日本在线xxx| a级在线观看| 国产日产精品一区| 国产精品久久国产三级国电话系列| 97人妻精品视频一区| 午夜精品剧场| 色噜噜狠狠狠综合曰曰曰| 菠萝菠萝蜜网站| 91蝌蚪精品视频| 欧美久久久久免费| www.99av.com| 色多多在线观看| 亚洲午夜三级在线| 久久69精品久久久久久国产越南| 成人免费av片| 一区二区中文字幕在线观看| 色猫猫国产区一区二在线视频| 黄色成人在线看| 黄色美女视频在线观看| 亚洲猫色日本管| 亚洲在线不卡| av影片在线看| 欧美极品aⅴ影院| 欧美精品一区二区视频| 婷婷av一区二区三区| 国产激情视频一区二区在线观看 | 女同一区二区| 天堂中文网在线| 成人黄色大片在线观看| 国产v亚洲v天堂无码| 精品国产av一区二区| 国产一区二区网址| 亚洲va欧美va国产综合久久| 91丨porny丨在线中文 | 性欧美极品xxxx欧美一区二区| 成人ssswww在线播放| 偷窥少妇高潮呻吟av久久免费 | 一区二区三区高清视频在线观看| 久久久亚洲精选| 精品无码人妻一区二区三区品 | 欧美午夜寂寞| 欧美日韩激情在线| 精品久久久99| 欧洲精品99毛片免费高清观看 | 日韩国产精品视频| 人妻无码中文久久久久专区| 偷拍自拍一区| 亚洲天堂久久av| 青青草视频成人| 欧美色爱综合| 欧美精品亚州精品| 久久久综合久久久| 亚洲理论在线| 日本亚洲欧洲色| 精品视频一二三区| 狠狠色狠狠色综合| 91文字幕巨乱亚洲香蕉| www.国产精品视频| caoporn国产精品| 国产专区一区二区| av资源种子在线观看| 一区二区成人在线| 免费涩涩18网站入口| 91精品久久久久久综合五月天| 国产性色av一区二区| 精品午夜福利在线观看| 日本午夜一本久久久综合| 国产经品一区二区| 蜜芽在线免费观看| 日韩欧美在线视频观看| 亚洲成人av免费观看| 欧洲美女日日| 欧美一级免费看| 草逼视频免费看| 欧美高清在线一区二区| 免费成人午夜视频| 日韩中文字幕一区二区高清99| 一本色道久久88亚洲综合88| 日韩 国产 在线| 国产精品一卡二卡在线观看| 午夜午夜精品一区二区三区文| 久草在线资源福利站| 日韩免费在线观看| 极品美妇后花庭翘臀娇吟小说| 午夜亚洲激情| 国产一区在线免费| 免费在线看电影| 日韩一区二区免费电影| 国产一区二区三区视频播放| 玖玖视频精品| 久久久久久久久久久一区| 牛牛精品视频在线| 日韩欧美中文字幕一区| 日韩激情综合网| 麻豆一区二区99久久久久| 日本一区二区高清视频| 欧美动物xxx| 亚洲精品一区二区网址| 国产性xxxx高清| 成人午夜免费av| 久久亚洲国产成人精品无码区 | 国产一区高清视频| 久色国产在线| 亚洲第一天堂av| 激情综合网五月婷婷| 处破女av一区二区| 黄色三级中文字幕| 久久aimee| 992tv在线成人免费观看| 蜜桃91麻豆精品一二三区| 亚洲欧美一区二区久久| 久久精品一二三四| 欧美精品激情| 国新精品乱码一区二区三区18| 色呦呦视频在线观看| 日韩精品一区二区三区三区免费| 久草视频在线资源| www.一区二区| 黄色片久久久久| 精品一区二区三区中文字幕老牛| 国产精品欧美在线| 91精彩视频在线观看| 欧美日韩国产bt| 欧洲猛交xxxx乱大交3| 国产传媒日韩欧美成人| 成人免费在线网| 米奇精品关键词| 日本精品免费观看| avtt在线播放| 日韩一级免费观看| 欧美日韩精品区| 国产欧美精品一区aⅴ影院 | 国产一区二区三区在线观看视频 | 久久久久人妻一区精品色欧美| 成人性生交大片免费| 国产精品333| 日韩久久视频| 国产精品播放| 免费亚洲电影| 久久夜色精品亚洲噜噜国产mv| 亚洲免费一级片| 色综合久久久网| 亚洲精品国产精品乱码在线观看| 国产东北露脸精品视频| 国产超级av在线| 日韩欧美电影| 国产精品国产精品| 国产精品美女午夜爽爽| 久久久av一区| 欧美挠脚心网站| 日韩一区二区三区在线观看| av黄色在线看| 中文字幕一区二区三区在线观看 | 自拍偷在线精品自拍偷无码专区| 免费观看污网站| 日韩高清在线一区| 国产美女主播在线| blacked蜜桃精品一区| 99精品欧美一区二区三区| www.com.cn成人| 欧美精品一区在线播放| 高清日韩av电影| 精品国产露脸精彩对白| 亚洲视频在线免费播放| 亚洲福利一区二区| 卡通动漫亚洲综合| 久久精品这里都是精品| 成人啪啪18免费游戏链接| 欧美a一区二区| www.com毛片| 欧美 日韩 国产一区二区在线视频 | 国产日韩高清在线| 精品少妇人妻av一区二区三区| 免费成人你懂的| 国产超级av在线| 国产综合亚洲精品一区二| 一区二区国产日产| 国产毛片一区二区三区| 国内精品久久久久久久果冻传媒| av在线国产精品| 国产日本欧美一区| 在线日本欧美| 欧美一区二区三区免费观看| 欧美人与性动交α欧美精品济南到| 最近日韩中文字幕中文| 高清中文字幕一区二区三区| 日韩精品免费在线视频| 欧美一级淫片免费视频魅影视频| 日韩欧美高清一区| 国产夫绿帽单男3p精品视频| 欧美二区在线观看| 中文天堂在线视频| 在线观看视频一区二区欧美日韩| 国产又黄又粗又爽| 精品人伦一区二区三区蜜桃网站| 精品99久久久久成人网站免费 | 亚洲国产一区自拍| 高h放荡受浪受bl| 欧美成人欧美edvon| 亚洲av色香蕉一区二区三区| 日韩欧美国产1| wwwav在线播放| 精品久久久久久久人人人人传媒| 精品欧美一区二区精品少妇| 日韩手机在线导航| 亚洲精品一区二区三区蜜桃| 日韩欧美成人激情| www.久久色| 精品国产精品网麻豆系列 | 国产一区二区三区在线看| 激情在线视频| 永久555www成人免费| 在线观看av的网站| 久久久97精品| a毛片在线观看| 久久久久久久97| 在线天堂资源www在线污| 国产成人极品视频| 成人精品一区二区三区电影| 国产在线日韩在线| 日韩最新av| 久久久婷婷一区二区三区不卡| 啪啪亚洲精品| 一区二区三区的久久的视频| 性xxxx欧美老肥妇牲乱| 乱熟女高潮一区二区在线| 亚洲日产国产精品| 成年人网站大全| 国内久久婷婷综合| 影音先锋资源av| 久久精品人人做人人爽97 | 亚洲电影激情视频网站| 精品成人久久久| 在线视频一区二区三区| 国产伦子伦对白视频| 亚洲激情视频在线播放| 国产免费a∨片在线观看不卡| 久久精彩免费视频| 超碰在线cao| 国产欧美一区二区三区在线| 国产图片一区| 日韩国产伦理| 亚洲私拍自拍| 99视频在线视频| 成人免费看视频| a天堂中文字幕| 一区二区三区欧美日韩| 69xxxx国产| 日韩精品一区国产麻豆| 撸视在线观看免费视频| 免费99精品国产自在在线| 末成年女av片一区二区下载| 国产一区二区在线播放| 台湾佬综合网| 亚洲AV无码成人精品一区| 亚洲在线网站| 国产在线a视频| 亚洲国产激情av| 中日韩精品视频在线观看| 欧美男生操女生| 精品电影在线| 97久久精品视频| 国产精品久久久久久久久久久久久久久 | 国产寡妇亲子伦一区二区三区四区| 91精品国产综合久久精品app| 青青色在线视频| 欧美日韩成人在线观看| 99久久er| 欧美一区二区三区四区夜夜大片| 一区二区自拍| 久草福利在线观看| 国产精品福利电影一区二区三区四区 | 波多野结衣在线播放一区| 黄色大片在线免费看| 国产激情一区二区三区四区| 日本少妇aaa| 在线观看视频91| 你懂的在线播放| 91精品国产自产91精品| 97久久精品| 九九久久九九久久| 六月丁香婷婷色狠狠久久| 日本高清www| 欧美日韩精品中文字幕| 成人乱码一区二区三区| 裸体女人亚洲精品一区| 四虎国产精品免费久久| 亚洲一区二区高清视频| 日韩二区三区在线观看| 成年人网站免费在线观看| 亚洲超碰97人人做人人爱| 丁香花免费高清完整在线播放| 久久亚洲一区二区三区四区五区高 | 91高清一区| 手机在线视频一区| 亚洲欧美日韩综合aⅴ视频| 国产又粗又黄又爽| www.亚洲天堂| japansex久久高清精品| 自拍偷拍一区二区三区| 精品一二三四区| 波多野结衣在线网址| 欧美一二三四区在线| 亚洲综合图区| 91亚色免费| 99香蕉国产精品偷在线观看| 中文字幕 日本| 欧美性猛交xxxx免费看| 欧美zozo| 国产精品久久久久福利| 97久久夜色精品国产| 黄色片子免费看| 亚洲自拍偷拍九九九| 好吊视频一区二区三区| 欧美亚洲激情视频| 欧美极品中文字幕| 欧美三级午夜理伦三级富婆| 国产精品久久久久久久久免费桃花 | 一二三四视频在线中文| 欧美自拍资源在线| 美女视频一区二区| 欧美成人一二三区| 亚洲国产毛片完整版| 2022成人影院| 伊人久久大香线蕉av一区| 国产91高潮流白浆在线麻豆| 男人的天堂一区二区| 一本色道久久88亚洲综合88| 国产色99精品9i| 免费不卡av在线| 国产区在线观看成人精品| 国产模特av私拍大尺度| 久久久久久久久久久免费精品| 夜夜春成人影院| 五月天激情播播| 午夜欧美视频在线观看 | 极品尤物一区| 亚洲色图久久久| 亚洲一区二区三区激情| 久色视频在线| 亚洲va男人天堂| 久久久噜噜噜| 麻豆天美蜜桃91| 亚洲欧美激情精品一区二区| 日韩美女在线| 久久精品免费一区二区| 自拍偷拍欧美精品| 无码国产伦一区二区三区视频| 国产精品日韩久久久久| 欧美日韩国产欧| 精品成人无码一区二区三区| 日韩一区二区精品在线观看| 欧美三级网址| 日韩欧美精品免费| 国产精品久久精品日日| 天天爽夜夜爽夜夜爽| 亚洲综合自拍一区| 老司机精品福利视频|