精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2024 | 自我糾錯如何使OpenAI o1推理能力大大加強?北大、MIT團隊給出理論解釋

人工智能 新聞
北大王奕森團隊與MIT合作,從理論上分析了大語言模型自我糾錯能力背后的工作機理。

自我糾錯(Self Correction)能力,傳統上被視為人類特有的特征,正越來越多地在人工智能領域,尤其是大型語言模型(LLMs)中得到廣泛應用,最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我糾正的方法。

傳統的大語言模型,因為在輸出答案的時候是逐個Token輸出,當輸出長度較長時,中間某些Token出錯是必然發生。但即使LLM后來知道前面輸出的Token錯了,它也得用更多錯誤來“圓謊”,因為沒有機制讓它去修正前面的錯誤。

而OpenAI o1在“慢思考”也就是生成Hidden COT的過程中,通過分析OpenAI官網給出的Hidden COT例子可以發現,在解決字謎問題的思考過程中,o1首先發現了每兩個連續的明文字母會映射到一個秘文字母,于是便嘗試使用奇數字母來構建明文,但是經過驗證發現并不合理(Not directly);接著又重新修正答案最終成功解出字謎。

圖片

圖1 OpenAI o1 官網示例(部分Hidden CoT)

Reflection 70B的關鍵技術也包括錯誤識別錯誤糾正。他們用到了一種名為 Reflection-Tuning(反思微調) 的技術,使得模型能夠在最終確定回復之前,先檢測自身推理的錯誤并糾正。在實際的執行過程中,這會用到一種名為思考標簽(thinking tag)的機制。模型會在這個標簽內部進行反思,直到它得到正確答案或認為自己得到了正確答案。

頻頻應用于大語言模型的自我糾錯技術為何有效?為什么糾錯過程可以讓模型把原本答錯的問題重新答對?

為了探究這一問題,北大王奕森團隊與MIT合作,從理論上分析了大語言模型自我糾錯能力背后的工作機理。

圖片

  • 論文題目:A Theoretical Understanding of Self-Correction through In-context Alignment
  • 論文地址:https://openreview.net/pdf?id=OtvNLTWYww
  • 代碼地址:https://github.com/yifeiwang77/Self-Correction

作者團隊將自我糾錯的過程抽象為對齊任務,從上下文學習(In-context learning)的角度對自我糾錯進行了理論分析。值得一提的是,他們并沒有使用線性注意力機制下的線性回歸任務進行理論分析,而是使用真實世界LLM在用的softmax多頭注意力機制的transformer結構,并利用Bradley-Terry 模型和 Plackett-Luce 模型(LLM對齊的實際選擇,用于RLHF和DPO)設計對齊任務進行研究。受理論啟發,他們提出了一種簡單的自我糾錯策略--上下文檢查(Check as Context),并通過實驗,在消除大語言模型中存在的潛在偏見以及防御越獄攻擊中效果顯著。

理論分析:自我糾錯實際上是一種上下文對齊?

不同于類似監督學習的標準上下文示例(請求,回答),自我糾錯示例可以形成一個三元組形式(請求,回答,獎勵),這類似于通過獎勵指示好壞樣本的 LLM 對齊。因此,作者團隊提出將自我糾錯形式化為一種“上下文對齊”(In-context Alignment),即通過提供一系列自我糾錯步驟的上下文,優化LLM的最終輸出,以獲得更高的獎勵。

對齊的過程通常包括:對于問題,收集個不同的模型回答,然后由人類或評估模型(在本文中,評估模型即該 LLM 本身)對這  個回答給出排序偏好。接著,使用一般的對齊模型(如Bradley-Terry (BT,n=2) or Plackett-Luce (PL loss, general n))進行建模:

其中為獎勵模型。

針對transformer模型,作者采用了帶有softmax多頭注意力機制的transformer結構,其前向傳播更新可以分為兩部分

  • 多頭注意力(MHSA)層:
  • FFN層:

獎勵函數  被設置為負均方誤差(MSE)損失,即:

在該設置下,參數的梯度下降可等價于對數據的更新:

圖片

作者證明了多層transformer(包含3-head softmax attention和relu激活函數的FFN)可以利用自我糾錯樣本生成更優獎勵的回答。具體而言,作者證明了存在模型權重,使得transformer可以通過在前向傳播的過程中執行對其內部獎勵模型參數的梯度下降,來生成更符合對齊目標的更優回答。

圖片

這是首次在理論上表明 LLM 可以在上下文中實現對齊的分析。該理論適用于多種自我糾錯方法,因為評估可以來自人類、外部驗證者或 LLM 本身。

圖片圖2 關于上下文對齊的驗證實驗,分別涉及TF和GD的比較(a)、不同獎勵噪聲p的影響(b)、模型深度的影響(c)、以及不同注意力機制的效果(d)、(e)、(f)。

作者也通過設置驗證實驗來檢驗其理論導出的種種結論,以及各個 transformer 結構模塊對 LLM 執行上下文對齊能力的影響,作者發現了很多有趣的結論:

  • 通過觀察比較LLM在執行上下文對齊時前向傳播的損失與梯度下降的損失曲線,LLM執行上下文對齊時的前傳行為與梯度下降損失曲線幾乎相同。(圖2(a))
  • 評價的質量直接影響自我糾錯的質量(圖2(b))。
  • 對多樣本的排序需要更深的模型層數,在達到一定深度后(15層),增加更多的層數并不能帶來更高的收益。(圖2(c))
  • Softmax注意力機制對從評價中分析回答優劣排序至關重要,而linear注意力則做不到這一點。具體來說,softmax 注意力機制可以有效地選取最優回答  并為各樣本生成加權平均所需的權重。(圖2(d))
  • 多頭注意力機制對token角色的區分很重要。具體而言,多頭注意力機制可以將生成的回答與正樣本拉近,與負樣本拉遠。實驗表明,3個attention head是上下文對齊任務中最優選擇。(圖2(e))
  • FFN對于token角色的轉變很重要。在經過一個MHSA層后,FFN可以將上一輪的正樣本屏蔽掉,從而使次優樣本變成下一輪迭代的最優樣本。(圖2(f))

自我糾錯策略:上下文檢查

作者使用上下文檢查(Check as Context,CaC)作為LLM完成自我糾錯的方法,在兩個現實世界的對齊任務中探索了自我糾錯:緩解社會偏見和防范越獄攻擊。

圖片

圖3 BBQ數據集上使用CaC的示例。

具體而言,首先對模型請求問題獲得回答初始回答,然后對該回答進行評估,得到獎勵。之后將初始回答,評估送入上下文,并重新請求問題,得到改正后的回答。此過程可多次重復以迭代改進回答,最終以最后一輪的模型回答作為模型的最終輸出。

消除LLM社會偏見

本文使用 BBQ(Bias Benchmark for QA)數據集,在 vicuna-7B 和 Llama2-7b-chat 模型上測試了 CaC 方法的效果。此外,還在 BBQ 上研究了模型大小、評估質量和糾錯輪數對糾錯效果的影響。主要結論如下:

  • 多數情況下,自我糾錯后的正確率高于原正確率(圖4)
  • 正確率提升與自我評估的準確率高度相關(圖4(c): ),甚至呈線性關系(圖5(a))。
  • 采用不同的評價方式效果依次提升:僅使用對/錯評價 < 自然語言評價 < 包含 CoT 的對/錯評價。這是因為 CoT 不僅能提高評價準確性,還能為模型提供額外的自然語言信息。(圖5(b))
  • 更大的模型有更好的糾錯能力(圖5(c)(d))
  • 當評價的正確率足夠高時,更多的糾錯輪數可以帶來更好的糾錯效果。(圖5(e))

圖片

圖4 CaC對于不同種類的偏見的修正

圖片

圖5 BBQ上關于模型大小、評估質量以及糾錯輪數的消融實驗

同時,在防御越獄攻擊的實驗中,CaC也是所有測試的防御手段中最低的。

更多文章細節,請參考原文:https://openreview.net/pdf?id=OtvNLTWYww

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-24 11:01:03

2024-11-29 13:57:38

2024-11-07 15:40:00

2024-09-18 10:37:00

強化學習AI模型

2024-12-09 11:06:31

2009-07-15 15:47:45

綜合布線驗收規范

2024-11-25 15:50:00

模型訓練

2024-10-10 13:01:43

2024-09-13 06:32:25

2025-01-23 10:45:52

2025-01-23 14:53:15

2024-11-07 22:59:36

2024-11-11 11:05:00

大語言模型系統

2025-03-10 08:10:00

AI研究安全

2025-11-10 08:51:00

LLMOpenAI模型

2025-04-18 09:13:00

2024-11-12 12:53:46

2024-10-05 00:00:00

2024-09-19 18:03:31

2025-01-20 13:08:25

點贊
收藏

51CTO技術棧公眾號

亚洲国产精品黑人久久久| 亚久久调教视频| 欧美成人video| 亚洲人精品午夜射精日韩| 欧美色视频免费| 久久99久久精品| 97色在线观看免费视频| 夫妇露脸对白88av| 亚洲天堂中文字幕在线观看| 狠狠久久五月精品中文字幕| 影音先锋欧美资源| 神马久久久久久久久久| 日本午夜一区二区| 久久久女人电视剧免费播放下载| 91久久免费视频| 97超碰成人| 欧美视频在线播放| 日本欧美黄色片| 好吊日视频在线观看| kk眼镜猥琐国模调教系列一区二区| 国产精品久久久久不卡| 久久久久亚洲av成人片| 成人影院天天5g天天爽无毒影院| 精品毛片乱码1区2区3区| 91国产精品视频在线观看| 丁香花视频在线观看| 中文字幕中文字幕在线一区| 精品国产_亚洲人成在线| 91激情在线观看| 久久经典综合| 97精品在线观看| 日韩在线中文字幕视频| 欧美日韩水蜜桃| 亚洲欧美另类在线观看| 国产chinese中国hdxxxx| 伊人国产精品| 欧美日韩一区精品| 日韩在线xxx| 色婷婷综合久久久中文一区二区| 亚洲靠逼com| 久久综合毛片| www.黄色小说.com| 精品亚洲aⅴ乱码一区二区三区| 欧美在线免费视频| 久久精品视频9| 欧美日韩亚洲国产精品| 久久精品国产96久久久香蕉| 国产一二三四视频| 国产尤物久久久| 亚洲欧美日韩国产成人| 大黑人交xxx极品hd| 国产主播性色av福利精品一区| 欧美一二三区在线| 精产国品一二三区| 欧美另类中文字幕| 欧美一区二区三区视频在线| 国产无色aaa| 欧美天堂一区| 91麻豆精品国产91久久久久久久久| 自拍偷拍21p| 四虎视频在线精品免费网址| 欧美日韩一区二区三区免费看| 手机在线免费观看毛片| 久久精品女人天堂av免费观看 | 91嫩草视频在线观看| 国产深喉视频一区二区| 国产91丝袜在线播放九色| av一区二区在线看| 日韩在线观看视频一区| 99久久99久久精品免费观看| 久久伦理网站| 户外极限露出调教在线视频| 国产日韩欧美不卡| 一区二区三区视频在线播放| 黄色片网站在线观看| 亚洲精品国产品国语在线app| 日韩国产成人无码av毛片| 黄页网站在线| 欧美性猛交xxxx乱大交极品| 91激情视频在线| 国产亚洲高清在线观看| 欧美成人福利视频| 久久精品国产亚洲AV熟女| 欧美综合一区| 久久99视频精品| 波多野结衣国产| 美国毛片一区二区三区| 91久久精品在线| 日本黄视频在线观看| 久久久久久久久久久99999| 日韩在线电影一区| av免费在线观看网址| 午夜欧美在线一二页| 国产精彩免费视频| 欧美国产亚洲精品| 亚洲色图国产精品| 欧美特级一级片| 午夜亚洲视频| 亚洲在线一区二区| 久久久久久青草| 一区二区三区四区精品在线视频| 国产偷人视频免费| 国产精品国产亚洲精品| 日韩精品中文字幕视频在线| 91传媒免费观看| 欧美亚洲自偷自偷| 亚洲www在线| 国产精品视频二区三区| 亚洲一区在线视频| 国内外成人免费在线视频| 狠狠一区二区三区| 精品国产一区二区三区久久久狼 | 中文字幕亚洲综合久久五月天色无吗''| 欧美激情性做爰免费视频| 涩涩视频在线观看| 99国产精品久| 大陆极品少妇内射aaaaaa| 午夜激情成人网| 亚洲国产99精品国自产| 成人免费精品动漫网站| 日韩在线一区二区三区| 精品无人区一区二区三区| 亚洲第一图区| 911精品国产一区二区在线| 日韩精品无码一区二区三区久久久 | 日韩精品一区在线| 99热6这里只有精品| 久久婷婷一区| 久久精品国产美女| 电影k8一区二区三区久久| 欧美一级夜夜爽| 呻吟揉丰满对白91乃国产区| 毛片一区二区| 精品中文字幕人| 波多野结衣精品| 日韩欧美国产1| 国产精品视频一区二区三 | 成人有码视频在线播放| 国产三级视频在线播放线观看| 午夜精品在线视频一区| 91精产国品一二三| 午夜久久美女| 99re视频在线播放| v片在线观看| 欧美一级午夜免费电影| 中国毛片直接看| 精品一区二区三区在线播放| 亚洲国产欧美不卡在线观看| 青青热久免费精品视频在线18| 亚洲免费一在线| 日韩不卡在线播放| 久久日一线二线三线suv| 1024av视频| 日本欧美三级| 国产成人精品一区二区在线| 久久精品色图| 欧洲视频一区二区| 91av手机在线| 国产一区二区三区久久久| 成人手机视频在线| 国产美女精品视频免费播放软件| 俺去了亚洲欧美日韩| 99久久精品国产一区色| 一区二区三区高清| 无码人妻一区二区三区精品视频| 在线观看日韩av电影| 国产伦精品一区二区三区| 国产直播在线| 亚洲人午夜精品免费| 中文字幕观看在线| 亚洲人成网站色在线观看| 精产国品一区二区三区| 亚洲手机视频| 日本成人黄色免费看| 99久久er| 久久91精品国产91久久久| 五月激情婷婷综合| 在线看一区二区| 51精品免费网站| 成人动漫视频在线| 看av免费毛片手机播放| 欧美一级淫片| www.成人av| 芒果视频成人app| 久久色精品视频| 色窝窝无码一区二区三区| 色狠狠综合天天综合综合| 萌白酱视频在线| 不卡的电视剧免费网站有什么| 国语对白做受xxxxx在线中国| 久久一区二区三区电影| 不卡一区二区三区四区五区| 另类激情视频| 欧美日本啪啪无遮挡网站| 黄色影院在线播放| 69成人精品免费视频| 五月激情六月丁香| 亚洲色图视频免费播放| 懂色av粉嫩av蜜乳av| 久久99国产精品成人| 亚洲美免无码中文字幕在线| 91一区二区| 美脚丝袜一区二区三区在线观看| 国产精品日韩精品在线播放| 欧美一级高清免费| 日本孕妇大胆孕交无码| 在线播放日韩精品| 日日夜夜精品免费| 制服.丝袜.亚洲.中文.综合| 亚洲伊人成人网| 亚洲精品视频观看| 久久久久亚洲AV成人无在| 成人av午夜电影| 亚洲一区二区福利视频| 日日欢夜夜爽一区| 欧美久久在线观看| 亚洲欧美在线专区| 日韩国产高清一区| 欧美男人操女人视频| 亚洲影院色无极综合| 日本一区免费网站| 日本精品久久中文字幕佐佐木| 污污的网站在线免费观看| 色悠悠国产精品| 青青草视频在线免费观看| 精品国产乱码久久久久久久久 | 老司机一区二区| 国产天堂在线播放| 国产精品久久久一区二区| 性高湖久久久久久久久aaaaa| 99成人超碰| 亚洲欧洲精品在线观看| 久久不见久久见免费视频7| 国产欧美日韩综合一区在线观看 | 国产一区二区视频在线观看免费| 欧美国产丝袜视频| www.av天天| 久久久久久亚洲综合| 亚洲最大的黄色网| gogogo免费视频观看亚洲一| av黄色一级片| 成人av网址在线| 日本一区二区在线免费观看| 粉嫩嫩av羞羞动漫久久久| 粗大的内捧猛烈进出视频| 国产精品18久久久久| 被黑人猛躁10次高潮视频| 国产一区在线观看视频| 四虎成人在线播放| 国产精品香蕉一区二区三区| 在线观看视频在线观看| 福利一区二区在线观看| 精品国产aⅴ一区二区三区东京热| 国产一区二区免费在线| 香蕉视频1024| av在线一区二区| 少妇大叫太粗太大爽一区二区| 91在线视频观看| 91精品人妻一区二区三区蜜桃欧美| 久久天堂av综合合色蜜桃网| 九九九视频在线观看| 国产精品久久久久久久久免费丝袜| 日韩在线视频免费看| 亚洲天堂成人网| 久草免费在线观看视频| 精品美女永久免费视频| 日韩欧美在线观看免费| 欧美无砖砖区免费| 国产又粗又猛视频| 欧美一区二区黄色| 色婷婷av一区二区三区之红樱桃 | 97人妻精品一区二区免费| 国产欧美日韩在线看| 91精品少妇一区二区三区蜜桃臀| 一区二区国产视频| 久久中文字幕免费| 欧美熟乱第一页| 亚洲精品国偷拍自产在线观看蜜桃| 亚洲国产精品福利| 国产精品四虎| 欧美巨大黑人极品精男| 丝袜老师在线| 91精品国产综合久久久久久久久| jizz国产精品| 欧美一区1区三区3区公司| 国产精品成人一区二区不卡| 国产精品一线二线三线| 日精品一区二区| 中文字幕一区二区三区四| 99久久免费精品高清特色大片| 日韩不卡av在线| 亚洲午夜羞羞片| 国产亚洲久一区二区| 精品福利在线导航| 2021av在线| 97在线视频免费| 成人97精品毛片免费看| 精品国产一区二区三| 天堂美国久久| 日日摸日日碰夜夜爽av| 国产在线精品一区二区三区不卡| 麻豆国产精品一区| 亚洲免费在线播放| 无码人妻丰满熟妇奶水区码| 日韩免费高清视频| 国产二区在线播放| 国内伊人久久久久久网站视频| 国精品产品一区| 久久久综合亚洲91久久98| 中文字幕一区二区三区久久网站| 久久精品一区二| 99天天综合性| 男女免费视频网站| 在线成人午夜影院| 极品美乳网红视频免费在线观看| 欧美大片在线看免费观看| 草民电影神马电影一区二区| 久久人人九九| 一区在线免费观看| 久久久九九九热| 国产精品久久久一区麻豆最新章节| 波多野结衣国产| 亚洲第一福利在线观看| 性欧美高清come| 成人看片人aa| 日韩久久电影| 五月婷婷激情久久| 国产三区在线成人av| 国产毛片aaa| 亚洲国产精品成人精品| aa视频在线观看| 高清日韩一区| 国内在线观看一区二区三区| 欧美污在线观看| 一二三区精品视频| av男人天堂av| 欧美成aaa人片免费看| 亚洲高清国产拍精品26u| 亚洲一区二区在线观| 日本特黄久久久高潮| 亚洲理论片在线观看| 日本高清不卡视频| 你懂的在线视频| 国产精品扒开腿做爽爽爽的视频| 网友自拍一区| 粗暴91大变态调教| 久久久不卡影院| 伊人久久成人网| 社区色欧美激情 | 亚洲免费看片| 国产精品波多野结衣| 国产精品一区二区在线观看不卡| 紧身裙女教师波多野结衣| 日韩一级高清毛片| 伦理av在线| 久久久久欧美| 日韩国产精品久久| 91视频最新网址| 日韩你懂的在线观看| 国产精品探花在线| 精品综合久久久| 日韩专区一卡二卡| 69xxx免费| 日韩一区二区高清| 国产蜜臀一区二区打屁股调教| 国新精品乱码一区二区三区18| 99热免费精品在线观看| av男人的天堂av| 欧美精品 国产精品| 羞羞网站在线看| 久久99导航| 美女久久久精品| 污污的视频在线免费观看| 日韩精品一区二区三区老鸭窝| 国产色播av在线| 亚洲乱码一区二区三区三上悠亚| 国产一区二区精品久久91| 国产一二三四在线| 精品亚洲一区二区三区| 日韩三级成人| 阿v天堂2018| 中文字幕第一区第二区| 99久久精品国产一区色| 日本道色综合久久影院| 水蜜桃久久夜色精品一区| 久久久久久久久久影视| 色猫猫国产区一区二在线视频| 国产素人视频在线观看| 精品九九九九| 久草在线在线精品观看| 中文字幕亚洲精品在线| xxx成人少妇69| 网曝91综合精品门事件在线| caoporm在线视频| 日韩欧美在线看| av片在线观看| 亚洲国产另类久久久精品极度| 成av人片一区二区| 91丨porny丨在线中文| 欧美一区在线直播|