精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型免微調解鎖對話能力,RLHF沒必要了!一作上交大校友:節省大量成本和時間

人工智能 新聞
新論文指出,預訓練完成剛出爐的基礎模型已經掌握了遵循指令的能力,只需要提示工程就能引導出來,引起開發社區強烈關注。

要搞大模型AI助手,像ChatGPT一樣對齊微調已經是行業標準做法,通常分為SFT+RLHF兩步走。

來自艾倫研究所的新研究卻發現,這兩步都不是必要的???

新論文指出,預訓練完成剛出爐的基礎模型已經掌握了遵循指令的能力只需要提示工程就能引導出來,引起開發社區強烈關注。

因為RLHF的成本非常高訓練還不穩定,這樣可就省了大錢了。

圖片

研究據此提出一種新的免微調對齊法URIAL

論文中把新方法形容為“解鎖基礎模型潛力的咒語”,能夠節省大量算力資源和時間。

更值得關注的是,不掌握穩定RLHF(人類強化學習)能力的小型團隊,也能低成本開發出可以聊天對話、遵循指令的對齊模型了。

圖片

目前URIAL代碼和新評估基準Just-Eval-Instruct已開源,剛剛上傳不久。

圖片

研究來自艾倫研究所和華盛頓大學Yejin Choi團隊,過去曾提出Top_p采樣,在如今大模型API調用中是常用參數。

圖片

一作研究員林禹辰是上交大校友。

圖片

打破SFT+RLHF神話

最早讓人們開始質疑對齊微調的,是一項Meta等在5月份一項研究LIMA

LIMA指出只需要1000個樣本做SFT(監督微調),就可以匹配ChatGPT的性能。

圖片

論文中LIMA團隊還探討了“表面對齊假設”(Superficial Alignment Hypothesis)

模型的知識和能力幾乎都是在預訓練階段學到的,對齊則是教會模型在與用戶互動時應使用哪些特定格式的子集。

換句話說,對齊階段只是調整模型的語言風格,沒有增強模型的能力。

從表面對齊假設出發,URIAL團隊做了充分的實驗,對比基礎模型和對齊模型之間的token分布偏移(TDS,token distribution shifts)

圖片

實驗選用3組基礎模型與對齊模型做對比,結果表明:

圖片

  • 對齊僅影響一小部分token。基礎模型和對齊模型在大多數位置的解碼中表現相同,共享排名靠前的一組token。
  • 對齊主要涉及文風相關的token,如話語標志(discourse markers,“首先、其次、總之、然而……”這些)、過渡詞和安全免責聲明,只占5-8%。
  • 對齊對較早出現的token更重要(生成內容的開頭),在后續位置對齊模型排名最高的token,基本位于基本模型排top-5的token之內。
  • 基礎模型已經獲得了足夠的知識來遵循指令,給定合適的上下文作為前綴時,它們的行為與對齊模型非常相似。

接下來的問題就是,不用SFT和RLHF的情況下,如何把一個基礎模型變成能多輪對話、遵循指令的AI助手?

免微調對齊法URIAL

團隊的免微調對齊法URIAL(Untuned LLMs with Restyled In-context ALignment),純粹利用基礎模型的上下文學習能力實現有效對齊,只需三個風格示例和一個系統提示。

圖片

在實驗中,團隊使用URIAL方法對齊7B、70B的Llama2以及Mistral-7B大模型。

圖片

結果表明當基礎模型很強時,URIAL的表現甚至優于SFT和RLHF

圖片

團隊認為URIAL方法的主要貢獻有:

  • 實施起來非常簡單,并且可完美重現,從而有助于未來新的免微調和微調對齊方法的開發和評估。
  • 可輕松對齊大尺寸模型(如Llama2-70b甚至Falcon-180b),節省大量算力和時間。
  • 可用于在預訓練過程中頻繁評估基礎模型,監控基礎模型的質量。
  • 可用于公平比較不同基礎模型之間的對齊潛力。過去不同模型的微調過程可能差異很大(例如數據、訓練方法、超參數等),不能直接反映基礎模型的質量。
  • 還可用于探索大模型對齊的科學,例如分析基礎模型在預訓練期間已經獲得的知識和技能,識別缺失的內容,而不是盲目地利用大量數據進行微調,從而產生不必要的計算成本。

圖片

實驗也探索了URIAL中示例的不同數量,如果提高到8個,一些指標中有明顯提升,但一些指標中也有下降,最終作者推薦用3個比較平衡

圖片

對于改用不同的示例也比較穩健

圖片

如果把之前對話作為示例的一部分,URIAL也可以讓基礎模型獲得多輪對話的能力

圖片

One More Thing

論文中實驗的Llama-2和Mistral,其實總體來說都屬于羊駝家族。

URIAL免微調對齊法是否用于羊駝架構之外的大模型?

由于不是羊駝的開源大模型不好找,我們試了試剛剛發布的Transformer挑戰者,Mamba架構基礎模型

Mamba是一種狀態空間模型,別說不是羊駝了,連Transformer都不是。

使用論文附錄提供的一份URIAL標準提示詞,簡單測試發現同樣適用。

圖片

使用URIAL詢問“你能用6歲小朋友也能聽懂的方式解釋什么是狀態空間模型嗎?”

Mamba將數學定義的狀態比喻成了車在路上的位置,比較簡單易懂,甚至給出markdown格式的圖片鏈接,試圖圖文并茂回答問題。

圖片

如果不使用URIAL直接輸入這個問題,Mamba的表現就是基礎模型那樣補全下文而不是回答問題了,解釋的內容也是車轱轆話來回說。

圖片

論文:https://allenai.github.io/re-align/

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-07-03 10:34:13

2024-10-28 07:20:00

AI模型

2016-05-12 16:22:43

IBM大型機LinuxONE

2022-12-19 14:39:29

機器人論文

2023-10-16 12:31:17

人工智能數據

2021-11-19 10:13:01

模型人工智能計算

2024-08-20 07:55:03

2023-06-16 09:45:36

AI視頻

2024-07-22 08:17:00

模型性能

2025-09-15 14:44:59

圖像生成AI模型

2024-06-20 07:23:29

2023-10-20 17:53:05

2023-09-18 11:25:00

2019-12-30 21:50:16

物聯網暖通空調IOT

2025-05-13 05:11:00

推理模型微調

2023-07-17 09:21:12

Meta模型

2024-02-02 21:42:41

2024-09-29 13:40:00

2023-06-16 09:49:11

人工智能研究

2025-07-07 08:56:00

點贊
收藏

51CTO技術棧公眾號

久久久久香蕉视频| 久久婷婷国产精品| 免费观看a视频| 国产精品毛片一区二区三区| 一区二区欧美在线| www.国产福利| 超级白嫩亚洲国产第一| 日本一区免费视频| 97se视频在线观看| 一级黄色av片| 狠狠入ady亚洲精品经典电影| 亚洲欧美国产日韩天堂区| 老司机午夜性大片| 国产一二三在线| 国产精品高潮呻吟| 国产精品区一区| 国产亚洲欧美日韩高清| 亚洲欧美综合| 一区二区三欧美| 黑森林av导航| 小说区图片区亚洲| 欧美性猛交xxxx乱大交| 三级在线免费观看| 成人在线免费公开观看视频| 成人国产精品免费网站| 91亚洲精品视频| 日本一本在线观看| 99综合视频| 欧美大成色www永久网站婷| 国产精品无码一区二区三区| 99re91这里只有精品| 欧美日韩精品一区二区天天拍小说| 欧美久久在线观看| 男人的天堂在线视频免费观看| 91蜜桃传媒精品久久久一区二区| 成人免费视频97| 久久久久久av无码免费看大片| 92国产在线视频| 999在线观看视频| 精品免费一区二区三区| 亚洲一区日本| 成人毛片av在线| 久久精品视频18| 国产精品久久国产精品| 亚洲综合在线第一页| 欧美www.| 成人黄色短视频| 国产欧美日韩中文字幕在线| 99久久精品久久久久久ai换脸| 日韩av片在线播放| 亚洲欧美综合| 麻豆乱码国产一区二区三区| chinese全程对白| 久久一区91| 中文字幕国产日韩| 国产午夜精品福利视频| 欧美热在线视频精品999| 亚洲精品乱码久久久久久金桔影视| 久久久久中文字幕亚洲精品| 久久精品免视看国产成人| 制服.丝袜.亚洲.中文.综合| 加勒比av中文字幕| 日本免费一区二区视频| 欧美一区二区久久久| 97超碰人人看| 中文字幕区一区二区三| 亚洲成人网在线| 国产精品无码一区二区三区免费 | 欧美猛男同性videos| 亚洲另类图片色| 波多野吉衣中文字幕| 国产在线日韩精品| 中文字幕在线日韩| 精品一区在线观看视频| 激情久久久久久久| 97久久久免费福利网址| 秋霞精品一区二区三区| 日韩和的一区二区| 国产在线一区二区三区| 成人黄色在线观看视频| 成人激情av网| 日产精品久久久一区二区| av在线之家电影网站| 亚洲色图欧美在线| av在线观看地址| 热三久草你在线| 日韩欧美在线一区| 波多野结衣国产精品| 涩爱av色老久久精品偷偷鲁| 亚洲国产精品一区二区久| 女人又爽又黄免费女仆| 国产精品97| 97国产成人精品视频| 成人小视频在线播放| 黑人巨大精品欧美黑白配亚洲 | 欧美日韩一区二区三区在线电影 | 欧美日韩国产综合久久| 秋霞午夜鲁丝一区二区| 亚洲人成精品久久久 | 亚洲成人a**址| 亚洲小说区图片| 欧美丝袜第一区| 日本美女视频一区| 欧洲vs亚洲vs国产| 久久亚洲精品中文字幕冲田杏梨| 中文字幕一区二区三区手机版| 日韩电影在线一区二区三区| 成人资源av| www黄在线观看| 亚洲国产精品久久久久秋霞影院| www.xxx亚洲| 91免费精品国偷自产在线在线| 亚洲欧美日韩天堂一区二区| 九九热国产在线| 日韩电影一二三区| 国产伦精品一区二区三区视频黑人 | 小草在线视频免费播放| 91精品国产综合久久久蜜臀粉嫩| 波多野结衣福利| 国内精品久久久久久久影视蜜臀| 国产精品日韩久久久久| 三级黄视频在线观看| 一区二区三区日韩在线观看| 天天干天天综合| 天堂99x99es久久精品免费| 久久综合电影一区| 一区二区视频在线免费观看| 久久影院午夜片一区| 欧美日韩激情四射| 亚洲精品第一| 在线视频精品一| 国产一级片毛片| 99视频精品免费视频| 九九久久九九久久| 日韩精品第二页| 色偷偷综合社区| 波多野结衣大片| 久久久久一区二区三区四区| 麻豆tv在线播放| 永久免费精品视频| 免费91在线视频| 97在线播放免费观看| 国产日韩亚洲欧美综合| 免费观看精品视频| 神马久久av| 欧洲成人在线观看| 欧美老女人性开放| 日韩欧亚中文在线| 粉嫩av蜜桃av蜜臀av| 国产亚洲在线| 久久婷婷开心| jizz内谢中国亚洲jizz| 亚洲天堂av电影| 怡红院av久久久久久久| 久久精品视频一区| 久草福利视频在线| japanese国产精品| 国产区精品视频| 免费黄色电影在线观看| 日韩一区二区三区精品视频| 国精品无码一区二区三区| 国产黄人亚洲片| 91亚洲精品国产| 好吊妞视频这里有精品| 97激碰免费视频| 全色精品综合影院| 欧美色视频在线| 正在播放国产对白害羞| 国产一区二区三区在线观看免费视频| 91精品国产毛片武则天| 精品国产导航| 日本视频久久久| 最新电影电视剧在线观看免费观看| 欧美视频一区二区三区| 四虎永久免费在线| 不卡的av电影| 成人一区二区三| 一区二区在线| 国产精品视频一区二区三区经| 成人性生交大片免费观看网站| 国产一区二区三区视频在线观看 | 亚洲成年人在线| 999这里只有精品| 中文字幕av一区二区三区高| 精品国产乱码久久久久久1区二区| 综合久久精品| 免费在线成人av| 亚洲18在线| 97色伦亚洲国产| 生活片a∨在线观看| 欧美大片顶级少妇| 欧美国产一级片| 一区二区三区在线免费视频| 国产精品无码一区二区三区| 国产毛片一区二区| 日本在线xxx| 国产精品国产一区| 免费看成人片| 秋霞午夜一区二区三区视频| 国产成人精品一区| 久久99亚洲网美利坚合众国| 伊人久久免费视频| 欧美一区,二区| 欧美三级视频在线播放| 日韩美女一级片| 中文字幕一区二区三区在线观看 | 国产精品系列视频| 五月天久久比比资源色| 2014亚洲天堂| 久久综合久久鬼色中文字| 国产九九九视频| 奇米影视一区二区三区| 91国视频在线| 欧美激情第二页| 在线成人性视频| 欧洲专线二区三区| 国产欧美一区二区三区不卡高清| 久久久久黄色| 国产成人亚洲综合青青| 精品众筹模特私拍视频| 中文字幕在线视频日韩| 邻居大乳一区二区三区| 日韩电视剧在线观看免费网站| 国产精品久久久久久无人区| 91福利在线免费观看| 国产成人在线免费观看视频| 一区二区三区视频在线看| 成人信息集中地| 欧美韩日一区二区三区| 少妇真人直播免费视频| 99久久免费精品| 成人区人妻精品一区二| 国产不卡一区视频| 俄罗斯女人裸体性做爰| 国内精品伊人久久久久av影院| 在线观看免费成人av| 水蜜桃久久夜色精品一区的特点| 亚洲熟妇国产熟妇肥婆| 亚洲伦理一区| 国产男女免费视频| 亚洲国产一区二区三区高清| 欧洲精品在线播放| 红桃视频国产一区| 丰满女人性猛交| 亚洲中无吗在线| 一级全黄肉体裸体全过程| 亚洲精品a级片| 麻豆md0077饥渴少妇| 婷婷综合激情| 欧美性受黑人性爽| 亚洲一区二区日韩| 黄色a级片免费看| 在线日本成人| 久久综合九色综合88i| 欧美亚洲网站| 日本久久精品一区二区| 日韩高清在线电影| 亚洲午夜激情影院| 国产伦精品一区二区三区在线观看| 国模私拍视频在线观看| 国产最新精品免费| 中国老熟女重囗味hdxx| 国产成人精品免费看| 成人做爰www看视频软件| av亚洲精华国产精华精| 中出视频在线观看| 国产亚洲一区二区在线观看| 精品视频第一页| 樱桃国产成人精品视频| 久久网一区二区| 欧美午夜www高清视频| 中文字幕在线观看1| 91精品国产综合久久小美女| 动漫av一区二区三区| 国产丝袜精品第一页| wwwww在线观看免费视频| 久久精品久久久久电影| 俺来也官网欧美久久精品| 51精品在线观看| 成人在线中文| 成人片在线免费看| 一本色道久久综合亚洲精品酒店| 色女人综合av| 欧美日韩在线大尺度| 国产美女三级视频| 麻豆国产欧美日韩综合精品二区| 国产又粗又猛大又黄又爽| 91女人视频在线观看| av网站免费在线看| 一区二区三区在线视频观看| 黄色免费av网站| 91精品久久久久久蜜臀| 男人的天堂在线视频| 久久久国产精彩视频美女艺术照福利| 麻豆视频在线看| 国产日本欧美一区二区三区| 日韩一二三区| 欧美日韩在线观看一区| 欧美激情视频一区二区三区在线播放 | 99在线看视频| 国精一区二区| 国内少妇毛片视频| 日本成人中文字幕| 亚洲激情 欧美| 国产精品福利一区| 久久久久久久久久久久久av| 制服丝袜av成人在线看| 国产片在线观看| 久久久久免费视频| 欧美综合影院| 免费看成人av| 亚洲午夜在线| 日日干日日操日日射| 久久久久久日产精品| 久久久久国产精品夜夜夜夜夜| 欧美伊人久久大香线蕉综合69| 欧美综合视频在线| 欧美男插女视频| 亚洲一区二区小说| 日韩aⅴ视频一区二区三区| 亚洲国产专区| 国产男女无遮挡猛进猛出| 国产精品女同互慰在线看| 欧美激情黑白配| 欧美精品一区二区三区四区| 搞黄网站在线观看| 国产精品视频精品| 欧美女优在线视频| 国产精品沙发午睡系列| 国产69精品久久777的优势| 日本精品人妻无码77777| 欧美日韩在线播放| 国产对白叫床清晰在线播放| 日本国产一区二区三区| 美国一区二区| 国产精品久久..4399| 成人av网址在线| 欧美成人三级在线观看| 欧美一区二区在线看| 久久亚洲天堂| 91久久久久久国产精品| 天天天综合网| www.51色.com| 一区二区在线观看视频| 亚洲va欧美va| 欧美激情一区二区三区在线视频观看| 视频一区中文字幕精品| 97在线免费视频观看| 懂色av中文一区二区三区| 久久97人妻无码一区二区三区| 欧美一区二区在线播放| 中文字幕有码在线观看| 亚洲va男人天堂| 欧美精品入口| 免费不卡的av| 欧美日韩国产麻豆| 国产一二三区在线视频| 国产精品视频导航| 小小影院久久| 国产精品熟妇一区二区三区四区 | 青青草国产免费| 不卡一区二区在线| 国产美女激情视频| 亚洲一二三在线| 日韩一区中文| 国产91porn| thepron国产精品| 免费视频久久久| 日韩在线观看免费全集电视剧网站 | 亚洲影视一区| 日韩www视频| 在线亚洲一区观看| 黄色成年人视频在线观看| 99一区二区| 久久狠狠婷婷| 天堂网中文在线观看| 日韩欧美综合一区| 涩涩av在线| 亚洲制服欧美久久| 国产99精品国产| 久久久久久不卡| 久久视频在线免费观看| 国产精品调教| 亚洲一二三区av| 一区二区三区高清| 国自产拍在线网站网址视频| 91视频国产高清| 中文在线不卡| 亚洲少妇xxx| 亚洲国产美女久久久久| 久久精品黄色| 国产黄色一级网站| 亚洲视频免费在线| 天天av综合网| 91网站在线免费观看| 亚洲欧美日韩综合国产aⅴ| 天天色影综合网| 精品网站999www| 日韩中文字幕一区二区高清99| 成人性视频欧美一区二区三区|