精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「模仿學習」只會套話?解釋微調+130億參數Orca:推理能力打平ChatGPT

人工智能 新聞
用GPT-4輔助訓練小模型,想會推理還得用「解釋微調」。

自ChatGPT API開放后,大量的研究都選擇利用ChatGPT和GPT-4等大型基礎模型(LFM)的輸出作為訓練數據,然后通過模仿學習來提升小模型的能力。

但由于模仿信號流于表面、訓練數據量不夠大、缺乏嚴格的評估標準等問題,小模型的實際性能被高估了。

從效果上來看,小模型更傾向于模仿LFM的輸出風格,而非推理過程。

圖片

論文鏈接:https://arxiv.org/pdf/2306.02707.pdf

為了應對這些挑戰,微軟最近發布了一篇長達51頁論文,提出了一個130億參數的Orca模型,可以學習模仿LFMs的推理過程。

研究人員為大模型設計了豐富的訓練信號,使得Orca可以從GPT-4中學習到解釋痕跡、逐步的思維過程、復雜的指令等,并由ChatGPT的教師協助指導;并通過采樣和選擇來挖掘大規模且多樣化的模仿數據,可以進一步提升漸進式學習效果。

在實驗評估中,Orca超過了其他SOTA指令微調模型,在BigBench Hard(BBH)等復雜的零樣本推理基準中實現了比Vicuna-13B翻倍的性能表現,在AGIEval上也實現了42%的性能提升。

圖片

此外,Orca在BBH基準上還實現了與ChatGPT持平的性能,在SAT、LSAT、GRE和GMAT等專業和學術考試中只有4%的性能差距,并且都是在沒有思維鏈的零樣本設置下測量的。

圖片

研究結果表明,讓模型從分步解釋中學習,無論這些解釋是由人類還是更高級的人工智能模型產生的,都是提高模型能力和技能的一個有前景的研究方向。

解釋微調(Explanation Tuning)

數據集構造

在訓練數據中,每個實例都包括三部分,即系統消息、用戶查詢和LFM回復。

系統消息(system message)放置在提示中開頭的部分,提供給LFM基本的上下文、引導以及其他相關的細節。

系統消息可以用來改變回復的長度、描述AI助手的性格、建立可接受和不可接受的LFM行為,并確定AI模型的回復結構。

研究人員手工制作了16條系統信息來設計LFM不同類型的回復,可以生成創造性的內容以及解決信息查詢問題,最重要的是能夠根據提示生成解釋和逐步推理的答案。

圖片

用戶查詢(user query)定義了希望LFM執行的實際任務。

為了獲得大量的、多樣化的用戶查詢,研究人員利用FLAN-v2集合,從中抽取500萬個用戶查詢(FLAN-5M),并收集ChatGPT的回復;然后進一步從500萬條指令中抽出100萬條指令(FLAN-1M),收集GPT-4的回復。

FLAN-v2集合由五個子集合組成,即CoT、NiV2、T0、Flan 2021和Dialogue,其中每個子集包含多個任務,每個任務都是一個查詢的集合。

每個子集合都與多個學術數據集相關,并且每個數據集都有一個或多個任務,主要關注零樣本和少樣本的查詢。

在這項工作中,研究人員只取樣訓練Orca的零樣本查詢,并且沒有從Dialogue子集中取樣,因為這些查詢往往缺乏背景,無法從ChatGPT中獲得有用的回復。

讓ChatGPT扮演Teaching Assistant

首先在FLAN-5M數據上訓練Orca(ChatGPT增強),隨后在FLAN-1M上進行第二階段的訓練(GPT-4增強)。

將ChatGPT作為中間的教師助手主要有兩個原因:

1. 能力差距

雖然GPT-4的參數量沒有公開,但130億參數的Orca肯定比GPT-4要小很多倍,而ChatGPT和Orca之間的能力差距更小,更適合作為中間教師,并且這種方式已經被證明可以提高更小的學生模型在知識蒸餾中的模仿學習性能。

這種方式也可以看作是一種漸進式學習或課程學習,學生首先從較容易的例子中學習,然后再學習較難的例子,假定了較長的回復會比較短的回復更難模仿,可以從更大規模的教師模型中改進推理和逐步解釋能力。

2. 成本和時間

從Azure OpenAI API進行大規模數據收集時會受到一些限制,包括每分鐘請求的速率限制,防止流量過大;由于服務延遲問題,每分鐘可用的token數量有限;提示長度和token補全的金錢成本。

圖片

相比之下,ChatGPT API比GPT-4終端更快、更便宜,所以從ChatGPT上收集了比GPT-4多5倍的數據。

圖片

從ChatGPT和GPT-4對應于不同系統消息的回復長度分布中可以觀察到,GPT-4的回復平均比ChatGPT長1.5倍,使得Orca能夠逐步從教師解釋的復雜性中學習,并通過消融實驗證明了教師幫助的影響。

訓練

在分詞階段,研究人員利用LLaMA的字節對編碼(BPE)分詞器來處理輸入的樣本,其中多位數字會被分割成多個單數字,并回落到字節來分解未知的UTF-8字符。

為了處理可變長度的序列,在LLaMA分詞器的詞匯表中引入了一個填充詞[[PAD]],最終的詞匯表包含32001個token

為了優化訓練過程并有效利用可用的計算資源,研究人員利用了packing技術,將多個輸入實例串聯成一個序列后再訓練模型。

在packing的過程中,串聯序列的總長度不超過max_len=2048 tokens,對輸入的樣本進行隨機打亂后將分成幾組,每組串聯序列的長度最多為max_len

考慮到訓練數據中增強指令的長度分布,每個序列的打包系數為2.7

為了訓練Orca,研究人員選擇只計算教師模型生成token的損失,也就是說學習生成以系統信息和任務指令為條件的回復,可以確保模型專注于從最相關和最有信息的token中學習,提高了訓練過程的整體效率和效果。

最后在20個裝有80GB內存的NVIDIA A100 GPU上訓練Orca,先在FLAN-5M(ChatGPT增強)上訓練4個epoch,花了160個小時;然后在FLAN-1M(GPT-4增強)上繼續訓練4個epoch

由于流量限制、終端負載以及回復的長度問題,從GPT-3.5-turbo(ChatGPT)和GPT-4的多個終端收集數據分別用了2周和3周的時間。

實驗部分

研究人員主要驗證了Orca在推理上的能力。

圖片

在AGIEval的實驗中可以看到,Orca的表現與Text-da-Vinci-003相當,并實現了ChatGPT 88%的性能表現,不過明顯落后于GPT-4

對于分析和推理任務,Vicuna的表現明顯更差,只保留了62%的ChatGPT質量,表明這種開源語言模型的推理能力很差。

雖然Orca與Text-da-Vinci-003的表現相當,但仍然比ChatGPT低5分,Orca在與數學有關的任務(在SAT、GRE、GMAT中)上與ChatGPT表現出較大的差距。

與Vicuna相比,Orca顯示出更強的性能,在每個類別上都超過了Vicuna,平均有42%的相對提高。

GPT-4的性能遠遠超過了所有其他模型,但在這個基準中仍有很大的提升空間,目前所有模型的性能都明顯低于人類的得分。

圖片

Orca的性能根據系統信息的類型有很大的不同,對于訓練的模型來說,空的系統消息往往效果很好。

圖片

Orca在不同任務的325個樣本中超越了ChatGPT(Orca-beats-ChatGPT例子),其中大部分來自LogiQA(29%),而其他LSAT任務和SAT-英語任務各占不到10%

在Big-Bench Hard Results數據集上的推理評估結果顯示,Orca在所有任務中的綜合表現上略好于ChatGPT,但明顯落后于GPT-4;比Vicuna性能高出113%

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-03-31 13:55:00

模型智能

2024-12-03 15:51:45

2023-10-28 13:36:48

模型ChatGPT

2023-11-07 14:07:51

GPT-4大語言模型

2023-07-19 15:01:14

GPT-4LaMA2參數

2025-11-07 09:28:08

2023-07-18 15:00:00

AI代碼

2023-10-31 12:29:25

模型訓練

2024-07-04 15:32:13

2023-12-03 08:49:38

微軟開源

2025-04-30 09:19:32

2023-08-25 09:34:24

模型訓練

2023-10-23 15:27:09

OpenAIChatGPT

2025-07-16 10:42:32

2023-06-06 07:03:02

2023-04-23 09:43:22

2025-06-23 09:09:00

2023-04-26 13:56:17

模型ChatGPT

2023-04-07 09:28:31

模型訓練

2023-04-04 13:17:00

GPUCMU開源
點贊
收藏

51CTO技術棧公眾號

性国裸体高清亚洲| 少妇一级淫片免费看| 欧美xxxxx视频| 欧美一区二区三区喷汁尤物| 精品少妇人欧美激情在线观看| 欧美女优在线| 国产又粗又猛又爽又黄91精品| 久久人人爽人人爽人人片av高清| 97超碰在线免费观看| 亚洲a成人v| 亚洲成人av一区二区三区| 日韩国产精品一区二区三区| 草逼视频免费看| 久久久一二三| 欧美国产日韩一区二区在线观看| 瑟瑟视频在线观看| 亚洲日本va中文字幕| 欧美伊人久久久久久久久影院| 激情五月六月婷婷| 成人免费黄色网页| 99国内精品久久| 91gao视频| 中文字幕在线观看第二页| 亚洲精品美女91| 久久五月情影视| 国产三级短视频| 日韩啪啪网站| 日韩欧美一级特黄在线播放| 可以看污的网站| 天天综合网天天| 香蕉成人伊视频在线观看| 中文字幕久久一区| jizz亚洲| 中文幕一区二区三区久久蜜桃| 国产一区二区三区免费不卡| av高清一区二区| 精品在线你懂的| 国产a级全部精品| 亚洲免费激情视频| 国产中文一区| 色综合久久久久久中文网| 日本不卡一二区| 欧美gayvideo| 最近日韩中文字幕中文| 在线小视频你懂的| 欧洲激情综合| 一夜七次郎国产精品亚洲| 午夜av免费看| 人人网欧美视频| 日韩成人av网| 无码h肉动漫在线观看| 卡通动漫国产精品| 精品无人区太爽高潮在线播放 | 欧美精品一区二区在线观看| 三级黄色片免费看| 国产成人免费视频网站视频社区| 欧美日韩久久久| 亚洲免费黄色网| 高清不卡一区| 欧美一级在线观看| 涩视频在线观看| 群体交乱之放荡娇妻一区二区 | 粉嫩av蜜桃av蜜臀av| 小嫩嫩12欧美| 在线观看欧美成人| 国产一区二区三区视频播放| 图片小说视频色综合| 久久久极品av| 久久激情免费视频| 99在线热播精品免费99热| 88xx成人精品| 懂色av蜜臀av粉嫩av喷吹| 免费的成人av| 91精品视频免费| 免费观看黄色av| 91老司机福利 在线| 视频一区亚洲 | 亚洲人成网站色在线观看| 男人的天堂视频在线| 后进极品白嫩翘臀在线播放| 欧美日韩在线观看视频| 国产一区二区在线免费播放| 亚洲精品三区| 亚洲国产日韩欧美在线图片| 国产ts在线播放| 亚洲影视一区二区三区| 亚州成人av在线| 免费视频网站在线观看入口| 韩国成人精品a∨在线观看| 国产精品三区在线| 成年人在线看| 亚洲综合在线视频| 精品免费国产一区二区| 试看120秒一区二区三区| 精品亚洲aⅴ在线观看| 欧美88888| 亚洲理论在线| 成人www视频在线观看| 亚洲卡一卡二卡三| 国产欧美视频一区二区| 超碰超碰超碰超碰超碰| 免费亚洲电影| 日韩一区二区免费高清| 91中文字幕永久在线| 欧美/亚洲一区| 日韩美女中文字幕| 韩国av电影在线观看| 国产欧美一区二区精品久导航 | 日韩av一级片| 动漫一区二区在线| 欧美黑人激情| 色综合久久综合中文综合网| 日本wwwwwww| 五月激情久久久| 日韩美女在线观看| 天堂av一区二区三区| 自拍偷拍国产精品| 美女网站免费观看视频| 免费看久久久| 欧美成人中文字幕| 一区二区视频在线免费观看| 久久色中文字幕| 国产精品久久..4399| 日韩黄色在线| 国产一区二区日韩精品欧美精品| 亚洲一区欧美在线| 国产91精品免费| 亚洲自拍偷拍一区二区三区| 影视一区二区三区| 亚洲免费视频观看| 日本午夜视频在线观看| 国产成人一级电影| 中文字幕不卡每日更新1区2区| 日韩欧美少妇| 亚洲欧美日韩在线高清直播| 黄色一级片免费看| www.激情成人| 奇米精品一区二区三区| 国产成人高清精品免费5388| 欧美成人手机在线| 国产孕妇孕交大片孕| 欧美国产禁国产网站cc| 人人爽人人av| 欧美日韩国产免费观看视频| 日本乱人伦a精品| 日韩亚洲视频在线观看| 五月激情综合婷婷| 亚洲永久无码7777kkk| 亚洲三级电影在线观看| 国产精品久久一区二区三区| 蜜臀av在线| 欧美精品一区二区三区很污很色的| 免费在线观看亚洲| 国产成人亚洲精品青草天美| 日韩黄色片在线| 99a精品视频在线观看| 午夜精品理论片| 色欲av永久无码精品无码蜜桃| 午夜一区二区三区视频| free性中国hd国语露脸| 老司机午夜精品视频| 日本在线观看一区| 亚洲精品第一| 色综合老司机第九色激情| 黄色小视频免费在线观看| 五月天中文字幕一区二区| 制服丝袜第二页| 日本伊人色综合网| 黄色免费高清视频| 国产精品巨作av| 日本不卡视频在线播放| 丁香婷婷在线| 日韩西西人体444www| 日韩特黄一级片| 国产亚洲污的网站| 激情在线观看视频| 亚洲精品社区| 天堂精品视频| 天堂久久av| 日本久久精品视频| 久久五月精品| 日韩av一区二区在线| 中文字幕日韩经典| 亚洲午夜一区二区| 乐播av一区二区三区| 国内成+人亚洲+欧美+综合在线 | 国产伦子伦对白在线播放观看| 亚洲欧洲成视频免费观看| 国产一区二区网站| 欧美日韩在线另类| 成年人一级黄色片| 91麻豆123| 免费黄色在线播放| 视频一区二区中文字幕| 国产女人18毛片| 国产成人一区| 99久久精品无码一区二区毛片 | 日韩欧美一卡二卡| 青青视频在线免费观看| 亚洲精品中文字幕乱码三区| 性久久久久久久久久| 国产精品一区二区视频| 久久人妻精品白浆国产| 欧美日韩成人| 婷婷五月色综合| 香蕉精品久久| 成人黄视频免费| 久久婷婷五月综合色丁香| 97色在线播放视频| 伊人手机在线| 最近2019年好看中文字幕视频| 五月婷婷丁香六月| 91精品国产综合久久精品性色| 欧美人一级淫片a免费播放| 亚洲va欧美va人人爽| 欧美一区免费观看| 日本一区免费视频| 三级男人添奶爽爽爽视频| 国产一区二区久久| 亚洲黄色小视频在线观看| 99国产精品| 97中文字幕在线| 亚洲成av人片乱码色午夜| 日本中文不卡| 欧美美女在线| 欧美精品亚洲精品| 欧美三级午夜理伦三级在线观看| 91欧美精品午夜性色福利在线| 素人一区二区三区| 日韩av免费在线播放| 麻豆mv在线观看| 高清欧美性猛交| 欧美家庭影院| 欧美激情精品久久久久久蜜臀 | 日韩一区三区| 天堂一区二区三区| 人人狠狠综合久久亚洲婷| 欧洲精品码一区二区三区免费看| 亚洲精品3区| 免费看成人午夜电影| 婷婷成人在线| 欧美精品亚洲精品| 极品美女一区二区三区| 日韩高清av电影| 欧美日韩中文字幕一区二区三区| 欧美乱偷一区二区三区在线| 影视先锋久久| 日韩区国产区| 97欧美在线视频| 女同性恋一区二区| 欧美不卡视频| 91午夜在线观看| 亚洲二区在线| 黄色动漫在线免费看| 免播放器亚洲| 色片在线免费观看| 久久99久久精品欧美| 尤物网站在线看| 粉嫩久久99精品久久久久久夜| 免费黄色av网址| 99re这里只有精品首页| 草草影院第一页| 中文字幕av不卡| 91麻豆免费视频网站| 亚洲一区免费在线观看| 日本系列第一页| 色婷婷亚洲精品| 国产又黄又粗又硬| 精品久久久久久久久久久久久久久| 黄色片一区二区| 亚洲色图激情小说| 丝袜美腿美女被狂躁在线观看| 九九热在线精品视频| 蜜桃视频在线网站| 国产精品扒开腿做爽爽爽的视频| 在线日韩三级| 精品在线观看一区二区| 日韩免费看片| 免费看欧美一级片| 久久一区亚洲| 初高中福利视频网站| 94色蜜桃网一区二区三区| 国产91丝袜美女在线播放| 亚洲你懂的在线视频| 丰满少妇乱子伦精品看片| 在线观看区一区二| 国产按摩一区二区三区| 亚洲精品日韩丝袜精品| av电影高清在线观看| 欧美在线视频免费播放| 成人豆花视频| 免费h精品视频在线播放| 亚洲精品国产偷自在线观看| 日韩精品视频久久| 国产美女主播视频一区| 网站免费在线观看| 中文字幕综合网| 青草视频在线观看免费| 日韩精品一区二区三区在线| 国产在线观看免费网站| 久久久久久久一区二区三区| 69堂免费精品视频在线播放| 成人在线免费网站| 99精品在线| 日日碰狠狠丁香久燥| 成人国产精品免费观看视频| xxxxx99| 欧美日韩中国免费专区在线看| 99久久精品国产一区二区成人| 亚洲人成毛片在线播放| 欧美24videosex性欧美| 国产日韩欧美在线| 美女少妇全过程你懂的久久| 少妇大叫太大太粗太爽了a片小说| 日本欧美大码aⅴ在线播放| 免费成人深夜夜行p站| 亚洲影视在线播放| 国产精品久久久久久久免费| 亚洲色图第一页| av资源亚洲| 蜜桃视频在线观看成人| 99热免费精品在线观看| 欧美一级片在线免费观看| 亚洲欧洲日产国码二区| 亚洲系列在线观看| 亚洲天堂成人在线| 中文字幕资源网在线观看免费| 成人欧美一区二区三区黑人免费| 亚洲国产精品日韩专区av有中文 | 盗摄精品av一区二区三区| 国产又粗又硬又长又爽| 欧美高清性hdvideosex| 天堂资源在线中文| 国产精品色午夜在线观看| 久久99蜜桃| 91淫黄看大片| 国产片一区二区三区| 中文字幕免费在线看| 一本色道久久88综合日韩精品| 欧洲一区二区三区精品| 欧美18视频| 日韩电影免费在线| 一级片久久久久| 欧美二区三区91| 成人无遮挡免费网站视频在线观看| 国产欧美一区二区三区四区| 欧美xxav| 久久久久无码精品| 亚洲在线视频一区| 欧美 日韩 国产 在线| 久久久久中文字幕2018| 久久动漫网址| 91免费视频网站在线观看| 久久综合久久鬼色| 在线观看亚洲黄色| 中文字幕日韩av综合精品| 成人永久在线| 欧美日韩不卡在线视频| 91一区二区在线| 欧美人一级淫片a免费播放| 日日骚久久av| 亚洲大奶少妇| 欧美日韩二三区| 欧美激情一区二区| 国产三级小视频| 97国产一区二区精品久久呦| 免费av一区| 日韩成人精品视频在线观看| 亚洲欧美乱综合| 天堂av资源网| 国产精品夜色7777狼人| 永久91嫩草亚洲精品人人| 四虎精品一区二区| 色哟哟精品一区| 成人在线观看免费网站| 国产私拍一区| 秋霞国产午夜精品免费视频| 男人操女人的视频网站| 日韩成人在线电影网| 国产91亚洲精品久久久| 日本一级黄视频| 久久九九久久九九| 国产美女主播在线观看| 亚州国产精品久久久| 水蜜桃精品av一区二区| 欧产日产国产精品98| 在线观看亚洲精品视频| 四虎影视成人| 日韩精品电影网站| 国产.欧美.日韩| 一区二区三区麻豆| 国内精品模特av私拍在线观看| 精品一区免费| 人妻巨大乳一二三区| 91精品91久久久中77777| 色av手机在线| 亚洲欧美日韩另类精品一区二区三区 | 国产精品羞羞答答在线观看| 少妇性l交大片7724com| 欧美在线影院一区二区|