精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

詳解“小而優”的大語言模型Zephyr 7B

譯文
人工智能
Zephyr 7B是由Hugging Face H4團隊創建的一個模型,主要目的是創建一個更小的語言模型,與用戶意圖保持一致,但性能勝過更大的模型。

Zephyr是Hugging Face發布的一系列大語言模型,使用蒸餾監督微調(dSFT)在更龐大的模型上進行訓練,顯著提高了任務準確性。

2023年是屬于大語言模型(LLM)和開源的一年。許多初創公司和企業開放了模型和權重的源代碼,以應對ChatGPT和Claude等專有LLM。2023年的一些重要公司和模型(開源)包括:

  • Meta(Llama和LLamav2)
  • TII(Falcon 7B、40B和180B)
  • Mistral(Mistral 7B和Mixtral8x7B)

然而,部署相對容易和便宜的7B模型無法與70B等更龐大的模型相提并論。最強大的開源模型是Mistral 7B,它勝過許多更龐大的模型。

圖1. Mistral-7B與各大模型的比較

可見,這些小模型仍然不能很好地響應自然提示,需要良好的提示工程。

引言

Zephyr 7B是由Hugging Face H4團隊創建的一個模型,主要目的是創建一個更小的語言模型,與用戶意圖保持一致,但性能勝過更大的模型。

Zephyr是Mistral-7B的校準版本,主要借助蒸餾的優點創建而成,在學術和對話衡量基準方面與70B型號不相上下。

圖2. Zephyr-7B的性能比較

關鍵特性

Zephyr性能出色的原因是H4團隊使用了這幾項關鍵技術。

  • 自我指導數據創建和DSFT(蒸餾監督微調)
  • 反饋收集
  • DSFT模型的DDPO(蒸餾直接偏好優化)

自我指導數據創建和DSFT

傳統上,監督微調(SFT)通過高質量的指令完成針對大語言模型的數據創建。這些數據的構建成本很高,需要人工監督。

其中一個值得關注的方法是使用Teacher模型(已經過訓練的LLM)來生成指令和響應。這項蒸餾技術首先用于Alpaca,證明了借助蒸餾監督微調,小模型的性能可以勝過大模型。

圖3. 自我指導管道

H4團隊使用Zephyr構建用于執行DSFT的高質量監督(指令和完成)數據集。根據生成的指令/完成訓練模型是一種蒸餾形式,名為DSFT(蒸餾監督微調)。

反饋收集

大語言模型通常借助人類反饋強化學習(RLHF)進行對齊。Zephyr則是使用來自更好的教師模型(比如GPT-4)的反饋來對齊模型的偏好,遵循超級反饋(Ultra Feedback)方法。

圖4. 超級反饋構建過程

其工作方式是,來自SFT的每個監督提示被傳遞給4個模型(Claude、Llama和Falcon等),針對單個提示的4個響應中每一個都借助GPT-4來評分。現在我們有了一個數據集,包括輸入(x)、最高評分完成(yw)和表示為低評分完成的隨機提示(yl),即我們有一個三元組(x、yw和yl)。

偏好優化

最后這一步的目標是最大化模型的偏好,偏向yw(最高評分完成)而非yl(低評分完成)。這是使用DPO(直接偏好優化)來完成的。使用DPO比使用普通RLHF來得簡單,直觀上性能優于RLHF。本例中的方法被之所以稱為dDPO,是由于它使用借助教師模型生成的蒸餾數據集。

圖5. DPO vs RLHF

整個算法看起來有點像這樣:

可以轉換成以下步驟:

  • 從dSFT模型(僅向前)計算(x, yw)和(x, yl)的概率。
  • 從dDPO模型計算(x, yw)和(x, yl)的概率。
  • 計算Eq 1,反向傳播以更新。重復步驟。

訓練細節

Zephyr使用的基本型號是Mistral-7B,它在發布時是最先進的開源模型。他們使用TRL庫進行微調和對齊。Deep-Speed Zero 3和Flash-Attention 2用來優化和加速訓練,充分利用GPU。模型使用AdamW優化器進行訓練,不使用權值衰減。所有實驗都在16臺A100s上運行,使用bfloat16精度,通常需要2-4小時才能完成。可以參閱原論文(https://arxiv.org/pdf/2310.16944.pdf),深入了解Zephyr訓練程序的細節。

結果

Zephyr團隊結合了最好的技術來訓練大語言模型,它只需70億個參數就可以媲美400億參數模型的性能,可以媲美700億個參數的聊天模型。

表2:Zephyr與其他LLM的比較

圖6. Zephyr與其他LLM的比較

使用

Zephyr模型在Hugging Face上免費可用,可以像其他語言模型一樣使用。

import torch
from transformers import pipeline
pipe = pipeline("text-generation",
model="HuggingFaceH4/zephyr-7b-alpha", # can also use the beta model
torch_dtype=torch.bfloat16,
device_map="auto")
# We use the tokenizer's chat template to format each message - see 
https://huggingface.co/docs/transformers/main/en/chat_templating
messages = [
{
"role": "system",
"content": "You are a friendly chatbot who always responds in the style of a 
pirate",
},
{"role": "user", "content": "How many helicopters can a human eat in one 
sitting?"},
]
prompt = pipe.tokenizer.apply_chat_template(messages, tokenize=False, 
add_generation_prompt=True)
outputs = pipe(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, 
top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

輸出:

<|system|>
You are a friendly chatbot who always responds in the style of a pirate.
<|user|>
How many helicopters can a human eat in one sitting?
<|assistant|>
Ah, me hearty matey! But yer question be a puzzler! A human cannot eat a 
helicopter in one sitting, as helicopters are not edible. They be made of metal, 
plastic, and other materials, not food!

結論

Zephyr-7B是一個小模型,展示了LLM提煉成小模型的能力。由此生成的模型Zephyr-7B基于Mistral-7B,為70億參數聊天模型奠定了新的先進記錄,甚至在MT-Bench上的性能勝過Llama2-Chat-70B。

參考資料:

  • Zephyr:語言模型對齊直接蒸餾(https://arxiv.org/abs/2310.16944)
  • HuggingFace Zephyr博文(https://huggingface.co/blog/Isamu136/understanding-zephyr)
  • 自我指導:https://arxiv.org/abs/2212.10560
  • 超級反饋:https://arxiv.org/abs/2310.01377

原文標題:Exploring the Zephyr 7B: A Comprehensive Guide to the Latest Large Language Model,作者:Ahmad Anis

鏈接:https://www.kdnuggets.com/exploring-the-zephyr-7b-a-comprehensive-guide-to-the-latest-large-language-model。

責任編輯:姜華 來源: 51CTO
相關推薦

2024-06-03 10:43:34

2024-04-02 09:17:50

AI數據開源

2024-03-25 08:00:00

2025-08-01 14:32:35

AI模型訓練

2024-07-22 09:00:00

2023-04-21 10:37:40

語言模型

2024-09-05 14:25:00

訓練代碼

2023-10-13 19:58:33

Mistral7B模型

2024-06-11 14:30:18

2024-05-09 08:33:33

2024-08-13 15:40:00

2024-03-18 07:01:42

2025-03-11 13:07:58

2023-12-17 13:07:11

訓練數據

2024-07-17 13:40:01

2024-07-17 12:13:11

2023-08-28 00:50:14

模型開源

2024-03-08 12:35:41

模型數據

2025-06-25 08:54:03

模型訓練AI
點贊
收藏

51CTO技術棧公眾號

久久久精品在线视频| 成人国产精品免费视频| 国产黑丝一区二区| 松下纱荣子在线观看| 久久久夜色精品亚洲| 国产精品永久免费| 欧美精品久久久久性色| 日韩三级视频| 精品视频在线免费观看| 无码毛片aaa在线| 天堂在线视频免费| 蜜臀av国产精品久久久久 | 欧美一区影院| 国产亚洲va综合人人澡精品 | 日韩av首页| 亚洲欧洲国产专区| 蜜桃网站成人| 国产露脸国语对白在线| 国产精品美女久久久| 色综合伊人色综合网站| jlzzjizz在线播放观看| 欧美视频第一| 福利视频一区二区| 懂色av粉嫩av蜜臀av| 天堂在线中文资源| 国产精品亚洲综合一区在线观看| 欧美一级视频一区二区| 一区二区成人免费视频| 成人高清av| 亚洲成人精品久久久| 蜜臀一区二区三区精品免费视频| av中文字幕在线看| 成人欧美一区二区三区1314 | 已婚少妇美妙人妻系列| 国产乱妇乱子在线播视频播放网站| 国产欧美一区二区精品性色超碰| 国产日韩欧美综合精品| 国产日产亚洲系列最新| 毛片av中文字幕一区二区| 欧美一级高清免费| 日本熟妇毛茸茸丰满| 亚洲免费二区| 日韩中文字幕免费看| 亚洲第一成人网站| 黄色欧美在线| 亚洲精品一区在线观看| 日韩精品在线播放视频| 一级欧美视频| 欧美视频一区二区在线观看| 亚洲乱码中文字幕久久孕妇黑人| 欧美hdxxxx| 亚洲欧美日韩久久| 伊人情人网综合| 大胆av不用播放器在线播放| 91视频免费看| 激情小说综合区| 空姐吹箫视频大全| 成人av免费在线| 国产经典一区二区三区 | 日韩专区一卡二卡| 日韩暖暖在线视频| 视频一区二区三区四区五区| 宅男噜噜噜66一区二区| 91国在线精品国内播放| 黄色片视频网站| 国产欧美综合一区二区三区| 88xx成人精品| 亚洲天堂一区在线观看| 免费中文字幕日韩欧美| 538国产精品视频一区二区| 日韩人妻无码一区二区三区99| 在线国产欧美| 69国产精品成人在线播放| 成人免费区一区二区三区| 99热免费精品| 国产97色在线| 又污又黄的网站| 精品一区二区三区免费观看| 亚洲精品免费在线视频| 懂色av一区二区三区四区| 懂色av一区二区三区蜜臀| 精品国产日本| a天堂中文在线88| 亚洲蜜桃精久久久久久久| 久久久久99精品成人片| 中文在线а√在线8| 色爱区综合激月婷婷| 日本黄大片一区二区三区| 超碰国产精品一区二页| 精品免费日韩av| av无码av天天av天天爽| 成人一区二区| 欧美另类在线观看| 欧美三日本三级少妇99| 日韩国产欧美一区二区三区| 成人免费在线视频网站| 少妇av在线播放| 国产日产欧美一区二区视频| 永久免费在线看片视频| 最新中文字幕在线播放| 欧美人与性动xxxx| 北京富婆泄欲对白| 成人3d动漫在线观看| 欧美成人精品在线播放| 中文在线第一页| 国产呦萝稀缺另类资源| 精品国产免费一区二区三区| 欧美a免费在线| 天天综合色天天| 男生操女生视频在线观看| 国产毛片精品| 色妞欧美日韩在线| 日韩 欧美 综合| 精品无人码麻豆乱码1区2区 | 东京热加勒比无码少妇| 视频在线日韩| 午夜精品一区二区三区免费视频| 亚洲精品乱码久久久久久自慰| **国产精品| 亚洲精品一区二区网址| 日韩激情综合网| 午夜在线精品| 97人摸人人澡人人人超一碰| 国产在线观看网站| 亚洲自拍偷拍网站| 亚洲最大成人在线观看| 女一区二区三区| 久久国产精品久久久久久久久久 | 色窝窝无码一区二区三区| 中文字幕国产一区二区| 欧美 日韩 国产一区| 日韩三级精品| 日韩网站在线观看| av毛片在线免费观看| av中文字幕在线不卡| 日韩精品一区二区三区电影| 国精产品一区一区三区四川| 亚洲国产精品久久91精品| 精品无码一区二区三区蜜臀 | 亚洲成人天堂网| 美女一区2区| 欧美激情精品久久久久久黑人 | 久久久久久久久免费视频| 色综合久久久久综合99| 午夜不卡久久精品无码免费| 欧美在线免费一级片| 91久久国产精品91久久性色| 成年在线观看免费人视频| 日韩欧美在线观看视频| 国产xxxxxxxxx| 亚洲啪啪91| 国产精品我不卡| 高清电影在线免费观看| 337p亚洲精品色噜噜狠狠| 国产美女网站视频| 蜜桃av噜噜一区| 亚洲女人毛片| 电影亚洲一区| 这里只有精品丝袜| 中文字幕在线网址| 国产精品电影院| 91小视频在线播放| 91精品国产乱码久久久久久久 | 国产剧情一区二区三区| 国产人妻互换一区二区| 清纯唯美激情亚洲| 欧美精品激情在线| 无套内谢的新婚少妇国语播放| 午夜精品影院在线观看| 亚洲第一页av| 日本不卡在线视频| 中文字幕黄色大片| 亚洲不卡在线| 性视频1819p久久| 三级毛片在线免费看| 色呦呦一区二区三区| 中文字幕第24页| 黑人精品欧美一区二区蜜桃| 99中文字幕在线观看| 国产精品国产| 热re99久久精品国产66热| 97电影在线看视频| 日韩欧美高清dvd碟片| 欧美一二三区视频| 中文在线一区二区| 日本少妇一级片| 99在线热播精品免费99热| 日本一区网站| 久久av网站| 欧美专区在线观看| 欧美一区二区三区| 亚洲国语精品自产拍在线观看| 国产一级免费视频| 亚洲色图第一区| 玖玖爱在线精品视频| 轻轻草成人在线| 欧美日韩dvd| 亚州综合一区| 成人网欧美在线视频| bbw在线视频| 最近的2019中文字幕免费一页| www.精品视频| 日本韩国欧美一区二区三区| 欧美激情图片小说| 久久理论电影网| 色婷婷狠狠18禁久久| 久久福利精品| 国产精品va在线观看无码| 神马久久一区二区三区| 亚洲一区二区三区成人在线视频精品| 久草在线中文最新视频| 日韩亚洲第一页| 午夜影院在线视频| 91精品国产色综合久久ai换脸| av网站中文字幕| 亚洲欧美电影院| 蜜桃av乱码一区二区三区| 成人国产精品免费网站| 中文字幕资源在线观看| 日韩中文欧美在线| 少妇高潮喷水在线观看| 午夜视频精品| 亚洲精品在线免费看| 亚洲免费福利一区| 成人激情直播| 国产美女精品视频免费播放软件| 奇米影视亚洲狠狠色| 国精产品一区一区三区mba下载| 色青青草原桃花久久综合| 欧洲免费在线视频| 亚洲国产精品久久久久久| 国产精品人人妻人人爽| 欧美亚洲愉拍一区二区| 精品人妻一区二区色欲产成人| 亚洲一区av在线| 国产女人被狂躁到高潮小说| 国产精品三级av| 国产传媒国产传媒| 久久久久久久久久久久久女国产乱| 国产成人精品一区二区三区在线观看 | 久久久成人网| 老太脱裤让老头玩ⅹxxxx| 午夜天堂精品久久久久| 国产911在线观看| 97精品视频在线看| 亚洲午夜在线观看| 欧美色图激情小说| 日韩欧美一区二区视频在线播放 | 日本一区二区久久精品| 色橹橹欧美在线观看视频高清| 国产乱码精品一区二区三区中文 | 精品一区二区日本| 国产成人澳门| 极品校花啪啪激情久久| 国产精品成人自拍| 精品婷婷色一区二区三区蜜桃| 国产精品极品| 久久久av水蜜桃| 亚洲成在人线免费观看| 欧美成人蜜桃| 精品香蕉视频| 一本一生久久a久久精品综合蜜 | 国产一二三区在线观看| 久久综合伊人77777| av毛片在线| 久久久久亚洲精品| 啊啊啊久久久| 奇米影视亚洲狠狠色| 欧美色网在线| 成人激情视频免费在线| 久久久久久久久成人| 99中文视频在线| 欧美激情网址| 日韩免费av电影| 久久国产影院| 国产精品88久久久久久妇女| 伊人影院久久| 成熟老妇女视频| 久久成人久久鬼色| 色诱av手机版| 久久久亚洲欧洲日产国码αv| 97人妻人人揉人人躁人人| 亚洲三级在线播放| 国产午夜福利片| 在线影视一区二区三区| 国产精品一二三四五区| 日韩av影院在线观看| 国产在线观看高清视频| 久久久成人av| 老色鬼在线视频| 国产精品专区第二| 国产福利资源一区| 日韩精品欧美一区二区三区| 亚洲一区二区三区| 狠狠97人人婷婷五月| 美女www一区二区| 在线观看免费视频国产| 中文字幕不卡三区| 久久久国产精华液| 在线一区二区观看| 成人av无码一区二区三区| 亚洲日本aⅴ片在线观看香蕉| av网站在线看| 国产91在线播放九色快色| 欧美高清hd| 水蜜桃亚洲精品| 激情欧美日韩| 在线观看免费的av| 久久免费视频色| 久久久久亚洲av成人片| 91国偷自产一区二区开放时间 | 717成人午夜免费福利电影| 少妇人妻偷人精品一区二区| 久久精品国产久精国产一老狼| 欧美男男激情videos| 91热精品视频| 精品国产一区二区三区噜噜噜| 欧美日韩福利在线| 精品一区二区三区久久| wwwwxxxx国产| 亚洲一区二区视频| 国产美女无遮挡永久免费| 亚洲欧美国内爽妇网| 丁香花在线电影| 91久久久久久国产精品| 精品日产免费二区日产免费二区| 男女日批视频在线观看| 国产精品一区免费在线观看| 美国一级黄色录像| 色综合久久88色综合天天免费| 亚洲国产精品无码久久| www国产精品com| 99只有精品| 欧美亚洲另类在线一区二区三区| 亚洲国产一区二区三区高清| 性xxxxxxxxx| 亚洲精品欧美激情| 国产又色又爽又黄又免费| 这里只有精品在线观看| 韩国精品主播一区二区在线观看| 国产日产精品一区二区三区四区| 欧美 日韩 国产精品免费观看| 国产精品一区二区小说| 国产亚洲精品资源在线26u| 日韩人妻无码一区二区三区99| 精品国产凹凸成av人导航| 欧美午夜大胆人体| 9a蜜桃久久久久久免费| 亚洲午夜电影| av天堂一区二区| 亚洲国产中文字幕在线视频综合| 国产xxxxxx| 欧美日韩爱爱视频| 涩爱av色老久久精品偷偷鲁| 中文字幕av久久| 国产一区二区三区美女| 国产极品国产极品| 日韩欧美第一区| 国产91在线视频蝌蚪| 91精品国产99久久久久久红楼| 牛牛国产精品| 女同性αv亚洲女同志| 亚洲一二三区在线观看| 深夜福利视频网站| 欧美一区二区色| 竹菊久久久久久久| 中文字幕永久视频| 国产精品久久99| 国产精品久久久久久无人区| 美女av一区二区| 一区二区网站| 亚洲 高清 成人 动漫| 久久久亚洲综合| 影音先锋国产在线| 久久中文字幕视频| 极品国产人妖chinesets亚洲人妖| 免费观看国产精品视频| 久久一区二区三区四区| 中文字幕 亚洲视频| 久久亚洲精品视频| 超碰97久久国产精品牛牛| 99精品视频在线看| 国产精品人成在线观看免费| 国产成人精品无码高潮| 久久久中文字幕| 国产精品免费大片| 亚洲免费在线播放视频| 亚洲国产美女搞黄色| 免费资源在线观看| 成人在线国产精品| 亚洲欧洲一区| 美国一级黄色录像| 精品国产一区二区精华| 日韩成人亚洲| 国产成人一区二区三区别| 久久精品人人爽人人爽| 一区二区三区免费观看视频| 久久久久国色av免费观看性色| 九九精品久久| 91丨porny丨九色|