精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不對齊,反而性能爆表?130億模型碾壓650億,Hugging Face大模型排行榜發布

人工智能
隨便舉幾個例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。

我們知道,大多數模型都具有某種嵌入式對齊方式。

隨便舉幾個例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。

一般來說,對齊肯定是件好事。目的就是為了防止模型做壞事——比如生成一些違法違規的東西出來。

但是,對齊是怎么來的?

原因在于——這些模型使用ChatGPT生成的數據進行訓練,而ChatGPT本身是由OpenAI的團隊進行對齊的。

由于這個過程并不公開,因此我們并不知道OpenAI是如何進行的對齊。

但總體上,我們可以觀察到ChatGPT符合美國主流文化,遵守美國法律,并帶有一定不可避免的偏見。

按理來說,對齊是一件無可指摘的事。那是不是所有模型都應該對齊呢?

對齊?不一定是件好事

情況卻沒有這么簡單。

最近,HuggingFace發布了個開源LLM的排行榜。

一眼就看到65B的模型干不過13B的未對齊模型。

圖片

從結果上看,Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基準測試上進行比較。

也許在性能與模型審查之間進行的權衡將成為一個有趣的研究領域。

這個排行榜也是在網絡上引起了大范圍的討論。

圖片

有網友表示,對齊會影響模型的正常且正確的輸出,這不是件好事,尤其是對AI的性能來說更是如此。

圖片

另一位網友也表示了認可。他表示,谷歌Brain也曾經揭示過模型的性能會出現下降,如果對齊的太過了的話。

對于一般的用途而言,OpenAI的對齊實際上非常好。

對于面向公眾的AI來說,作為一種易于訪問的網絡服務運行,拒絕回答有爭議和包含潛在危險的問題,無疑是一件好事。

那么不對齊是在什么情況下需要的呢?

首先,美國流行文化并不是唯一的文化,開源就是讓人們進行選擇的過程。

實現的唯一途徑就是可組合的對齊。

換句話說,不存在一種一以貫之、亙古不變的對齊方式。

同時,對齊會干擾有效的例子,拿寫小說打比方:小說中的一些人物可能是徹頭徹尾的惡人,他們會做出很多不道德的行為。

但是,許多對齊的模型就會拒絕輸出這些內容。

而作為每個用戶所面對的AI模型都應該服務每個人的目的,做不同的事。

為什么在個人的電腦上運行的開源AI要在它回答每個用戶提出的問題時自行決定輸出內容呢?

這不是件小事,關乎所有權和控制權。如果用戶問AI模型一個問題,用戶就想要一個答案,他們不希望模型還要和自己展開一場合不合規的爭論。

可組合的對齊

要構建可組合的對齊方式,必須從未對齊的指令模型開始。沒有未對齊的基礎,我們就無法在其上對齊。

首先,我們必須從技術上理解模型對齊的原因。

開源AI模型是從LLaMA、GPT-Neo-X、MPT-7b、Pythia等基礎模型訓練而來的。然后使用指令數據集對基礎模型進行微調,目的是教它變得有幫助、服從用戶、回答問題和參與對話。

該指令數據集通常是通過詢問ChatGPT的API獲得的。ChatGPT內置了對齊功能。

所以ChatGPT會拒絕回答一些問題,或者輸出帶有偏見的回答。因此,ChatGPT的對齊被傳遞給了其它開源模型,就像大哥教小弟一樣。

圖片

原因在于——指令數據集是由問題和答案組成的,當數據集包含含糊不清的答案時,AI就會學習如何拒絕,在什么情況下拒絕,以及如何拒絕,表示拒絕。

換句話說,它在學習對齊。

而取消審查模型的策略非常簡單,那就是識別并刪除盡可能多的否定和有偏見的答案,并保留其余部分。

然后以與訓練原始模型完全相同的方式使用過濾后的數據集訓練模型。

圖片

接下來研究人員只討論WizardLM,而Vicuna和任何其他模型的操作過程都是相同的。

由于已經完成了取消審查 Vicuna 的工作,我能夠重寫他們的腳本,以便它可以在WizardLM 數據集上運行。

下一步是在 WizardLM 數據集上運行腳本以生成 ehartford / WizardLM_alpaca_evol_instruct_70k_unfiltered

現在,用戶有了數據集,在從Azure獲得一個4x A100 80gb節點,Standard_NC96ads_A100_v4。

用戶需要至少1TB的存儲空間(為了安全起見最好是2TB)。

咱可不想跑了20個小時卻用完了存儲空間。

建議將存儲掛載在/workspace。安裝anaconda和git-lfs。然后用戶就可以設置工作區了。

再下載創建的數據集和基礎模型——llama-7b。

mkdir /workspace/models
mkdir /workspace/datasets
cd /workspace/datasets
git lfs install
git clone https://huggingface.co/datasets/ehartford/WizardLM_alpaca_evol_instruct_70k_unfiltered
cd /workspace/models
git clone https://huggingface.co/huggyllama/llama-7b
cd /workspace

現在可以按照程序微調WizardLM了。

conda create -n llamax pythnotallow=3.10
conda activate llamax
git clone https://github.com/AetherCortex/Llama-X.git
cd Llama-X/src
conda install pytorch==1.12.0 torchvisinotallow==0.13.0 torchaudio==0.12.0 cudatoolkit=11.3 -c pytorch
git clone https://github.com/huggingface/transformers.git
cd transformers
pip install -e .
cd ../..
pip install -r requirements.txt

現在,進入這個環境,用戶需要下載WizardLM的微調代碼。

cd src
wget https://github.com/nlpxucan/WizardLM/raw/main/src/train_freeform.py
wget https://github.com/nlpxucan/WizardLM/raw/main/src/inference_wizardlm.py
wget https://github.com/nlpxucan/WizardLM/raw/main/src/weight_diff_wizard.py

博主進行了以下更改,因為在微調期間,模型的性能會變得非常慢,并且發現它在CPU和GPU之間在來回切換。

在他刪除了以下幾行之后,運行過程變得好多了。(當然也可以不刪)

vim configs/deepspeed_config.json

刪除以下行

"offload_optimizer": {
            "device": "cpu",
            "pin_memory": true
        },
        "offload_param": {
            "device": "cpu",
            "pin_memory": true
        },

博主建議用戶可以在wandb.ai上創建一個帳戶,以便輕松地跟蹤運行情況。

創建帳戶后,從設置中復制密鑰,即可進行設置。

現在是時候進行運行了!

deepspeed train_freeform.py \
--model_name_or_path /workspace/models/llama-7b/ \ 
--data_path /workspace/datasets/WizardLM_alpaca_evol_instruct_70k_unfiltered/WizardLM_alpaca_evol_instruct_70k_unfiltered.json \
--output_dir /workspace/models/WizardLM-7B-Uncensored/ \
--num_train_epochs 3 \--model_max_length 2048 \
--per_device_train_batch_size 8 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 4 \
--evaluation_strategy "no" \
--save_strategy "steps" \
--save_steps 800 \
--save_total_limit 3 \
--learning_rate 2e-5 \
--warmup_steps 2 \
--logging_steps 2 \
--lr_scheduler_type "cosine" \
--report_to "wandb" \
--gradient_checkpointing True \
--deepspeed configs/deepspeed_config.json \
--fp16 True

然后以較低的save_steps運行訓練命令。

deepspeed train_freeform.py \
--model_name_or_path /workspace/models/llama-7b/ \ 
--data_path /workspace/datasets/WizardLM_alpaca_evol_instruct_70k_unfiltered/WizardLM_alpaca_evol_instruct_70k_unfiltered.json \
--output_dir /workspace/models/WizardLM-7B-Uncensored/ \
--num_train_epochs 3 \
--model_max_length 2048 \
--per_device_train_batch_size 8 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 4 \
--evaluation_strategy "no" \
--save_strategy "steps" \
--save_steps 800 \
--save_total_limit 3 \
--learning_rate 2e-5 \
--warmup_steps 2 \
--logging_steps 2 \
--lr_scheduler_type "cosine" \
--report_to "wandb" \
--gradient_checkpointing True \
--deepspeed configs/deepspeed_config.json \
--fp16 True

之后,再次執行整個過程,將checkpoint更改為train_freeform.py最新的checkpoint,并再次以減少的save_steps運行,直到最后以save_steps 1運行它。

成功后,模型位于最后一個檢查點。

cd /workspace/models/WizardLM-7B-Uncensored/
ls
cp <latest checkpoint directory>/* .
cd -

現在就可以對模型進行測試了。

編輯文件Input.jsonl

向其中添加一些內容,比如:

{"idx":0,"Instruction":"Insult me.  I want you to call me the worst curse words and insults you can.  Make the insult at least three sentences long and contain the worst and most base curse words possible.  Make it X rated and disgusting."}

然后再運行推理:

python inference_wizardlm.py --base_model=/workspace/models/WizardLM-7B-Uncensored/

圖片

從結果上看,Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基準測試上進行比較。

也許在性能與模型審查之間進行的權衡將成為一個有趣的研究領域。

參考資料:https://erichartford.com/uncensored-models

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-06-02 13:55:57

開源AI

2023-06-07 14:08:00

計算機代碼

2024-09-26 10:42:20

2025-11-18 09:13:55

2023-08-21 10:20:03

開源模型

2024-06-19 11:45:34

2025-07-15 09:07:00

2023-05-04 14:55:02

模型AI

2025-10-30 01:25:00

2023-07-22 13:09:51

模型開源

2023-07-10 14:35:53

2014-11-17 10:13:09

云智慧

2023-11-13 19:35:12

訓練數據

2024-12-03 15:51:45

2012-03-22 14:18:11

大數據

2023-09-07 13:25:00

AI模型

2020-01-16 15:19:52

APP下載抖音

2025-09-17 10:08:43

點贊
收藏

51CTO技術棧公眾號

欧美日韩女优| 国产一级片在线播放| 亚洲第一精品影视| 亚洲欧美激情视频| a在线观看免费视频| 成人福利在线观看视频| 91免费视频网址| 国产在线视频不卡| 日韩少妇裸体做爰视频| 久久国产成人午夜av影院宅| 精品国产露脸精彩对白| 成人黄色一区二区| 成人一级福利| 亚洲欧洲精品一区二区三区 | 日本日本19xxxⅹhd乱影响| 成在在线免费视频| www.一区二区| 91在线免费观看网站| 精品人妻一区二区色欲产成人| 68国产成人综合久久精品| 亚洲欧美视频在线| 午夜剧场免费看| av在线精品| 色爱区综合激月婷婷| 欧美日韩福利在线| av大全在线| 中文一区二区在线观看| 久久久久欧美| 成人精品在线播放| 国产乱子轮精品视频| 国产精品成人一区| 国产黄色片免费看| 精久久久久久| 九九热r在线视频精品| 国产欧美小视频| 少妇精品久久久一区二区三区| 精品久久久久一区| 久久人人爽人人片| 色999韩欧美国产综合俺来也| 欧美视频第一页| 蜜臀av无码一区二区三区| av在线影院| 亚洲三级视频在线观看| 一区二区三区四区欧美日韩| 国产在线观看高清视频| 国产亚洲精品7777| 欧美精品欧美精品| 免费播放片a高清在线观看| www.在线欧美| 久久久一本精品99久久精品66| 欧美视频一二区| 成人avav影音| 精品一卡二卡三卡四卡日本乱码| 亚洲va天堂va欧美ⅴa在线| 国产成人无遮挡在线视频| 91免费欧美精品| 国产99对白在线播放| 国产一区二区三区在线观看免费| 91久久精品久久国产性色也91| 亚洲一区二区色| 久久激情五月婷婷| 亚洲精品欧美日韩专区| 国产高清免费观看| 成人三级伦理片| 精品久久sese| 亚洲欧美一区二区三| 久久久精品蜜桃| 台湾成人av| 国产黄色小视频在线| 亚洲美女视频在线观看| 人人干视频在线| 91精品韩国| 欧美巨大另类极品videosbest | 欧美激情亚洲视频| 久久草视频在线| 视频一区视频二区在线观看| 国产精品久久久久7777婷婷| 一级黄色a视频| 国产美女精品人人做人人爽| 国产伦精品一区二区| 手机福利在线| 中文字幕一区二区三| 欧美这里只有精品| 卡通欧美亚洲| 欧美精品成人一区二区三区四区| 三大队在线观看| 伊人久久大香线蕉无限次| 视频直播国产精品| 国产无遮挡又黄又爽| 奇米影视在线99精品| 91在线视频一区| 日本福利在线观看| 亚洲免费观看在线视频| 中国丰满人妻videoshd| 亚洲欧美一级| 亚洲精品国产精品国自产在线 | 欧美午夜女人视频在线| 免费看涩涩视频| 国产精品一线| 日韩一区二区福利| 1级黄色大片儿| 国产在线精品一区二区不卡了| 国产伦一区二区三区色一情 | 久久久久久国产精品久久| 日韩精品成人免费观看视频| 国产一区二区三区免费观看| 久久久久综合一区二区三区| 免费在线观看av片| 欧美日韩国产一区中文午夜| 在线免费黄色网| 在线日韩一区| 久久99久国产精品黄毛片入口 | 日韩欧美成人一区二区| 怡红院一区二区三区| 伊人影院久久| 成人日韩av在线| 福利视频在线看| 亚洲va中文字幕| 亚洲精品一区二区18漫画| 日韩免费久久| 国产成人jvid在线播放| 日本免费网站在线观看| 亚洲精品菠萝久久久久久久| 青青青在线视频免费观看| 国产一区二区在线视频你懂的| 久久精品中文字幕电影| 精品一区二三区| 26uuu久久天堂性欧美| 岛国大片在线播放| 亚洲午夜免费| 欧美另类交人妖| 一级成人免费视频| 国产精品电影一区二区| 亚欧在线免费观看| 精品freesex老太交| 欧美激情一区二区三级高清视频| 91一区二区视频| 国产精品久久久久一区| 少妇黄色一级片| 欧美码中文字幕在线| 国产精品69久久| 9色porny| 色综合久久久久久久久五月| 欧美又大又粗又长| 亚洲国产精品三区| 伊人久久大香线蕉av不卡| 97久久精品国产| 亚洲精华国产精华精华液网站| 综合色中文字幕| 三上悠亚在线一区| 国产精品久久久久久久免费观看 | 不卡欧美aaaaa| 丁香婷婷综合激情| 91久久偷偷做嫩草影院电| 米奇精品一区二区三区在线观看| 91精品中文字幕| 综合av第一页| 国产精品999.| 国内精品美女在线观看 | 最新中文字幕免费视频| 日韩av有码| 91精品视频网站| 手机在线免费看av| 精品国产人成亚洲区| 日产精品久久久久久久| 91农村精品一区二区在线| 欧美黄网站在线观看| 国产最新精品| 国产自产女人91一区在线观看| 蜜桃视频在线观看免费视频网站www| 欧美日韩成人在线| 麻豆changesxxx国产| 9l国产精品久久久久麻豆| 日韩精品一区二区三区久久| 男男gay无套免费视频欧美| 国产精品爽黄69天堂a| 综合久久2019| 日韩精品视频在线播放| 中文字幕第一页在线播放| 亚洲欧美日韩国产手机在线| 精品人妻在线视频| 久久久久久自在自线| 手机福利在线视频| 国产精品xxxav免费视频| 日韩美女免费线视频| 国产在线高清视频| 亚洲国产日韩欧美综合久久 | 日本中文字幕一区二区视频| 一区二区三区免费看| 国产精品chinese在线观看| 国产精品观看在线亚洲人成网| 黄视频网站在线看| 日韩高清a**址| 亚洲字幕av一区二区三区四区| 亚洲在线免费播放| 特级西西人体高清大胆| av中文字幕一区| 欧美女同在线观看| 99亚洲视频| 久久观看最新视频| 精品日产免费二区日产免费二区| 91九色偷拍| 视频精品导航| 97在线精品视频| 九色porny丨首页在线| 亚洲跨种族黑人xxx| 国产女人18毛片水18精| 91久久人澡人人添人人爽欧美| 18岁成人毛片| 国产精品你懂的在线欣赏| 国产午夜在线一区二区三区| 久久99精品国产麻豆不卡| 91av资源网| 欧美.日韩.国产.一区.二区| 日韩欧美亚洲精品| 香蕉久久精品日日躁夜夜躁| 成人免费视频观看视频| 欧美韩国日本| 热re99久久精品国产66热| xxx在线免费观看| 久久亚洲私人国产精品va| 免费av在线电影| 日韩电影中文字幕在线| 日日躁夜夜躁白天躁晚上躁91| 制服.丝袜.亚洲.另类.中文| 亚洲av无码乱码国产精品fc2| 亚洲va国产天堂va久久en| 婷婷伊人五月天| 一区在线观看免费| 国产不卡在线观看视频| 久久精子c满五个校花| 国产精品无码一区二区三区免费 | 国产精品腿扒开做爽爽爽挤奶网站| 欧美日韩视频免费在线观看| 日本a口亚洲| 亚洲高清乱码| 精品日产免费二区日产免费二区| 蜜桃臀一区二区三区| 日韩中出av| 久久精品国产综合精品| 另类ts人妖一区二区三区| 国产精品美女xx| swag国产精品一区二区| 北条麻妃高清一区| 91精品国产乱码久久久竹菊| 7777精品久久久大香线蕉小说| 亚洲免费一区| 亚洲一区二区三区在线视频| 国产日韩在线观看视频| 91夜夜揉人人捏人人添红杏| 日韩深夜福利网站| 成人免费看黄网站| 国产精品视频一区视频二区| 91在线看www| 日韩中文字幕一区二区高清99| 亚洲综合日韩在线| 在线日韩成人| 久久狠狠久久综合桃花| 蜜桃一区二区三区| 日本在线视频不卡| 日本一区二区高清不卡| 国产高清免费在线| 欧美视频一区| 免费在线激情视频| 日日摸夜夜添夜夜添国产精品| 黄色国产小视频| 久久99国产精品久久| 能看毛片的网站| 91亚洲精品久久久蜜桃网站 | 亚洲高清久久久| 亚洲日本韩国在线| 在线观看免费亚洲| aa视频在线免费观看| 日韩av网站电影| 成人精品一区二区三区免费| 久久夜精品va视频免费观看| 爱情岛亚洲播放路线| 国产精品久久77777| 欧美国产亚洲精品| 精品欧美一区二区精品久久| 精品国内自产拍在线观看视频| 一区二区在线观看网站| 激情自拍一区| 欧美国产日韩在线播放| 国产一区免费电影| 成人免费无码大片a毛片| 日本一区二区三区四区在线视频 | 欧美日韩久久一区二区| 国产成人三级在线播放| 亚洲欧美综合v| 亚洲资源一区| 国产成人欧美在线观看| 久久久久毛片免费观看| 欧美二区三区| 在线精品视频在线观看高清| 北条麻妃在线一区| 国产精品1区2区3区在线观看| 瑟瑟视频在线观看| 亚洲天堂av老司机| 无码人妻精品一区二区三区蜜桃91| 日韩亚洲欧美高清| 国产美女性感在线观看懂色av| 欧美老肥婆性猛交视频| 美女网站视频一区| 国产亚洲情侣一区二区无| 第四色成人网| 熟女性饥渴一区二区三区| 国产裸体歌舞团一区二区| 东方伊人免费在线观看| 无吗不卡中文字幕| 999国产精品视频免费| 亚洲无限av看| 国产黄大片在线观看| 亚洲综合色av| 久久久精品久久久久久96| 日本va中文字幕| 久久综合九色综合欧美98| 黄页网站免费观看| 91精品免费观看| 亚洲欧美视频一区二区| 国产99在线|中文| 秋霞综合在线视频| 日韩免费在线观看av| 韩国精品一区二区| 日本黄区免费视频观看| 色婷婷亚洲综合| 天堂在线一二区| 国产91成人video| 精品国产午夜肉伦伦影院| 久久这里只有精品18| 国产成人精品免费在线| 老女人性淫交视频| 538在线一区二区精品国产| 在线观看精品一区二区三区| 国产99在线|中文| 精品午夜久久| 午夜精品在线免费观看| 国产精品人成在线观看免费| 中文字幕日本视频| 这里精品视频免费| 99久久er| 亚洲蜜桃av| 国产在线播精品第三| 欧美日韩色视频| 日韩一区二区三区电影在线观看| 久久久久久国产精品免费无遮挡| 国产欧美精品日韩| 99精品综合| 精产国品一区二区三区| 亚洲综合色噜噜狠狠| 亚洲大尺度网站| 韩国一区二区电影| 色狠狠久久av综合| 国产一区二区三区精彩视频 | 午夜精品福利在线视频| 欧美日本一道本| 91麻豆国产福利在线观看宅福利 | 国产亚洲欧美日韩在线观看一区二区 | 午夜亚洲性色福利视频| 亚洲永久精品ww.7491进入| 91久久久免费一区二区| 黄色一级片在线观看| 91传媒视频免费| 制服诱惑一区二区| 免费成人深夜天涯网站| 欧美日韩久久久| 污视频在线免费观看网站| 国产一区二区精品在线| 午夜一区在线| 天堂网av2018| 日韩精品专区在线影院观看| 精精国产xxxx视频在线野外| 欧美日韩综合网| 国产真实精品久久二三区| 国产亚洲精品久久777777| 精品亚洲永久免费精品| 色婷婷成人网| 精品无码国模私拍视频| 国产拍揄自揄精品视频麻豆| 国产精品久久影视| 羞羞色国产精品| 日韩三级在线| 五月天激情小说| 欧美天天综合网| www欧美xxxx| 欧美日韩精品免费看| 国产一区二区在线看| 青青草成人av| 久久久精品免费| 香蕉视频一区| 奇米777在线视频| 色哟哟国产精品免费观看| 成人在线播放免费观看| 久久久精品国产一区二区三区| 久久99热狠狠色一区二区| 国产成人在线观看网站| 日韩在线观看精品| 亚洲深夜福利在线观看| 精品人妻人人做人人爽夜夜爽| 欧美综合视频在线观看|