精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

300美元平替ChatGPT!斯坦福130億參數(shù)「小羊駝」誕生

人工智能 新聞
繼Alpaca 后,斯坦福聯(lián)手CMU、UC伯克利等機構(gòu)的學(xué)者再次發(fā)布了130億參數(shù)模型駱馬(Vicuna),僅需300美元就能實現(xiàn)ChatGPT 90%的性能。

繼Meta的LLaMA模型開源后,AI界研究人員就在這個模型基礎(chǔ)上衍生出許多版本。

前段時間,斯坦福發(fā)布了Alpaca,是由Meta的LLaMA 7B微調(diào)而來,僅用了52k數(shù)據(jù),性能可以與GPT-3.5匹敵。

今天,斯坦福學(xué)者聯(lián)手CMU、UC伯克利等,再次推出一個全新模型——130億參數(shù)的Vicuna,俗稱「小羊駝」(駱馬)。

圖片

Vicuna是通過在ShareGPT收集的用戶共享對話上對LLaMA進(jìn)行微調(diào)訓(xùn)練而來,訓(xùn)練成本近300美元。

研究人員設(shè)計了8個問題類別,包括數(shù)學(xué)、寫作、編碼,對Vicuna-13B與其他四個模型進(jìn)行了性能測試。

測試過程使用GPT-4作為評判標(biāo)準(zhǔn),結(jié)果顯示Vicuna-13B在超過90%的情況下實現(xiàn)了與ChatGPT和Bard相匹敵的能力。

同時,在在超過90%的情況下勝過了其他模型,如LLaMA和斯坦福的Alpaca。

圖片

團(tuán)隊成員來自加州大學(xué)伯克利分校、卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)、加州大學(xué)圣地亞哥分校和本·扎耶德人工智能大學(xué)。

圖片

90%匹敵ChatGPT

研究人員讓斯坦福的Alpaca和Vicuna來了一輪大比拼,分別對基準(zhǔn)問題回答進(jìn)行了演示。

在使用70K用戶共享的ChatGPT對話數(shù)據(jù)對Vicuna進(jìn)行微調(diào)后,研究發(fā)現(xiàn)Vicuna能夠生成比Alpaca更詳細(xì)、結(jié)構(gòu)更合理的答案。

問:寫一篇關(guān)于最近去夏威夷旅行的有趣的旅游博客文章,強調(diào)文化體驗和必看景點。

圖片

Alpaca的回答可以說是一個濃縮版,短短幾行就寫完了,沒有按照要求完成任務(wù)。它僅是提到了自己寫了一篇博客,并對博客內(nèi)容做了一個概述。

圖片

再來看Vicuna,撰寫了一篇詳細(xì)且引人入勝的旅行博客文章,不僅內(nèi)容有趣,還詳細(xì)地介紹了夏威夷的文化體驗和必看景點。

圖片

由此,讓GPT-4給打分,Alpaca7分,Vicuna滿分。

圖片

那么和ChatGPT對打,Vicuna的表現(xiàn)又如何呢?

兩者雙雙得了9分!

可以看到,這兩個模型提供一次夏威夷之旅的文章不僅引人入勝,而且文筆流暢。

另外,兩個回答中的詳細(xì)程度和準(zhǔn)確性都很出色,而且兩個模型都有效地傳達(dá)了夏威夷之旅的興奮和美麗。

此外,研究人員還將Vicuna與LLaMA,以及谷歌的Bard模型進(jìn)行了測試,測試結(jié)果顯示,LLaMA表現(xiàn)最差(1分),幾乎沒有回應(yīng)。

Bard回答的準(zhǔn)確性和相關(guān)性也是比較高,有9分的成績,但是在更具吸引力回答方面,略低于Vicuna。

除了寫作,研究人員在編碼、數(shù)學(xué)、角色扮演、常識等方面分別對Vicuna模型與其他四個模型的能力進(jìn)行了對比,總共80道題。

圖片

最后,研究人員基于GPT-4的初步評估總結(jié)如圖所示。可以看到,Vicuna達(dá)到了Bard/ChatGPT的90%以上的能力。

圖片

由GPT-4評估的相對響應(yīng)質(zhì)量

有趣的是,在這次Vicuna的demo中,團(tuán)隊還加入了Alpaca和LLaMA的試用,而前者剛被關(guān)閉不久。

Demo地址:https://chat.lmsys.org/

模型介紹

ChatGPT橫空出世讓人興奮不已,但OpenAI不Open的事實讓圈內(nèi)人實在懊惱。

恰恰,Meta的LLaMA模型開源,為許多研究人員動手研發(fā)自己的模型提供了選擇。

Vicuna-13B誕生正是受到LLaMA和斯坦福Alpaca項目的啟發(fā)。這是一個基于增強數(shù)據(jù)集和易于使用、可擴展的基礎(chǔ)設(shè)施的開源聊天機器人。

該模型的訓(xùn)練數(shù)據(jù)來自于ShareGPT收集的用戶分享的對話,然后研究人員通過對LLaMA基本模型進(jìn)行微調(diào),Vicuna-13B就誕生了。

Vicuna-13B展示了與其他開源模型(如斯坦福Alpaca)相媲美的性能。

研究人員對Vicuna-13B的性能進(jìn)行了初步評估,并描述了其訓(xùn)練和服務(wù)基礎(chǔ)設(shè)施。

同時,這一模型演示demo已經(jīng)上線,所有研究人員都能參與在線演示互動,以測試這個聊天機器人的能力。

圖片

工作流程概述

對于Vicuna-13B訓(xùn)練流程,具體如下:

首先,研究人員從ChatGPT對話分享網(wǎng)站ShareGPT上,收集了大約70K對話。

接下來,研究人員優(yōu)化了Alpaca提供的訓(xùn)練腳本,使模型能夠更好地處理多輪對話和長序列。之后利用PyTorch FSDP在8個A100 GPU上進(jìn)行了一天的訓(xùn)練。

在模型的質(zhì)量評估方面,研究人員創(chuàng)建了80個不同的問題,并用GPT-4對模型輸出進(jìn)行了評價。

為了比較不同的模型,研究人員將每個模型的輸出組合成一個單獨的提示,然后讓GPT-4評估哪個模型給出的回答更好。

圖片

LLaMA、Alpaca、Vicuna和ChatGPT的對比

訓(xùn)練

Vicuna是通過使用來自ShareGPT公共API收集的約70K用戶分享對話數(shù)據(jù)微調(diào)創(chuàng)建的。

為了確保數(shù)據(jù)質(zhì)量,研究人員將HTML轉(zhuǎn)換回markdown,并過濾掉一些不適當(dāng)或質(zhì)量較低的樣本。

另外,研究人員將較長的對話劃分為較小的片段,以適應(yīng)模型的最大上下文長度。

Vicuna的訓(xùn)練方法建立在斯坦福的Alpaca基礎(chǔ)上,并進(jìn)行了以下改進(jìn):

  • 內(nèi)存優(yōu)化:

為了使Vicuna能夠理解長上下文,將最大上下文長度從Alpaca的512擴展到2048,這大大增加了GPU內(nèi)存需求。在此,研究人員通過使用梯度檢查點和閃存注意力來解決內(nèi)存壓力。

  • 多輪對話:

通過調(diào)整訓(xùn)練損失以考慮多輪對話,并僅在聊天機器人的輸出上計算微調(diào)損失。

  • 通過Spot實例降低成本:

40倍的數(shù)據(jù)集和4倍的序列長度對訓(xùn)練帶來了相當(dāng)大的挑戰(zhàn)。研究人員采用SkyPilot托管的Spot實例來降低成本,通過利用自動恢復(fù)搶占與自動區(qū)域切換進(jìn)而減少成本。

這種解決方案將7B模型的訓(xùn)練成本從500美元降低到約140美元,將13B模型的訓(xùn)練成本從約1000美元降低到300美元。

評估

評估AI聊天機器人是一項具有挑戰(zhàn)性的任務(wù),因為它需要檢查語言理解、推理和上下文意識。隨著AI聊天機器人變得越來越先進(jìn),現(xiàn)有的開放基準(zhǔn)可能不再足夠。

例如,斯坦福Alpaca中使用的評估數(shù)據(jù)集self-instruct,可以被SOTA聊天機器人有效地回答,這使得人類難以分辨性能差異。更多的限制包括訓(xùn)練/測試數(shù)據(jù)污染和創(chuàng)建新基準(zhǔn)的潛在高成本。

為了解決這些問題,研究人員提出了一個基于GPT-4的評估框架,從而實現(xiàn)對聊天機器人性能的自動評估。

首先,通過精心設(shè)計的提示,讓GPT-4能夠生成多樣化且具有挑戰(zhàn)性的問題。并利用8個不同類別共80道題,如角色扮演、編碼/數(shù)學(xué)任務(wù)等,來測試這些模型(LLaMA、Alpaca、ChatGPT、Bard和Vicuna)在不同領(lǐng)域上表現(xiàn)出的性能。

然后,研究人員要求GPT-4根據(jù)幫助程度、相關(guān)性、準(zhǔn)確性和細(xì)節(jié)對答案的質(zhì)量進(jìn)行評分。結(jié)果顯示,GPT-4不僅可以產(chǎn)生相對一致的分?jǐn)?shù),還可以提供詳細(xì)的解釋來說明為什么給出這樣的分?jǐn)?shù)。但是,GPT-4并不擅長評判編碼/數(shù)學(xué)任務(wù)。

圖片

由GPT-4評估的響應(yīng)比較

GPT-4在超過90%的問題中更喜歡Vicuna,而不是現(xiàn)有的SOTA開源模型(LLaMA、Alpaca)。

在45%的問題中,GPT-4認(rèn)為Vicuna的回答和ChatGPT差不多甚至更好。

綜合來看,Vicuna在總分上達(dá)到ChatGPT的92%。

圖片

局限

研究人員指出,與其他大語言模型類似,Vicuna也存在著一定的局限性。

比如,Vicuna在涉及編程、推理、數(shù)學(xué)以及事實準(zhǔn)確性的任務(wù)上表現(xiàn)不佳。

此外,它也沒有經(jīng)過充分優(yōu)化以保證安全性或減輕潛在的毒性或偏見。

為解決安全方面的問題,研究人員在demo中采用了OpenAI的審查API來過濾掉不適當(dāng)?shù)挠脩糨斎搿?/span>

剩下的名字不多了

現(xiàn)在,除了美洲駝(LLaMA),羊駝(Alpaca),駝馬(Vicuna)都安排上了。

研究人員要趕快沖,因為留給你們的名字不多了(1個)。

圖片


責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-03-14 13:45:14

模型AI

2023-04-07 13:54:37

模型AI

2023-03-22 15:14:00

數(shù)據(jù)模型

2023-04-04 13:17:00

GPUCMU開源

2023-03-15 10:26:00

模型開源

2023-05-26 10:50:38

模型AI

2025-01-17 10:26:19

模型開發(fā)ChatGPT

2023-06-05 15:44:15

GPT-4AI

2023-05-22 09:28:30

模型AI

2023-09-21 12:31:54

AI數(shù)據(jù)

2023-07-03 13:23:47

OpenChatOpenLLMChatGPT

2023-02-14 09:45:11

模型測試

2022-08-11 13:44:59

芯片AI

2024-05-06 08:00:00

AI模型

2023-06-25 13:28:21

2023-02-17 09:01:50

ChatGPT對話機器人

2009-05-19 09:06:41

Apple斯坦福iPhone

2013-01-31 09:45:14

斯坦福超級電腦百萬內(nèi)核

2012-03-21 21:38:27

蘋果

2019-12-16 14:33:01

AI人工智能斯坦福
點贊
收藏

51CTO技術(shù)棧公眾號

欧美情侣性视频| 337p亚洲精品色噜噜| 人偷久久久久久久偷女厕| 欧美一级做a爰片免费视频| 久久中文字幕二区| 亚洲成人免费在线视频| www日韩视频| 最新av在线播放| 久久久久国产成人精品亚洲午夜| 成人国产精品一区二区| 五月天婷婷网站| 日韩大片在线观看| 日韩av在线影院| 国产探花在线看| 日韩电影免费观| 亚洲精品国产一区二区精华液| 免费精品视频一区二区三区| 国产精品无码免费播放| 性久久久久久| 久久久久久久久久久免费精品| 波多野结衣av在线观看| 凹凸av导航大全精品| 欧美视频一区在线观看| 国产 欧美 日韩 一区| 91大神xh98hx在线播放| 99在线视频精品| 92裸体在线视频网站| 99久久精品国产亚洲| 欧美一区久久| 色诱女教师一区二区三区| 噜噜噜在线视频| xxxx日韩| 欧美大片在线观看一区| 亚洲精品怡红院| 一区二区三区短视频| 亚洲一区在线看| 亚洲黄色网址在线观看| 国产精品久久久久久久龚玥菲| 成人精品国产免费网站| 亚洲自拍在线观看| 国产精品久久久久久久久久久久久久久久 | 欧美α欧美αv大片| 免费看污污网站| 日本综合字幕| 91国在线观看| 成年人视频在线免费| 国产蜜臀一区二区打屁股调教| 亚洲欧洲日韩女同| 亚洲一区在线免费| 99reav在线| 国产精品女主播av| 正在播放一区| 久草免费在线| 亚洲欧美国产77777| 在线观看视频黄色| 国产高清一区二区三区视频 | 狠狠躁夜夜躁人人爽天天高潮| 欧美黄在线观看| 欧美成人性色生活仑片| 亚洲av鲁丝一区二区三区| 天天做天天爱天天综合网2021| 色yeye香蕉凹凸一区二区av| 免费黄色国产视频| 牛牛国产精品| 欧美激情一级精品国产| 国产午夜福利精品| 午夜一区二区三区不卡视频| 日本在线精品视频| 亚洲精品91天天久久人人| 日本 国产 欧美色综合| 成人精品久久av网站| 国产成人三级在线播放| 丁香六月综合激情| 激情视频在线观看一区二区三区| 亚洲欧美自偷自拍| 国产人伦精品一区二区| 神马影院午夜我不卡| 午夜视频成人| 一个色在线综合| 免费毛片小视频| 99久久精品一区二区成人| 欧美精品在线视频| 日本天堂在线播放| 免费一区二区三区视频导航| 在线播放国产一区中文字幕剧情欧美 | 丰满肥臀噗嗤啊x99av| 99国产精品久久| 亚洲欧美久久久久一区二区三区| 91精选在线| 精品国产乱码久久久久酒店| 精品久久久噜噜噜噜久久图片 | 成年人午夜剧场| 亚洲毛片一区| 国产精品一二三在线| 粉嫩av一区二区夜夜嗨| 欧美国产欧美综合| 日本男女交配视频| 成人一区视频| 亚洲国产精品久久精品怡红院| 国产精品无码午夜福利| 天天综合一区| 国产激情综合五月久久| 国产深喉视频一区二区| 26uuu国产日韩综合| 在线观看日韩片| 在线天堂新版最新版在线8| 欧美日韩电影在线| 亚洲国产欧美视频| 欧美一区不卡| 国产欧美一区二区| 男男电影完整版在线观看| 亚洲美女少妇撒尿| 亚洲性生活网站| 日韩三级毛片| 欧美激情亚洲精品| 99久久久国产精品无码网爆| 国产香蕉久久精品综合网| 搞av.com| 亚洲国产视频二区| 日韩中文字幕精品视频| 欧美一区二区三区不卡视频| 不卡欧美aaaaa| 经典三级在线视频| 日韩欧美激情| 国产亚洲美女久久| 天天综合网久久综合网| 国产不卡一区视频| 裸体裸乳免费看| 国产成人午夜性a一级毛片| 日韩精品视频免费专区在线播放 | 色综合天天综合网国产成人综合天 | 99国产精品白浆在线观看免费| gogo大尺度成人免费视频| 国产亚洲美女精品久久久| 欧美日韩一级黄色片| 91色.com| 国产深夜男女无套内射| 超碰97久久国产精品牛牛| 超碰97人人做人人爱少妇| 中文字幕+乱码+中文乱码91| 国产亚洲一二三区| 91蝌蚪视频在线观看| 国产成人影院| 国产不卡精品视男人的天堂| 三级在线视频| 色噜噜狠狠一区二区三区果冻| 日本xxx在线播放| 国产亚洲网站| 欧美日韩一区在线播放| 成人教育av| 亚洲免费视频一区二区| 欧美日韩综合一区二区三区| 久久久久国色av免费看影院| www.xxx亚洲| 日韩欧美高清| 91视频国产一区| 任你弄在线视频免费观看| 日韩精品一区二区三区中文精品| 久草网在线观看| 不卡视频在线看| 久草精品在线播放| 清纯唯美综合亚洲| 亚洲free性xxxx护士白浆| 成人av黄色| 精品国产一区二区亚洲人成毛片| 日韩污视频在线观看| 久久久久久免费毛片精品| 黄色影院一级片| 欧美日韩激情| 亚洲japanese制服美女| 国产探花在线观看| 亚洲视频在线观看网站| 亚洲图片欧美在线| 一区二区久久久| 给我免费观看片在线电影的| 久久综合影音| 法国空姐在线观看免费| 久久久伦理片| 国产精品亚洲自拍| 丁香高清在线观看完整电影视频 | 91精品免费| 色一区二区三区| 中文字幕综合一区| 黄色av网站免费在线观看| 日韩欧美中文在线| 成年人二级毛片| 99re这里只有精品首页| www.精品在线| 999亚洲国产精| 亚洲欧美影院| 免费看成人人体视频| 国产精品国模在线| 欧美卡一卡二| 在线视频免费一区二区| 国内精品偷拍视频| 欧美在线一区二区| 国产一级做a爰片在线看免费| 国产亚洲美州欧州综合国| 日本在线视频播放| 天堂蜜桃91精品| 国产美女主播在线| 久久精品国产亚洲夜色av网站| 国产精品免费一区二区三区| 欧美日韩国产网站| 97视频在线观看视频免费视频 | 麻豆9191精品国产| 国产亚洲精品久久久久久久| 欧美一区二区三区高清视频| 国产伦理久久久| vam成人资源在线观看| 国产成人精品av| a毛片不卡免费看片| 色悠悠久久88| 福利在线午夜| 亚洲精品国产suv| www.亚洲欧美| 欧美精品v日韩精品v韩国精品v| 毛片视频网站在线观看| 一区二区三区高清在线| 最新黄色av网址| 国产午夜亚洲精品羞羞网站| 久久久国产精品无码| 国产一区二区在线观看免费| youjizzxxxx18| 美女爽到呻吟久久久久| 男女猛烈激情xx00免费视频| 一本一本久久a久久综合精品| 日韩精品不卡| 欧美美乳视频| 免费看成人av| 中文字幕伦av一区二区邻居| 国产一区免费观看| 粉嫩的18在线观看极品精品| 成人影片在线播放| 年轻的保姆91精品| 亚洲自拍偷拍区| 精品一区二区三区四区五区| 成人性生交大片免费观看嘿嘿视频 | 理论片大全免费理伦片| 国产精品18久久久久久久久| 亚洲一区二区三区四区精品| 久久av资源站| 九一精品久久久| 激情综合色播五月| √天堂资源在线| 久久电影国产免费久久电影| 亚洲欧美国产中文| 精品影视av免费| 在线观看日本www| 国产精品亚洲视频| www.四虎精品| 99久久精品费精品国产一区二区| 欧美熟妇精品一区二区蜜桃视频| 国产成人av电影| 国产熟女高潮一区二区三区| 91碰在线视频| 国产熟女一区二区| 国产精品美女久久久久久| 秋霞欧美一区二区三区视频免费| 中文字幕亚洲欧美在线不卡| 成人在线观看小视频| 亚洲影院在线观看| 国产欧美日韩另类| 欧美主播一区二区三区| 在线免费观看高清视频| 日韩欧美亚洲国产另类 | 9l国产精品久久久久麻豆| 免费黄色在线视频| 国产精品视频第一区| 69xx绿帽三人行| 五月天中文字幕一区二区| 久久99国产综合精品免费| 欧美亚洲愉拍一区二区| 国产人妻精品一区二区三| 欧美成人福利视频| 每日更新在线观看av| 久久精品99国产精品酒店日本| 七七成人影院| 国产激情久久久| 在线播放一区二区精品视频| 久久久久久久久久久久久久一区 | 99在线精品一区二区三区| 人人妻人人澡人人爽| 亚洲欧洲综合另类| 综合激情网五月| 欧美一二区视频| 日本五码在线| 欧美精品在线看| 日本韩国欧美| 成人黄色在线免费观看| 国产成人手机高清在线观看网站| 天天做天天爱天天高潮| 久久精品三级| 永久免费看片在线观看| 久久久一区二区三区捆绑**| 69夜色精品国产69乱| 欧美日韩国产精品| 国产三级按摩推拿按摩| 亚洲女成人图区| 欧美黄色视屏| 国产欧美精品xxxx另类| 五月天亚洲一区| 日本道在线视频| 奇米色一区二区三区四区| 97人妻天天摸天天爽天天| 日韩毛片精品高清免费| 五月天婷婷激情| 亚洲精品v天堂中文字幕| 久操视频在线免费播放| 国产精品久久久亚洲| 日韩精品导航| 久久艹国产精品| 麻豆国产欧美日韩综合精品二区 | 国产欧美精品一二三| 国产欧美日韩卡一| 国产三级av片| 欧美精品一区在线观看| 国产盗摄在线观看| 国产免费一区视频观看免费 | 99精品欧美一区| 欧美久久久久久久久久久久| 欧美日韩精品欧美日韩精品| 伦理片一区二区三区| 4p变态网欧美系列| 精品丝袜久久| r级无码视频在线观看| 国产黄色91视频| 顶臀精品视频www| 欧美日韩国产综合草草| 成年人在线观看视频| 国产91精品网站| 久久99免费视频| av免费在线播放网站| 久久综合av免费| 中文字幕一区在线播放| 日韩成人在线视频| 中文在线а√天堂| 免费成人深夜夜行视频| 久久久精品午夜少妇| 能免费看av的网站| 色哟哟精品一区| 国产一区电影| 国产精品激情自拍| 成人嘿咻视频免费看| 黑人粗进入欧美aaaaa| 国产人妖乱国产精品人妖| 日本一区二区三区久久| 综合网中文字幕| 99久久久国产| 九九久久九九久久| 成人免费不卡视频| 97超碰人人干| 亚洲欧洲在线播放| 久久天堂av| 国产卡一卡二在线| 国产精品一区二区三区网站| 69av.com| 亚洲精品国产精品国自产在线| 涩涩视频在线| 日本一区二区精品| 久久99深爱久久99精品| 国产精品免费人成网站酒店| 日韩一区二区电影在线| 成人观看网址| 欧美一区二区福利| 韩日精品视频一区| 国产香蕉在线视频| 精品亚洲一区二区三区在线观看| 97久久香蕉国产线看观看| 一区二区三区视频在线播放| 国产91高潮流白浆在线麻豆 | 中日韩一级黄色片| 欧美tk丨vk视频| 成人私拍视频| 在线一区日本视频| 成人午夜视频免费看| av大全在线观看| 最近中文字幕2019免费| 亚洲一区二区三区日本久久九| jizzjizz国产精品喷水| 国产精品色在线| 三级网站在线看| 国产精品专区第二| 亚洲激情网站| 国产精品久久国产精麻豆96堂| 欧美大片日本大片免费观看| 伊人色综合一区二区三区影院视频 | 欧美区国产区| 国产熟女一区二区| 欧美mv日韩mv亚洲| 激情小说亚洲| 国精产品一区一区三区视频| 中文字幕高清不卡| 欧美一级视频免费| 成人黄色av播放免费| 一区二区国产精品| 曰本女人与公拘交酡| 亚洲天堂av在线免费观看| 一区二区三区免费在线看| 亚洲黄色av网址|