精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擊敗LLaMA?史上超強「獵鷹」排行存疑,符堯7行代碼親測,LeCun轉贊

人工智能 新聞
前幾天公布的LLM排行榜引發業內人士廣泛討論,新模型Falcon在性能上真的能打過LLaMA嗎?符堯實測來了!

前段時間,初出茅廬的獵鷹(Falcon)在LLM排行榜碾壓LLaMA,在整個社區激起千層浪。

但是,獵鷹真的比LLaMA好嗎?

簡短回答:可能不是。

圖片

符堯團隊對模型做了更深入的測評:

「我們在MMLU上復現了LLaMA 65B的評估,得到了61.4的分數,接近官方分數(63.4),遠高于其在Open LLM Leaderboard上的分數(48.8),而且明顯高于獵鷹(52.7)。」

沒有花哨的提示工程,沒有花哨的解碼,一切都是默認設置。

圖片

目前,Github上已經公開了代碼和測試方法。

對于獵鷹超越LLaMA存疑,LeCun表態,測試腳本的問題...

圖片

LLaMA真·實力

目前在OpenLLM排行榜上,Falcon位列第一,超過了LLaMA,得到了包括Thomas Wolf在內的研究人員的力薦。

圖片

然而,有些人對此表示疑慮。

先是一位網友質疑,LLaMA這些數字從哪來,看起來與論文數字不一致...

圖片

隨后,OpenAI科學家Andrej Karpathy也對LLaMA 65B為什么在Open LLM排行榜上的分數明顯低于官方(48.8 v.s. 63.4)表示關注。

并發文,到目前為止,我一直避免在推特上發表關于獵鷹的文章,因為這一點,不確定。

為了弄清楚這個問題,符堯和團隊成員決定對LLaMA 65B進行一次公開的測試,結果得到61.4分。

圖片

在測試中,研究者沒有使用任何特殊機制,LLaMA 65B就能拿到這個分數。

這一結果恰恰證明了,如果想要模型實現接近GPT-3.5的水平,最好是在LLaMA 65B上使用RLHF。

根據就是,近來符堯團隊發表的一篇Chain-of-Thought Hub論文的發現。

圖片

當然,符堯表示,他們這一測評并非想要引起LLaMA和Falcon之間的爭端,畢竟這些都是偉大的開源模型,都為這個領域做出了重大的貢獻!

另外,Falcon還有更加方便的使用許可,這也讓它有很大的發展潛力。

對于這一最新測評,網友BlancheMinerva指出,公平的比較應該在默認設置下運行獵鷹(Falcon)在MMLU上。

對此,符堯稱這是正確的,并正進行這項工作,預計在一天后可以得到結果。

圖片

不管最終的結果怎樣,要知道GPT-4這座山峰才是開源社區真正想要追求的目標。

OpenLLM排行榜問題

來自Meta的研究人員稱贊,符堯很好地再現了LLaMa的結果,并指出了OpenLLM排行榜的問題。

與此同時,他還分享了關于OpenLLM排行榜的一些問題。

圖片

首先,MMLU的結果:LLaMa 65B MMLU結果在排行榜上是15分,但對7B模型來說是一樣的。13B、30B模型也存在較小的性能差距。

OpenLLM真的需要在公布哪個模型是最好的之前看看這個。

圖片

基準:這些基準是如何選擇的?

ARC 25 shot和Hellaswag 10 shot似乎與LLM并不特別相關。如果能在其中加入一些生成式基準就更好了。雖然生成式基準有其局限性,但它們仍然是有用的。

圖片

單一平均分:將結果減少到單一分數總是很吸引人的,平均分是最容易的。

但在這種情況下,4個基準的平均值真的有用嗎?在MMLU上獲得1分和在HellaSwag上獲得1分是一樣的嗎?

在LLM快速迭代的世界里,開發這樣一個排行榜肯定有一定的價值。

圖片

還有來自谷歌研究人員Lucas Beyer也發表了自己的觀點,

瘋狂的是,NLP研究人員對同一個基準有不同的理解,因此導致了完全不同的結果。同時,每當我的同事實現一個指標時,我都會立即問他們是否真的檢查將官方代碼的完美重現,如果沒有,就放棄他們的結果。

圖片

另外,他還表示,據我所知,無論模型如何,它實際上都不會重現原始基準測試的結果。

圖片

網友附和道,這就是LLM基準的現實...

圖片

Falcon——開源、可商用、性能強

說到Falcon,其實值得我們再好好回顧一下。

按LeCun的說法,大模型時代,開源最重要。

圖片

而在Meta的LLaMA代碼遭泄之后,各路開發者都開始躍躍欲試。

Falcon正是由阿聯酋阿布扎比的技術創新研究所(TII)開發的一支奇兵。

剛發布時從性能上看,Falcon比LLaMA的表現更好。

目前,「Falcon」有三個版本——1B、7B和40B。

TII表示,Falcon迄今為止最強大的開源語言模型。其最大的版本,Falcon 40B,擁有400億參數,相對于擁有650億參數的LLaMA來說,規模上還是小了一點。

不過,此前TII曾表示,別看咱Falcon規模雖小,性能卻很能打。

先進技術研究委員會(ATRC)秘書長Faisal Al Bannai認為,「Falcon」的發布將打破LLM的獲取方式,并讓研究人員和創業者能夠以此提出最具創新性的使用案例。

圖片

FalconLM的兩個版本,Falcon 40B Instruct和Falcon 40B在Hugging Face OpenLLM排行榜上位列前兩名,而Meta的LLaMA則位于第三。

而前文所講的有關排行榜的問題也正是這個。

盡管「Falcon」的論文目前還沒公開發布,但Falcon 40B已經在經過精心篩選的1萬億token網絡數據集的上進行了大量訓練。

研究人員曾透露,「Falcon」在訓練過程非常重視在大規模數據上實現高性能的重要性。

我們都知道的是,LLM對訓練數據的質量非常敏感,這就是為什么研究人員會花大量的精力構建一個能夠在數萬個CPU核心上進行高效處理的數據管道。

目的就是,在過濾和去重的基礎上從網絡中提取高質量的內容。

目前,TII已經發布了精煉的網絡數據集,這是一個經過精心過濾和去重的數據集。實踐證明,非常有效。

僅用這個數據集訓練的模型可以和其它LLM打個平手,甚至在性能上超過他們。這展示出了「Falcon」卓越的質量和影響力。

圖片

此外,Falcon模型也具有多語言的能力。

它理解英語、德語、西班牙語和法語,并且在荷蘭語、意大利語、羅馬尼亞語、葡萄牙語、捷克語、波蘭語和瑞典語等一些歐洲小語種上也懂得不少。

Falcon 40B還是繼H2O.ai模型發布后,第二個真正開源的模型。

另外,還有一點非常重要——Falcon是目前唯一的可以免費商用的開源模型。

在早期,TII要求,商業用途使用Falcon,如果產生了超過100萬美元以上的可歸因收入,將會收取10%的「使用稅」。

可是財大氣粗的中東土豪們沒過多長時間就取消了這個限制。

至少到目前為止,所有對Falcon的商業化使用和微調都不會收取任何費用。

土豪們表示,現在暫時不需要通過這個模型掙錢。

而且,TII還在全球征集商用化方案。

對于有潛力的科研和商業化方案,他們還會提供更多的「訓練算力支持」,或者提供進一步的商業化機會。

圖片

這簡直就是在說:只要項目好,模型免費用!算力管夠!錢不夠我們還能給你湊!

對于初創企業來說,這簡直就是來自中東土豪的「AI大模型創業一站式解決方案」。

根據開發團隊稱,FalconLM 競爭優勢的一個重要方面是訓練數據的選擇。

研究團隊開發了一個從公共爬網數據集中提取高質量數據并刪除重復數據的流程。

在徹底清理多余重復內容后,保留了 5 萬億的token——足以訓練強大的語言模型。

40B的Falcon LM使用1萬億個token進行訓練, 7B版本的模型訓練token達到 1.5 萬億。

圖片

(研究團隊的目標是使用RefinedWeb數據集從Common Crawl中僅過濾出質量最高的原始數據)

此外,Falcon的訓練成本相對來說更加可控。

TII稱,與GPT-3相比,Falcon在只使用75%的訓練計算預算的情況下,就實現了顯著的性能提升。

圖片

圖片

而且在推斷(Inference)時只需要只需要20%的計算時間,成功實現了計算資源的高效利用。

責任編輯:張燕妮 來源: 新智元
相關推薦

2021-09-26 18:52:14

AI 數據人工智能

2017-11-18 21:01:46

2023-02-21 16:28:12

Transforme模型

2019-01-08 10:53:13

存儲并購戴爾

2021-06-02 14:48:34

3DAI 人工智能

2024-01-16 09:28:09

智能汽車

2025-10-27 08:42:00

2023-07-22 13:09:51

模型開源

2024-05-21 13:06:02

2022-06-06 08:51:56

PandasSQLPython

2024-01-23 13:15:07

模型訓練

2024-01-18 13:38:00

AI數據

2023-03-13 15:42:00

模型芯片

2020-02-04 16:30:16

云計算行業科技

2023-06-02 13:55:57

開源AI

2021-04-09 15:20:47

編程語言Fortran程序員

2022-01-14 15:01:53

谷歌開源技術

2025-08-05 00:00:00

MLLMGPTClaude

2020-12-03 15:05:41

Kubernetes工具開發
點贊
收藏

51CTO技術棧公眾號

久久久资源网| 正在播放亚洲一区| 日韩免费性生活视频播放| 国产精品成人一区二区三区| 午夜理伦三级做爰电影| 中文字幕永久免费视频| 成人性生交大片免费看96| 老司机亚洲精品| 欧美r级在线观看| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 久久精品国产av一区二区三区| 成人午夜视屏| 国产一区二区美女诱惑| 一区三区二区视频| 777精品久无码人妻蜜桃| 国产又粗又长又黄| 激情婷婷综合| 日韩欧美aaa| 国产精品v欧美精品v日韩| 国产精品久久久久久久久久精爆| 日韩三级不卡| 国产精品久久久久久久久免费丝袜| 国内精品伊人久久| 制服下的诱惑暮生| 97人人在线| 久久婷婷av| 欧美美女18p| 成人亚洲精品777777大片| 视频在线不卡| 国产精品日韩久久久| 精品成人一区二区三区| 日本香蕉视频在线观看| 精品人妻无码一区二区| 欧美伊人久久| 日韩无一区二区| 久久99久久久久久| 少妇高潮一区二区三区69| 亚洲午夜黄色| 亚洲精品97久久| 欧美日韩成人免费视频| 日韩大片b站免费观看直播| 久久精品盗摄| 日韩在线视频二区| 中文字幕视频三区| 动漫一区在线| 国产不卡在线播放| 欧美激情在线视频二区| 亚洲av无码国产精品久久| 国产伦久视频在线观看| 99久久精品99国产精品| 欧美亚洲在线播放| 日韩人妻一区二区三区| 精品在线网站观看| 一本大道久久a久久综合婷婷| 日本一区视频在线播放| 中文av免费观看| 日韩国产欧美在线视频| 色多多国产成人永久免费网站 | 精品日韩一区二区| 青青草精品在线| 国产传媒在线观看| 亚洲一区二区精品久久av| 久久精品人成| 亚洲无码精品国产| 在线看片一区| 中日韩美女免费视频网址在线观看| 超碰人人草人人| 91嫩草国产线观看亚洲一区二区| 夜夜精品浪潮av一区二区三区| 久久久久久精| 蜜桃视频在线免费| 亚洲国产精品成人综合 | 国产精品成人久久电影| 国产中文字幕在线观看| 国产麻豆日韩欧美久久| 97**国产露脸精品国产| www.97视频| 日韩黄色网络| 91麻豆精品91久久久久久清纯| 天天操天天干天天做| 欧美区一区二区| 欧美午夜不卡视频| 分分操这里只有精品| 天堂av在线| 夜夜嗨av一区二区三区| 日韩a∨精品日韩在线观看| 小视频免费在线观看| 欧美亚洲国产一区二区三区va| 亚洲一区二区福利视频| 欧美自拍电影| 亚洲成人中文在线| 一级黄色录像免费看| 欧美亚洲日本| 国产精品久久久久三级| 日本不卡久久| 婷婷伊人综合中文字幕| 国产午夜精品久久久久久免费视| 91免费版黄色| 一级久久久久久久| 视频一区二区三区中文字幕| 成人激情视频小说免费下载| 日本久久综合网| 亚洲精品四区| 欧美寡妇偷汉性猛交| 国产中文av在线| 一二三区精品| 午夜欧美不卡精品aaaaa| 欧美日韩在线视频免费播放| 日韩成人精品一区| 亚洲美女喷白浆| 亚洲欧美日韩色| 亚洲国产一区二区三区网站| 欧美一区二区视频在线观看| 国产成年人视频网站| 国产乱人伦精品一区| 精品毛片乱码1区2区3区| 亚洲v国产v欧美v久久久久久| 精品国产乱子伦一区二区| 一区二区欧美亚洲| 欧美日韩精品区| 国产精品夜夜夜| 91麻豆蜜桃| 拍真实国产伦偷精品| 国产精品久久久久久久久果冻传媒| 国产91在线亚洲| dy888亚洲精品一区二区三区| 欧美性猛交xxxx黑人| 国产精品欧美性爱| 另类在线视频| 欧美多人爱爱视频网站| 一区二区三区精| 欧美韩国日本不卡| 一级一片免费播放| 日韩免费小视频| 欧美日韩三级在线| 日本国产在线播放| 日韩视频一二区| 久久人体大胆视频| 纪美影视在线观看电视版使用方法| 国产区精品区| 欧美一二三视频| 天天综合网在线观看| 亚洲电影中文字幕在线观看| 善良的小姨在线| 亚洲欧美日韩高清在线| 久久久久久久久久婷婷| www.成人精品| 一区二区国产盗摄色噜噜| 国产高清av片| 欧美午夜寂寞| 日韩中文字幕在线精品| 91插插插插插插| 日韩视频不卡| 国产亚洲欧美一区二区| 色综合成人av| 黑人巨大精品欧美一区二区免费| 欧美午夜性生活| 成人自拍视频| 亚洲精品永久免费精品| 中文字幕乱码av| 亚洲久久一区| 国产一区免费观看| 中文在线аv在线| 亚洲欧美日韩一区二区在线| 亚洲国产精品无码久久久| 国产日韩精品视频一区| 日韩高清第一页| 一本一本久久a久久综合精品| 亚洲一区二区三区成人在线视频精品| 五十路在线观看| 国产日本欧美一区二区| 九九热免费精品视频| 99精品全国免费观看视频软件| 久久免费精品视频| 天堂网www中文在线| 91久久精品网| 精品无码国产一区二区三区51安| 成人同人动漫免费观看| 欧美交受高潮1| 天堂av在线免费观看| 在线免费观看日韩欧美| 国产一线在线观看| 久久精品盗摄| 视频一区二区视频| 卡通动漫精品一区二区三区| 日韩美女视频在线观看| 国产刺激高潮av| 国产精品福利一区二区三区| 日本一区二区三区在线免费观看| 亚洲精品美女91| 在线观看免费91| 九九热线视频只有这里最精品| 中文字幕欧美国内| 亚洲国产精品久久人人爱潘金莲| 中文字幕在线观看一区二区| 日本人dh亚洲人ⅹxx| 亚洲久久在线| 亚洲在线观看一区| 欧美变态挠脚心| 成人国产精品av| 丝袜诱惑一区二区| 精品久久久av| 五月婷中文字幕| 在线不卡一区二区| chinese全程对白| 99精品在线观看视频| xxxx在线免费观看| 石原莉奈在线亚洲二区| 日韩 欧美 视频| 91亚洲国产高清| 国产日本欧美一区| 天天在线视频色| 色猫猫国产区一区二在线视频| 日本高清一二三区| 激情久久久久久久久久久久久久久久| 日韩精品久久一区| www.亚洲一二| 91久久久久久久久久久| av网址在线看| 欧美日韩国产成人在线免费| 日本熟妇一区二区| 91论坛在线播放| 久久国产色av免费观看| 妖精视频一区二区三区| 国产国产精品人在线视| 国产精品一级伦理| 欧美日韩黄色一区二区| 午夜毛片在线观看| 亚洲国产你懂的| 免费国产羞羞网站美图| 中文字幕 久热精品 视频在线| 极品粉嫩小仙女高潮喷水久久| 一区二区三区四区五区精品视频| 日本一区二区三区四区五区六区| 日本免费精品| 国产乱肥老妇国产一区二| 大片免费在线看视频| 中文字幕精品久久久久| 蜜桃视频在线观看网站| 国产手机视频精品| 香港一级纯黄大片| 亚洲第一级黄色片| 亚洲成熟少妇视频在线观看| 亚洲午夜电影在线| 欧美日韩成人免费观看| 97久久精品人人爽人人爽蜜臀| 99精品视频免费版的特色功能| 激情国产一区二区| 五月天开心婷婷| 国内外成人在线| 欧美精品色视频| 国产盗摄精品一区二区三区在线| 成人免费在线小视频| 人人狠狠综合久久亚洲婷婷| 日韩欧美精品一区二区三区经典| 国产一区二区三区日韩精品| 日韩三级在线播放| 久久社区一区| 青青在线免费视频| 九一亚洲精品| 99久久99久久精品国产片| 中老年在线免费视频| 日本成熟性欧美| 国产网友自拍视频导航网站在线观看| 亚洲成人免费网站| 天天舔天天干天天操| 亚洲欧洲在线观看| 黑人乱码一区二区三区av| 精品国产伦一区二区三区观看方式 | 婷婷在线视频观看| 欧美大胆在线视频| 人操人视频在线观看| 亚洲裸体xxxx| av在线免费观看网| 亚洲二区中文字幕| 亚洲人妻一区二区| 一区二区三区亚洲| 成人av免费| 97香蕉超级碰碰久久免费的优势| 成人爽a毛片免费啪啪| 国产一区在线播放| 超碰成人在线观看| 日韩精品成人一区二区在线观看| 91嫩草亚洲精品| 亚洲色成人www永久在线观看| 久久字幕精品一区| 香蕉视频xxxx| 91麻豆精品秘密| 午夜激情视频在线播放| 亚洲国产乱码最新视频| 国产精华7777777| 欧美性xxxxhd| 国产又粗又猛视频| 亚洲第一中文字幕| 午夜在线视频播放| 91sa在线看| 小说区图片区亚洲| 国产精品爽爽爽| 91亚洲无吗| 深夜福利成人| 国产不卡av一区二区| 宅男在线精品国产免费观看| 日韩午夜av| 午夜激情影院在线观看| 91麻豆国产在线观看| 午夜免费激情视频| 在线免费观看日本欧美| 亚洲精品成人区在线观看| 尤物99国产成人精品视频| 免费在线国产视频| 久久福利网址导航| 色偷偷偷在线视频播放| 欧洲中文字幕国产精品| 9999在线精品视频| 日韩av高清| 亚洲一区欧美激情| 女人另类性混交zo| 粉嫩一区二区三区性色av| 青青操在线播放| 色婷婷综合久色| 四季av日韩精品一区| 九九九热精品免费视频观看网站| 天堂久久午夜av| 成人精品一区二区三区电影黑人| 日韩av三区| 国产玉足脚交久久欧美| 国产精品一二三四| 欧美大片xxxx| 欧美精品vⅰdeose4hd| 国产69久久| 国产mv久久久| 影视先锋久久| 久久无码高潮喷水| 99国产精品久久久久久久久久久| 久久久久久久久久久97| 激情成人中文字幕| 中文字幕免费视频观看| 日韩精品一区二区三区第95| 超清av在线| 国产精品999| 亚洲制服欧美另类| 国产欧美在线一区| 91视频国产资源| 亚洲黄色小说图片| 日韩www在线| 人人干在线视频| 国产精品丝袜高跟| 成人久久综合| 国产视频1区2区3区| 风间由美一区二区三区在线观看| 欧美成人黄色网| 日韩网站在线看片你懂的| 欧美亚洲天堂| 国精产品99永久一区一区| 一区二区三区高清视频在线观看| free性中国hd国语露脸| 欧美性精品220| 国产三区四区在线观看| 国产精品久久久久久久午夜| 日韩精品久久久久久久软件91| 福利在线小视频| 粉嫩高潮美女一区二区三区| 国产精品自拍视频一区| 亚洲精品理论电影| 日韩中文在线播放| 亚洲一区二区三区午夜| 国产美女精品人人做人人爽| 久久久久久欧美精品se一二三四| 精品久久久久99| 中文字幕色婷婷在线视频| 日韩精品一区二区三区四区五区 | 亚洲精品日韩激情在线电影| 欧美久色视频| 超碰影院在线观看| 国产精品拍天天在线| 国产片在线播放| 一区二区亚洲欧洲国产日韩| 九九九精品视频| 免费久久99精品国产自| 午夜久久黄色| 久久午夜夜伦鲁鲁片| 欧美在线观看一二区| 91在线中字| 欧美极品视频一区二区三区| 欧美视频福利| 人妻大战黑人白浆狂泄| 欧美精选一区二区| а√天堂8资源中文在线| 日韩免费电影一区二区三区| 国产精品亚洲第一| 国产成人一级片| 亚洲精品国产美女| av有声小说一区二区三区| 桥本有菜av在线| 91在线观看一区二区| 在线黄色av网站| 91精品国产91久久久久久最新| 欧美aaaa视频| 欧美 日本 国产| 日韩欧美一区二区不卡|