精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

直追GPT-4!李開復Yi-34B新成績公布:94.08%的勝率超越LLaMA2等主流大模型

人工智能
Elo評分越高,說明模型在真實用戶體驗上的表現越出色,可說是眾多大模型評測集中最能展現 “Moment of Truth 真實關鍵一刻” 的用戶導向體驗對決。

僅次于GPT-4,李開復零一萬物Yi-34B-Chat最新成績公布——

在Alpaca經認證的模型類別中,以94.08%的勝率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT!

圖片圖片

不僅如此,在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現追平GPT-3.5。

在五花八門的大模型評測中,伯克利LMSYS ORG排行榜采用了一個最為接近用戶體感的 “聊天機器人競技場” 特殊測評模式,讓眾多大語言模型在評測平臺隨機進行一對一 battle,通過眾籌真實用戶來進行線上實時盲測和匿名投票,11月份經25000的真實用戶投票總數計算了20個大模型的總得分。

Elo評分越高,說明模型在真實用戶體驗上的表現越出色,可說是眾多大模型評測集中最能展現 “Moment of Truth 真實關鍵一刻” 的用戶導向體驗對決。

圖片圖片

△LMSYS ORG榜單(發布于2023年12月8日)

中文能力方面,Yi-34B-Chat 微調模型同樣不遑多讓。SuperCLUE是一項針對中文能力的排行榜,從基礎能力、專業能力和中文特性能力三個不同的維度,評估模型的能力。

根據11月底發布的《SuperCLUE中文大模型基準評測報告 2023》,11月下旬首度發布的 Yi-34B Chat,迅速晉升到和諸多國產優秀大模型齊平的 “卓越領導者” 象限,在多項基準評測中的 “SuperCLUE 大模型對戰勝率” 這項關鍵指標上,Yi-34B-Chat 取得31.82%的勝率,僅次于GPT4-Turbo。

△中文SuperCLUE排行榜(發布于2023年11月28日)△中文SuperCLUE排行榜(發布于2023年11月28日)

對話場景實測

Yi-34B-Chat 模型實力在不同的對話場景中實力如何?來看幾個更直觀的問題演示:

例如“喂”給Yi-34B-Chat如下問題:

Transformer 模型結構能不能走向 AGI ?

圖片圖片

不難看出,Yi-34B-Chat的回答可以說是有理有據。

再來:

給我生成一個小紅書文案,給大家安利一只豆沙色的口紅。

圖片圖片

回答可以說是非常符合現在小紅書主流的帶貨風格了。

中文理解方面,我們再出一道題:

小王給領導送了一份禮物后。領導說:“小王,你這是什么意思?”小王:“一點心意,意思意思。”領導:“你這就不夠意思了。”小王:“小意思,小意思。”領導:“小王,你這人真有意思。”小王:“也沒什么別的意思。”領導:“那我多不好意思。”小王:“是我不好意思。”這個意思到底是什么意思?

圖片圖片

可以看到,即便是在非常“繞”的中文理解方面,Yi-34B-Chat也是精準的拿捏住了。

據零一萬物介紹,除了 Yi 系列強基座的貢獻以外,Yi-34B-Chat 模型的效果還得益于其人工智能對齊(AI Alignment)團隊采用了一系列創新對齊策略。通過精心設計的指令微調流程,不僅強化了模型在理解和適應人類需求方面的能力,還使得模型與人類價值觀對齊,包括幫助性(Helpful),可靠性(Honest),無害性(Harmless)等。

在強基座設定下,該團隊采用了一種輕量化指令微調方案,該方案涵蓋了單項能力提升和多項能力融合兩個階段。
其中,單項能力包括通用指令跟隨、創意內容生成、數學、推理、編程、泛COT、對話交互等。通過大量的消融實驗,針對模型單能力構建和多能力融合總結了獨家認知經驗。

在數據的量和質方面,一方面,團隊在強基座模型上,實現僅需要少量數據(幾條到幾百條),就能激發模型特定單項能力;另一方面,數據質量比數量重要,少量高質量數據比大量低質量數據更好。通過關注超出模型能力的“低質量”數據,減少了模型“幻覺”。

在指令多樣性與難度方面,團隊通過在各能力項下構建任務體系,實現了訓練數據中的指令均衡分布,大幅提升了模型泛化性。通過復合指令構造和指令難度進化,不僅提升了模型效果,也顯著降低了對數據量的需求。

在風格一致性方面,團隊發現訓練數據的風格會影響模型收斂速度和能力上限的逼近程度,因此統一了回復風格,比如重點設計了CoT的回復風格,實現在輕量SFT情況下,避免了風格不一致加劇模型的“記憶”現象。

在多能力融合階段,團隊采用網格搜索的方法來決定數據配比和超參數的設置,通過基準測試和自建評測集的結果來指導搜索過程,成功實現模型的多能力融合。

不僅如此,Yi模型開源首月,數據也很亮眼。

在Hugging Face社區下載量為16.8萬,魔搭社區下載量1.2萬。在GitHub 獲得超過4900個Stars。

由于性能表現強勁,多家知名公司和機構推出了基于Yi模型基座的微調模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區數字經濟研究院(簡稱IDEA研究院)認知計算與自然語言研究中心(簡稱CCNL中心)聯合發布的SUS-Chat-34B等,均性能表現優異。而AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。

知名技術寫作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,“從這點看 Yi 對于開源生態的幫助還是非常巨大的。”

用戶真實反饋實錄

Yi-34B開源發布后,開發者Eric Hartford就發現了模型存在的一個小問題。

他在郵件中寫道:

感謝你們提供了一個優秀的模型。Yi模型使用了與LLaMA模型完全相同的架構,只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具,保持張量名稱的一致性是有價值的。”Eric建議,在Yi被廣泛傳播前,及時恢復張量名稱。

零一萬物意識到命名問題的疏忽對開發者造成的不便,跟Eric和其他開發者提出說明,表達誠摯的歉意,并很快便在各開源平臺重新提交模型及代碼,完成了開源社區的版本更新。

然而Eric自己也沒有預想到,他的這個建議,在國內竟被曲解、誤讀,引發了輿論關于Yi模型“抄襲”LLaMA的質疑。

事實上,一個模型核心技術護城河是在架構之上,通過數據訓練獲得的參數和代碼,在沿用了開源社區普遍使用的LLaMA 架構之上。

根據零一萬物團隊的說法,他們是從零開始,用高質量的數據集、自研訓練科學和AI Infra打造了 Yi-34B 在內的系列模型。為了執行對比實驗的需要,對部分推理參數進行了重新命名。原始出發點是為了充分測試模型,而非刻意隱瞞來源。

身處這場輿論風暴的中心,Eric也在X(twitter)上寫道:

他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物,已經發表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創建的數據集訓練Yi,對開源領域的貢獻是值得贊揚的。

圖片圖片

緊接著,他又說,“使用Llama架構沒有任何問題。訓練才是關鍵。Yi給了我們目前可獲得的最佳模型,沒有任何可抱怨的。”

現在,Eric已經成為Yi-34B的忠實擁躉,會使用Yi-34b-200k數據集訓練其他的模型產品,并感嘆絲滑般的訓練體驗。

數字化創業者,開發者,技術寫作者蘇洋表示:

我自己本身是大模型產品的重度用戶,除了用了很久的 Tabnine、Copilot 做代碼輔助生成之外,也算是第一批開始氪金使用 Chat 的玩家,基本各家廠商模型出來都會申請內測,體驗模型的實際能力。這里除去工作中接觸和使用模型的機會外,作為獨立開發者,玩了十幾年的代碼,我個人也非常好奇模型究竟能夠發展到什么程度。

我了解到 Yi-34B 有幾個渠道,當時的 Huggingface 榜單第一名、小圈子朋友的“點贊”和“吐槽”、各種群里刷屏的消息。

圖片圖片

我是開發者,同時也是終端用戶,所以非常好奇,這個模型到底行不行?或者說更想知道模型哪里是行的,哪里是不行的。尤其是榜單分數這么高,質疑聲浪也這么高?與其霧里看花、眾說紛紜,不如自己實際跑一跑。

于是,我嘗試使用家里本地的機器,在純 CPU 環境、CPU & GPU 混合環境下對模型進行測試,結果比想象中要好。

尤其是社區中的 finetune 后的版本,在對新聞、研究報告的摘要總結方面,對非結構化的信息中的實體識別和抽取上表現非常不錯。早些時候,官方還未推出 Chat 版本時,來自社區的 Chat 版本在對話的過程中,通史類的問答表現也非常不錯。當然,可能是由于零一在訓練過程中,出于安全考慮,過濾太多語料的緣故,一些本土化的內容仍然不夠深入。

而且,不光是我的個人體驗,海外也有用戶有相同體感,在“海外貼吧” Reddit 上有分享自己的感受,你們可以自己搜搜看。

我會時不時的瀏覽下 HF 的榜單,在最近榜單中的前三十名,有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,從這點看 Yi 對于開源生態的幫助還是非常巨大的。

34B 普通用戶努努力還是能自己相對低成本跑起來的,68 和 70B 的模型想要本地運行,需要更多的資源。但其實目前分數其實相比較 34B 拉不開太多,也就三四分平均分,但參數量差了一倍。換言之,企業想部署使用,所需要的成本也可以得到非常大的節約。

目前國產大模型在開源榜單上已經是第一梯隊,但如果把競爭范圍追加到閉源模型、尤其是海外的模型,仍有很大的距離要去追趕。目前的普遍體驗是開源模型最多只有 GPT-3.5 + 的水平。

我個人相信國產大模型是能夠很快追趕至第一梯隊的。

就如同很多底子很好,又勤奮刻苦的中國大學生,能夠在使用正確方法的前提下,通過努力,不斷的進入更好的學習環境,不斷刷新自己成績,取得耀眼的學術成就。現實中,哪怕是對華人苛刻的 “八大藤校”,是不是中國人越來越多了呢?

只要底子好,堅持使用開源的正確路線和方法,做好本地化適配和調優,就有希望。

參考鏈接:
[1]https://huggingface.co/01-ai/[2]https://www.modelscope.cn/organization/01ai

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-09-11 15:57:16

人工智能模型GPT-4

2023-09-19 14:56:00

模型訓練

2023-08-27 12:54:59

GPT-4神秘版本Code

2024-02-07 12:13:03

AI模型

2025-05-30 07:40:56

2023-07-25 09:23:23

Llama 2GPT-4

2024-05-20 08:40:00

2024-03-27 13:32:00

AI數據

2023-06-05 12:32:48

模型論文

2023-08-21 10:36:23

2024-01-30 21:18:57

模型智能CMMLU

2023-10-11 13:09:52

訓練模型

2024-06-17 18:04:38

2023-09-07 13:25:00

AI模型

2024-12-25 20:01:13

2023-06-08 11:27:10

模型AI

2023-08-27 14:08:17

開源代碼Meta大模型

2023-11-09 12:41:40

AI數據

2023-11-15 09:23:00

模型AI
點贊
收藏

51CTO技術棧公眾號

国产永久免费网站| 久久久免费电影| 999在线免费视频| 2019中文字幕在线视频| 精彩视频一区二区| 欧美精品国产精品日韩精品| 国产福利短视频| 性欧美video另类hd尤物| 一区二区三区不卡视频在线观看| 精品久久久久久一区| 进去里视频在线观看| 午夜精品久久99蜜桃的功能介绍| 亚洲国产精彩中文乱码av在线播放| 激情婷婷综合网| 99福利在线| 久久亚洲捆绑美女| 666精品在线| 在线观看 亚洲| 欧美 日韩 国产 一区| 亚洲另类图片色| 深夜做爰性大片蜜桃| 最近在线中文字幕| 一区二区三区中文免费| 日本一区高清在线视频| 国产精品色综合| 亚洲欧美日本日韩| 久久91亚洲精品中文字幕| 麻豆av免费观看| 中文字幕一区二区三区四区久久| 91久久精品一区二区三区| 日本a在线天堂| 中文字幕日本在线观看| www久久精品| 成人蜜桃视频| 国产普通话bbwbbwbbw| 日日嗨av一区二区三区四区| 久久久亚洲精选| 手机av在线看| 精品久久电影| 日韩精品在线看| 91精产国品一二三| 91成人精品观看| 在线观看视频欧美| 国产成人a亚洲精v品无码| 国内小视频在线看| 一区二区三区欧美激情| 永久域名在线精品| 99reav在线| 国产欧美一区二区三区鸳鸯浴| 久久精品国产一区二区三区不卡| 精品人妻一区二区三区日产乱码 | 成人福利片在线| 亚洲成人精品在线观看| 日韩精品一区二区免费| 亚洲奶水xxxx哺乳期| 中文字幕字幕中文在线中不卡视频| 日韩久久久久久久| 国产中文字幕在线视频| 久久色视频免费观看| 蜜桃999成人看片在线观看| 无码国产精品一区二区免费16| 不卡av在线免费观看| 国产视频精品网| 日本精品久久久久| 波多野结衣亚洲一区| 国产在线精品一区二区三区》| 人妻无码一区二区三区久久99| www.日本不卡| 麻豆av一区| 男人的天堂av高清在线| 26uuu另类欧美| 免费国产一区| 国产免费永久在线观看| 国产精品拍天天在线| 中文字幕欧美日韩一区二区三区| 麻豆av在线导航| 一区二区三区在线视频观看58| 国产91沈先生在线播放| yellow字幕网在线| 色婷婷av一区二区| 中文字幕第100页| 国产精品视频一区视频二区| 精品国产乱码91久久久久久网站| 亚洲の无码国产の无码步美| 九九在线高清精品视频| 色av中文字幕一区| 久久久久99精品成人片毛片| 宅男噜噜噜66一区二区| 国产成人午夜视频网址| 国产又粗又长视频| 岛国av在线一区| 欧美国产二区| 日本在线视频网| 香蕉加勒比综合久久| 欧美少妇性生活视频| 主播大秀视频在线观看一区二区| 欧美精品乱码久久久久久按摩| 图片区偷拍区小说区| 六月丁香久久丫| 中文字幕精品av| 久久久www成人免费毛片| 欧美一区=区| 91在线观看免费高清完整版在线观看 | 亚洲一区二区成人在线观看| 久久久久人妻精品一区三寸| 国产麻豆一区二区三区| 精品亚洲va在线va天堂资源站| 成年人视频软件| 亚洲精选久久| 成人深夜直播免费观看| 五月婷婷伊人网| 中文字幕一区三区| 国产精品亚洲αv天堂无码| 国产精品成人3p一区二区三区| 亚洲精品国产suv| 成人精品一二三区| 国产欧美精品| 91成人免费看| 国产毛片在线| 欧美日韩国产精品专区 | 最新欧美日韩亚洲| 在线毛片观看| 日韩精品中文字幕一区| 欧美丰满美乳xxⅹ高潮www| 一区三区视频| 91情侣偷在线精品国产| a中文在线播放| 精品久久久久久久久久久久久久 | 久久久久久久性潮| 日韩成人网免费视频| 卡通动漫亚洲综合| 美女一区二区视频| 青青草久久网络| 亚洲国产成人二区| 日韩精品免费在线视频观看| 久久久久无码精品国产| 国内精品伊人久久久久影院对白| 日本不卡一区二区三区视频| 高潮在线视频| 精品久久国产老人久久综合| 欧美黄色aaa| 麻豆精品在线播放| 午夜精品一区二区三区四区| 亚洲wwww| 亚洲欧美激情精品一区二区| 国产香蕉视频在线| av不卡在线观看| 亚洲人成无码网站久久99热国产| 亚洲综合影院| 欧美激情精品久久久久久黑人| 国产人妖一区二区| 亚洲桃色在线一区| 中文字幕在线观看日| 99久久婷婷| 国产在线精品播放| 欧美日韩欧美| 69堂精品视频| 91日韩中文字幕| 国产精品一区二区黑丝| 米仓穗香在线观看| 99re6热只有精品免费观看| 欧美成人精品在线播放| 精品人妻一区二区三区含羞草 | 成人精品小蝌蚪| 日韩a级黄色片| 国产欧美自拍一区| 91成人精品网站| 九色在线播放| 欧美日韩高清一区二区三区| 免费高清在线观看电视| 国产一区二区三区不卡在线观看| av中文字幕av| 国产精品美女在线观看直播| 91成人天堂久久成人| 国产一级免费在线观看| 欧美日韩国产免费| 91成人福利视频| www.久久精品| 日本xxxxxxx免费视频| 日韩欧美午夜| 999日本视频| 欲香欲色天天天综合和网| 国产亚洲精品美女久久久| 一级α片免费看刺激高潮视频| 亚洲欧美偷拍卡通变态| www.com日本| 丝袜美腿亚洲色图| dy888午夜| 校园春色另类视频| 91精品国产自产在线老师啪| 美女精品导航| 国产一区二区激情| www国产在线| 色网站国产精品| 国产性xxxx| 久久午夜色播影院免费高清| 一级做a免费视频| 日韩视频一区| 一区二区在线观看网站| 成人中文字幕视频| 国产精品一区二区电影| 久久香蕉av| 自拍偷拍免费精品| 神马午夜精品95| 777a∨成人精品桃花网| 欧美精品二区三区| 亚洲欧美色一区| 一区二区三区免费在线观看视频| 国产美女精品一区二区三区| 伊人成色综合网| 99久久婷婷这里只有精品| 久久草.com| 视频精品一区| 国产日韩精品综合网站| 91av亚洲| 欧美精品电影免费在线观看| 黄色av免费在线| 亚洲视频在线观看| 神马午夜电影一区二区三区在线观看| 欧美人与禽zozo性伦| 中文字幕一区二区人妻电影| 一区二区三区中文免费| 久久成人小视频| 久久久高清一区二区三区| 欧美做受高潮中文字幕| 国产一区二区日韩精品| 色婷婷狠狠18| 爽好久久久欧美精品| 1024av视频| 亚洲第一伊人| av在线免费观看国产| 欧美激情视频一区二区三区免费| 亚洲视频电影| 精品久久网站| 欧美一区免费视频| 亚洲精品国产动漫| 麻豆精品视频| 亚洲精品无吗| 久久综合久久综合这里只有精品| 给我免费播放日韩视频| ts人妖另类在线| 日韩精品中文字幕吗一区二区| 成人免费网视频| 白嫩亚洲一区二区三区| 国产日韩精品在线播放| 性欧美video另类hd尤物| 国产免费一区二区三区在线观看| 外国电影一区二区| 国产精品爱啪在线线免费观看| 久久99久久99精品免观看软件| 2020欧美日韩在线视频| 美女网站在线看| 456亚洲影院| 丝袜美腿一区| 国产精品久久一区| 日本一区二区三区中文字幕| 国产日韩精品在线播放| 国产午夜精品一区在线观看| 亚洲影院在线看| 2020最新国产精品| 国产伦精品一区二区三区四区视频| 超碰成人在线免费| 麻豆av一区二区三区久久| 蜜桃成人av| 亚洲欧美日韩另类精品一区二区三区| 色综合天天爱| 熟女熟妇伦久久影院毛片一区二区| 亚洲人metart人体| 丝袜人妻一区二区三区| 国产精品美女| 亚洲 激情 在线| 国产精品系列在线观看| 中文视频在线观看| 久久精品在线免费观看| 911国产在线| 亚洲综合视频网| 久草手机在线观看| 欧美三级中文字| 国产高清视频免费| 亚洲精品二三区| 大地资源中文在线观看免费版| 久久激情五月丁香伊人| 肉肉视频在线观看| 日韩av观看网址| 亚洲午夜国产成人| 国产一区在线免费观看| 日韩精品永久网址| 日韩国产小视频| 久久中文精品| 色哟哟免费视频| 久久久久九九视频| 午夜精品一区二区三区视频| 精品国产户外野外| 国产露脸国语对白在线| 日韩成人在线观看| 免费黄网在线观看| 91精品国产91久久久| 日韩亚洲国产免费| 精品日本一区二区三区| 99久久.com| 国产性xxxx18免费观看视频| 精品一区二区三区视频在线观看 | 国产精品欧美久久久久无广告| 免费网站观看www在线观| 色网站国产精品| 亚洲国产精品一| 中文国产成人精品久久一| 变态调教一区二区三区| 国产免费一区视频观看免费| 婷婷精品在线| 日韩精品第1页| 视频在线在亚洲| 天天躁日日躁狠狠躁av麻豆男男| 国产精品少妇自拍| 黄色片视频网站| 91精品在线观看入口| 国产高清一级毛片在线不卡| 国产+人+亚洲| 精品中文字幕一区二区三区四区 | 国产精品久久av| 高清日韩欧美| 艳母动漫在线观看| 卡一卡二国产精品| 国产一二三四五区| 黄色一区二区在线| 成人福利小视频| 久久精品视频中文字幕| 91在线亚洲| 欧洲精品国产| 久久在线精品| 男生草女生视频| 黄色一区二区在线| 人妻一区二区三区免费| 九九热99久久久国产盗摄| 久久精品国产福利| 亚洲免费在线精品一区| 青青草成人在线观看| 三上悠亚ssⅰn939无码播放| 精品毛片三在线观看| 亚洲成人黄色片| 色综合男人天堂| 日韩精品三级| 热久久最新地址| 国产伦理精品不卡| 永久久久久久久| 7777精品伊人久久久大香线蕉| 快射av在线播放一区| 91精品在线一区| 亚洲深深色噜噜狠狠爱网站| 欧美一级视频在线| 亚洲色图一区二区三区| 国产色片在线观看| 欧美xxxx14xxxxx性爽| 欧美成年网站| 17c丨国产丨精品视频| av资源网一区| 久久99国产综合精品免费| 亚洲男女性事视频| abab456成人免费网址| 一区二区视频国产| 国产成人av自拍| 国产成人无码精品亚洲| 精品无人区乱码1区2区3区在线 | 成人妇女免费播放久久久| 综合激情一区| 第一页在线视频| 天天色综合成人网| a天堂中文在线88| 国产伦精品免费视频| 一本一道久久a久久精品蜜桃| 美女被爆操网站| 欧美日韩国产在线播放| 国产高清av在线| 91社区国产高清| 日韩午夜电影| 谁有免费的黄色网址| 在线不卡一区二区| 97在线超碰| 视频一区不卡| 国产精品一区二区男女羞羞无遮挡| 日本亚洲欧美在线| 一个人www欧美| 日韩精品三级| 99热成人精品热久久66| 国产精品久久久久久久蜜臀| 99热这里只有精品在线| 91高清视频免费观看| 国产精品88久久久久久| 波多野结衣加勒比| 欧美影视一区二区三区| 怡红院在线播放| 欧美激情视频一区二区三区| 精品亚洲成a人在线观看| 日韩av电影网| 日韩视频在线免费观看| 欧美挤奶吃奶水xxxxx| 久国产精品视频| 日韩欧美在线国产| 亚洲七七久久综合桃花剧情介绍| 欧美日韩国产高清视频|