精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

阿里開源的32B大模型到底強在哪里?

人工智能
很多同學對國內大語言模型與GPT的差距也比較關心,我找到了一個Qwen1.5-72B和GPT-4的能力對比圖,如下所示,可以看到差距還是很明顯的,在數學、編程、復雜問題處理等方面都有著很大的提升空間。當然我們一直在追趕,只是別人也在進步,有人說這個差距是1年,也有人說是2年,你怎么看呢?

阿里巴巴最近開源了一個320億參數的大語言模型Qwen1.5-32B,網上都說很強很強,那么它到底強在哪里呢?

更高的性價比

Qwen1.5-32B中的B是billion的意思,也就是10億,32B就代表320億參數量。

阿里之前還開源過一個大模型Qwen-1.5-72B,72B就代表720億參數量。

相比之前開源的Qwen-1.5-72B,Qwen1.5-32B參數少了一多半,但是測試表現并沒有相差多少。

大語言模型文件中的主要內容就是參數,參數少了一半,模型的文件大小也會小一半,那么加載到顯存時占用的空間也會小一半。大家可能都知道現在顯卡比較緊俏,我特地到京東查了一下,消費級的3090在8K左右,4090已經飆升到了1.5個W左右。

圖片圖片

顯存占用小一半就可以使用更少數量的顯卡或者更低顯存的顯卡,這無疑會節省很多成本,而且模型的表現相比之前的大塊頭也沒有多少明顯的損失,所以用戶能獲得更高的性價比。

性能測試優良

上邊提到Qwen1.5-32B的性能測試表現還不錯,那么這個不錯到底表現在哪里呢?

這里我找到一張測試結果的圖表:

圖片圖片

之前我看這些圖表時都比較懵逼,主要就看誰的分數高,分高就是好,但是具體好在哪里也說不清楚。

這次我特地去查詢了這些指標代表的含義,總算是搞明白了,特別分享給大家。

這些分數對應的每一列都是一個數據集,所謂數據集就是一些問題的集合,用它們來考察大模型應對各種問題的處理能力。這些數據集通常是知名大語言模型研究機構發布的,比較權威。

  • MMLU(Massive Multitask Language Understanding): 多領域知識理解,考察的是綜合能力。涵蓋57個不同領域的多項選擇題,包括歷史、文學、科學、工程技術等多個學科。使用這個數據集能評估模型的泛化能力,就是用它解決沒有訓練過的問題,或者說新問題,看看它的表現如何。
  • CMMLU: 中文場景的多領域知識理解。由MBZUAI、上海交通大學、微軟亞洲研究院共同推出,包含67個主題,涉及自然科學、社會科學、工程、人文以及常識等,專門用于評估語言模型在中文語境下的知識和推理能力。
  • C-Eval: 中文能力評估。由上海交通大學、清華大學和愛丁堡大學的研究人員在2023年5月聯合推出。包含13948個多項選擇題,涵蓋了52個不同的學科和四個難度級別。
  • GSM8K (Google's Standard Math Dataset 8K): 解決數學問題的能力。Google開發的一個數學問題求解數據集,包含大約8,000個高中到大學水平的數學問題。
  • MATH: 解決數學問題的能力,類似于GSM8K。包含初等代數,代數,數論,計數和概率,幾何,中等代數和微積分等領域的多種數學問題,用LaTeX格式編寫。
  • MBPP (Mathematics Benchmarks for Pretrained Models): 數學推理和問題解決能力。包含一系列需要模型生成數學表達式或文字解答的數學問題。
  • HumanEval: 編程能力。由OpenAI創建,專為評估代碼生成模型的有效性。包含數百個編程題目及其解決方案。
  • BBH (Big-Bench Hard): 復雜語言理解能力。由Google、斯坦福等研究人員開發的數據集,包含大量復雜語言理解任務的集合,可能包含需要深度推理、常識運用或復雜認知技能的任務。

有了對這幾個指標的理解,我們可以看到Qwen1.5-32B和Qwen1.5-72B的能力相差無幾,在理解復雜語言的能力上還略勝一籌,不知道是不是學習了百度弱智吧的問題。

在這個對比圖表上還有幾個模型,我特別介紹下:

  • Llama2-34B:Llama是Meta公司(也就是facebook)開源的一個大預言模型,有了Llama的開源,才有了國內大模型的百花齊放,否則大家還得摸索一陣。不過從這張圖表上可以看出,Llama的這個模型已經落后了,普遍落后于其他模型,真是青出于藍而勝于藍。
  • Yi-34B:這個據稱是自研成功的開源大語言模型,也是在Llama開源后推出的,自然是借鑒了Llama,只不過不清楚借鑒了多少。這個模型是李開復老師投資的零一萬物開發出來的,也是300多億的參數,綜合能力還不錯,只是數學能力和解決復雜問題的能力比Qwen差一點。
  • Mixtral-8x7B:一款高質量的稀疏專家混合模型,是一個歐洲公司開發的。這里的混合模型說的是其內部有多個子模型,比如有的擅長數學,有的擅長法語,有的擅長代碼生成,等等。在生成Token時,Mixtral-8x7B會選擇兩個內部的專家子模型進行生成,每個專家子模型的參數是6B,所以它會比普通的300億參數處理的更快。從圖表對比可以看出其在數學和編程方面的能力還是挺不錯的。

很多同學對國內大語言模型與GPT的差距也比較關心,我找到了一個Qwen1.5-72B和GPT-4的能力對比圖,如下所示,可以看到差距還是很明顯的,在數學、編程、復雜問題處理等方面都有著很大的提升空間。當然我們一直在追趕,只是別人也在進步,有人說這個差距是1年,也有人說是2年,你怎么看呢?

圖片圖片

實測體驗

指標上的表現并不能代表全部,我們用最近熱議的“弱智吧”問題來測試一下。

“弱智吧”是一個百度貼吧,里邊充滿荒謬、離奇、不合常理的發言,研究者發現使用這里邊的問題訓練大語言模型能獲得比較好的邏輯能力。

這里使用的工具是我在AutoDL上分享的一個鏡像實例,這個鏡像基于開源項目 text-generation webui,在這個webui中可以體驗多種大語言模型。

創建實例

如果你也想實際測試一下,可以按照下面的步驟創建一個容器實例。

首先注冊一個賬號,AutoDL的訪問地址:https://www.autodl.com

創建實例時:地區選擇“西北B區”,網絡比較穩定;因為鏡像安裝的大模型需要24G顯存,所以顯卡需要選擇3090或者4090;GPU數量只需要1個就能跑起來。

圖片圖片

鏡像選擇“社區鏡像”,輸入 yinghuoai-text-generation-webui ,即可找到這個鏡像。

圖片圖片

實例啟動后,在服務器實例列表中點擊“JupyterLab”,進入一個Web頁面。

圖片圖片

在JupyterLab頁面中打開“啟動器”,這個鏡像會安裝3個大模型,默認啟動的是Qwen-32B,這實際上是一個4bit的量化模型,只需要24G的顯存就能跑起來,但是相比原版的32B性能略有下降,不過也夠用了。原版的32B需要數倍的顯存,AutoDL上跑起來成本太高。

圖片圖片

啟動成功后,我們可以看到一個Gradio的鏈接,點擊就會在瀏覽器打開 text-generation-webui。

圖片圖片

另外 text-generation-webui 還支持通過API訪問大模型,API定義兼容OpenAI協議,有興趣的可以體驗下。

體驗Qwen-32B

進入后需要先設置一下角色,在參數(Parameters)頁簽中,選擇“AI助理”。這個AI助理是我創建的,方便進行中文對話。

圖片圖片

在聊天(Chat)頁簽的右側,有一個“Mode”,定義了大模型處理提示詞的模式,需要選擇“chat-instruct”。

圖片圖片

然后我們就可以和它聊天了,如下是弱智吧的3個經典問題。可以看到,只有“生魚片是死魚片”這個問題回答的不太好,大模型好像不太能理解生魚片的生到底是什么意思。

圖片圖片

正常應該怎么回答呢?我先到阿里的“通義千問”上問了一下,感覺也沒太能回答到點上,畢竟師出同門,訓練用的語料應該都差不多。

圖片圖片

然后我又找了一個GPT-4的應用問了一下。GPT-4倒是準確把握住了“生”和“死”的含義,只是它回答的不是那么直接,大家看圖片中的內容吧。

圖片圖片

在測試數據集的評測中,Qwen1.5-32B的中文處理能力是明顯高于GPT-4的,但是“生魚片是死魚片”這個問題的確沒有回答好,這是模型的泛化能力不足,還是訓練語料的問題呢?對于這個問題,你怎么看?

模型下載

Huggingface:

https://huggingface.co/Qwen

Huggingface鏡像站:

https://hf-mirror.com/Qwen

AI快站:

https://aifasthub.com/models/Qwen

責任編輯:武曉燕 來源: 螢火架構
相關推薦

2024-04-08 08:05:00

大模型人工智能開源

2025-03-25 09:24:05

2025-09-19 11:09:40

2023-11-03 07:47:12

機器資源大模型:

2025-06-18 02:30:00

推理能力強化學習大語言模型

2025-03-25 12:11:08

2024-09-20 10:02:12

2021-12-15 06:58:28

RedisEhCache緩存

2021-10-06 19:02:36

Keil編譯器Armclang

2017-06-22 16:18:58

IBM光譜存儲軟件定義存儲

2023-09-05 14:43:15

2021-02-26 07:17:47

MySQLMariaDB

2025-10-29 00:00:00

光通信AI人工智能

2025-04-14 09:27:00

2021-07-26 08:12:31

開源API網關

2025-06-12 08:46:00

2014-01-07 13:54:40

Hadoop日志

2019-05-22 10:38:00

5G芯片中興
點贊
收藏

51CTO技術棧公眾號

先锋在线资源一区二区三区| 国产91精品网站| 日本天堂在线播放| 久草在线视频网站| 91麻豆免费观看| 国产日韩在线免费| 精品无码久久久久| 国产亚洲欧美日韩在线观看一区二区| 欧美色欧美亚洲另类二区| 成人性做爰片免费视频| 神马午夜电影一区二区三区在线观看 | 日韩精品一区二区在线| 免费观看日韩毛片| 菠萝菠萝蜜在线观看| 99国产一区二区三精品乱码| 国产一区二区色| 国产精品xxxx喷水欧美| 国产精品伦理久久久久久| 亚洲国产高清自拍| 四季av一区二区三区| 国产直播在线| 亚洲免费观看高清完整版在线观看 | 国产ts人妖一区二区三区| 国产探花在线视频| 亚洲大片精品免费| 欧美大片在线观看| 亚洲国产日韩欧美在线观看| 乡村艳史在线观看| 亚洲激情欧美激情| 在线视频不卡国产| melody高清在线观看| 99国产欧美另类久久久精品| 91视频免费进入| 在线观看毛片视频| 噜噜噜久久亚洲精品国产品小说| xxxxx成人.com| 欧美 变态 另类 人妖| 天堂久久av| 欧美高清视频不卡网| 青青草原成人网| 男女羞羞在线观看| 亚洲一区二区视频| 800av在线免费观看| 黄色网址在线免费观看| 国产精品欧美极品| 欧美日韩在线播放一区二区| 午夜视频免费在线| 99riav一区二区三区| 成人欧美一区二区三区黑人免费| 91丨九色丨丰满| 免费一级片91| 国产日产欧美a一级在线| 成人毛片在线播放| 久久最新视频| 91国内在线视频| 国产成人无码精品亚洲| 亚洲小说欧美另类社区| 亚洲97在线观看| 激情五月色婷婷| 亚洲欧美日韩专区| 人人爽久久涩噜噜噜网站| 亚洲欧美精品一区二区三区| 香蕉亚洲视频| 国产成人亚洲综合青青| 天天干,天天干| 三级在线观看一区二区 | 精品国产乱子伦| 视频一区二区中文字幕| 国产精品色婷婷视频| 亚洲自拍第二页| 国产自产2019最新不卡| 91av一区二区三区| 日韩一级中文字幕| 国产亚洲成av人在线观看导航| 日本在线播放一区| 日韩av中文| 亚洲另类一区二区| 2018国产在线| 国产超碰精品| 欧美日韩国产成人在线91| 久久6免费视频| 99re91这里只有精品| 日韩不卡在线观看| 精品国产aaa| 亚洲影视一区二区三区| 欧美精品第一页在线播放| 日本va欧美va国产激情| 日韩av一级电影| 亚洲伊人久久综合| 内射后入在线观看一区| 国产丝袜美腿一区二区三区| 在线精品亚洲一区二区| 波多野结依一区| 欧洲色大大久久| www.黄色网| 热久久天天拍国产| 久久久噜噜噜久久久| 黄色污污网站在线观看| 国产一级精品在线| 久久精品美女| a视频在线播放| 色哟哟日韩精品| 日韩精品国产一区| 精品视频久久| 国内精品久久久久久影视8| 无码人妻丰满熟妇区五十路| 国产精品一二一区| 日韩av电影免费观看| 日本无删减在线| 欧美系列亚洲系列| 国产白袜脚足j棉袜在线观看| 欧美伦理影院| 97在线视频免费播放| 国产精品suv一区| 国产一区二区电影| 日韩.欧美.亚洲| 校园春色亚洲| 精品免费99久久| 一级黄色片日本| 日本aⅴ精品一区二区三区| 激情视频一区二区| 很黄的网站在线观看| 在线观看一区不卡| 亚洲第九十七页| 欧美日韩一区自拍| 国产精品一区二区三区久久| 欧美日韩激情视频一区二区三区| 夜夜精品视频一区二区| 一区二区免费av| 欧美亚洲激情| 国产91露脸中文字幕在线| 成人毛片视频免费看| 亚洲欧美一区二区在线观看| 中文字幕永久视频| 日韩大片在线免费观看| 久久久在线免费观看| 精品国产亚洲av麻豆| 亚洲天堂久久久久久久| 亚洲精品久久久久久宅男| 国内精品久久久久久久影视简单| 91成人在线观看国产| 日韩中文字幕影院| 亚洲国产日产av| 亚洲乱妇老熟女爽到高潮的片 | 91在线观看地址| 欧美视频在线观看视频| 97久久亚洲| 国产综合在线视频| 人妻va精品va欧美va| 亚洲国产中文字幕在线视频综合| 潘金莲一级淫片aaaaaaa| 欧美日韩网站| 国产成人精品免费视频大全最热| 女同一区二区免费aⅴ| 日韩欧美国产一区二区在线播放| 日本黄色小说视频| 国产成人免费在线观看| 免费在线看黄色片| 国语一区二区三区| 国模精品系列视频| 午夜视频在线免费播放| 一道本成人在线| 老熟妇一区二区| 久久精品99久久久| 国产免费xxx| caoporn成人免费视频在线| 午夜伦理精品一区| 青青草免费观看免费视频在线| 色综合久久66| 天堂av网手机版| 国产麻豆成人精品| 国产九九九九九| 国产麻豆精品久久| 国产美女91呻吟求| av片在线观看免费| 日韩一区二区精品在线观看| 精品无码免费视频| 91小视频在线免费看| xxxx一级片| 欧美三级小说| 免费看国产精品一二区视频| 亚洲爽爆av| 韩国欧美亚洲国产| 国产在线视频网址| 91麻豆精品国产无毒不卡在线观看| 久久久久国产精品夜夜夜夜夜| 99精品欧美一区二区三区小说| 999香蕉视频| 亚洲字幕久久| 欧美不卡1区2区3区| 日本中文字幕视频一区| 久久久久久久久国产| 免费观看成年在线视频网站| 在线91免费看| a v视频在线观看| 日本一区二区不卡视频| 国产精品99精品无码视亚| 久久久蜜桃一区二区人| 蜜桃网站在线观看| 美女少妇全过程你懂的久久 | 精品资源在线| 国产免费一区二区三区在线能观看| 三级福利片在线观看| 亚洲视频免费一区| 亚洲毛片在线播放| 欧美视频一区二区三区四区 | 精品视频一区二区| 台湾天天综合人成在线| 日本亚洲欧美成人| 日本片在线观看| 日韩网站免费观看| 免费在线性爱视频| 欧美大肚乱孕交hd孕妇| 中文字幕视频二区| 精品福利免费观看| 麻豆精品一区二区三区视频| 国产无一区二区| 在线免费观看污视频| 精品中文字幕一区二区| 99蜜桃臀久久久欧美精品网站| 欧美精品1区| 午夜欧美性电影| 视频小说一区二区| 国产91精品入口17c| 亚洲精品毛片| 国产精品露脸自拍| 巨茎人妖videos另类| 久久久久久成人精品| 成人免费视屏| 久久久999精品视频| 99riav在线| 国产亚洲福利一区| 久久精品国产亚洲a∨麻豆| 精品国产伦理网| 精品国产99久久久久久宅男i| 欧美无砖砖区免费| 波多野结衣电车痴汉| 福利二区91精品bt7086| 国产乱码久久久久久| 亚洲一二三四在线| 久久久99精品| 亚洲一区二区在线免费看| 精品一区在线视频| 亚洲在线视频一区| 久久一二三四区| 亚洲高清不卡在线| 久久久香蕉视频| 亚洲高清免费在线| 国产女同在线观看| 黑人极品videos精品欧美裸| 亚洲精品午夜国产va久久成人| 精品久久久中文| 视频一区二区三区四区五区| 色综合一个色综合| 亚洲毛片一区二区三区| 在线中文字幕一区| 中文字幕a级片| 精品视频全国免费看| 一级黄色片在线观看| 欧美精品123区| 国内老熟妇对白hdxxxx| 亚洲国产高清福利视频| 四虎电影院在线观看| 亚洲高清一二三区| 日本高清中文字幕二区在线| 亚洲人成在线电影| 丝袜美腿美女被狂躁在线观看| 久久精品99久久久香蕉| 男女在线观看视频| 欧洲一区二区视频| 日本亚洲欧洲无免费码在线| 97视频热人人精品| 欧美变态网站| 日韩亚洲视频在线| 欧美区亚洲区| 精品99在线视频| 美女视频黄久久| 国产sm在线观看| 久久婷婷久久一区二区三区| 毛片久久久久久| 一个色在线综合| 日日噜噜噜噜人人爽亚洲精品| 欧美色综合天天久久综合精品| 国产免费黄色大片| 亚洲精品www久久久久久广东| 国产精品一二三区视频| 久久亚洲综合国产精品99麻豆精品福利 | 综合亚洲自拍| 中文精品一区二区三区| 亚洲精品婷婷| 91精品999| 99国产精品久久久| 成年人一级黄色片| 欧美视频免费在线| 国产精品久久免费| 亚洲精选在线观看| gogo在线高清视频| 庆余年2免费日韩剧观看大牛| 亚洲欧美在线人成swag| 久久一区二区三区欧美亚洲| 国产精品久久久久久久久妇女| 久久久亚洲国产精品| 毛片基地黄久久久久久天堂| 亚洲激情 欧美| 亚洲视频在线观看一区| 婷婷激情五月综合| 亚洲第一男人av| 国产在线观看a| 日韩av毛片网| 久久国产精品免费精品3p| 中文字幕av日韩精品| 国产毛片一区| 国产一精品一aⅴ一免费| 中文字幕乱码久久午夜不卡| 国产一级精品视频| 日韩一二三区视频| 免费不卡视频| 国产精品久久久久av| 欧美成人专区| 国产 欧美 日本| 国内外成人在线视频| 国产调教在线观看| 欧美性xxxxx极品娇小| 亚洲成人777777| 欧美成人免费网| 成人噜噜噜噜| 一本一道久久久a久久久精品91| 久久国产66| 91精品人妻一区二区| 亚洲国产欧美在线| 国产xxxxxx| 久久综合五月天| 欧美黑粗硬大| 性欧美大战久久久久久久免费观看| 性欧美videos另类喷潮| 超碰男人的天堂| 欧美日韩中国免费专区在线看| 女人18毛片水真多18精品| 欧美激情xxxxx| 91在线一区| 黄色www网站| 91丝袜国产在线播放| av中文在线播放| 亚洲人成网站777色婷婷| 欧美天堂视频| 奇米视频888战线精品播放| 午夜宅男久久久| 国产精品毛片一区二区| 日本韩国精品在线| 国产乱理伦片a级在线观看| 热99在线视频| 日韩欧美一区免费| 性生生活大片免费看视频| 综合久久综合久久| 国产人妻精品一区二区三| 九九精品在线视频| 高清日韩欧美| 日韩在线视频在线观看| 久久久久久久久久久黄色| 伊人久久中文字幕| 久久精品欧美视频| 久久久久久爱| 国产一二三在线视频| 久久夜色精品国产欧美乱极品| 亚洲男人天堂网址| 日韩中文字幕网址| 综合激情网...| 久久久免费视频网站| 国产精品丝袜在线| 国产露脸国语对白在线| 久久久久久亚洲精品中文字幕| 五月国产精品| 黄色小视频免费网站| 亚洲乱码一区二区三区在线观看| 欧美一区,二区| 国产99视频精品免视看7| 91欧美大片| 岛国精品资源网站| 欧美性猛片xxxx免费看久爱| 国产精品一卡二卡三卡| 国产一区二区三区高清| 日韩福利视频导航| xxxx日本少妇| 亚洲女人天堂网| 国产精品色婷婷在线观看| 老太脱裤让老头玩ⅹxxxx| 欧美激情一区在线观看| 国产高清第一页| 日韩av免费在线看| 欧美91大片| 成人无码av片在线观看| 日韩三级.com| 日韩在线短视频| 日韩精品在线观看av| 日本一区二区久久| 免费av一级片| 国产在线拍偷自揄拍精品| 国产精品腿扒开做爽爽爽挤奶网站| 久久爱一区二区| 亚洲另类欧美自拍|