精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通義千問再開源,Qwen1.5帶來六種體量模型,性能超越GPT3.5

人工智能 新聞
超越 Claude、GPT-3.5,提升了多語言支持能力。

趕在春節(jié)前,通義千問大模型(Qwen)的 1.5 版上線了。今天上午,新版本的消息引發(fā)了 AI 社區(qū)關注。

新版大模型包括六個型號尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最強版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多語言支持。

阿里通義千問團隊表示,相關技術也已經(jīng)上線到了通義千問官網(wǎng)和通義千問 App。

除此以外,今天 Qwen 1.5 的發(fā)布還有如下一些重點:

  • 支持 32K 上下文長度;
  • 開放了 Base + Chat 模型的 checkpoint;
  • 可與 Transformers 一起本地運行;
  • 同時發(fā)布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 權重。

借助更先進的大模型作為評委,通義千問團隊在兩個廣泛使用的基準 MT-Bench 和 Alpaca-Eval 上對 Qwen1.5 進行了初步評估,評估結果如下:

圖片

盡管落后于 GPT-4-Turbo,但最大版本的 Qwen1.5 模型 Qwen1.5-72B-Chat 在 MT-Bench 和 Alpaca-Eval v2 上都表現(xiàn)出了可觀的效果,性能超過 Claude-2.1、GPT-3.5-Turbo-0613、Mixtral-8x7b-instruct 和 TULU 2 DPO 70B,與最近熱門的新模型 Mistral Medium 不相上下。

此外通義千問團隊表示,雖然大模型判斷的評分似乎與回答的長度有關,但人類觀察結果表明 Qwen1.5 并沒有因為產(chǎn)生過長的回答來影響評分。AlpacaEval 2.0 上 Qwen1.5-Chat 的平均長度為 1618,與 GPT-4 的長度一致,比 GPT-4-Turbo 短。

通義千問的開發(fā)者表示,最近幾個月,他們一直在專注探索如何構建一個真正「卓越」的模型,并在此過程中不斷提升開發(fā)者的使用體驗。

圖片

相較于以往版本,本次更新著重提升了 Chat 模型與人類偏好的對齊程度,并且顯著增強了模型的多語言處理能力。在序列長度方面,所有規(guī)模模型均已實現(xiàn) 32768 個 tokens 的上下文長度范圍支持。同時,預訓練 Base 模型的質量也有關鍵優(yōu)化,有望在微調過程中為人們帶來更佳體驗。

基礎能力

關于模型基礎能力的評測,通義千問團隊在 MMLU(5-shot)、C-Eval、Humaneval、GS8K、BBH 等基準數(shù)據(jù)集上對 Qwen1.5 進行了評估。

圖片

在不同模型尺寸下,Qwen1.5 都在評估基準中表現(xiàn)出強大的性能,72B 的版本在所有基準測試中都超越了 Llama2-70B,展示了其在語言理解、推理和數(shù)學方面的能力。

最近一段時間,小型模型的構建是業(yè)內(nèi)熱點之一,通義千問團隊將模型參數(shù)小于 70 億的 Qwen1.5 模型與社區(qū)中重要的小型模型進行了比較:

圖片

在參數(shù)規(guī)模低于 70 億的范圍內(nèi) Qwen1.5 與業(yè)界領先的小型模型相比具有很強的競爭力。

多語言能力

在來自歐洲、東亞和東南亞的 12 種不同語言上,通義千問團隊評估了 Base 模型的多語言能力。從開源社區(qū)的公開數(shù)據(jù)集中,阿里研究者構建了如下表所示的評測集合,共涵蓋四個不同的維度:考試、理解、翻譯、數(shù)學。下表提供了每個測試集的詳細信息,包括其評測配置、評價指標以及所涉及的具體語言種類。

圖片

詳細的結果如下:

圖片

上述結果表明,Qwen1.5 Base 模型在 12 種不同語言的多語言能力方面表現(xiàn)出色,在學科知識、語言理解、翻譯、數(shù)學等各個維度的評估中,均展現(xiàn)了不錯的結果。更進一步地,在 Chat 模型的多語言能力上,可以觀察到如下結果:

圖片

長序列

隨著長序列理解的需求不斷增加,阿里在新版本上提升了千問模型的相應能力,全系列 Qwen1.5 模型支持 32K tokens 的上下文。通義千問團隊在 L-Eval 基準上評估了 Qwen1.5 模型的性能,該基準衡量了模型根據(jù)長上下文生成響應的能力。結果如下:

圖片

從結果來看,即使像 Qwen1.5-7B-Chat 這樣的小規(guī)模模型,也能表現(xiàn)出與 GPT-3.5 可比較的性能,而最大的模型 Qwen1.5-72B-Chat 僅略微落后于 GPT4-32k。

值得一提的是,以上結果僅展示了 Qwen 1.5 在 32K tokens 長度下的效果,并不代表模型最大只能支持 32K 長度。開發(fā)者可以在 config.json 中,將 max_position_embedding 嘗試修改為更大的值,觀察模型在更長上下文理解場景下,是否可以實現(xiàn)令人滿意的效果。

鏈接外部系統(tǒng)

如今,通用語言模型的一大魅力在于其與外部系統(tǒng)對接的潛在能力。RAG 作為一種在社區(qū)中快速興起的任務,有效應對了大語言模型面臨的一些典型挑戰(zhàn),如幻覺、無法獲取實時更新或私有數(shù)據(jù)等問題。此外,語言模型在使用 API 和根據(jù)指令及示例編寫代碼方面,展現(xiàn)出了強大的能力。大模型能夠使用代碼解釋器或扮演 AI 智能體,發(fā)揮出更為廣闊的價值。

通義千問團隊對 Qwen1.5 系列 Chat 模型在 RAG 任務上的端到端效果進行了評估。評測基于 RGB 測試集,是一個用于中英文 RAG 評估的集合:

圖片

圖片

然后,通義千問團隊在 T-Eval 基準測試中評估了 Qwen1.5 作為通用智能體運行的能力。所有 Qwen1.5 模型都沒有專門面向基準進行優(yōu)化:

圖片

圖片

為了測試工具調用能力,阿里使用自身開源的評估基準測試模型正確選擇、調用工具的能力,結果如下:

圖片

最后,由于 Python 代碼解釋器已成為高級 LLM 越來越強大的工具,通義千問團隊還在之前開源的評估基準上評估了新模型利用這一工具的能力:

圖片

結果表明,較大的 Qwen1.5-Chat 模型通常優(yōu)于較小的模型,其中 Qwen1.5-72B-Chat 接近 GPT-4 的工具使用性能。不過,在數(shù)學解題和可視化等代碼解釋器任務中,即使是最大的 Qwen1.5-72B-Chat 模型也會因編碼能力而明顯落后于 GPT-4。阿里表示,會在未來的版本中,在預訓練和對齊過程中提高所有 Qwen 模型的編碼能力。

Qwen1.5 與 HuggingFace transformers 代碼庫進行了集成。從 4.37.0 版本開始,開發(fā)者可以直接使用 transformers 庫原生代碼,而不加載任何自定義代碼(指定 trust_remote_code 選項)來使用 Qwen1.5。

在開源生態(tài)上,阿里已經(jīng)與 vLLM、SGLang(用于部署)、AutoAWQ、AutoGPTQ(用于量化)、Axolotl、LLaMA-Factory(用于微調)以及 llama.cpp(用于本地 LLM 推理)等框架合作,所有這些框架現(xiàn)在都支持 Qwen1.5。Qwen1.5 系列目前也可以在 Ollama 和 LMStudio 等平臺上使用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-11 09:20:48

2023-11-01 19:03:58

GPT-4

2023-10-31 15:26:02

阿里云通義千問

2024-08-30 15:19:22

2023-09-01 21:12:13

GPT3.5模型微調

2023-02-16 13:48:56

模型論文

2023-08-23 13:27:00

SQLCoder開源開發(fā)

2024-06-11 07:03:00

大模型開源Qwen2

2025-02-08 09:30:00

2023-12-01 13:36:01

阿里云通義千問

2025-09-12 10:02:21

AI模型開源

2023-12-12 13:16:00

模型訓練

2025-09-15 03:00:00

2023-08-03 19:11:45

2025-08-15 12:53:15

2024-10-30 11:06:59

SpringAI模型

2025-03-27 10:04:36

阿里云通義千問多模態(tài)

2023-12-27 14:06:00

模型訓練

2025-05-15 03:25:00

點贊
收藏

51CTO技術棧公眾號

亚洲国产精品91| 久久影院午夜精品| 大尺度一区二区| 欧美一级片免费在线| 成人欧美一区二区三区黑人一| 香蕉成人在线| 欧美日韩一区二区在线播放| 亚洲国产婷婷香蕉久久久久久99| 亚洲成人一级片| 日韩激情视频网站| 久久久久久久久网站| 四季av中文字幕| 精品伊人久久久| 欧美日韩二区三区| 极品美女扒开粉嫩小泬| 国产原创在线观看| 久久久久久久网| 99久久久精品免费观看国产| 亚洲国产无线乱码在线观看| 亚洲国产高清一区二区三区| 最近2019年中文视频免费在线观看| 亚洲成年人在线观看| 精品久久久网| 一本到不卡精品视频在线观看 | 日韩不卡一二三| 91av久久| 亚洲国产一区二区视频| 免费观看黄色的网站| 国产精品久久久久久久龚玥菲 | 热re99久久精品国产99热| 午夜免费福利视频| 精品影院一区二区久久久| 国产ts一区二区| 国产精品国产三级国产专区52| 午夜精品婷婷| 麻豆国产精品va在线观看不卡| 免费看91的网站| 美日韩中文字幕| 亚洲精品视频在线观看视频| 久久久久亚洲无码| 超碰成人免费| 欧美本精品男人aⅴ天堂| 午夜一区二区视频| 青青在线精品| 羞羞污视频在线观看| av在线不卡免费看| 国产精品视频在线免费观看| www久久久久久| 国产精品一级黄| 91丝袜脚交足在线播放| 国产欧美久久久| 国产一区二区久久| 51午夜精品| 午夜精品久久久久久久第一页按摩| 狠狠久久亚洲欧美| 91久久久久久| 性一交一乱一色一视频麻豆| 国产成人av一区二区| 国产高清一区视频| 五月激情丁香婷婷| 久久久久久麻豆| 艳色歌舞团一区二区三区| 日本中文字幕电影在线免费观看| 国产精品女人毛片| 女女同性女同一区二区三区按摩| 在线观看三级视频| 午夜婷婷国产麻豆精品| 国产男女在线观看| 日韩护士脚交太爽了| 欧美一区二区三区男人的天堂| 永久免费看片在线观看| 狼人精品一区二区三区在线| 亚洲视频视频在线| 日日操免费视频| 亚洲欧美文学| 欧美一级黄色网| 亚洲网站免费观看| 国产成人自拍高清视频在线免费播放| 国产精品jizz视频| 精品美女视频在线观看免费软件 | 日本精品网站| 欧美二区三区的天堂| 野战少妇38p| 国产区精品区| 欧美黑人极品猛少妇色xxxxx| 久久久久久久久影院| 人人精品人人爱| av免费观看久久| 国外av在线| 一区二区三区影院| 日韩一级在线免费观看| 国产日本亚洲| 亚洲精品国产欧美| 国产日产精品一区二区三区的介绍| 欧美日韩 国产精品| 国产99久久精品一区二区 夜夜躁日日躁 | 欧美日韩一区二区三区在线| 欧美激情一区二区三区p站| 欧美日韩中字| 性色av一区二区三区| 伊人网站在线观看| 91丝袜国产在线播放| 国产日本欧美在线| **在线精品| 日韩免费高清av| 欧美激情 一区| 夜夜嗨一区二区| 成人午夜黄色影院| 国产小视频在线| 欧美日韩国产在线| 中文字幕一二三| 日韩一区二区中文| 日韩av免费在线观看| 欧美自拍偷拍一区二区| 中文字幕一区二区三区四区| 久久国产乱子伦免费精品| youjizz欧美| 久色乳综合思思在线视频| 国产又粗又猛又黄视频| 99久久综合狠狠综合久久| 成人国产一区二区三区| 亚洲福利影视| 亚洲一区二区精品| 久久精品视频7| av在线不卡观看免费观看| 日韩专区第三页| 国产成人免费av一区二区午夜 | a√中文在线观看| 日韩一区二区视频在线观看| 美国精品一区二区| 日本免费新一区视频| 欧洲一区二区日韩在线视频观看免费 | 自拍偷拍 国产| 校园春色另类视频| 69国产精品成人在线播放| 免费成人在线看| 亚洲影院久久精品| 美国黄色一级视频| 极品中文字幕一区| 国产精品成人观看视频免费| 黄网av在线| 精品国产精品网麻豆系列| 久草免费在线观看视频| 国产jizzjizz一区二区| 青青青青在线视频| 都市激情亚洲| 国内自拍欧美激情| 三级在线电影| 在线一区二区三区| 亚洲一级理论片| 国产精品一二三区| 激情小视频网站| 欧美性生活一级片| 秋霞av国产精品一区| 国产一级二级三级在线观看| 欧美日韩欧美一区二区| 少妇高潮一区二区三区喷水| 国内一区二区在线| 精品成在人线av无码免费看| 黄色欧美网站| 国产999在线| 蜜桃av在线免费观看| 日韩欧美专区在线| 中文字幕一区二区三区精品 | 狠狠色综合播放一区二区| 国产成人三级视频| 激情视频极品美女日韩| 秋霞成人午夜鲁丝一区二区三区| 成年人视频在线免费观看| 欧美精品18+| 日本中文字幕网| 久久九九国产精品| 亚洲精品国产一区二区三区| 欧美日韩三级| 欧美在线3区| 国产精品一区二区精品视频观看| 久久久久久网站| 国产最新视频在线| 欧美一区二区三区系列电影| 日本中文字幕免费观看| 国产精品国产a| 亚洲av熟女高潮一区二区| 久久午夜激情| 国产又粗又长又爽视频| 亚洲精品456| 91香蕉国产在线观看| 中文字幕在线高清| 美女av一区二区三区| 视频二区在线| 欧美一区二区三区日韩视频| 国产91国语对白在线| 亚洲摸摸操操av| 白白色免费视频| 国产99精品在线观看| 欧美国产日韩在线播放| 精品动漫av| 一级黄色免费在线观看| 在线观看欧美理论a影院| 超碰在线97av| 久久精品xxxxx| 欧美自拍视频在线| 青草青在线视频| www.亚洲男人天堂| 三区在线视频| 欧美精品一区男女天堂| 国产又黄又爽视频| 色激情天天射综合网| 日韩高清一区在线| 欧美日韩一区二区三区视频 | avav在线播放| 欧美日一区二区| 久久99精品久久久久久久青青日本 | 男男电影完整版在线观看| 91精品国产综合久久精品| 无码人妻av一区二区三区波多野| 亚洲国产乱码最新视频| 97成人资源站| 国产精品美女久久久久aⅴ国产馆| 少妇精品一区二区| 成人性生交大合| 国产不卡的av| 精品写真视频在线观看| 黄色三级视频片| 久久黄色影院| 日本十八禁视频无遮挡| 影音先锋久久| 国产精品视频一二三四区| 91精品国产91久久综合| 亚洲人久久久| 久久视频精品| 翔田千里亚洲一二三区| 久久99国产精品久久99大师| 国产精品久久久久久久久久久久午夜片 | 成人在线观看免费高清| 久久精品男人天堂av| 国产精品九九九九九| 91一区二区三区在线观看| 日韩aaaaa| 91小视频免费观看| 97伦伦午夜电影理伦片| 91视视频在线直接观看在线看网页在线看| 成人做爰www看视频软件| 国产成人在线看| 免费观看黄网站| 国产成人精品1024| 国产国语老龄妇女a片| gogo大胆日本视频一区| 中国一级特黄录像播放| 97se亚洲国产综合自在线观| 疯狂揉花蒂控制高潮h| 91免费版在线| 国产中年熟女高潮大集合| 国产欧美视频一区二区| 欧美成人久久久免费播放| 亚洲欧洲日本在线| 欧美精品成人久久| 亚洲大片精品永久免费| 久久久久99精品成人片三人毛片| 色婷婷av一区| 中文字幕第2页| 91麻豆精品国产91久久久| 国产青青草视频| 亚洲丁香久久久| 免费播放片a高清在线观看| 中文字幕国产精品久久| 成人高清免费在线| 性金发美女69hd大尺寸| 亚洲一区二区三区四区| 成人日韩在线电影| 欧美有码在线| 亚洲毛片aa| 欧美日韩蜜桃| 欧美 日韩 国产 激情| 国内不卡的二区三区中文字幕 | 久久久视频在线| 欧洲亚洲两性| 91九色蝌蚪国产| 久久综合社区| 亚洲一卡二卡| av成人黄色| 久国产精品视频| 99久久99久久综合| 人人艹在线视频| 午夜国产不卡在线观看视频| 国产成人麻豆免费观看| 欧美成人女星排行榜| 国产青青草在线| 久久久中文字幕| 粉嫩av一区二区三区四区五区| 91亚色免费| 欧美一区二区三区高清视频| 国产一区二区三区播放| 日韩精品亚洲一区二区三区免费| 91人妻一区二区三区| 国产区在线观看成人精品| 久久老司机精品视频| 欧美视频精品在线观看| 天天操天天插天天射| 两个人的视频www国产精品| 欧美xoxoxo| 国产精品日本一区二区| 无码一区二区三区视频| 国产免费人做人爱午夜视频| 国产福利一区二区| 国产精品18在线| 欧美视频在线视频| 懂色av蜜臀av粉嫩av分享吧| 日韩中文在线中文网三级| 日韩激情电影免费看| 国产高清精品一区| 91精品蜜臀一区二区三区在线| 日韩欧美xxxx| 95精品视频在线| 玖玖爱免费视频| 91精品在线一区二区| 成全电影播放在线观看国语| 欧美中文字幕视频在线观看| 超碰在线一区| 台湾无码一区二区| 国产资源在线一区| 欧美成人久久久免费播放| 欧美在线一区二区| 你懂的视频在线观看| 91精品国产91久久久久| www.亚洲一二| 真人抽搐一进一出视频| 国产91丝袜在线播放| 中文字幕av久久爽av| 91精品一区二区三区在线观看| 91亚洲精选| 国产精品日韩一区| 操欧美老女人| 日韩高清第一页| 亚洲四区在线观看| www.热久久| 欧美黄色片视频| av成人资源| 日韩国产一级片| 99在线精品免费| 中日韩黄色大片| 日韩精品视频免费专区在线播放| 日韩激情电影| 欧洲在线视频一区| 免费在线观看视频一区| 毛片久久久久久| 欧美福利一区二区| 18av在线视频| 国产亚洲欧美一区二区 | 538任你躁在线精品免费| 欧美极品aⅴ影院| 91资源在线视频| 欧美大片免费观看在线观看网站推荐| 亚洲91在线| www.日本三级| aaa亚洲精品| av片免费观看| 日韩有码在线播放| 日韩中文字幕一区二区高清99| 污污污污污污www网站免费| 粉嫩嫩av羞羞动漫久久久| 日本中文字幕免费观看| 国产午夜精品视频| 欧美日韩破处视频| 青青青在线观看视频| 91麻豆.com| 91在线精品入口| 91精品国产成人| 色欧美自拍视频| 老女人性生活视频| 欧美天堂在线观看| 免费看美女视频在线网站| 国产精品色一区二区三区| 男的操女的网站| 欧美成人乱码一区二区三区| 激情黄产视频在线免费观看| 欧美日韩一区二区三区在线视频 | 1769国内精品视频在线播放| 欧美日韩xxxx| 天天干天天曰天天操| 精品久久久久久久久久国产| youjizz在线播放| a级国产乱理论片在线观看99| 噜噜爱69成人精品| 全网免费在线播放视频入口| 国产视频精品一区二区三区| 国产日韩欧美中文在线| 黄色a级片免费| 亚洲欧美一区二区三区极速播放| 午夜在线视频观看| 成人做爰www免费看视频网站| 中文精品视频| 亚洲天堂一级片| 亚洲欧美日韩爽爽影院| 麻豆国产一区| 91极品视频在线观看| 亚洲大片免费看| 182tv在线播放| 亚洲欧洲久久| 26uuu色噜噜精品一区二区| www.黄色国产|