全球開源大模型，前十五名全是中國的

2025-08-26 09:10:00

近日，隨著新一代大語言模型（LLM）的一波更新，開源大模型再次成為了熱門討論話題。

都在說國內(nèi)大模型正在馳騁開源領(lǐng)域，具體的情況如何？

近日，隨著新一代大語言模型（LLM）的一波更新，開源大模型再次成為了熱門討論話題。軟件工程師、自媒體 Rohan Paul 發(fā)現(xiàn)了一個驚人的現(xiàn)象：Design Arena 排行榜上排名前十幾位開源 AI 模型全部來自中國。

Design Arena 是目前全球最大規(guī)模的眾包 AI 生成設(shè)計 Benchmark 平臺，它的核心機制是讓真實的人類用戶進行評測，基于 Elo Rating（類似于國際象棋評分體系）等級分制度進行模型對戰(zhàn)。

用戶在平臺上會被隨機展示兩段由不同模型生成的回答，然后進行投票選擇「哪一個更好」。每一次投票都會影響對應(yīng)模型的 Elo 分數(shù)，進而形成動態(tài)的排行榜。Elo 核心原理是，高分選手擊敗低分選手，得分會很少，而低分選手爆冷戰(zhàn)勝高分選手時，得分會很多。因此用對弈的角度來看的話，這是一個相對公平、符合認知的評分系統(tǒng)。

因此，不同于 MMLU、SWE-Bench 這類客觀指標(biāo)，Design Arena 更貼近于「用戶真實體驗」。新模型一上線，就能迅速通過對戰(zhàn)獲得口碑分數(shù)。

在 Design Arena 上，如果把條件設(shè)定為「開源」，可見現(xiàn)在的前 15 名是清一色的國產(chǎn)開源大模型：

排名第一的是 DeepSeek-R1-0528，智譜的 GLM-4.5 和阿里的 Qwen 3 Coder 480B 緊隨其后。

再往下我們能看到 DeepSeek、Qwen、GLM 的各種型號，Kimi 在 7 月份開源的 K2 模型…… 一直到第 16 名才是 OpenAI 最近開源的 GPT OSS 120B。

在前 15 名中，各家大模型廠商上榜的模型數(shù)量依次如下：

阿里：6 款
DeepSeek：5 款
智譜：3 款
Kimi：1 款

最近一段時間，國內(nèi) AI 公司不斷發(fā)布新一代開源大模型，正在開拓 AI 技術(shù)的前沿。甚至對于國內(nèi)科技公司來說，開源已經(jīng)成為了最近一兩個月發(fā)布的主旋律。

在 Hugging Face 發(fā)布的中國 AI 社區(qū) 7 月開放成果中，包括阿里、智譜、昆侖萬維、月之暗面、騰訊、階躍星辰等在內(nèi)的多家廠商先后開源了 33 款大模型。

此前還有機構(gòu) Interconnects（深度聚焦前沿 AI 研究的高質(zhì)量內(nèi)容平臺）匯總了國內(nèi)頂尖的 19 家開源模型實驗室，包括 DeepSeek 這樣的頂級機構(gòu)，以及一些通過技術(shù)報告和小眾模型嶄露頭角的新興學(xué)術(shù)實驗室。

這 19 個開源玩家依次是：DeepSeek、Qwen、Moonshot AI (Kimi)、Zhipu / Z.AI、StepFun、Tencent (Hunyuan)、RedNote (Xiaohongshu)、MiniMax、OpenGVLab / InternLM、Skywork、ByteDance Seed、OpenBMB、Xiaomi (MiMo)、Baidu (ERNIE)、Multimodal Art Projection、Alibaba International Digital Commerce Group、BAAI 以及 inclusionAI、Pangu (Huawei)。

在大模型領(lǐng)域里，技術(shù)和性能領(lǐng)先的一直是以 GPT 系列為代表的閉源大模型。但隨著 Llama 系列興起，越來越多的開源模型逐漸成為了推動技術(shù)向前進步的重要動力。近一年多時間里，國產(chǎn)大模型集群式的崛起，則重塑了全球 AI 版圖。

現(xiàn)在說起開源的大模型，大多數(shù)人的第一反應(yīng)早已不是 Llama，而是 Qwen 和 DeepSeek。有人認為，正是 DeepSeek 等開源大模型能夠與閉源頂尖模型分庭抗禮，才讓眾多應(yīng)用端公司得以轉(zhuǎn)變工作重點，把精力放在模型調(diào)優(yōu)和應(yīng)用優(yōu)化的工作上來，進而加速了 AI 技術(shù)的落地。

或許這樣的趨勢也會扭轉(zhuǎn) AI 研究社區(qū)的趨勢，讓未來最先進模型的開源成為必選項。

最后，在外網(wǎng)也有人在為中國的 AI 模型崛起尋找深層原因。這位 Illya Gerasymchuk 是數(shù)學(xué)專業(yè)的碩士，他認為原因在于數(shù)學(xué)基礎(chǔ) —— 目前東亞人在數(shù)學(xué)領(lǐng)域上已經(jīng)占據(jù)了主導(dǎo)地位。

這是否和我們一直以來的印象已經(jīng)有些不一樣了？

責(zé)任編輯：張燕妮來源：機器之心

開源模型 AI