老外給中國 AI 開源廠商打分:第一梯隊是 DeepSeek 和 Qwen
中國開源模型開發商排名
Nathan Lambert,Allen人工智能研究所的研究員兼Interconnects通訊作者,于2025年8月17日發布了“中國開源模型開發商排名”。
該報告根據19家中國人工智能實驗室在開源AI生態系統中的貢獻質量和數量進行評估,重點關注開源模型、工具和數據集的發布,而非專有能力或原始性能。

該排名強調通過可訪問的資源推動全球AI發展的影響。Lambert的分析指出,中國在開源AI領域的快速進步,今年夏季的旗艦模型如Qwen 3、Kimi K2和Zhipu GLM 4.5讓“AI世界為之震動”。
排名分層如下(基于Lambert的分級):
圖片
圖片
此排名具有主觀性,基于Lambert對發布質量、創新和生態系統影響的評估。他指出可能存在遺漏,并歡迎反饋以更新未來版本。
對于這個排名,你覺得咋樣?
報告的關鍵見解
- 方法論:實驗室按開源貢獻排名,不包括整體實力。這排除了一些專注專有的公司,如百度的主要ERNIE團隊或字節跳動的核心努力,但包括其開源分支。
- 趨勢:中國開源生態系統強調成本效益的MoE架構、混合推理模式和行業特定適應。發布通常包括基礎模型、指令微調版本和部署工具。
- 挑戰:美國出口管制限制了高端芯片的獲取,推動了高效訓練的創新(例如FP8精度、異構MoE)。Lambert從本次研究中認識到,理解中國AI生態系統需要更多全球合作。
- 未來計劃:報告提到隨著生態系統的發展將重新評估排名,可能包括與西方的比較(如同Lambert后續的西方分層列表,美國實驗室無一匹敵中國頂級層級)。
以下幾個源于原文描述:
Qwen(通義千問)
qwenlm.ai | ?? Qwen | X @Alibaba_Qwen
通義千問是阿里巴巴云部門的主要AI實驗室,以其開源語言模型系列而聞名。多年來,他們一直在發布各種規模的模型(與Llama 1到3非常相似)。最近,他們的Qwen 2.5和Qwen 3模型在AI研究和初創企業開發中的市場份額正在加速增長。
Qwen在發布方面更接近美國大型科技公司而非其他中國AI實驗室:他們覆蓋了整個技術棧,從VLM到嵌入模型、編碼模型、圖像和視頻生成等。
他們還通過發布各種規模的強大模型來滿足所有可能的客戶(或者說開源社區的每個部分)。小型密集模型對于學術界進行實驗和中小企業為其應用提供動力很重要,因此基于Qwen的模型在受歡迎程度上爆炸式增長也就不足為奇了。
除了為所有人發布模型外,他們還專注于支持(西方)社區,發布用于本地使用的MLX和GGUF版本的模型,或為其編碼模型提供CLI,其中包括大量免費請求。
與一些美國公司不同,核心團隊在人員數量上似乎保持相對較小,與其他中國AI實驗室一致:Qwen3有177名貢獻者,而Llama 3的數量是其三倍,Gemini 2.5則有超過3,000人參與模型開發。
月之暗面(Kimi)
moonshot.cn | ?? moonshotai | X @Kimi_Moonshot
月之暗面是所謂的"AI六小虎"之一,這是由中國媒體和投資者確定的一組熱門中國AI初創公司。這個群體包括百川、智譜AI、月之暗面、MiniMax、階躍星辰和01.AI——其中大多數都吸引了科技基金和其他科技補助的投資。例如,阿里巴巴被視為AI領域的大贏家,因為他們擁有自己的模型,并且是月之暗面的主要投資者,這有點像美國大型科技公司投資新AI實驗室的融資輪。
雖然他們的第一批模型K1和K1.5是封閉的,只能通過API使用,但在R1發布后,他們開始使用Muon優化器發布開源模型的實驗模型。與DeepSeek類似,他們專注于單一模型線,小型實驗最終反饋到主模型中。K2是他們的"登月計劃",即yolo運行,并迅速成為類似于R1的熱門產品(請參閱我們的發布報告)。
關于Kimi的更多閱讀可以在ChinaTalk上找到。
智譜 / Z.AI
z.ai | ?? zai-org | X @Zai_org
智譜在西方被稱為Z.ai,是清華大學的初創公司分拆,獲得了中國公司和風險投資的大量投資。目前,他們甚至在考慮IPO,這將使他們成為第一家這樣做的AI六小虎。
在模型方面,他們最近發布的GLM-4.5和GLM-4.5V最為人所知,這些模型對于其規模來說都非常強大(兩者都是相當大的專家混合模型)。然而,他們不僅發布LLM,還發布圖像和視頻生成模型,使他們與純LLM公司和實驗室區別開來。
階躍星辰(StepFun)
stepfun.ai | ?? stepfun-ai | X @StepFun_ai
階躍星辰最初是一家封閉模型提供商,但在DeepSeek R1震撼行業后轉向開源模型發布。他們主要專注于多模態模型發布,Step3是他們的旗艦VLM。他們還有圖像、音頻和視頻生成模型。
騰訊(混元)
hunyuan.tencent.com | ?? Tencent | X @TencentHunyuan
混元主要以HunyuanVideo和Hunyuan3D而聞名。雖然他們已經發布了三個系列的不同LLM,但他們的發布帶有非常嚴格的許可證,這對中國公司來說是不尋常的,當與可以在其他地方找到的性能水平相結合時,會抑制興奮感。
小紅書(RedNote)
xiaohongshu.com | ?? rednote-hilab
中國版Instagram小紅書最近加入了發布開源模型的中國公司行列。特別是他們強大的字符識別/OCR模型讓許多人感到驚訝(請參閱我們的報道)。與小米和百度類似,他們在近期和遠期的整體開放戰略是什么還有待觀察,他們還沒有在大型前沿模型領域競爭。
MiniMax
minimaxi.com | ?? MiniMaxAI | X @MiniMax__AI
MiniMax是另一家AI六小虎,也是從封閉公司開始的。在R1發布后,他們改變了策略,發布了Minimax-Text-01的權重,隨后發布了基于它的推理模型。這些模型的獨特賣點是通過混合注意力實現的100萬上下文窗口。
這些文本模型并不是他們唯一關注的——他們還有圖像和視頻生成模型,但這些仍然是封閉的,只能通過他們的API使用。他們還在大力推廣他們的消費者平臺,因為他們著眼于IPO。
OpenGVLab / InternLM
internlm.intern-ai.org.cn | ?? InternLM | X @opengvlab
InternLM和OpenGVLab與上海人工智能實驗室有著深厚的聯系,InternLM專注于語言模型,而OpenGVLab發布視覺模型。雖然他們發布了一系列模型,如S1或InternLM-Math,但這些組織主要以強大的InternVL系列而聞名。雖然第一個版本主要使用他們自己的InternLM預訓練模型,但后來的版本(如InternVL3)依賴Qwen作為語言后端。
OpenBMB
openbmb.ai | ?? openbmb | X @OpenBMB
OpenBMB是清華大學NLP實驗室(智譜從同一所大學分拆出來)的開源社區(類似于BigScience),得到了北京人工智能研究院(BAAI)和ModelBest的支持。
他們主要專注于邊緣的小型多模態模型,如MiniCPM-V-4。然而,許可證相當嚴格,考慮到該組織的社區驅動起源,這令人驚訝。除了模型發布,他們還發布框架和專門的內核,以確保他們的模型在低端硬件上運行。
字節跳動豆包:顛覆性定價策略的全球挑戰者
快速崛起成為全球第二的秘密
字節跳動豆包在2024年5月正式發布后,僅用半年時間就成為全球月活用戶第二的AI應用。根據2025年最新數據,豆包以 1.07億MAU位居全球第二,僅次于ChatGPT的5.46億,超越了DeepSeek的9,688萬。在中國市場,豆包更是以5,998萬MAU穩居第一。
這種爆發式增長背后是精心設計的技術和商業策略。豆包-1.5-Pro采用稀疏混合專家(Sparse MoE)架構,在推理時僅激活部分參數,卻能實現相當于7倍規模密集模型的性能,效率比傳統MoE架構提升3倍。在成本控制上,豆包達到了驚人的水平:每百萬token僅需 0.11美元 (輸入),比DeepSeek R1便宜5倍,比OpenAI o1便宜200倍。
激進的投流策略與用戶增長
字節跳動在推廣豆包上展現了其在流量運營方面的核心優勢。2024年4-5月,公司投入1,800萬元廣告費用,6月猛增至 1.24億元。通過與抖音(4億+日活)、今日頭條等50多個自有應用的深度整合,豆包實現了低成本的病毒式增長。
用戶數據顯示,豆包的日均token消耗量超過4萬億,自發布以來增長了33倍。日新增下載量達到80萬用戶,留存率超過50%,遠高于行業平均水平。這種增長不僅來自免費策略降低的使用門檻,更得益于字節跳動在用戶體驗和產品迭代上的極致追求。
與DeepSeek的激烈競爭
2025年1月,DeepSeek在日活用戶上以2,220萬反超豆包的1,700萬,但豆包在月活用戶上仍保持領先。兩者的競爭體現了不同的技術路線:豆包采用閉源的專有稀疏MoE架構和異構系統設計,而DeepSeek堅持開源路線,專注于強化學習訓練。
在商業模式上,豆包通過火山引擎平臺主攻B2B市場,已覆蓋30多個行業,企業客戶平均使用量增長22倍。關鍵企業合作包括招商銀行、華泰證券等金融機構,以及沐瞳科技等游戲公司。豆包還為學術界提供數萬億免費token支持研究。
Seed團隊的組織架構與人才戰略
字節跳動為AI發展建立了獨特的雙軌組織結構:Flow部門專注文本和多模態生成,Seed部門探索通用智能的新方法。Seed團隊預計2025年將超過300名員工,創始人張一鳴親自參與AI人才招募。
公司的"Top Seed人才計劃"瞄準2025-2026年畢業的博士生,提供"遠超行業平均水平"的實習薪酬。最新的招聘重點包括機器人開發(10多個崗位)、多模態生物基礎模型、量子化學應用等前沿領域。2024年12月,字節跳動與北京大學建立聯合實驗室,專注大模型系統軟件和超大規模集群資源研究。
商業化模式與收入情況
字節跳動2024年總營收達到1,550億美元,增長29%。AI相關資本支出110億美元,預計2025年將達到220億美元。豆包的商業模式呈現B2B和B2C雙輪驅動特征:B2B業務通過火山引擎提供API服務,估計貢獻50%以上的AI收入;B2C則通過免費應用獲取用戶,通過生態系統變現。
最新的豆包1.6定價為每百萬token輸入0.8元、輸出8元,視頻生成每千token僅1.05元,比競爭對手便宜70%。這種激進的定價策略正在重塑整個AI行業的經濟模型,迫使所有競爭對手跟進降價。
小米:輕量化AI的創新實踐者
大模型布局與MiLM技術特點
小米采用"(軟件×硬件)^AI"的戰略公式,將AI定位為其"人車家"生態系統的指數級倍增器。2024年11月發布的MiLM2系列覆蓋0.3B到30B參數范圍,支持云端、邊緣和設備端部署。技術創新包括將上下文窗口從4,000擴展至 20萬token,TransAct結構化剪枝方法減少92%計算量,專有量化方法將精度損失降低78%。
2025年最新發布的MiMo-7B展現了小米在模型效率上的突破。盡管只有70億參數,MiMo在AIME 2025測試中達到55.4%通過率,超越OpenAI的o1-mini 4.7個百分點。這一成就源于25萬億token的從零訓練和2,000億推理token的專門優化。
與硬件產品的深度結合
小米是首家成功在移動設備上運行13億和60億參數模型的公司。小米14/15系列、Redmi K60/K50系列均已支持端側AI。在汽車領域,小米SU7集成了MiLM-1.3B,實現全鏈路語音交互,用戶可通過車輛控制智能手機、CarIoT和家居設備。HyperOS整合了AI模型跨200多個處理器平臺和20多個文件系統,HyperMind認知中心使用環境、視覺、聲音和行為感知構建智能家居體驗。
小愛同學的AI升級情況
2024年2月小愛通過大模型監管審批,9月完成"大模型小愛"全設備升級。增強功能包括智能問答、實時翻譯、文檔分析、會議轉錄等,生成速度超過每秒11個詞。覆蓋設備包括小米5系列以上手機、小米音響Pro等智能音箱,以及即將推出的智能顯示屏。2025年最新功能包括AI圖像創意編輯、車輛外部喚醒等跨設備協調能力。
百度文心一言:搜索巨頭的AI轉型
最新版本與技術進展
2025年3月發布的ERNIE 4.5系列采用混合專家架構,最大模型達424B參數,活躍參數47B。ERNIE X1深度思考模型在推理任務上與DeepSeek R1性能相當,但 成本降低50%。技術創新包括FlashMask動態注意力掩碼、異構多模態混合專家、時空表示壓縮等。性能基準顯示,ERNIE在中文語言處理多項指標上超越GPT-4。
市場份額與用戶規模
文心一言用戶增長呈現爆發態勢:從2024年4月的2億用戶增長至11月的 43億總用戶。API日調用量達到165億次,是2023年的33倍。根據IDC報告,百度在中國MaaS市場占有率28%,AI大模型解決方案市場占有率17%,均位列第一。平臺統計顯示,已有100萬+應用開發、1,000+平臺組件、85,000服務客戶和40萬+企業用戶。
與其他國產大模型的競爭態勢
相比豆包的娛樂和社交媒體整合,文心一言在企業應用和B2B服務領域領先。在金融領域,6家國有大行和30多家區域銀行采用文心;醫療領域600多家醫院使用智能診斷系統,準確率92.7%;政府服務覆蓋283個城市,日均咨詢500萬次。2025年4月起文心機器人完全免費,應對新興競爭對手的挑戰。
商業化進展
2024年百度總收入1,331億元,AI云收入同比增長26%,AI相關收入增長近3倍。企業定價策略上,ERNIE 4.5 API每千token輸入0.004元、輸出0.016元,比GPT-4.5便宜99%。中國財富500強企業中78%已部署文心應用。成功案例包括建設銀行4,000多個網點日均200萬+咨詢量、92%解決率;寶鋼智能質檢準確率提升35%、效率提升68%。
排名實驗室的詳細資料(僅供參考)
以下是每個層級的公司背景、成立日期、主要發布和貢獻的分解(從搜索和報告細節中編譯)。成立日期基于現有數據為近似值。
前沿層級
這些實驗室在高質量、頻繁的開源發布方面領先,推動生態系統增長。
- DeepSeek AI (成立:2023年7月,杭州;由High-Flyer對沖基金支持) 主要模型:DeepSeek-V2(2024年5月)、DeepSeek-Coder-V2(2024年7月)、DeepSeek-V3(2024年12月,671B參數)、DeepSeek-R1(2025年1月)、DeepSeek-R1-0528(2025年5月)。
貢獻:專注于成本效益的MoE架構;V3訓練成本600萬美元,使用受出口限制的芯片。采用MIT開源許可;在推理/數學領域表現卓越。支持聊天機器人;影響全球“人造衛星時刻”。 - Qwen(阿里巴巴) (成立:2013年作為阿里巴巴的一部分;Qwen系列始于約2023年) 主要模型:Qwen1.5(2023年)、Qwen2(2024年6月)、Qwen2.5(2024年9月)、Qwen3(2025年4月,密集/MoE變體高達235B-A22B)、QwQ-32B(2024年11月)、QvQ-72B(2025年)、Qwen3-Coder(2025年7月)。
貢獻:Apache 2.0許可;混合推理模式;在多語言/嵌入任務中表現強勁。下載量超過3億次;支持阿里巴巴生態系統。Qwen3系列在36T標記上訓練,在推理方面(例如62分在智能指數上)表現出色。
接近競爭對手層級
強勁的挑戰者,持續發布高影響力成果。
- 月之暗面AI(Kimi) (成立:2023年3月,北京;創始人:楊志林等人) 主要模型:Kimi(2023年10月,20萬上下文)、Kimi K1.5(2025年1月)、Kimi K2(2025年7月,1T總數/32B活躍MoE)。
貢獻:長上下文專家;代理AI重點。K2采用修改后的MIT開源許可;在編碼/數學領域表現卓越。支持Kimi聊天機器人(1300萬用戶)。 - 智譜AI (成立:2019年,北京;源自清華大學) 主要模型:GLM-4系列(最高GLM-4.5,2025年7月)、CogView4-6B、CogVideoX1.5-5B。
貢獻:后訓練能力強;GLM-4.5在工具使用/推理上處于SOTA狀態。采用Apache開源許可;注重代理原生功能。
值得注意層級
可靠的貢獻者,具有值得注意的創新。
- StepFun (成立:2023年4月,北京)主要模型:Step-2(萬億參數MoE)、Step-1.5V、Step-1X(圖像生成)、Step3(2025年7月,多模態推理)。
貢獻:硬件感知設計;低成本解碼。開源Step系列;在視覺/多模態領域表現卓越。 - 騰訊(Hunyuan) (成立:1998年;AI努力始于2010年代)主要模型:Hunyuan-Turbo(2025年)、Hunyuan-Large(2024年11月,389B/52B活躍MoE)、Hunyuan3D-2(3D生成)。
貢獻:在編碼/多模態領域表現強勁;Hunyuan-Large在中文任務上處于SOTA狀態。采用Apache開源許可。 - 紅點(小紅書) (成立:2013年,上海;AI努力始于2023年)主要模型:dots.llm1(2025年6月,142B/14B活躍)、Hailuo(視頻生成)。
貢獻:社交媒體導向;內容生成能力強。開源dots系列;與小紅書應用集成。 - MiniMax (成立:2021年,上海)主要模型:MiniMax-M1(2023年7月)、Hailuo(視頻生成)、MiniMax-Text-01(2025年1月,456B/45.9B活躍)、MiniMax-VL-01(多模態)。
貢獻:代理焦點;長上下文效率。采用Apache開源許可;在視頻/語音領域表現強。 - OpenGVLab / InternLM (成立:約2021年,上海;上海人工智能實驗室)主要模型:InternLM2(2024年)、InternVL3(2025年4月,最高78B)、InternVL2.5(2025年7月)。
貢獻:多模態焦點;開源Intern系列。在視覺-語言領域強;支持多任務輸出。 - Skywork (成立:約2023年,北京;昆侖科技)主要模型:Skywork-13B(2024年)、Skywork-R1V3-38B(2025年7月)、Skywork-SWE-32B(SWE重點)。
貢獻:開源推理模型;在數學/代碼領域強。采用Apache開源許可;注重數據擴展。
上升期層級
新興玩家,影響力日益增長。
- 字節跳動Seed (成立:2023年;字節跳動的AI實驗室)主要模型:Seed1.5-VL(2025年5月,多模態)、Seedance(2025年6月,視頻生成)、Seed-Prover(2025年8月,定理證明)。
貢獻:多模態/推理焦點;開源Seed系列。支持豆包聊天機器人。 - OpenBMB (成立:2022年;清華大學衍生)主要模型:CPM-2(2021年)、MiniCPM系列(最高MiniCPM-V-4,2025年8月,4B參數)。
貢獻:高效小型模型;開源MiniCPM(邊緣部署)。在多模態領域強。 - 小米(MiMo) (成立:2010年;AI努力始于2023年)主要模型:MiMo-7B(2025年4月,推理系列)。
貢獻:緊湊型推理模型;采用Apache開源許可。盡管規模小,但在數學/代碼領域表現強。 - 百度(ERNIE) (成立:2000年;AI自2019年以來)主要模型:Ernie 3.0(2023年)、Ernie 3.5(2023年6月)、Ernie 4.0(2023年10月)、Ernie 4.5(2025年3月,多模態)、Ernie X1(2025年3月,推理)。
貢獻:混合推理;在中文/多模態領域強。部分開源;支持Ernie Bot(3億用戶)。
榮譽提及層級
有潛力但貢獻有限的實驗室。
- 多模態藝術投影(M-A-P) (成立:2022年7月;開源社區)主要模型:MERT(音樂)、MuPT(符號音樂)、YuE(音樂生成,2025年1月)。
貢獻:多模態藝術焦點;開源音樂模型。 - 阿里巴巴國際數字商業集團 (成立:2017年作為阿里巴巴的一部分;AI約2023年)主要模型:Aidge/Pic Copilot(AI電商設計,2023年12月)。
貢獻:電商工具;多語言支持。 - 北京人工智能研究院(BAAI) (成立:2018年11月,北京)主要模型:吳道系列(2021年)、Emu3(2024年10月,多模態)、FlagAI工具包。
貢獻:研究樞紐;開源基礎設施。注重倫理/安全。 - InclusionAI (成立:約2023年;學術焦點)主要模型:具體有限;對數據集/工具的貢獻。
貢獻:AI包容性;開源以減輕偏見。 - 盤古(華為) (成立:2021年;華為AI實驗室)主要模型:Pangu-Σ(2023年4月,1.085T參數)、Pangu 3.0(2023年7月)、Pangu 5.0(2024年6月)、Pangu 5.5(2025年6月,718B參數)。
貢獻:行業特定;多模態。聚焦制造/天氣。?
本文轉載自??AI進修生??,作者:Aitrainee

















