Qwen發布Qwen3-Coder：開源4800億參數級代碼模型新標桿

作者：前端小智 2025-07-28 02:55:00

向Qwen團隊致敬，他們開放了Qwen3-Coder的全部權重模型。這對于開源社區和開發者而言意義非凡。其超長上下文雖然誘人，但實際使用場景可能并不常見。

阿里巴巴旗下的Qwen團隊剛剛發布了迄今為止最先進的代碼模型Qwen3-Coder。這款模型提供了多種規模版本，其中最大的版本參數高達4800億，樹立了開源代碼模型的新標準，尤其在編程生成、瀏覽器交互以及工具調用等領域表現突出，足以與Claude 4 Sonnet一較高下。

近期開發者社區內對Claude 4 Sonnet模型的抱怨逐漸增多，主要源自于Claude的頻繁限流和性能下降，這讓不少開發者開始轉而尋找新的解決方案。如今Qwen3-Coder攜卓越的基準測試成績以及開源開放的特性，成為了新的關注焦點。

一個重要問題隨之而來：在真實的編程場景中，Qwen3-Coder是否足夠優秀，足以挑戰Claude在實際工作流程中的領先地位呢？

什么是Qwen3-Coder？

Qwen3-Coder是阿里云Qwen團隊基于Qwen3系列開發的代碼專用模型。

該模型完全開源，專為超長上下文場景的智能化編程設計，借助YaRN技術，其上下文窗口支持長達100萬token，實際運行時啟用了350億個活躍參數。

Qwen3-Coder延續了基礎版Qwen3模型的優勢，除了擅長代碼生成外，在數學推理和通用語言理解等任務中也有突出表現。

該模型支持358種編程語言，包括但不限于Python、JavaScript、TypeScript、C++、Java、Go、Rust、PHP、SQL、HTML、CSS和Shell等主流語言。

據Qwen團隊工程師林君陽介紹，盡管現在還不敢說Qwen3-Coder完全能與Claude Sonnet 4媲美，但作為智能化編程助手，它的表現已經非常突出，比此前發布的Qwen2.5-Coder強大許多，采用了MoE架構，能力得到質的飛躍。

如需了解更多技術細節，可參考官方白皮書。

根據基準測試結果顯示，Qwen3-Coder-480B-A35B-Instruct已經成為迄今為止性能最強的開源智能代碼模型。

下面，我們將深入了解它的具體表現。

Qwen3-Coder模型特點

Qwen3-Coder-480B-A35B-Instruct的主要參數如下：

類型：因果語言模型（CLM）
訓練階段：預訓練和后訓練（強化學習）
總參數量：4800億（啟用參數350億）
模型層數：62層
注意力頭數（GQA）：Q頭96個，KV頭8個
專家網絡（Experts）數：160個（激活8個）
原生上下文長度：262,144 tokens

默認支持對話模式，無需手動禁用思考標簽（think標簽），隨時可以用于聊天式交互。

預訓練階段

Qwen3-Coder使用7.5萬億token進行預訓練，其中70%的數據來自代碼相關領域。在強化編程能力的同時，保留了基礎的數學與通用推理能力。此外，該模型默認支持256K tokens超長上下文，通過YaRN技術還可擴展到1M tokens。

團隊還通過Qwen2.5-Coder清理和重寫了部分低質量訓練樣本，大幅降低了模型“幻覺”（hallucination）的發生概率。

后訓練階段

后訓練階段重點采用了強化學習技術（Code RL），并針對真實世界的編程任務進行優化訓練，以提高代碼可執行性。

同時引入了長程強化學習（Long-Horizon RL），在SWE-Bench等需要長期規劃的任務中表現更加優秀。

團隊利用阿里云平臺并行運行了20,000個訓練環境，這極大地提升了模型在實際場景中的表現。

Scaling Code RL

Qwen3-Coder基準測試表現

根據官方發布的測試數據顯示，Qwen3-Coder 480B-A35B-Instruct在開源智能編程模型中遙遙領先。

Qwen3-Coder Benchmarks. Image from Qwen

具體測試中，Qwen3-Coder在編程任務、瀏覽器交互及工具使用方面的表現遠超其他開源模型，Terminal-Bench評分37.5、Mind2Web評分55.8、TAU-Bench Retail評分達到77.5。

盡管如此，它仍未超越Claude Sonnet-4，后者在復雜任務處理、準確度與細致控制方面更具優勢，如在SWE-bench、BFCL等工具測試中仍占領先位置。

總體來看，Qwen3-Coder已處于開源模型領先地位，與Claude差距逐步縮小，但目前還無法完全超越頂級閉源模型。

如何訪問Qwen3-Coder？

Qwen團隊同時開源了一個命令行編程工具：Qwen Code。

Qwen Code基于Gemini Code進行了定制化改造，新增了專屬提示詞（prompt）和函數調用協議，更充分發揮Qwen3-Coder的智能編程能力。

項目現已在GitHub平臺開源，目前貢獻者26位，Star數量超5600個。

Qwen3-Coder GitHub page. Image by Jim Clyde Monge

克隆項目到本地方法：

git clone https://github.com/QwenLM/qwen-code.git
cd qwen-code && npm install && npm install -g

注意：安裝時會下載大量約9-10GB大小的Safetensor模型文件，請確保磁盤空間充足。

Qwen3-Coder safetensor files. Image by Jim Clyde Monge

設置環境變量（使用OpenAI SDK調用）：

export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"

然后即可使用命令qwen進行編程。

Qwen3-Coder CLI. Image by Jim Clyde Monge

也可以通過HuggingFace或Qwen官方應用在線使用Qwen3-Coder，無需安裝。

示例1：與Qwen3-Coder-480B-A35B-Instruct對話

若想測試Qwen3-Coder的聊天能力，可進入官方HuggingFace空間。在頁面右側有聊天窗口，你可以直接向模型提問。

如下例所示：

Qwen3-Coder HuggingFace. Image by Jim Clyde Monge

用戶提問：請用簡單語言解釋一下什么是量子計算。

模型回答：

量子計算就像一臺性能超級強悍的計算器，但它的工作方式和普通電腦完全不同。

普通計算機 vs 量子計算機：

普通計算機使用的是“比特”（bits），要么為0要么為1，就像電燈開關一樣，要么開，要么關。
量子計算機使用的是“量子比特”（qubits），它們能同時處于0和1的疊加狀態，就像一個旋轉的硬幣，在落下前同時擁有正面和反面。

量子的神奇特性：

疊加：量子比特能同時處于多種狀態，因此量子計算機能一次性探索大量可能性。
糾纏：量子比特之間有奇特的聯系，改變其中一個狀態，無論距離多遠，另一個都會立刻感知。
干涉：量子計算機能夠強化正確答案并抵消錯誤答案，這種現象就像調準電臺信號一樣，快速準確找到想要的信息。

獨特優勢：

普通電腦逐步解決問題，而量子計算機能同時探索上千種方案，更高效地解決復雜問題，就像成千上萬臺電腦同時工作。

現實應用領域：

藥物研發：模擬分子間的相互作用。
密碼學：破解現有的加密技術。
優化問題：尋找最短路徑或最優排程方案。
人工智能：更高效地處理海量數據。

當前挑戰：

量子計算機十分脆弱，需要極低溫環境（接近絕對零度），極易出錯，造價昂貴且制造困難。

可以將量子計算視為專用于極為復雜問題的特殊工具，而非日常使用電腦的替代品。

若想通過Playground界面與模型交互，需在HuggingFace官網生成一個免費的推理API訪問令牌（Inference API Token），否則模型無法正常回應。

HuggingFace creating API token. Image by Jim Clyde Monge

獲得令牌后，即可打開Playground界面，并進行更精細的參數調整，如temperature、top-p和token數等。

HuggingFace Qwen3-Coder dashboard. Image by Jim Clyde Monge

用戶提問：單詞strawberry里面有幾個字母R？

模型回答：

單詞“strawberry”逐字檢查如下：

s-t-r-a-w-b-e-r-r-y

s：不是R
t：不是R
r：這是第一個R
a：不是R
w：不是R
b：不是R
e：不是R
r：這是第二個R
r：這是第三個R
y：不是R

因此，單詞“strawberry”共有3個字母R。

示例2：使用Qwen3-Coder快速創建Web應用

Qwen3-Coder擅長從零開始生成前端Web應用。你可以前往官方HuggingFace空間，直接在Prompt框中描述你想生成的網頁或應用。

例如，以下是一個生成包含5只寶可夢（Pokémon）SVG圖像的提示示例：

用戶輸入Prompt：「幫我生成一個包含5只寶可夢SVG圖像的網頁，要有詳細特征。」

模型很快開始在界面右側生成完整的HTML/React代碼，整個過程大約只需30秒。

圖片

以下即為代碼運行后的實際效果：

HuggingFace Qwen3-Coder example. Image by Jim Clyde Monge

生成的SVG圖案非常細致，每只寶可夢在鼠標懸停時還擁有流暢的動畫效果。

此外，也可在Qwen官方的Chat應用中進行類似操作。登錄chat.qwen.ai，選擇Qwen3-Coder模型及需要的工具（如創建Web應用、深入研究或圖像生成等）：

Qwen web app with Qwen3-Coder example. Image by Jim Clyde Monge

作為測試，再試一下圖像生成效果，使用如下Prompt：

Prompt示例：一個復古未來主義風格的機械獅子特寫，靈感來自經典高達動畫風格。獅子頭部由棱角分明的白色裝甲板組成，配以鮮明的紅藍色細節，眼睛為發光的綠色護目鏡風格，下方暴露出機械結構。背景是一座霓虹燈裝飾的復古科幻城市，有鏡頭光暈，色彩鮮艷，線條清晰銳利，整體效果震撼，電影級別的光影處理，色彩對比鮮明。

生成的圖像效果如下：

Qwen web app with Qwen3-Coder example. Image by Jim Clyde Monge

不過整體質量不盡如人意，相比谷歌Imagen 4、Midjourney等專業圖像生成模型還有明顯差距。

作為對比，同樣的Prompt在Flux Labs AI使用谷歌的Imagen 4生成的效果明顯更優質，更準確地體現了原有描述。

Flux Labs image generation example. Image by Jim Clyde Monge

通過對比可見，Qwen3-Coder雖然在代碼生成方面表現突出，但圖像生成能力仍然較弱。

Qwen3-Coder API費用

Qwen3-coder-plus為官方API商業版，根據輸入token數量階梯定價：

上下文窗口：1,048,576 tokens
免費額度：激活后180天內100萬tokens免費使用

具體費用（每百萬tokens）：

0~32K tokens：輸入，輸出5
32K~128K tokens：輸入，輸出9
128K~256K tokens：輸入，輸出15
256K~1M tokens：輸入，輸出60

（圖片占位）

結語

建議開發者嘗試一下免費平臺，親自驗證Qwen3-Coder在實際編程工作中的表現是否能達到甚至超出預期。

期待Qwen3-Coder未來能與Claude 4 Sonnet更緊密競爭，共同推動智能編程領域發展。

責任編輯：武曉燕來源：大遷世界

Qwen 代碼模型