僅激活 3B 參數(shù)可媲美 GPT-4o,Qwen3 深夜更新,一手實(shí)測(cè)來(lái)了! 原創(chuàng)
7 月 29 日凌晨,Qwen 團(tuán)隊(duì)再度公布重磅更新——此前已經(jīng)廣受好評(píng)的 Qwen3-30B-A3B 模型迎來(lái)了新版本:Qwen3-30B-A3B-Instruct-2507 。機(jī)器學(xué)習(xí)愛(ài)好者 Vaibhav (VB) Srivastav 第一時(shí)間分享了使用反饋:「最新的 Qwen3-30B-A3B-2507 在搭載 MLX 的 Mac 上運(yùn)行速度極快」。

聚焦官方給出的數(shù)據(jù),這個(gè)非思考模式(non-thinking mode)的新模型,將長(zhǎng)文本理解能力提升至 256K,僅激活 3B 參數(shù),就能取得可媲美 Gemini 2.5-Flash(non-thinking)、 GPT-4o 等頂尖閉源模型的超強(qiáng)性能。同時(shí),其在指令跟隨、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等方面均有顯著提升。

目前,「一鍵部署 Qwen3-30B-A3B-Instruct-2507」已上線至 OpenBayes 公共教程中,一鍵克隆即可快速體驗(yàn) demo 。筆者已經(jīng)為大家進(jìn)行了實(shí)測(cè),詢問(wèn)北京多地區(qū)的暴雨和臺(tái)風(fēng)登陸上海這兩個(gè)極端天氣現(xiàn)象之間是否有關(guān)聯(lián),測(cè)試了這個(gè)非思考模式的模型,其迅速?gòu)亩鄠€(gè)角度給出了回答。
此外,我們還為新用戶準(zhǔn)備了驚喜算力資源福利,使用邀請(qǐng)碼「Qwen3-2507」注冊(cè)即可獲得 2 小時(shí)雙卡 A6000 使用時(shí)長(zhǎng)(資源有效期 1 個(gè)月),數(shù)量有限,不要錯(cuò)過(guò)!
教程鏈接:
Demo 運(yùn)行
1. 進(jìn)入 hyper.ai 首頁(yè)后,選擇「教程」頁(yè)面,并選擇「一鍵部署 Qwen3-30B-A3B-Instruct-2507」,點(diǎn)擊「在線運(yùn)行此教程」。


2. 頁(yè)面跳轉(zhuǎn)后,點(diǎn)擊右上角「克隆」,將該教程克隆至自己的容器中。

3. 選擇「NVIDIA RTX A6000-2」以及「PyTorch」鏡像,OpenBayes 平臺(tái)上線了新的計(jì)費(fèi)方式,大家可以按照需求選擇「按量付費(fèi)」或「包日/周/月」,點(diǎn)擊「繼續(xù)執(zhí)行」。新用戶使用下方邀請(qǐng)鏈接注冊(cè),可獲得 4 小時(shí) RTX 4090 + 5 小時(shí) CPU 的免費(fèi)時(shí)長(zhǎng)!
HyperAI 超神經(jīng)專屬邀請(qǐng)鏈接(直接復(fù)制到瀏覽器打開):
??https://go.openbayes.com/9S6Dr??


4. 等待分配資源,首次克隆需等待 2 分鐘左右的時(shí)間。當(dāng)狀態(tài)變?yōu)椤高\(yùn)行中」后,點(diǎn)擊「API 地址」旁邊的跳轉(zhuǎn)箭頭,即可跳轉(zhuǎn)至 WebUI 頁(yè)面。請(qǐng)注意,用戶需在實(shí)名認(rèn)證后才能使用 API 地址訪問(wèn)功能。


效果演示
1. 最近極端天氣頻發(fā),北京接連暴雨后,上海又迎來(lái)了臺(tái)風(fēng),讓我們來(lái)問(wèn)問(wèn) Qwen3-30B-A3B-Instruct-2507 上海臺(tái)風(fēng)和北京暴雨的是否有關(guān)系,看看它怎么回答。
* 進(jìn)入 API 后,若左上角不顯示「Model」,這表示模型正在初始化,由于模型較大,請(qǐng)等待約 2-3 分鐘后刷新頁(yè)面即可。

2. 該版本的模型是一個(gè)非思考模式(non-thinking mode)的新模型,從多個(gè)角度客觀給出了分析。


以上就是本期推薦的教程,歡迎大家親自體驗(yàn)~
教程鏈接:

















