還記得前陣子的 DeepSeek-V3.1 嗎?那一版已經(jīng)把上下文記憶力拉到 128K,相當(dāng)于“過目不忘”的小強(qiáng)記憶。
現(xiàn)在,DeepSeek 團(tuán)隊(duì)又放大招了 —— DeepSeek-V3.2-Exp。這次升級(jí),不光能打,還特別“省電”。

?? 1. DSA:AI 的“共享 WiFi”模式
新版本的核心黑科技,叫 DSA(Distributed Shared Attention)。
簡(jiǎn)單理解:
以前,每個(gè) Query(問題)都要單獨(dú)配一套 Key-Value(答案線索),就像宿舍里每個(gè)人都得裝一個(gè)路由器,麻煩還浪費(fèi)電。
現(xiàn)在,DSA 讓多個(gè) Query 共享同一套 Key-Value,相當(dāng)于整棟宿舍都能用一個(gè)大功率 WiFi,速度還更快。
好處是啥?
算力更?。荷僭熘貜?fù)連接。
效率更高:一次計(jì)算,大家共享。
更穩(wěn):模型在處理長(zhǎng)文本時(shí)不卡頓。
?? 2. 評(píng)測(cè)結(jié)果:又快又穩(wěn)
來看官方放出的評(píng)測(cè)圖??
訓(xùn)練更穩(wěn)(圖 2):

DeepSeek-V3.2 在兩個(gè)任務(wù)(BrowseComp & SWE Verified)上的曲線更平滑,表現(xiàn)穩(wěn)步上升,就像心電圖一樣——不亂跳,說明學(xué)得很扎實(shí)。
省電更猛(圖 3):


以前模型的算力消耗是 平方級(jí) O(L2),L 越長(zhǎng),計(jì)算壓力爆炸。
V3.2 換成 O(Lk),壓力直降。結(jié)果是:
預(yù)填充更快:丟進(jìn)長(zhǎng)文檔,不卡;
解碼更省電:輸出大段內(nèi)容,更輕松。
實(shí)戰(zhàn)還在驗(yàn)證中:
團(tuán)隊(duì)說了,內(nèi)部測(cè)試沒問題,但接下來要在真實(shí)業(yè)務(wù)場(chǎng)景里繼續(xù)跑,看看在復(fù)雜環(huán)境下還能不能保持穩(wěn)定。
?? 3. 開發(fā)者福利:API 價(jià)格砍半!
不僅模型更省電,API 價(jià)格也大跳水??
輸入(Input):
Cache hit:從 $0.07 → $0.028
Cache miss:從 $0.56 → $0.28
輸出(Output):
從 $1.68 → $0.42
簡(jiǎn)單說,就是 成本腰斬。對(duì)開發(fā)者來說,這波升級(jí)不僅更快更穩(wěn),還更省錢。
?? 4. 總結(jié)一句
DeepSeek-V3.2 = 聰明 + 省電 + 穩(wěn)定 + 便宜。

既提升了算力效率,又保證了長(zhǎng)文本處理能力,還把 API 價(jià)格打下來。對(duì)個(gè)人開發(fā)者和企業(yè)來說,幾乎就是“真香”升級(jí)。
?? 小問題拋給你:
你覺得 AI 的價(jià)格降到什么程度,才算真正“普及”?































