看圖寫代碼,3毛錢開發一個網頁!字節AI Coding新模型真卷麻了
編程模型最新卷王來了。
就在今天,火山引擎推出了面向Agentic編程任務深度優化的全新代碼模型Doubao-Seed-Code。
三個不同的維度,卷出了新高度。
第一,性能SOTA,與TRAE開發環境深度結合后,能更快、更準地解決問題,登頂了SWE-Bench Verified榜單。
圖片
第二,價格,調用價格國內最低,火山引擎還配套推出9塊9套餐,一杯咖啡錢,就能搞定各種摸魚小游戲——比如辦公室躲老板(doge)。
圖片
最后,遷移成本——Doubao-Seed-Code原生兼容Anthropic API,在Claude Code環境中進行遷移,都不用做復雜的配置,幾乎就是零成本切換。
不過說歸說鬧歸鬧,最后還得看實測效果。
咱實測一波看看……
實測Doubao-Seed-Code
老樣子,Coding測試,咱先設置幾個進階任務,看看能力究竟幾斤幾兩。
首先是基礎功能,然后交互優化,接著工程化重構,最后完整網站設計……
邏輯上層層遞進,難度上從單一視覺實現到復雜問題解決,逐步考驗Doubao-Seed-Code的綜合能力。
第一階段聚焦簡單任務,看看它的基礎視覺效果實現能力。
請幫我創建一個銀河系粒子效果動畫。要求:
1)使用Canvas繪制粒子系統;2)粒子隨機分布在畫布上,模擬星空效果;3)粒子有不同的大小和亮度,模擬遠近不同的星星;4)添加鼠標交互,鼠標移動時粒子會有輕微的響應;5)背景使用深色漸變,營造宇宙深邃感。請使用HTML5 Canvas和JavaScript實現。
圖片
這個任務的核心需求單一,沒有復雜的交互,模型耗時1分多鐘輸出完整的HTML5 Canvas+JS代碼,運行后粒子隨機分布,大小與亮度差異也確實能體現遠近感,和鼠標交互的輕微響應也能get。
結果很不錯,能快速完成簡單視覺任務,技術棧使用準確且基礎功能無偏差。
圖片
緊接著,驗證一下模型對“視覺風格+復雜交互邏輯”的理解與優化能力。
這次在Claude Code里進行API調用,不得不夸一句,“無縫銜接”真絲滑,就這個API原生兼容爽!
實際上也不止Claude Code,Doubao-Seed-Code在Cursor、Cline、Codex CLI等主流智能編程環境里,都能與開發者們日常使用的工具無縫銜接。
圖片
完整html,Minecraft風格,展示拉鏈形狀,當我上下移動鼠標時,拉鏈會像真實的拉鏈一樣打開和關閉。拉鏈閉合拉開的速度慢點。要求:禁止使用任何改變應用結構或組件化范式的JavaScript 框架/庫(例如:React,Vue,Angular)。可以cdn引用第三方庫以滿足題目要求,如Three.js,p5js。最終產物必須是純粹的HTML、CSS和JS文件。如果需要創建多個文件(HTML/CSS/JS),請確保所有文件引用均使用相對路徑。
圖片
任務是開發Minecraft風格拉鏈交互效果,相比第一階段增加了“鼠標上下移動控制拉鏈開合(速度慢)” 的交互要求。
模型第一次做完項目倒是非常貼心地幫忙檢查了運行效果,也給了一些速度修改建議。
Minecraft風格是有了、拉鏈形狀也有了,但這個交互方式,怎么看也不像拉鏈啊……
圖片
是不是提示的問題,那咱再進一步改造一下:
這個交互模式不像現實生活中的拉鏈
很快就找到了問題所在,定位到交互邏輯與現實場景脫節的核心問題。
圖片
一次改造后的效果如下:
圖片
雖然第一次沒完成,但調整起來效率尚可,在多輪交互時響應也還算絲滑。
下面,咱來看看Doubao-Seed-Code解決工程化問題的能力,給它給一份舊代碼,讓它找bug并且進行項目重構。
測試素材是一份有多個問題的記事本項目。
(提供文件)定位這份代碼的bug,并進行結構化重構
Doubao-Seed-Code拿到任務后先是明確了舊代碼的問題,將Bug定位到了具體的代碼行。
圖片
隨后輸出重構代碼,還列出了優化清單。
圖片
對比兩份代碼,從菜單創建模塊可以看出,左邊舊代碼結構混亂,并且沒有分離設計,重構后的代碼拆分了菜單與文件操作模塊,并且綁定了快捷鍵。
圖片
具體到某個函數,比如打開文件夾模塊,左邊舊代碼中文內容亂碼,沒有進行文件不存在的異常處理,新代碼都進行了改善。
圖片
可以看出模型面對“多Bug+結構混亂”的復雜工程問題時,具備系統性診斷與專業重構的能力。
重構后的記事本be like:

最后進行完整項目開發,測試模型對多需求整合與落地的能力。
幫我開發一個故宮博物院的導覽網站。需要包含幾個主要宮殿的介紹,配上高清的館藏文物圖片。最重要的是,每個宮殿的介紹頁面,都要有一個語音導覽按鈕,點擊后能播放由AI生成的專業語音解說。
圖片
由于沒有提前提供素材,模型在交付的代碼中主動補充了圖片替換教程,詳細說明如何按需搜索素材并替換占位圖,解決了素材缺失的問題。
圖片
從最終效果來看,網站結構完整,涵蓋了核心功能模塊,語音導覽按鈕的邏輯也已預留,并且實現了完整功能。
同時還考慮到了實際使用中的素材問題,不得不說,全面~

等一下,好像還有更有意思的事情,Doubao-Seed-Code居然能看圖寫代碼!
現階段,只有Claude系列、GPT-4V等一些國外模型能夠參考UI設計稿或截圖生成代碼。
Doubao-Seed-Code要是能做到,那真是國產編程模型獨一份了。
馬上來試試!先提供一個“移動端咖啡點單頁面”的UI設計稿:
圖片
(提供UI設計稿)請參考給出的UI設計稿圖片,生成一個“移動端咖啡點單頁面”,生成滿足所有要求的前端代碼,確保頁面主題明確。
點餐頁面就這么水靈靈的做出來了,相似度99%!
那另外的1%去哪了?
圖片
原來是為了避免素材依賴,Doubao-Seed-Code給畫了個和原圖不太一樣的咖啡杯(hhh
圖片
這只能說,「圖片在手,UI我有」了。
整體測完后,Doubao-Seed-Code的實測效果,確實符合官方強調的優勢特點——
- 國內首個支持視覺理解能力的編程模型,能夠參照UI設計稿、界面截圖或手繪草圖直接生成對應代碼;同時,還能對已生成的頁面進行視覺比對,主動識別樣式偏差與功能Bug,并自主完成修復優化,顯著提升了前端開發效率;
- 原生兼容Anthropic API。對于廣大使用Claude Code的開發者,幾乎零成本即可將API切換到Doubao-Seed-Code。多平臺適配,還對Claude Code、Trae等主流IDE進行了特別優化;
- 原生256K長上下文,在處理長代碼文件、多模塊依賴等復雜場景能力提升,實現端到端自主編程,全棧開發友好,前端能力突出;
當然,性能上的優勢之外,火山引擎在AI大模型浪潮中給人的最大印象,還得是穩定又便宜。
模型夠強,保障夠硬,價格夠低
AI Coding愈發競爭激烈,各廠商紛紛發力卷性能卷價格卷使用保障,火山引擎也不遑多讓。
最最最受關切的成本問題,也被火山引擎打到了“一杯咖啡價”。
綜合使用成本在業界平均水平上砍了62.7%,在調用價格上,不僅比國際主流模型低得多,還卷到了國內最低價:
- 0-32k輸入區間:輸入1.20元/百萬Token,輸出8.00元/百萬Token
- 32-128k輸入區間:輸入1.40元/百萬Token,輸出12.00元/百萬Token
- 128-256k輸入區間:輸入2.80元/百萬Token,輸出16.00元/百萬Token
打個比方,要創建一個美觀的交互式英語學習網站,在0-32k區間的相同tokens量下,Claude Sonnet 4.5的成本約4.05元,GLM-4.6約0.77元,而Doubao-Seed-Code僅約0.34元。
這不剛好雙11,火山引擎還給個人開發者安排了省錢大禮包,推出了支持最新模型的Coding Plan,最低套餐首月僅需9.9元。
火山引擎自投身編程模型研發以來,從早期版本的逐步迭代,到推出如豆包大模型系列,在編程能力上可以說是持續進化。
開源了命令行AI Agent——veCLI,通過自然語言交互,實現從指令到代碼的自動化構建與運行。
圖片
還基于編程相關模型打造了IDE產品TRAE 。如今,在字節內部,超過80%的工程師都在使用TRAE輔助開發,其整體月活用戶已超100萬。
現下,Doubao-Seed-Code和TRAE的組合拳更是有亮眼表現,在SWE-Bench-Verified基準上“卷”到了SOTA。
圖片
Doubao-Seed-Code在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流測評也表現出色,在國內同賽道模型中表現突出。
圖片
表現如此,離不開背后的技術支撐優化。
這次,火山引擎為Doubao-Seed-Code構建了覆蓋10萬容器鏡像的龐大訓練庫,支持端到端沙盒環境評測;依托千卡GPU集群,實現了萬級并發沙盒session能力。
采用端到端強化學習,直接從任務沙盒反饋中學習,不用依賴復雜的蒸餾過程,優化路徑也更高效。
圖片
另外,火山引擎還在算力和安全保障上,做了進一步加碼。
背靠火山引擎的超大資源池,即便遇到多用戶并行調用、復雜項目開發等高頻場景,也能保持穩定響應。
同時,模型由火山方舟提供推理接口服務,代碼數據傳輸和調用過程全程加密,不用擔心核心開發信息泄露。
可以說把企業級AI開發,痛點都琢磨得透透的了。
不愧是宇宙廠自己先用先檢驗的產品和技術。
AI coding正進入了“一杯咖啡”時代,而且還是一杯國產咖啡價格的時代。
想要薅這個羊毛,復制下方鏈接或點擊“閱讀原文”即可傳送~
































