精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva! 精華

發(fā)布于 2025-4-17 09:43
瀏覽
0收藏

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

文章鏈接:https://arxiv.org/pdf/2504.11346 官方鏈接:https://team.doubao.com/tech/seedream3_0  

亮點直擊

  • 相比Seedream 2.0能力全面增強:在用戶偏好測試中表現(xiàn)出色,在圖文對齊、構圖結構、美學質量和文字渲染等關鍵能力方面有重大突破。
  • 文本渲染性能提升顯著:在中英文小尺寸字符生成和高美學長文本排版方面表現(xiàn)優(yōu)異。小文本生成與美學排版難題的開創(chuàng)性方案,在圖文設計輸出上超越 Canva 等平臺的人設模板。
  • 圖像美學提升:圖像美學質量顯著提升,在電影場景和人像寫實度方面表現(xiàn)卓越。
  • 原生高分辨率輸出:支持 2K 分辨率的原生輸出,免除后處理需求,同時兼容更高分辨率并可適配多種長寬比。
  • 推理成本高效:多項模型加速技術,3.0 秒內生成一張 1K 分辨率圖像(不含位置編碼),推理速度遠超其他商用模型。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

解決的問題

  • 復雜提示詞對齊不佳:在處理多目標、多關系的復雜提示詞時,精確性和一致性不足。
  • 精細文字生成能力弱:在生成小尺寸字體、多行排版、復雜文字排版方面存在明顯短板。
  • 圖像美學與真實感不足:特別是在電影感畫面和人像肌理的生成方面表現(xiàn)欠佳。
  • 原生分辨率限制:此前只能生成 512×512px 小圖,需要后處理進行超分辨率提升。

提出的方案

  • 數(shù)據(jù)層改進:使用缺陷感知訓練機制和雙軸協(xié)同采樣框架,將數(shù)據(jù)集規(guī)模提升至原來的兩倍。
  • 預訓練階段改進:引入四項關鍵訓練策略:
  • 混合分辨率訓練(Mixed-Resolution Training)
  • 跨模態(tài) RoPE(Cross-Modality Rotary Position Embedding)
  • 表征對齊損失(Representation Alignment Loss)
  • 分辨率感知時間步采樣(Resolution-Aware Timestep Sampling)
  • 后訓練階段優(yōu)化:在 SFT 中引入多樣化審美描述,并利用基于視覺語言模型(VLM)的獎勵機制進行調優(yōu)。
  • 推理加速策略:通過一致噪聲預期與重要性感知采樣策略,在保持畫質的同時實現(xiàn) 4-8 倍速度提升。

Seedream 3.0 已于 2025 年 4 月初集成進多個平臺,包括豆包和即夢。殷切希望 Seedream 3.0 能成為提升工作與生活各方面生產力的實用工具。

技術細節(jié)

數(shù)據(jù)

在 Seedream 2.0 中,采用了一種嚴格的數(shù)據(jù)過濾策略,系統(tǒng)性地剔除包含輕微缺陷(如水印、覆蓋文字、字幕、馬賽克等)的圖像數(shù)據(jù)。這種嚴格的過濾顯著限制了訓練所用數(shù)據(jù)量,尤其考慮到此類缺陷樣本約占原始數(shù)據(jù)集的 35%。為解決這一問題,Seedream 3.0 引入了一種創(chuàng)新的“缺陷感知訓練范式”。該范式包含一個專門訓練的缺陷檢測器,基于 15,000 張由主動學習引擎挑選并人工標注的樣本構建。該檢測器可通過邊界框預測精確定位缺陷區(qū)域。


當檢測出的缺陷區(qū)域總面積小于圖像空間的 20%(可配置閾值)時,我們保留這些此前被剔除的樣本,同時實施掩碼潛空間優(yōu)化。具體來說,在潛空間的擴散損失計算中,我們采用空間注意力掩碼機制,將來自缺陷區(qū)域的特征梯度排除在外。這種創(chuàng)新方法在保持模型穩(wěn)定性的同時,將有效訓練數(shù)據(jù)集擴展了 21.7%。


為優(yōu)化數(shù)據(jù)分布,我們提出了一種“雙軸協(xié)同數(shù)據(jù)采樣框架”,從視覺形態(tài)和語義分布兩個維度聯(lián)合優(yōu)化。在視覺模態(tài)方面,我們繼續(xù)采用分層聚類方法,確保不同視覺模式的平衡表達。在文本語義層面,我們通過詞頻-逆文檔頻率(TF-IDF)實現(xiàn)語義平衡,有效解決描述文本的長尾分布問題。為進一步增強數(shù)據(jù)生態(tài)的協(xié)同性,我們開發(fā)了一個跨模態(tài)檢索系統(tǒng),為圖文對構建聯(lián)合嵌入空間。該系統(tǒng)在所有基準測試中均達到最先進水平。


該檢索增強框架通過以下方式動態(tài)優(yōu)化數(shù)據(jù)集:

  • 通過目標概念檢索注入專家知識;
  • 通過相似度加權采樣進行分布校準;
  • 利用檢索到的鄰近對進行跨模態(tài)增強。

模型預訓練

模型架構

核心架構設計延續(xù)自 Seedream 2.0,該版本采用 MMDiT 處理圖像和文本 token,并捕捉兩種模態(tài)之間的關系。在 Seedream 3.0 中,擴大了基礎模型的總參數(shù)量,并引入了多項改進,從而提升了模型的可擴展性、泛化能力以及圖文對齊效果。


混合分辨率訓練。 Transformer原生支持可變長度 token 輸入,并已在基于 ViT 的視覺識別任務中被證實有效。在 Seedream 3.0 中,在每次訓練階段將不同長寬比和分辨率的圖像打包在一起進行混合分辨率訓練。具體來說,我們首先以平均分辨率為 2562(含多種長寬比)進行預訓練,然后在更高分辨率圖像(5122 到 20482)上進行微調。同時,引入尺寸嵌入作為附加條件,使模型感知目標分辨率?;旌戏直媛视柧氾@著提升了數(shù)據(jù)多樣性,提高了模型對未見分辨率的泛化能力。


跨模態(tài)旋轉位置編碼(RoPE)。 在 Seedream 2.0 中,引入了可縮放 RoPE,使模型更好地泛化至未訓練的長寬比與分辨率。在 Seedream 3.0 中,將該技術擴展為“跨模態(tài) RoPE”,進一步提升視覺-文本 token 的對齊效果。我們將文本 token 視為形狀為 [1, L] 的二維 token,并對其應用二維 RoPE [22]。文本 token 的列向位置 ID 被順序賦值于圖像 token 之后??缒B(tài) RoPE 有效建模了模態(tài)內和模態(tài)間的關系,對提升圖文對齊與文本渲染精度至關重要。

模型訓練細節(jié)

訓練目標 在 Seedream 3.0 中,采用了 Flow Matching訓練目標,以及表示對齊損失(REPA):

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

其中使用線性插值形式:

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

一般來說,在高分辨率訓練時,我們會將分布向低信噪比(SNR)方向偏移以增加其采樣概率。在訓練過程中,計算數(shù)據(jù)集??的平均分辨率以確定偏移后的時間步分布。在推理階段,根據(jù)目標分辨率和寬高比計算偏移因子。

模型后訓練

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

審美描述生成器(Aesthetic Caption)

為 CT 和 SFT 階段中的數(shù)據(jù)特別訓練了多個版本的描述生成模型。如圖 4 所示,這些描述模型在審美、風格和布局等專業(yè)領域提供了準確的描述。這確保了模型可以更有效地響應相關提示,從而提升模型的可控性以及經過提示詞工程處理后的表現(xiàn)。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

模型訓練細節(jié)

為了確保模型在不同分辨率下都能取得良好表現(xiàn),在訓練過程中采用了一種分辨率平衡策略。這種方法確保了不同分辨率訓練數(shù)據(jù)的充分采樣,從而增強了模型在各種場景中跟隨提示的能力。

獎勵模型擴展

與之前 Seedream 2.0 使用 CLIP 作為獎勵模型不同,現(xiàn)在采用視覺-語言模型(VLMs)作為獎勵建模框架。這一改變利用了 VLM 更強大的基礎能力和獎勵擴展?jié)摿?。受大語言模型(LLMs)中生成式獎勵建模(RM)技術啟發(fā),我們將指令明確地表述為查詢,并從“Yes”響應 token 的歸一化概率中導出獎勵。


這種方法有效地利用了預訓練 LLM 中的知識,并自然受益于 LLM 的擴展效應,從而提升了獎勵質量。我們系統(tǒng)性地將獎勵模型從 1B 參數(shù)規(guī)模擴展到超過 20B。實驗證明了獎勵模型擴展的顯著效果,表明增加獎勵模型容量能夠提升獎勵建模表現(xiàn)。

模型加速

本文加速框架建立在 Hyper-SD 和 RayFlow基礎上。重新思考了擴散過程,使得每個樣本可以遵循其自身自適應的生成軌跡,而不是強制所有樣本都經過一個共同路徑最終收斂到標準高斯先驗。在傳統(tǒng)的擴散模型中,所有樣本都會被逐步轉換為各向同性的高斯噪聲,導致在概率空間中的軌跡重疊。這種重疊增加了隨機性,降低了可控性,并在反向過程引入了不穩(wěn)定性。本文改為將每個數(shù)據(jù)點引導到特定的目標分布,從而實現(xiàn)每個樣本軌跡的個性化定制。這顯著減少了路徑沖突,并提升了生成穩(wěn)定性和樣本多樣性。


穩(wěn)定采樣的一致性噪聲期望

為了確保采樣過程中平滑且一致的過渡,引入了一個統(tǒng)一的噪聲期望向量,該向量從預訓練模型中估計得出。這個期望向量作為所有時間步的全局參考,使去噪過程在時間上保持一致。通過保持期望的一致性,我們能夠在不降低圖像質量的前提下壓縮采樣步數(shù)。理論分析進一步表明,我們的設計最大化了從數(shù)據(jù)到噪聲再返回的數(shù)據(jù)-噪聲正反路徑的概率,從而帶來了更穩(wěn)定的采樣和更可靠的重建效果。

學習關鍵時間步的采樣

除了重新設計生成路徑,還著力提升訓練效率。擴散模型的標準訓練過程通常對時間步進行均勻采樣,這會引入高方差損失,并在非關鍵信息步驟上浪費計算資源。


為了解決這一問題,引入了一個重要性采樣機制,學習聚焦于訓練中最關鍵的時間步。將隨機 Stein 偏差(SSD)與一個神經網絡相結合,該網絡學習一個依賴數(shù)據(jù)的時間步分布。該網絡預測哪些時間索引對減少訓練損失的貢獻最大,從而使我們在優(yōu)化過程中優(yōu)先考慮這些時間步。結果是更快的收斂速度和更高效的訓練資源利用。


本文框架支持在極少步驟下進行高效采樣,同時不犧牲生成質量。其遵循一個迭代去噪日程,采樣步驟遠少于未加速的基線方法。盡管步驟減少,本文方法在美學質量、文本-圖像對齊和結構保真度等關鍵方面達到了或超過了需要 50 次函數(shù)評估(NFE)才能實現(xiàn)的基線結果。這些結果表明,我們的軌跡設計與噪聲一致性機制在實現(xiàn)高質量合成與最小計算代價方面的有效性。對于其他加速方法,如量化,直接采用 Seedream 2.0 的方案。

模型性能

在一次公開進行的評測中,Seedream 3.0 在全球頂級文本生成圖像模型中排名第一,超越了 GPT-4o、Imagen 3、Midjourney v6.1、FLUX1.1 Pro、Ideogram 3.0 等模型。

還進行了嚴格的專家評估,包括人工評估和自動評估。結果顯示,Seedream 3.0 在所有關鍵性能指標上相較于前一版本均有顯著提升,并在與行業(yè)領先模型的比較中表現(xiàn)出色。


值得注意的是,Seedream 3.0 在兩個方面表現(xiàn)尤為卓越:密集文本渲染和逼真人像生成。此外,還在下面提供了與 GPT-4o的系統(tǒng)對比分析,探討兩個模型在不同領域的能力邊界??傮w結果展示在圖 1 中。

Artificial Analysis 競技場

Artificial Analysis 是一個領先的 AI 模型評測平臺,專注于圖像和視頻生成。該平臺提供動態(tài)排行榜,基于關鍵指標如輸出質量、生成速度和成本,對模型進行評估,從而實現(xiàn)對最先進 AI 系統(tǒng)的客觀比較。


該平臺的文本生成圖像排行榜允許用戶匿名比較不同模型生成的圖像。為了保證公平性,用戶對相同提示下生成的圖像進行投票,且不知曉圖像來自哪個模型。模型的排名基于 ELO 評分系統(tǒng),該系統(tǒng)在一定程度上反映了用戶的偏好。


Seedream 3.0 參與了 Artificial Analysis 的排名評測,并在整體評分中取得了第一名,擊敗了 GPT-4o,在 Recraft V3、HiDream、Reve Image、Imagen 3(v002)、FLUX1.1 Pro 和 Midjourney v6.1 等其他模型中建立了顯著優(yōu)勢。


此外,它還在多個子維度中表現(xiàn)最佳,包括以下風格類別:通用 & 寫實風、動漫、卡通 & 插畫、傳統(tǒng)藝術;以及以下主題類別:人物:肖像、人物:群體 & 活動、奇幻、未來主義和物理空間。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

綜合評估

人工評估

建立了一個更大規(guī)模的評測基準,以便在不同場景下對 Seedream 3.0 進行更全面的評估。該基準被命名為 Bench-377,由 377 個提示詞構成。除了考察文本到圖像對齊、結構合理性和審美感等基本維度外,提示詞的設計還考慮了使用場景。我們主要考慮了五大類場景:電影化、美術、娛樂、美學設計和實用設計。我們提出了“實用設計”這一類別,因為 Seedream 3.0 已被證明在輔助日常工作和學習方面具有顯著作用。例如,它可以在幻燈片中的圖標排布、手抄報插圖設計等任務中提供支持。


基于 Bench-377,文本到圖像模型的系統(tǒng)性人工專家評估是通過三個基本標準進行的:文本圖像對齊、結構正確性以及審美質量。圖 6 展示了五種使用場景的具體結果。Seedream 3.0 在文本圖像對齊和結構保真度方面顯著優(yōu)于 Seedream 2.0 和其他競品模型。值得注意的是,它在美學表現(xiàn)方面整體得分超過了 Midjourney。此外,在設計類場景中,其表現(xiàn)也明顯優(yōu)于 Midjourney,盡管在藝術類場景中略遜一籌。Imagen 3 在文本圖像對齊和結構方面也展現(xiàn)出較好的表現(xiàn),但在美學評估中表現(xiàn)欠佳。Midjourney 雖然具有出色的審美能力,但在功能對齊和結構保真度方面表現(xiàn)有限。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

圖 7、8、9 和 10 展示了基礎能力提升如何促進多樣場景的生成。文本圖像對齊能力的提升使得用戶意圖能夠被更精準地表達。例如,對微表情的生動描繪提升了電影氛圍的表現(xiàn)力。對復雜描述和專業(yè)術語(如“三視圖”)的精準理解與表達,能更好地滿足用戶的設計需求。這些能力的基礎支撐來自于結構穩(wěn)定性和審美質量的增強。例如,動態(tài)動作中四肢的完整性、小物體的細節(jié)呈現(xiàn),以及在顏色、光照、材質和構圖方面的提升,都是 Seedream 3.0 高可用性的關鍵因素。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

自動評估

根據(jù)上一版本的自動評估方式,對文本到圖像生成模型進行了兩項標準的評估:文本圖像對齊和圖像質量。Seedream 3.0 在所有基準中持續(xù)排名第一。


在文本圖像對齊的自動評估中,主要關注 EvalMuse,它在多個基準中與人工評估具有較好的一致性。如表 1 所示,Seedream 3.0 的表現(xiàn)優(yōu)于其他模型。更精細的維度分析顯示,與 Seedream 2.0 相比,Seedream 3.0 在大多數(shù)維度上都有所提升,尤其是在物體、活動、位置、食物和空間等方面。為了與此前報告的結果保持一致,此處及后續(xù)章節(jié)中也納入了對 Ideogram 2.0 的評估。


在圖像質量評估方面,復用了兩個外部指標 HPSv2和 MPS,以及兩個內部評估模型:Internal-Align 和 Internal-Aes。如表 1 所示,Seedream 3.0 在所有指標上均排名第一。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

在包含 MPS 和我們內部審美評估模型的審美評估中,Seedream 3.0 的表現(xiàn)優(yōu)于 Midjourney,而 Seedream 2.0 在先前評估中未能做到這一點。同時,在 HPSv2 指標方面,Seedream 3.0 首次突破了 0.3,表明我們的模型與人類偏好具有極高的一致性。

文本渲染

Seedream 2.0 在文本渲染方面(特別是中文字符)獲得了用戶的廣泛好評。在 Seedream 3.0 中,進一步優(yōu)化了這一能力并進行了全面評估。我們的文本評估基準包含 180 條中文提示和 180 條英文提示,覆蓋了包括 logo 設計、海報、電子顯示、印刷文本和手寫文本在內的多種類別。


采用一個基于感知的指標(可用率)以及兩個基于統(tǒng)計的指標(文本準確率和命中率)來評估文本渲染能力??捎寐手傅氖窃谖谋句秩净菊_的前提下,考慮文本與其他內容的融合及整體審美質量后,被認為可接受的圖像比例。具體的客觀指標定義如下:

文本準確率 定義為:

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

文本命中率定義為:

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

圖 11 顯示,Seedream 3.0 在文本渲染性能方面優(yōu)于包括其前代版本(Seedream 2.0)在內的現(xiàn)有模型。該系統(tǒng)對中英文字符均實現(xiàn)了 94% 的文本可用率,基本消除了文本渲染作為圖像生成限制因素的問題。值得注意的是,中文文本可用率相較于 Seedream 2.0 提升了 16%??捎寐逝c命中率接近的數(shù)值進一步表明,布局或媒介相關的渲染錯誤發(fā)生頻率極低。這些結果驗證了我們原生文本渲染方法相比于后期合成方式和外部插件解決方案的有效性。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

除了整體可用率的提升,Seedream 3.0 在密集文本渲染方面的卓越表現(xiàn)也尤為值得關注。密集文本指的是字符密度高、內容較長的段落,如包含眾多祝福語的文字內容,一直是此前模型的挑戰(zhàn)所在。相比之下,Seedream 3.0 在處理此類細字符時展現(xiàn)出了顯著的進步。如圖 12 和圖 13 所示,Seedream 3.0 在小字符的精度生成以及文本布局的自然性方面均表現(xiàn)出色。為進行對比,將在后續(xù)章節(jié)中評估另一個在密集文本渲染方面也表現(xiàn)突出的模型 GPT-4o。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

擬真肖像

AI 生成圖像(尤其是肖像)過于合成的外觀,一直是文本生成圖像模型的批評焦點。諸如過于光滑的皮膚和油膩的質感等問題,使得生成圖像看起來很不自然。


為了全面評估 Seedream 3.0 在該領域的表現(xiàn),構建了一個包含 100 條提示詞的肖像評估集。這些提示詞聚焦于肖像生成的多個方面,包括表情、姿態(tài)、角度、發(fā)型特征、皮膚紋理、服飾和配飾等。評估采用 Elo 對戰(zhàn)方式,參與者需在不同模型生成的肖像中選出更優(yōu)者,并說明理由。評估標準主要關注兩個維度:真實感與情感表達。


參評模型包括 Seedream 3.0、Seedream 2.0、Midjourney v6.1、FLUX-Pro 1.1,以及以擬真著稱的新版 Ideogram 3.0。為了確保公平比較,Midjourney v6.1 會進行多輪圖像生成,以排除那些過于藝術化或抽象的結果,保留更具現(xiàn)實感的作品。


經過超過 50,000 輪公開對戰(zhàn)評估后,結果如圖 14 所示(部分模型變體未顯示)。

Seedream 3.0 與 Midjourney v6.1 并列第一,顯著優(yōu)于其他模型。圖 15 中的示例展示了 Seedream 3.0 成功去除了人像中的合成感。生成的人臉紋理如今具備諸如皺紋、細小面部毛發(fā)和疤痕等真實特征,逼近自然人類皮膚的外觀。同時,Seedream 3.0 仍可根據(jù)提示生成完美無瑕的皮膚質感。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

此外,雖然 Midjourney v6.1 在紋理表現(xiàn)方面略遜于 Seedream 3.0,但在情感表達上的表現(xiàn)更為突出,這也為其贏得了高分排名。未來版本將進一步加強這兩個方面。


特別指出,Seedream 3.0 能夠直接生成高分辨率圖像,如 2048×2048,進一步提升了肖像紋理質量。圖 16 展示了部分 Seedream 3.0 的生成示例。生成肖像的質量正朝著專業(yè)攝影水準邁進,為應用場景帶來全新可能。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

與 GPT-4o 的對比

近期,GPT-4o 推出了令人印象深刻的圖像生成功能,展現(xiàn)出極強的多模態(tài)能力。由于缺乏大規(guī)模圖像生成的 API,尚無法進行系統(tǒng)性評估。然而,通過選取部分案例進行對比分析發(fā)現(xiàn),GPT-4o 與 Seedream 3.0 在不同場景中各具優(yōu)勢與不足。

密集文本渲染

GPT-4o 展現(xiàn)出優(yōu)秀的文本渲染能力,從多個示例中可見一斑。benw 生成了可比案例以便進行比較,如圖 17 所示。GPT-4o 在渲染英文小字符及部分 LaTeX 符號方面表現(xiàn)出色。然而,在中文字體渲染方面存在明顯不足。相比之下,Seedream 3.0 能輕松應對密集的中文文本生成,并在排版和美學構圖方面優(yōu)于 GPT-4o。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

圖像編輯

圖像編輯任務將生成能力與真實圖像結合,因其實際應用價值而備受關注。GPT-4o 能根據(jù)提示對給定圖像執(zhí)行編輯操作。由 Seedream 派生出的 SeedEdit 同樣支持此類功能。此外,Gemini-2.0 近期在多模態(tài)圖像生成方面展現(xiàn)出強勁能力,尤其是在交替生成與多輪編輯方面。本研究聚焦于這些模型的單輪圖像生成能力,如圖 18 所示。展示了 SeedEdit 在保持 ID 和遵循提示方面表現(xiàn)更優(yōu)。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

這三種模型各具特點。GPT-4o 擅長滿足多樣的編輯需求,但在保留原始圖像(尤其是 IP 和 ID 一致性)方面表現(xiàn)欠佳。Gemini-2.0 雖然在像素層級上保留原始圖像,但常出現(xiàn)色彩不自然和圖像質量下降的問題。SeedEdit 1.6 實現(xiàn)了平衡的性能,能有效應對典型編輯需求,并保持較高的可用率。但在處理更復雜的任務(如多圖參考、多輪編輯)方面仍有局限。未來版本將針對這些問題進行改進。


主要對比了 SeedEdit 與 GPT-4o 在文本相關編輯任務中的表現(xiàn)。文本編輯本身具有挑戰(zhàn)性,它要求不僅能渲染文本,還能識別并理解圖像中的字符。能處理文本編輯任務,是可控圖像生成向真實圖像應用邁進的重要標志。圖 19 展示了文本寫入、刪除、修改等任務的示例。SeedEdit 繼承了 Seedream 3.0 的文本相關能力,表現(xiàn)令人滿意。它能夠精準識別圖像中的文本,從而實現(xiàn)準確刪除或修改。同時,在添加文本時,SeedEdit 能考慮排版,使文本與原圖無縫融合。相比之下,GPT-4o 雖能完成文本編輯任務,但在保留原圖方面表現(xiàn)不佳,限制了其實用性。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

生成質量

生成質量(包括色彩、紋理、清晰度和美學吸引力)是評估文本生成圖像模型的重要指標。Seedream 系列在這些方面持續(xù)表現(xiàn)出色,而 GPT-4o 則存在一些短板。如圖 20 所示,GPT-4o 生成的圖像往往帶有偏黃暗調,且存在較多噪點,嚴重影響圖像在多場景中的使用價值。

Seedream 3.0技術細節(jié)重磅發(fā)布!中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva!-AI.x社區(qū)

結論

本文介紹了 Seedream 3.0,它通過多項創(chuàng)新策略應對了現(xiàn)有挑戰(zhàn),包括圖像分辨率受限、復雜屬性依從性、細粒度排版生成,以及視覺美感和保真度不足等問題。通過在數(shù)據(jù)構建、模型預訓練、后訓練和模型加速等方面進行系統(tǒng)升級,Seedream 3.0 在多個維度上較前一版本取得了全面提升。


Seedream 3.0 提供原生高分辨率輸出、全能能力、更高的文本渲染質量、更佳的視覺效果和極致的生成速度。隨著其在豆包、即夢等平臺上的集成,Seedream 3.0 展現(xiàn)出強大的潛力,成為覆蓋各類工作與生活場景的高效生產力工具。


本文轉自AI生成未來 ,作者:AI生成未來


原文鏈接:??https://mp.weixin.qq.com/s/eUrV5XgxuhimSTGPOfwntw??

收藏
回復
舉報
回復
相關推薦
日韩三级电影视频| 国产熟女一区二区三区五月婷 | www男人天堂| 精品美女在线观看视频在线观看 | 五月天丁香社区| 在线精品亚洲欧美日韩国产| 国产日韩欧美精品电影三级在线| 91久久国产综合久久91精品网站| 美女毛片在线观看| 一区二区三区日本久久久| 欧美日韩激情一区二区三区| 精品国偷自产一区二区三区| 久蕉在线视频| 国产精品一区二区男女羞羞无遮挡 | 亚洲美女毛片| 久久精品国产电影| 日韩人妻一区二区三区| 国产成人久久精品一区二区三区| 黑人与娇小精品av专区| 91在线一区二区三区| 国产1区2区3区在线| 综合激情婷婷| 国产一区二区动漫| 亚洲黄色小说在线观看| 巨大黑人极品videos精品| 欧美oldwomenvideos| 91国偷自产一区二区使用方法| 国产盗摄视频在线观看| 国产午夜在线视频| 成人免费的视频| 成人黄色影片在线| 中文在线观看免费高清| 亚洲黄色高清| 久久综合久中文字幕青草| 久久久精品成人| 色天天色综合| 亚洲国产三级网| 中文字幕乱码在线人视频| 国产电影一区二区三区爱妃记| 亚洲高清视频的网址| 老司机午夜网站| 日本三级在线播放完整版| 久久久久久久久99精品| 久久一区免费| 亚洲欧美日韩免费| 不卡的av在线| 精品无码久久久久久久动漫| 亚洲精品久久久久久动漫器材一区 | 国产永久免费视频| 青青草视频一区| 日韩av观看网址| 亚洲免费在线观看av| 在线日本高清免费不卡| 欧美国产视频日韩| 久艹视频在线观看| 黄色精品网站| 97人人做人人爱| 国产又大又黑又粗免费视频| 极品少妇一区二区三区| 久久久久久久久亚洲| 欧美成人精品激情在线视频| 欧美激情视频一区二区三区在线播放| 久久精品电影一区二区| 国产精品免费在线视频| 91av精品| 欧美激情极品视频| 国产成年人免费视频| 亚洲黄页一区| 日本成熟性欧美| 日韩免费av网站| 日本欧美一区二区三区乱码| 国产精品偷伦一区二区| 一本一道精品欧美中文字幕| 久久爱www久久做| 91视频8mav| 午夜精品久久久久久久99热黄桃 | 久久久久九九九| 男女网站在线观看| 亚洲国产精品成人综合| 中文字幕中文字幕99| 18+激情视频在线| 亚洲va中文字幕| caopor在线视频| 123成人网| 3d成人动漫网站| 小毛片在线观看| av影片在线一区| 久久视频免费观看| 中文字幕亚洲精品在线| 日韩二区三区四区| 亚洲自拍偷拍色图| 深夜影院在线观看| 国产精品视频线看| 隔壁人妻偷人bd中字| 成人小电影网站| 欧美人牲a欧美精品| 杨幂一区二区国产精品| 天堂日韩电影| 久久精品国产亚洲精品2020| 国产福利久久久| 强制捆绑调教一区二区| 99久久国产免费免费| 国产三级视频在线看| 亚洲欧美成人一区二区三区| 99热在线这里只有精品| 电影一区中文字幕| 亚洲人成人99网站| 麻豆一区产品精品蜜桃的特点| 麻豆精品网站| 成人看片在线| 免费看美女视频在线网站| 午夜精品123| 国产精品久久久久久久av福利| 久久porn| 久久av中文字幕| 国产高潮久久久| 国产乱码精品一区二区三区忘忧草| 九九九九精品| 成人影院在线看| 欧美三级中文字| 国产伦精品一区二区三区妓女| 88国产精品视频一区二区三区| 日本高清视频精品| 天天干天天干天天干| 亚洲免费av高清| 五月婷婷丁香色| 国产a久久精品一区二区三区| 九九视频这里只有精品| 国产免费不卡视频| 日本一区二区高清| 那种视频在线观看| 色综合www| 欧美中文字幕在线播放| 性生活三级视频| 亚洲免费看黄网站| 九九热免费在线观看| 国产成人手机高清在线观看网站| 午夜精品久久久久久久白皮肤 | 亚洲无限av看| 影音先锋在线国产| 91视频国产观看| 波多野结衣之无限发射| 高清一区二区三区| 欧美黄色成人网| 亚洲第一天堂网| 亚洲激情一二三区| 黄色三级视频在线播放| 99精品国产一区二区三区| 国产精品青青在线观看爽香蕉| 奇米影视888狠狠狠777不卡| 午夜伦理一区二区| 午夜剧场免费看| 在线免费高清一区二区三区| 91在线观看网站| 国产羞羞视频在线播放| 精品久久久久久无| 国产污视频在线观看| www.性欧美| 国产xxxxx在线观看| 欧美人与拘性视交免费看| 欧美伊久线香蕉线新在线| 视频在线观看你懂的| 色诱视频网站一区| 成人无码av片在线观看| 久久精品99久久久| 正在播放一区| 综合中文字幕| 97在线视频一区| 国产专区在线播放| 欧美三级日韩三级| 成年人一级黄色片| av电影天堂一区二区在线观看| 国产一区二区在线视频播放| 欧美猛男同性videos| 国产精品中文在线| 在线āv视频| 日韩大片免费观看视频播放| 国产一区免费看| 亚洲人成网站影音先锋播放| 娇妻高潮浓精白浆xxⅹ| 久久精品盗摄| 中国成人亚色综合网站 | 久久综合毛片| 国语自产精品视频在线看抢先版结局 | 国产在线精品成人一区二区三区| www免费在线观看| 亚洲激情视频在线播放| 波多野结衣一区二区在线| 亚洲欧洲精品成人久久奇米网| 亚洲精品乱码久久久久久9色| 亚洲黄色在线| 一区不卡字幕| 老司机在线精品视频| 国产精品视频精品| 啦啦啦中文在线观看日本| 亚洲天堂男人天堂女人天堂| 国产美女无遮挡永久免费| 五月天久久比比资源色| 日本成人免费在线观看 | www久久久久久久| 国产乱码精品1区2区3区| 97国产在线播放| 91精品啪在线观看国产18| 国产嫩草一区二区三区在线观看| 日本另类视频| 韩国视频理论视频久久| 自拍视频在线| 亚洲成人中文字幕| 7m精品福利视频导航| 亚洲v在线观看| 蜜臀av在线播放一区二区三区| 日韩国产精品毛片| 国产伦精品一区二区三区视频| 91色p视频在线| 户外露出一区二区三区| 欧美日韩不卡合集视频| 91在线视频| 亚洲图片欧美日产| 无码国产精品一区二区免费16| 欧美日韩三级一区| 亚洲免费在线视频观看| 亚洲综合免费观看高清在线观看| 久久久久久成人网| av动漫一区二区| 日本中文字幕精品| 久久国产精品第一页| 黄色一级片播放| 欧美午夜在线视频| 9999在线观看| 成人在线国产| 日本一区二区三区视频在线播放| 9999久久久久| 51精品国产人成在线观看| 欧美高清你懂的| 国产精品av在线播放| 欧美a级在线观看| 91精品国产91久久久久久吃药 | 国产精品成人午夜| av男人的天堂av| 久久久亚洲欧洲日产国码αv| 四虎成人免费视频| 国产成人在线视频免费播放| www.五月天色| 久久超碰97中文字幕| 成人性生交免费看| 久久激情五月婷婷| 黄色手机在线视频| 久久精品国产99国产精品| the porn av| 麻豆成人av在线| 免费一区二区三区在线观看| 日本成人在线视频网站| 国产精品一区二区小说| 蜜臀久久久久久久| www.99在线| 麻豆精品在线播放| 色18美女社区| 国产一区二区三区美女| 国产免费无码一区二区| jvid福利写真一区二区三区| 欧美日韩人妻精品一区在线| 成人18精品视频| aa片在线观看视频在线播放| 91老师国产黑色丝袜在线| 精品久久久久久中文字幕人妻最新| 337p粉嫩大胆噜噜噜噜噜91av| 国产精品无码网站| 国产婷婷色一区二区三区四区| 日本xxxxxxxxx18| 国产精品久久久久影院| 中文字幕五月天| 亚洲国产一二三| 免费污污视频在线观看| 欧美色偷偷大香| 国产精品主播一区二区| 精品国产伦理网| 日韩大胆视频| 色七七影院综合| 在线三级电影| 国产91精品久| 玖玖精品在线| 精品国产免费久久久久久尖叫| 久久91成人| 欧美日韩一级在线| 99精品久久| 国产色视频在线播放| 懂色av一区二区夜夜嗨| 91精品人妻一区二区| 1000精品久久久久久久久| 日本免费在线播放| 欧洲一区二区三区在线| 成人h动漫精品一区二区无码 | 91深夜福利视频| 日本成人a网站| 手机看片日韩国产| 亚洲免费婷婷| 精品国产鲁一鲁一区二区三区| 成人av电影免费在线播放| 女人黄色一级片| 亚洲超丰满肉感bbw| 亚洲特级黄色片| 亚洲精品国精品久久99热| 一级毛片视频在线| 2024亚洲男人天堂| 视频一区中文字幕精品| 亚洲v国产v在线观看| 亚洲视频久久| 久久久久久久久久一区| 91在线一区二区三区| 欧美日韩综合一区二区| 欧美亚洲尤物久久| 无码精品在线观看| 久久99亚洲精品| 国产91在线精品| 欧美日韩精品中文字幕一区二区| 午夜精品久久| 亚洲视频第二页| 久久久久国产成人精品亚洲午夜| 中文字幕在线2021| 欧美日韩国产在线播放网站| 亚洲aⅴ在线观看| 九色91av视频| 国产美女视频一区二区| 亚州欧美一区三区三区在线| 国产精品五区| 一级国产黄色片| 亚洲一区自拍偷拍| 国产一区二区自拍视频| 中文字幕亚洲国产| 日韩成人影音| 欧美日韩喷水| 另类av一区二区| 中文人妻一区二区三区| 亚洲国产视频一区| 99国产精品欲| 精品国内产的精品视频在线观看| 日本一区免费网站| 日本福利一区二区三区| 久久国产毛片| 精品国产av无码| 日韩欧美国产黄色| 四虎影视2018在线播放alocalhost| 欧美激情在线一区| 亚洲国产高清在线观看| 强伦女教师2:伦理在线观看| 麻豆91在线看| 乱老熟女一区二区三区| 欧美日韩国产欧美日美国产精品| www.在线播放| 国产主播精品在线| 91精品国产自产拍在线观看蜜 | 瑟瑟视频在线免费观看| 国产午夜精品视频| 日本美女久久| 日本三级福利片| 国产福利一区二区三区视频在线| 国产喷水在线观看| 日韩欧美一卡二卡| 人人超在线公开视频| 国产一区在线免费| 天堂久久久久va久久久久| 亚洲码无人客一区二区三区| 色久优优欧美色久优优| av成人手机在线| 亚洲一区二区三| 欧美久久视频| 国产三级国产精品| 欧美视频完全免费看| 日本视频在线| 国产精品视频在线免费观看| 99热精品在线观看| 伊人影院综合网| 91精品国产91久久久久久最新毛片| √天堂8在线网| 国产一区二区三区四区五区在线 | 蜜桃色一区二区三区| 五月婷婷久久综合| 国产在线超碰| 亚洲free性xxxx护士hd| 日韩午夜av| 国产午夜精品久久久久久久久| 欧美一区二区三区在线观看 | 国产在线视频不卡| 国产在线不卡| 亚洲人成人无码网www国产| 欧美精品粉嫩高潮一区二区| 国产在线xxx| 天堂一区二区三区| 高清国产午夜精品久久久久久| 一级成人黄色片| 操日韩av在线电影| 香蕉久久夜色精品国产使用方法| 亚洲国产高清av| 亚洲成人动漫av| 黄色动漫在线| 久久伊人资源站| 国产麻豆精品视频| 草莓视频18免费观看| 欧美乱大交xxxxx| 成人在线亚洲|