精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

美團開源全模態,比肩頂級閉源模型,開源新SOTA

人工智能 新聞
LongCat-Flash-Omni能實現毫秒級的實時音頻-視覺交互。不僅能理解復雜的模態組合,還能像人一樣進行低延遲的實時對話。這在AI通往具備全模態感知與交互能力的路上,又劃上了一筆。

美團LongCat團隊發布了5600億參數開源全模態模型LongCat-Flash-Omni。

LongCat-Flash-Omni能實現毫秒級的實時音頻-視覺交互。不僅能理解復雜的模態組合,還能像人一樣進行低延遲的實時對話。這在AI通往具備全模態感知與交互能力的路上,又劃上了一筆。

一個模型聽懂看懂還能聊

LongCat-Flash-Omni的核心是一個端到端的全模態架構。

它可以像一個統一的大腦,接收文本、音頻、圖像、視頻或是這些信息的任意組合作為輸入,然后直接生成包含語義和情感的語音。

這個大腦由幾個關鍵部分協同工作:一個敏銳的視覺編碼器、一套完整的音頻處理工具、一個強大的語言模型主干,以及一套為實時交互量身定制的流式處理機制。

模型的眼睛是LongCat-ViT(視覺變換器),一個經過精心設計的視覺編碼器。

它解決了傳統視覺模型的一個痛點:固定分辨率。

傳統模型在處理圖片前,通常需要粗暴地將圖片縮放或裁剪成一個固定尺寸,這無疑會損失信息。LongCat-ViT則原生支持各種分辨率和寬高比的輸入,無論是高清大圖還是手機豎屏視頻,都能最大程度地保留原始信息。

這個視覺編碼器在傳統Vision Transformer(視覺變換器)結構之上,集成了一系列增強設計,比如能同時處理圖像和視頻的統一分塊模塊、更精準捕捉空間位置的二維旋轉位置嵌入(2D-RoPE)、以及提升穩定性和效率的SwiGLU激活函數和RMSNorm層。

為了在實時交互中快速處理視頻流,模型的視覺編碼器采用了相對輕量級的配置,參數量為6.37億。

LongCat-ViT的訓練過程也頗具巧思,它采用漸進式方案。模型先從固定低分辨率(如224x224)的圖像學起,這是課程學習的思路,讓模型先掌握基礎視覺概念。然后,再逐步過渡到處理原生分辨率的圖像和視頻。這種由易到難的學習方式,不僅節約了大量的計算資源,也讓模型收斂得更快更穩定。

模型的聽覺和說話能力,經歷了一次重要的進化。

在訓練的早期階段,模型使用一個音頻標記器(Tokenizer),將連續的音頻波形轉換成離散的編碼,就像把語音翻譯成一種特殊的文字。

這種做法的好處是,模型可以像處理文本一樣,用統一的下一token預測方式來學習和生成語音,訓練效率很高。這個標記器是LongCat-Audio-Codec,它以16.67赫茲的頻率將音頻離散化為四個碼本,一個碼本負責語義,另外三個負責音色、音調等聲學細節。

團隊很快發現,這種離散化處理會損失聲音中微妙的細節,比如語氣中的猶豫、環境中的微弱背景音。

為了讓模型聽得更真切,從訓練的第五階段開始,引入了一個音頻編碼器。這個編碼器不再將音頻文字化,而是將其轉換為連續的音頻特征(即向量表示),直接輸入給LLM主干。

有趣的是,在生成語音時,模型仍然輸出離散的音頻token。

這保證了生成過程與LLM固有的預測范式一致。隨后,一個高效的音頻解碼器將這些token實時轉換回流暢的語音波形。這個解碼器同樣來自LongCat-Audio-Codec,支持流式解碼,延遲極低,僅需超前三幀數據即可工作。

這個音頻編碼器本身也是為低延遲而生的流式架構。

它將音頻切分成每80毫秒一幀的片段,并通過一種名為FSMN(前饋序列記憶網絡)的高效結構來處理。為了在延遲和性能間找到最佳平衡,只有最后幾層處理單元會稍微偷看一點未來的信息,而前面的層則嚴格按時間順序處理,保證了極快的響應速度。

模型思考和決策的核心,是建立在LongCat-Flash之上的一個5600億參數的MoE(混合專家)語言模型。根據任務內容,它會智能地選擇激活一小部分最相關的專家(約270億參數)。

這種選擇性思考的機制,使得LongCat-Flash-Omni在擁有巨大知識儲備的同時,計算效率極高,為實時交互提供了可能。

要實現流暢的實時音視頻對話,模型必須能同步處理來自攝像頭和麥克風的連續數據流。

LongCat-Flash-Omni為此設計了一套精妙的視頻策略和流式交互機制。

視頻處理本身就是一個難題,時長、分辨率、幀率千差萬別。模型采用動態幀采樣策略,默認每秒采樣2幀(2 FPS),但會根據視頻長短動態調整。短視頻會以更高幀率采樣,確保信息密度;超長視頻則會均勻采樣,避免內存爆炸。

為了讓模型理解視頻的時間順序,每個視頻幀前面都會被加上一個文本時間戳。這樣,輸入給LLM的序列就形成一個時空交錯的序列。

在實時交互中,模型采用了一種稀疏-密集采樣策略,堪稱點睛之筆。

當用戶正在說話或進行操作時,模型會以2 FPS的密集采樣率,專注地看和聽,盡可能捕捉所有信息。

當輪到模型回應時,它會切換到0.5 FPS的稀疏采樣率,用余光關注著視頻流,既保留了對環境的感知,又大大降低了計算開銷,為自身的思考和生成騰出資源。

音頻和視頻的特征被切分成以1秒為單位的同步數據塊,像拉鏈一樣交錯輸入LLM。這種時間同步、分塊交錯的機制,確保了模型能盡早接收到用戶的視聽信息,從而將響應延遲降到最低。

模型學會了十八般武藝

訓練一個能處理所有模態的模型,最大的挑戰在于不同模態數據的性格迥異。

文本是高度濃縮的符號,語義密度極高。語音雖然也是序列信號,但信息密度遠低于文本,還夾雜著情感、口音等副語言信息。視覺信息則是空間性的,視頻更是在空間之上增加了時間維度,復雜度指數級增長。

面對這種異質性,直接將所有數據一鍋燉效果很差。LongCat-Flash-Omni的訓練借鑒了人類的學習過程,采用了一種課程啟發的漸進式策略,分階段、由易到難地學習。

LongCat-Flash-Omni的訓練被劃分為五個核心階段。

模型首先在一個高質量、多樣化的純文本語料庫(約16萬億token)上進行訓練。這為模型打下了堅實的語言基礎,使其成為一個知識淵博、邏輯清晰的文化人。

在語言能力穩固后,引入結構上最接近文本的語音數據。模型學習將聲音信號與語言模型的語義空間對齊,理解語音中的語義和副語言信息。此時,語音被處理成離散的token。

模型開始學習看圖。大規模的圖像-文本對和圖文交錯數據被引入,模型開始建立視覺表征與語言概念之間的連接,學會看圖說話、理解圖中的復雜關系。

引入最復雜的視頻數據。模型開始學習理解時空動態,進行事件推理。同時,更高質量、更多樣化的圖像數據也被加入,進一步強化模型的視覺理解深度。

模型的記憶力從8000token擴展到128000token。通過專門的長上下文多模態數據進行訓練,模型學會了處理長視頻、長文檔,并能在漫長的對話中保持上下文一致性。

這是為了解決階段1中離散語音token帶來的信息損失問題。模型在這一階段學習直接處理連續的音頻特征,這使其能夠捕捉到更細微的聲學細節,顯著提升了下游語音任務的保真度和性能。

這個由簡到繁、層層遞進的訓練策略,確保了模型在學習新模態能力的同時,不會遺忘或削弱已有的單模態能力,最終成長為一個真正的全能選手。

龐然大物也能身輕如燕

一個強大的模型,從訓練完成到能被用戶流暢使用,還需要高效的工程技術作為支撐。

預訓練之后,模型會經歷監督微調(SFT)和強化學習(RL)兩個階段。

SFT階段,模型通過學習海量高質量的指令數據,學會更好地理解和遵循人類的意圖。這些數據覆蓋了多模態理解、推理、交互對話和專業領域知識。

特別是為了實時交互,團隊專門策劃了模擬真實場景的語音-視覺問答、實時視頻分析等多模態交互數據。

強化學習階段則更進一步,通過引入人類偏好數據,訓練一個獎勵模型,然后利用這個獎勵模型來指導語言模型生成更符合人類喜好、更有用、更安全的回答。

訓練一個5600億參數的全模態模型,對計算基礎設施是巨大的考驗。

最大的挑戰在于模型和數據的異質性。

LLM、視覺編碼器、音頻編碼器各有各的計算和內存需求。

為了解決這個問題,團隊提出了模態解耦并行(MDP)策略。

這個策略的核心思想是因材施教,允許不同模odal組件采用最適合自己的并行策略。比如,LLM部分采用張量并行和流水線并行,而視覺和音頻編碼器則采用數據并行。

為了協調這些以不同方式運行的組件,團隊設計了一個名為ModalityBridge的通信框架,負責在它們之間高效地同步梯度和傳輸數據。這種解耦設計,使得多模態訓練的吞吐量能夠維持在純文本訓練的90%以上,效率極高。

此外,團隊還進行了一系列性能和內存優化。通過梯度檢查點技術,用計算換內存;通過混合精度訓練,減少內存占用;通過使用FlashAttention等內存高效的算子,降低計算過程中的內存峰值。這些策略共同保證了龐大的模型能夠在現有的硬件資源上穩定高效地進行訓練。

為了實現低延遲的實時交互,推理框架的設計至關重要。

團隊設計了一個解耦的推理框架,將視覺處理、音頻處理、LLM推理和音頻合成等模塊拆分為獨立的服務。這種設計允許它們并行工作,極大地降低了端到端的延遲。

更核心的是一個異步流式管道。

輸入的音頻和視頻流被切分成小塊,并被異步地送入各自的編碼器。編碼后的特征再異步地送入LLM進行處理。LLM生成的文本和音頻token也是流式地輸出。

正是這套精心設計的推理系統,讓激活270億參數的LongCat-Flash-Omni,也能實現250毫秒的驚人響應速度。

全能選手的成績單令人矚目

LongCat-Flash-Omni在視覺、音頻、文本以及跨模態的多個權威基準測試中,都展現了強大的性能。

在圖像理解方面,模型在VQAv2、TextVQA、DocVQA等多個基準上都取得了頂尖成績,尤其是在需要細粒度理解的文檔問答(DocVQA)上表現突出。

在視頻理解方面,模型在需要時空推理的TempCompass和MuirBench上表現出色,證明了其強大的動態場景理解能力。

在音頻理解方面,無論是在語音識別基準LibriSpeech上,還是在更具挑戰性的多語言語音識別基準FLEURS上,模型都超越了現有的主流模型。

在音頻指令跟隨任務,如音頻問答和音頻描述上,模型同樣表現優異。

作為模型的基礎,其文本能力也保持在頂尖水平。

在綜合性的跨模態理解基準OmniBench上,模型展現了強大的多模態信息整合與推理能力。

LongCat-Flash-Omni通過統一的框架,將強大的離線理解能力和低延遲的實時交互能力無縫結合,并開源了模型和其背后的技術思路,為通往更自然、更高效人機交互的未來,鋪下了一塊堅實的基石。

責任編輯:張燕妮 來源: AIGC開放社區
相關推薦

2025-08-07 02:00:00

2025-10-28 08:40:00

2018-04-23 16:46:59

開源

2023-12-01 13:36:01

阿里云通義千問

2025-04-28 14:13:43

開源SOTA多模態

2024-08-19 08:45:00

開源模型

2025-06-17 09:07:24

2022-12-06 14:11:32

開源模型

2021-03-08 16:08:21

AIOps工具開源

2025-03-19 09:30:00

2025-08-18 08:30:00

AI模型開源

2025-10-13 08:50:00

2013-11-19 11:55:14

2011-06-08 10:29:37

開源閉源蘋果

2014-08-22 11:15:52

2025-11-07 01:25:00

美團全模態大模型

2022-02-14 16:08:15

開源項目線程池動態可監控

2024-03-25 12:40:19

訓練模型

2025-11-07 09:16:02

2016-12-01 18:52:42

開源閉源
點贊
收藏

51CTO技術棧公眾號

国产一级免费观看| 伊人久久久久久久久| 国产福利电影在线| 精品影院一区二区久久久| 久久99国产精品久久久久久久久| www男人天堂| 日韩三区在线| 亚洲欧美另类小说视频| 精品毛片久久久久久| 亚洲高清视频免费观看| 在线免费观看日本欧美爱情大片| 亚洲国产精品久久91精品| 日本在线观看免费视频| 羞羞网站在线免费观看| 国产性色一区二区| 风间由美一区二区三区| 国产精品国产精品国产| 国产一区激情| 神马国产精品影院av| 久久久久亚洲无码| 欧洲亚洲精品久久久久| 精品久久久久久久久久| 日韩精品一区二区三区电影| 国产综合在线观看| 成人18视频日本| 国产原创欧美精品| 亚洲男人的天堂在线视频| 99tv成人| 亚洲人精品午夜在线观看| 337p日本欧洲亚洲大胆张筱雨| 成人国产精选| 精品久久久久久久中文字幕| 欧美在线观看黄| 色大18成网站www在线观看| www..com久久爱| 91av免费看| 一级黄色a毛片| 日韩精品每日更新| 国内精品400部情侣激情| 久久福利免费视频| 欧美一区二区三| 亚洲精品美女久久久久| 一级黄色免费毛片| 性欧美video另类hd尤物| 色综合一个色综合亚洲| 拔插拔插海外华人免费| 亚洲按摩av| 亚洲人被黑人高潮完整版| 亚洲高清乱码| www.在线视频.com| 久久免费美女视频| 欧美日韩国产综合视频在线| 欧美日韩影视| 91理论电影在线观看| 精品一区二区国产| 神马一区二区三区| av亚洲精华国产精华精| 国产精品一区二区在线观看 | 极品尤物一区二区| 国产毛片一区二区三区| 亚洲色图国产精品| 色综合99久久久无码国产精品| 欧美日韩123| 永久免费精品影视网站| 日韩一级片在线免费观看| 国产影视一区| 最新国产精品亚洲| 国精品人伦一区二区三区蜜桃| 欧美韩日高清| 欧美裸身视频免费观看| 免费高清在线观看电视| 综合亚洲视频| 亚州av一区二区| 国产99久久久| 另类小说欧美激情| 亚洲综合视频1区| 黄色小视频免费观看| 成人av电影在线观看| 欧美日韩免费观看一区| 日本中文字幕在线播放| 亚洲精品久久嫩草网站秘色| 欧美一级免费播放| 性高爱久久久久久久久| 3d成人动漫网站| 中文字幕人妻一区| 免费成人高清在线视频theav| 中文字幕欧美日韩| www.av视频| 亚洲一区自拍| 国产主播欧美精品| 日韩一区二区三区在线观看视频| 国产午夜亚洲精品理论片色戒 | 欧美性xxxxhd| 无需播放器的av| 麻豆一二三区精品蜜桃| 日韩激情视频在线播放| 第一次破处视频| 综合一区二区三区| 日韩免费视频在线观看| 国产精品一二三四五区| 2020日本不卡一区二区视频| 正在播放亚洲| 成人免费观看在线观看| 欧美午夜精品久久久| 年下总裁被打光屁股sp| 一本色道久久综合亚洲精品酒店| 色妞在线综合亚洲欧美| 日韩精品在线不卡| 精品一区二区三区免费| 精品日本一区二区三区| 麻豆网在线观看| 欧美丝袜美女中出在线| 少妇丰满尤物大尺度写真| 国产日产精品_国产精品毛片| 欧美精品免费在线| 国产美女www| 不卡区在线中文字幕| 一区二区视频在线观看| 成人影院入口| 精品国免费一区二区三区| 国产又粗又黄又猛| av不卡免费看| 波多野结衣久草一区| 91在线观看| 日韩欧美aaa| 精品少妇人妻av一区二区三区| 天天天综合网| 国产精品久久久久久久久影视| 天堂网av2014| 亚洲一区二区三区美女| 日本一二三区在线| 欧美艳星介绍134位艳星| 欧美在线视频导航| 四虎永久在线观看| 亚洲一区二区三区四区的| 日韩欧美理论片| 99re66热这里只有精品8| 国产精品久久久久久网站| 五月婷婷综合久久| 午夜精品久久久久久久久久| 师生出轨h灌满了1v1| 99久久婷婷这里只有精品 | 青草全福视在线| 久久av影院| 日日噜噜噜夜夜爽亚洲精品| 中文字幕+乱码+中文| 久久精子c满五个校花| 国产aaa一级片| 青青草久久爱| 欧美一二三视频| 人妻91麻豆一区二区三区| 一区二区视频在线看| 亚洲女人在线观看| 亚洲综合自拍| 成人免费在线看片| 国产美女一区视频| 亚洲国产一区自拍| 国产成人一区二区三区影院在线 | 欧美三级资源在线| 人人妻人人澡人人爽| 日韩国产欧美视频| 午夜视频久久久| 四虎精品在线观看| 精品中文字幕乱| 人妻少妇精品无码专区久久| 精品国产乱码久久久久酒店| 四虎永久免费在线观看| 日韩电影免费在线观看网站| 亚洲不卡1区| 成人在线视频国产| 欧美精品激情视频| 青青草超碰在线| 欧美专区日韩专区| 欧美爱爱免费视频| 成人永久看片免费视频天堂| 精品久久一二三| 教室别恋欧美无删减版| 91精品久久久久久久久久久| 日韩欧美一起| 亚洲欧美www| 一区二区三区免费在线| 一区二区三区中文字幕在线观看| av在线播放网址| 日本视频一区二区| 精品人妻人人做人人爽| 欧美日韩另类图片| 国产有码在线一区二区视频| 国产蜜臀av在线播放| 亚洲一区www| 国产a级免费视频| 日韩欧美成人网| 国产精品三区在线观看| av成人免费在线| 日韩欧美国产片| 亚洲茄子视频| 亚洲一区二区三区色| 东京久久高清| 国产精品日日摸夜夜添夜夜av| 日本一本在线免费福利| 亚洲一区二区久久| 欧美 日韩 国产 在线| 欧美在线影院一区二区| 久久一区二区三| 中文乱码免费一区二区| 欧美一区二区免费在线观看| 久久电影网电视剧免费观看| 日本三级免费网站| 欧美精品自拍| 亚洲伊人婷婷| 色爱综合av| 99热最新在线| 精品69视频一区二区三区| 国内精品国产三级国产在线专| 日本不卡三区| 亚洲视频一区二区| 色综合视频在线| 日韩一区二区三区在线视频| 在线观看国产区| 欧美日韩美女视频| 久久精品视频久久| 亚洲男人的天堂网| 国产又粗又猛又爽又黄的视频小说| 99久久精品费精品国产一区二区| 国产高清av片| 蜜臀av性久久久久蜜臀aⅴ流畅| 亚洲熟妇国产熟妇肥婆| 欧美三级特黄| 日韩a级黄色片| 国产精品成人av| 亚洲制服中文| 日韩一区电影| 婷婷四月色综合| blacked蜜桃精品一区| 久久久人人爽| 神马久久影院| 久久久久久99| 中文字幕中文字幕精品| 激情欧美一区二区三区中文字幕| theporn国产在线精品| 成人黄色在线免费观看| 久久伊人影院| 亚洲综合色av| 视频在线观看免费影院欧美meiju| 成人淫片在线看| 四虎永久精品在线| 91亚洲人电影| 久久综合偷偷噜噜噜色| 91中文字幕在线观看| 久久免费福利| 91福利视频导航| 综合激情五月婷婷| 精品不卡在线| 亚洲老女人视频免费| 人禽交欧美网站免费| jiujiure精品视频播放| 亚洲国产日韩美| 97精品一区| 国产盗摄视频在线观看| 欧美精品aa| 91免费黄视频| 亚洲综合精品四区| 欧美黑人又粗又大又爽免费| 日韩电影在线免费看| 国产一二三区av| 国产一区二区网址| 天堂va欧美va亚洲va老司机| 成人av在线资源| 丝袜美腿中文字幕| 国产精品午夜春色av| 97成人资源站| 欧美日韩国产专区| 艳妇乳肉豪妇荡乳av无码福利| 欧美美女网站色| 国 产 黄 色 大 片| 日韩av在线高清| 99中文字幕一区| 精品少妇一区二区30p| 亚洲最新无码中文字幕久久| 国产精品天天狠天天看| 亚洲精品在线播放| 久久久福利视频| 久久看人人摘| 久久国产精品视频在线观看| 丝袜亚洲另类丝袜在线| 欧美视频亚洲图片| 97久久超碰精品国产| www.涩涩爱| 亚洲国产一区视频| 波多野结衣一区二区在线 | 中文字幕第一页在线视频| 丰满白嫩尤物一区二区| 性久久久久久久久久| 亚洲欧洲综合另类| 日本中文字幕第一页| 欧美伦理视频网站| 熟妇人妻av无码一区二区三区| 神马久久久久久| 手机在线观看av| 91日本在线视频| 亚洲素人在线| 国产91沈先生在线播放| 日韩精品每日更新| 国产a级黄色片| 综合激情成人伊人| 丰满少妇xoxoxo视频| 日韩一级完整毛片| 成人不用播放器| 97国产suv精品一区二区62| 日韩黄色三级在线观看| 免费看成人av| 影音先锋久久久| 最新国产黄色网址| 久久久影院官网| 久久久久无码国产精品不卡| 欧美日韩一区二区三区不卡| 天堂影院在线| 欧美日本啪啪无遮挡网站| 福利视频亚洲| 免费看成人午夜电影| 伊人久久大香线蕉av超碰演员| 拔插拔插华人永久免费| 国产欧美一区二区三区沐欲| 好吊操这里只有精品| 日韩精品专区在线| 久草中文在线观看| 国产精品美女久久久久久免费| 欧美成人午夜77777| 国产精品啪啪啪视频| 狠狠色丁香久久婷婷综合_中 | 亚洲欧美日韩系列| 影音先锋黄色网址| 在线观看欧美日韩| 欧美日韩五码| 欧美一区二区三区四区夜夜大片| 99精品国产一区二区青青牛奶| 少妇极品熟妇人妻无码| 亚洲精品第1页| 99国产精品久久久久久久成人 | 欧美日韩高清免费| 国产精品久久久久久模特| 国产精品一区二区无码对白| 亚洲国产成人高清精品| 午夜免费福利视频| 色综合91久久精品中文字幕| 国产免费区一区二区三视频免费| 亚洲一卡二卡| 国产在线乱码一区二区三区| 久艹在线观看视频| 在线电影一区二区三区| 精品国产白色丝袜高跟鞋| 国产日韩av在线播放| 图片小说视频色综合| 欧美体内she精高潮| 亚洲欧美激情插| 精品人妻无码一区二区| 欧美二区在线播放| 超碰成人福利| 男人揉女人奶房视频60分| 91亚洲大成网污www| 久久久久久久久黄色| 亚洲人成亚洲人成在线观看| 成人国产精选| 精品无码av无码免费专区| 成人综合在线观看| 日韩色图在线观看| 中文字幕国产亚洲| 免费观看性欧美大片无片| 国产玉足脚交久久欧美| 99久久99精品久久久久久| 日本视频免费观看| xxxxxxxxx欧美| 国产亚洲成av人片在线观黄桃| a级黄色一级片| 国产日韩欧美制服另类| 91丨porny丨在线中文| 久久69精品久久久久久久电影好| 精品久久对白| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 红桃av永久久久| 国产永久免费高清在线观看视频| 国产欧美最新羞羞视频在线观看| 欧美激情无毛| 精品夜夜澡人妻无码av| 欧美日韩久久久一区| 天堂va在线| 日本高清久久一区二区三区| 九一九一国产精品| 91av在线免费视频| www.久久色.com| 欧美三级午夜理伦三级小说| 最新中文字幕2018| 亚洲午夜在线视频| av一本在线| 精品国产乱码久久久久久久软件 | 国产精品久久中文| 国色天香一区二区| 中文字幕伦理片| 亚洲精品国精品久久99热| 久久亚洲精品中文字幕| 丰满爆乳一区二区三区|