精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

智譜運氣是差一點點,視覺Token研究又和DeepSeek撞車了

人工智能 新聞
太卷了,DeepSeek-OCR剛發布不到一天,智譜就開源了自家的視覺Token方案——Glyph。

這不巧了嗎……智譜和DeepSeek,又雙叒撞車了。

太卷了,DeepSeek-OCR剛發布不到一天,智譜就開源了自家的視覺Token方案——Glyph

既然是同臺對壘,那自然得請這兩天瘋狂點贊DeepSeek的卡帕西來鑒賞一下:

或許你也會對我們的工作感興趣。

發論文就發論文,怎么還爭上寵了。(doge)

網友調侃be like:AI界也有自己的霸總愛情片。

智譜也做視覺壓縮

是的,與DeepSeek-OCR一樣,智譜這篇論文的目標同樣也是通過視覺的方式,破解當下LLM上下文冗長的難題。

激增的上下文

隨著LLM能力一路狂飆,用戶和廠商對于長上下文的需求也越來越迫切。

畢竟,不論是長文檔分析、代碼審查,還是多輪對話,模型可不能像金魚那樣看過就忘。要讓它們真正靠譜地執行任務,就得有足夠穩定的「工作記憶」。

但擴充上下文可是個相當吃力不討好的工作。

舉個例子:如果把上下文從50K擴到100K,算力的消耗大約會變成原來的四倍。

原因在于,更多的Token,就意味著模型需要記住更多的激活值、緩存、注意力權重,這些東西在訓練和推理階段都是靠真金白銀堆出來的。

如果能實實在在地提升性能,多花點錢也認了。

可最讓人心痛的是,砸了重金擴上下文,模型還不一定更聰明

IBM的研究就指出,光靠“多塞 Token”并不能保證模型表現線性提升。

相反,當輸入太長、信息太雜時,模型反而可能陷入噪聲干擾和信息過載,越看越糊涂。

關于這類問題,目前大概有三種比較主流的解決方案:

第一類,是擴展位置編碼。

在Transformer結構里,模型并不知道輸入的先后順序,因此要給每個Token加上“位置編碼”,告訴模型這是誰先誰后。

而擴展位置編碼的做法,就是把原有的位置編碼區間直接向外延伸。

比如,把0~32K的位置區間“插值”到0~100K,這樣,模型就能在工作時接受更長的輸入,而不必重新訓練。

雖然如此,這并沒有解決推理成本的問題,模型在推理階段依舊要遍歷所有上下文。

而且,模型雖然能繼續讀下去,但由于它在訓練中從未見過如此長的上下文,現在逼著人家讀肯定表現不會好。

第二類,是改造注意力機制。

既然上下文變長了,那就讓模型「讀」快一點,比如用稀疏注意力、線性注意力等技巧,提高每個Token的處理效率。

但再怎么快,賬還是那本賬,Token的總量沒有減少,如果上下文都到了幾十萬,多高的效率也頂不住。

第三類,是檢索增強RAG路線。

它通過外部檢索先挑重點、再喂給模型,輸入變短了,推理輕快了。

但大家也知道,RAG的輸出結果肯定不如模型基于訓練數據的回答,而且還會因多出來的檢索步驟拖慢整體響應。

踏破鐵鞋無覓處,上下文真是個令人頭疼的問題。

看「圖」說話

為了解決這個問題,研究團隊提出了一種新范式——Glyph

大道至簡:既然純文本的信息密度不夠,那就把它放進圖片里。

普通LLM處理文本時,是把句子拆成一個個獨立的Token依次輸入,效率很低。

比如,如果一句話能分成1000個Token,模型就得老老實實算1000個向量,還要在它們之間做注意力計算。

相比之下,Glyph不會逐字閱讀,而是先把整段文字排版成圖像式的視覺Token,再把這張「截圖」交給VLM去處理。

之所以要這么做,是因為圖像能承載的信息密度遠高出純文本,僅需一個視覺Token就能容納原先需要好幾個文本Token的內容。

借助這種方式,即便是一個上下文固定的VLM,無需借助稀疏注意力、RAG等工具,也能輕松吃下足以「撐死」LLM的超長文本。

舉個例子:小說《簡·愛》大約有240K的文本Token,對一臺上下文窗口只有128K的傳統LLM來說,只能塞進去一半。

這種情況下,如果你想問一些涉及到故事跨度比較大的問題,傳統模型多半答不上來。

比如:女主離開桑菲爾德后,誰在她陷入困境時幫助了她?

但如果使用Glyph,把整本書渲染成緊湊的圖像,大約只需要80K視覺Token。

這樣一來,同樣是128K上下文的VLM就能輕松看完整部《簡·愛》,對故事脈絡心中有數,也能從更大的全局視角來回答問題。

這么立竿見影的效果,是怎么實現的呢?

Glyph的訓練流程主要分為三個階段:

第一階段:持續預訓練(Continual Pre-training)

這一階段的目標,是讓模型把自己的長上下文理解能力從文字世界遷移到視覺世界。

具體而言,研究團隊先盡可能多地將海量長文本渲染成不同風格的圖像,把VLM扔在各式各樣排版、字體、布局中“讀圖識文”,以便訓練出更強的泛化能力。

在這個過程中,模型會不斷學習如何把圖像中的文字信息,與原始文本語義對齊。

第二階段:LLM驅動的渲染搜索(LLM-driven Rendering Search)

雖然多樣化的渲染方式能提升模型的泛化能力,但在實際應用中,效率和精度必須兼顧。

文字如何轉成圖,決定了壓縮率可讀性之間的微妙平衡。

字體太大、排版太松固然不好,這樣做信息密度太低,有悖于視覺Token的初衷。

不過,過于追求信息密度也不是好事。

字體小、布局緊,雖然壓縮率高,卻可能讓模型“看不清”,理解出現偏差。

為此,研究團隊引入由LLM驅動的遺傳搜索算法,讓模型自動探索最優的渲染參數——比如字體大小、頁面布局、圖像分辨率等——力求在盡可能壓縮的同時不丟語義。

第三階段:后訓練(Post-training)

在找到最優的渲染方案后,研究團隊又動手做了兩件事:有監督微調和強化學習,旨讓模型在“看圖讀文”這件事上更聰明、更穩。

此外,他們還在SFT和RL階段都加上了輔助OCR對齊任務,教模型學會從圖像里準確還原文字細節,讓視覺和文本兩種能力真正融為一體。

最終,Glyph一舉練成兩大神功:

1、看懂長文,推理穩準狠。

2、認清細節,讀圖不傷腦。

靠著這套組合拳,Glyph在高壓縮的視覺上下文任務里依然能游刃有余。

狂砍75%上下文

讀懂了原理,接下來讓我們看看Glyph的實際表現如何。

事實證明,Glyph的確有助于大幅削減Token數。

實驗結果顯示,Glyph在多項長上下文基準測試中實現了3–4倍的Token壓縮率,同時依然保持與主流模型(如Qwen3-8B)相當的準確度。

這種壓縮不僅減輕了算力負擔,還帶來了約4倍的prefill與解碼速度提升,以及約2倍的SFT訓練加速。

更令人驚喜的是,在極端壓縮的情況下,一個上下文窗口僅128K的VLM,依然能夠應對相當于百萬Token級的文本任務,并絲毫不落下風。

此外,雖然Glyph的訓練數據主要來自渲染后的文本圖像,但它在多模態任務上同樣表現出色,證明了其強大的泛化潛力。

綜上所述,這篇論文提出了一種名為Glyph的長上下文建模框架。

核心思路是把長文本“畫”成圖,再讓VLM去看圖讀文,做到一目十行,從而能實現高效的上下文擴展。

論文作者

這么厲害的成果,都是誰做出來的?

論文的一作是Jiale Cheng,他是清華大學的博士生,主要研究方向包括自然語言生成、對話系統和相關的人工智能交互技術。

目前,Jiale已發布了多篇論文,并在谷歌學術上有不錯的影響力。

此外,論文還有三位主要貢獻者:Yusen Liu、Xinyu Zhang、Yulin Fei。

遺憾的是,都沒有太多公開資料。

擔任本文通訊作者的是黃民烈教授

黃教授本科與博士均畢業于清華大學,目前是清華大學計算機科學與技術系長聘教授,同時兼任智能技術與系統實驗室副主任、清華大學基礎模型中心副主任。

此外,他還是北京聆心智能科技有限公司的創始人兼首席科學家。

黃教授的研究方向主要集中在人工智能、深度學習、強化學習,自然語言處理等。

像素或成最終Token

繼MoE名聲鵲起后,DeepSeek-OCR的出現再次在AI領域掀起了一波技術革命。

截至10月22日,抱抱臉上最受歡迎的前四個模型,全部都支持OCR。

一方面,自然是視覺Token本身的巨大潛力。

在上下文建模方面,視覺Token的表現堪稱驚艷——

DeepSeek-OCR僅用100個視覺Token,就能在原本需要800個文本Token的文檔上取得高達97.3%的準確率。

這種效率提升,意味著AI的門檻正被迅速拉低。

據DeepSeek介紹,引入OCR技術后,單張NVIDIA A100-40G GPU每天可處理超過20萬頁文檔

按這個速度推算,僅需一百多張卡,就足以完成一次完整的模型預訓練。

降本增效歷來是開源陣營的強項,但在這次熱議中,大家的關注點不再僅僅停留于此——

視覺Token的出現,或許正在從底層重塑LLM的信息處理方式。

未來,像素可能取代文本,成為下一代AI的基本信息單元

卡帕西指出,像素天生比文本更適合作為LLM的輸入,主要有兩點原因:

1、信息壓縮更高 → 更短的上下文窗口,更高的效率。

2、信息流更廣泛 → 不僅能表示文字,還能包含粗體、顏色、任意圖像。

馬斯克的觀點則更加激進:

從長遠來看,人工智能模型的輸入和輸出中 99% 以上都將是光子。

此外,OCR的爆火也不禁讓人再次思考AI與腦科學之間千絲萬縷的聯系。

用圖像而非文本作為輸入,乍看之下似乎反直覺,但細想便會發現,這反而更貼近人腦的信息處理方式。

人類獲取任何新信息時,最先感知到的都是圖像。

即便是閱讀,我們的大腦最初接收的也只是由像素按特定規律排列組合的一串圖形,在經過一層層視覺處理后,這些像素才被翻譯成“文字”的概念。

從這個角度來看,OCR的表現固然驚艷,但也沒那么出乎意料了。

畢竟,視覺才是人類數萬年來接觸世界的一手資料。

相比之下,語言不過是我們基于視覺與其他感官體驗提煉出的高度濃縮的抽象層。它標準化、成本低,但本質上依舊是視覺的降維產物。

即便再清晰的影子,也注定會流失不少細節。

有趣的是,當AI在各項指標上不斷逼近人類、引發普遍焦慮的同時,每當技術發展陷入瓶頸,我們又總能從那個被質疑“沒那么智能”的人腦里重新找到答案

神經網絡、注意力機制、MoE……都是這個規律下的產物。

而這一次,深不可測的「人類智能」,從視覺Token上再次得到了印證。

論文:https://arxiv.org/pdf/2510.17800

GitHub:https://github.com/thu-coai/Glyph

責任編輯:張燕妮 來源: 量子位
相關推薦

2011-10-27 16:11:46

后PC時代

2023-12-25 07:56:23

Linux內存管理內存映射

2010-09-16 09:19:17

2014-07-24 13:32:01

Google NowSiri

2021-07-02 09:24:23

Windows 11操作系統微軟

2018-01-09 21:47:17

2019-04-01 10:20:29

技術研發指標

2015-12-28 16:17:32

華為

2021-02-24 09:54:53

4G5G運營商

2025-02-19 10:48:15

2015-11-05 09:29:53

程序員進步

2019-11-19 10:28:22

AWS虛擬機入門

2017-02-06 13:25:40

.NET視頻

2025-09-03 14:02:08

AI大模型訓練

2010-05-20 15:29:43

優化IIS

2010-01-04 19:22:49

Silverlight

2016-04-05 10:12:58

HiveSQLHadoop

2013-01-08 10:06:43

創業創業方法

2009-12-15 14:27:30

Ruby存取器
點贊
收藏

51CTO技術棧公眾號

av成人在线观看| 欧美男男激情freegay| 欧美日一区二区在线观看 | 久久精品美女视频网站| 国产成人精品一区二区三区在线观看| av在线加勒比| 国产欧美久久久精品影院| 欧美伊人久久久久久久久影院 | 色悠悠在线视频| 在线免费看h| 亚洲色欲色欲www| 久久99欧美| 91国产免费视频| 在线亚洲精品| 萌白酱国产一区二区| 日本黄色特级片| 精品国产三级| 欧美性受xxxx黑人xyx| www.国产在线视频| 日本免费中文字幕在线| 26uuu亚洲综合色欧美| 成人av免费网站| 久久精品国产欧美亚洲人人爽| 亚洲中文字幕无码一区| 黑人一区二区三区| 日韩欧美黄色动漫| www.国产在线视频| 黄色网在线看| 亚洲国产高清在线| 老司机精品福利在线观看| 国产夫绿帽单男3p精品视频| 日韩黄色小视频| 韩日欧美一区二区| 澳门黄色一级片| 日韩a一区二区| 亚洲老板91色精品久久| 美女扒开腿免费视频| 95精品视频| 欧美性受xxxx| 日韩欧美黄色大片| 中文字幕不卡三区视频| 亚洲超丰满肉感bbw| 日本一区二区三区四区五区六区| 久久视频www| 91视频在线观看免费| 成人在线观看网址| 国产成人三级在线播放 | 舔着乳尖日韩一区| 国产精品videossex国产高清| 麻豆tv入口在线看| 中文字幕在线一区免费| 亚洲精品一品区二品区三品区| 男男激情在线| 久久久夜色精品亚洲| 久久99精品久久久久久久青青日本 | 免费在线视频一区| 国产成人啪精品视频免费网| 久久精品无码av| 麻豆九一精品爱看视频在线观看免费| 91成人天堂久久成人| 日操夜操天天操| 亚洲高清成人| 97精品久久久| www.国产色| 久色成人在线| 国产精品福利在线| 岳乳丰满一区二区三区| 另类成人小视频在线| 国产欧美亚洲视频| 国产又爽又黄又嫩又猛又粗| 国产美女av一区二区三区| 亚洲精品欧美一区二区三区| 国产高清视频免费| 成人永久免费视频| 精品一卡二卡三卡四卡日本乱码| 污污的视频网站在线观看| 99久久婷婷国产| 欧洲一区二区日韩在线视频观看免费 | 国产精品一区免费在线| 日韩美女在线视频| 少妇激情一区二区三区视频| 丝袜av一区| 搡老女人一区二区三区视频tv| 永久免费看片直接| 亚洲国产一区二区精品专区| 日韩av手机在线观看| 亚洲一级特黄毛片| 国产成人a级片| 久久久精彩视频| www.视频在线.com| 亚洲三级电影网站| 国产h视频在线播放| 日本欧美韩国| 精品国产伦一区二区三区观看体验 | www.男人天堂网| 亚洲黄色网址| 制服丝袜日韩国产| aaaa黄色片| 成人精品天堂一区二区三区| 欧美日本高清一区| 免费黄色av片| 国产成人av在线影院| 欧美第一黄网| www在线免费观看视频| 婷婷久久综合九色综合伊人色| 簧片在线免费看| 亚洲网一区二区三区| 在线视频欧美性高潮| 麻豆视频在线观看| 免费一级片91| 国内一区在线| 黄色大片在线播放| 日韩欧美视频一区二区三区| 日本r级电影在线观看| 天天躁日日躁成人字幕aⅴ| 久久综合九色九九| 一级一片免费看| 高清在线成人网| 亚洲综合首页| 成人做爰视频www网站小优视频| 欧美一卡在线观看| 日韩av片在线| 翔田千里一区二区| 国产伦精品一区二区三区高清版| 免费在线观看av网站| 日韩欧美在线第一页| 伊人久久一区二区三区| 久久人人99| 国产精品av在线播放| 熟妇高潮一区二区| 艳妇乳肉豪妇荡乳av| 国产69精品久久久久777| 一区二区视频在线播放| 深夜成人福利| 国产视频丨精品|在线观看| 欧美精品乱码视频一二专区| 美女在线观看视频一区二区| 日本欧美精品久久久| 成年男女免费视频网站不卡| 日韩免费高清av| 东方av正在进入| 极品美女销魂一区二区三区| 五月天亚洲综合小说网| 日韩天堂在线| 亚洲无限av看| 日本三级一区二区三区| 久久精品视频网| 91av俱乐部| 国内亚洲精品| 国产精品都在这里| av在线资源网| 在线播放一区二区三区| 国产高清视频免费在线观看| 久久91精品久久久久久秒播| 日韩中文字幕一区| 国产精品黄色片| 久久精品国产欧美激情| 国产黄色片网站| 一区二区三区加勒比av| 人妻av一区二区三区| 欧美日韩精品| 久久精品五月婷婷| 欧美日韩123区| 亚洲人永久免费| 在线观看免费观看在线| 中文字幕在线观看一区| 五月天国产视频| 午夜精品久久久久99热蜜桃导演| 国产厕所精品在线观看| 女人高潮被爽到呻吟在线观看| 日韩成人在线电影网| 在线精品免费视| 中文字幕一区二区在线观看| 樱花草www在线| 伊人久久久大香线蕉综合直播| 精品国产一二| www.国产精品| 九九九久久国产免费| 少妇精品高潮欲妇又嫩中文字幕| 欧美日韩一区二区免费视频| 极品尤物一区二区| 国产成人在线影院| 国产在线观看福利| 欧美oldwomenvideos| 国产成人精品免费视频大全最热 | 337p日本欧洲亚洲大胆鲁鲁| 欧美一区二区三区四区五区| 国产乡下妇女做爰毛片| 久久精品一区四区| 亚洲综合在线一区二区| 久久成人精品| 免费观看中文字幕| 三级小说欧洲区亚洲区| 国产一区二区丝袜高跟鞋图片| 欧美人与性动交α欧美精品济南到| 精品小视频在线| 国产人妖一区二区三区| 狠狠综合久久av一区二区小说| 国产视频123区| 成人黄页毛片网站| 久久久久久蜜桃一区二区| 亚洲午夜极品| 五月婷婷综合色| 精品精品国产毛片在线看| 国产精品美女主播在线观看纯欲| 午夜在线激情影院| 在线亚洲国产精品网| 亚洲精品字幕在线| 欧美日韩一区二区三区免费看| 日韩 国产 在线| 1区2区3区欧美| 久久久久久久毛片| 丁香六月综合激情| 欧美性受xxxxxx黑人xyx性爽| 亚洲男人影院| 激情小视频网站| 午夜影院欧美| 视频一区不卡| 亚洲自拍都市欧美小说| 成人黄视频免费| 欧洲亚洲精品| 国产精品久久久av久久久| 98色花堂精品视频在线观看| 久久国产加勒比精品无码| 国产精品久久久久久久龚玥菲 | 受虐m奴xxx在线观看| 国产91在线观看丝袜| 亚洲在线观看网站| a√在线中文网新版址在线| 一本久久a久久精品亚洲| 久久久久人妻一区精品色欧美| 亚洲色图制服丝袜| 美女三级黄色片| 欧美激情资源网| 免费看黄色av| 国产欧美视频在线观看| 真人bbbbbbbbb毛片| 白白色 亚洲乱淫| 老熟女高潮一区二区三区| 国内精品在线播放| 免费看涩涩视频| 久久99热这里只有精品| 中文av一区二区三区| 日韩av不卡在线观看| caopor在线视频| 久久免费高清| 波多野结衣作品集| 男人的天堂亚洲一区| 亚洲欧美另类动漫| 天堂精品中文字幕在线| 久久人妻精品白浆国产| 日韩在线一二三区| 国产福利影院在线观看| 日本成人在线一区| 欧美在线aaa| 久久国产精品99久久人人澡| 福利片一区二区三区| 黄网站免费久久| 制服下的诱惑暮生| 国产91富婆露脸刺激对白| wwwww在线观看| 成人免费视频国产在线观看| 亚洲中文字幕一区| 国产午夜精品一区二区三区嫩草| a级大片在线观看| 中文字幕欧美日本乱码一线二线| 最新日韩免费视频| 亚洲欧美激情小说另类| 青青草精品在线视频| 亚洲成人自拍偷拍| 国产亚洲欧美在线精品| 欧美色综合影院| 国产女同91疯狂高潮互磨| 欧美一区二区三区公司| 日本高清视频免费观看| 国产午夜精品理论片a级探花| 久久久久久久影视| www国产亚洲精品久久网站| 日本伦理一区二区| 国产91精品久久久久| 亚洲国产尤物| 春色成人在线视频| 久久av超碰| 91精品国产毛片武则天| 亚洲伦伦在线| 国自产精品手机在线观看视频| 又骚又黄的视频| 日韩精品一区二区三区在线播放 | 男人添女荫道口女人有什么感觉| 影音先锋久久| 天堂av在线网站| 成人av影院在线| 国产又粗又猛又爽又黄的视频四季| 尤物视频一区二区| 一级黄色av片| 日韩一级大片在线观看| 欧美少妇另类| 欧美激情一区二区三级高清视频| 高清电影一区| 成人一区二区三区四区| 日本一区二区在线看| 激情伊人五月天| 韩国欧美国产1区| 成人免费无遮挡无码黄漫视频| 亚洲欧美日韩国产成人精品影院 | 欧美精品丝袜久久久中文字幕| 亚洲欧洲精品视频| 超碰精品一区二区三区乱码| 超级碰碰久久| 国产精品久久亚洲7777| 91日韩欧美| av免费在线播放网站| 国产成人免费视频精品含羞草妖精| 超碰97av在线| 色综合天天视频在线观看 | 国产亚洲精品综合一区91| 亚洲wwwww| 成人在线精品视频| 国产中文精品久高清在线不| 国产美女主播在线| 国产精品亚洲专一区二区三区| 18精品爽国产三级网站| 色久优优欧美色久优优| 日本毛片在线观看| 欧美国产日韩免费| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 亚洲欧洲久久| 日韩一区精品视频| 中文字幕一二三四区| 亚洲丰满少妇videoshd| 99久久精品国产色欲| 日韩中文在线中文网三级| av一区在线播放| 日韩久久久久久久久久久久久| 奶水喷射视频一区| 国产精品无码在线| 精品国产91久久久久久| 天天操天天干天天爱| 久久久久久av| 国产精品xxx在线观看| 免费人成自慰网站| 成人手机电影网| 日韩免费电影一区二区| 国产一精品一av一免费爽爽| 一区二区在线观| 久99久精品视频免费观看| 美女福利视频网| 在线电影院国产精品| 国产三级在线播放| 亚洲一区二区免费在线| 亚洲澳门在线| 一级做a爱视频| 怡红院av一区二区三区| www.五月婷婷| 久久久久久尹人网香蕉| 任我爽精品视频在线播放| 国产亚洲精品网站| 久久久久久久久伊人| 在线观看日本网站| 国产午夜精品视频| 精品176极品一区| 永久免费在线看片视频| 国产成人午夜片在线观看高清观看| 麻豆视频在线观看| 亚洲国产第一页| 成人日韩在线| 最新黄色av网站| 从欧美一区二区三区| 人人干人人干人人干| 亚洲欧美综合另类中字| 成人精品一区二区三区电影| 成人手机视频在线| 高清国产一区二区| 免费视频久久久| www国产精品视频| 久久久久影视| 黑人粗进入欧美aaaaa| 亚洲免费av在线| 十九岁完整版在线观看好看云免费| 国产精品大片wwwwww| 欧美不卡一区| 97人妻精品一区二区三区免| 在线看一区二区| 国产传媒在线播放| 久久久人人爽| 韩国视频一区二区| 亚洲GV成人无码久久精品| 日韩专区在线观看| 国产精品美女在线观看直播| 毛片av免费在线观看| 亚洲女同女同女同女同女同69| 日本免费网站在线观看| 国产精品永久免费视频| 在线 亚洲欧美在线综合一区| 人妻少妇一区二区| 欧美大胆一级视频| 99久久精品一区二区成人| 丁香婷婷综合激情| 国产精品国产三级国产aⅴ原创| 高清毛片aaaaaaaaa片|