精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

馬斯克新模型背后算法來自英偉達???

人工智能
正如Grok-4-fast所表現出來的一樣,這篇論文解決了困擾行業已久的推理成本問題。一味的硬件Scaling只會讓模型廠商賬單上的數字越來越長,用戶耐心也在漫長的推理時間中逐漸被消耗殆盡。為此,英偉達研究團隊推出了一種全新「混合結構」模型——Jet-Nemotron。

Grok-4-fast最近在降本增效上的表現堪稱一騎絕塵,連有「路由器」傍身的GPT5都給干趴下了。

面對如此驚艷的推理效率,很多人第一反應就是:堆卡式的算力scaling又一次大顯神威了。

實際上,Grok的背后確實有英偉達的影子。

但這次立功的,或許不是老黃的顯卡,而是算法。

沒錯,Grok-4-fast的秘密武器,被和一篇英偉達的算法論文關聯在了一起。

讓LLM快53倍的火箭發動機

正如Grok-4-fast所表現出來的一樣,這篇論文解決了困擾行業已久的推理成本問題。

一味的硬件Scaling只會讓模型廠商賬單上的數字越來越長,用戶耐心也在漫長的推理時間中逐漸被消耗殆盡。

為此,英偉達研究團隊推出了一種全新「混合結構」模型——Jet-Nemotron。

經過一系列全面的基準測試,發現Jet-Nemotron-2B的表現與Qwen3、Qwen2.5、Gemma3和Llama3.2等頂尖開源模型不相上下,還能實現約53倍的速度提升。

圖片

例如在MMLU-Pro上,Jet-Nemotron-2B不僅準確率比Qwen3-1.7B-Base更高,就連生成速度也要快上47倍。

此外,Jet-Nemotron-2B即便遇上參數更大的模型也絲毫不虛,它在MMLU和MMLU-Pro上的準確率甚至可以超過DeepSeek-V3-Small和Moonlight(總參數量15B,激活參數量2.2B)。

改變這一切的關鍵,在于一個叫PortNAS的新框架。

不同于以往的方法,PostNAS不是從零開始訓練,而是以一個預訓練的全注意力模型為起點,并凍結其MLP權重,只探索注意力機制的改進。

這樣一來,不僅能讓訓練成本直接降低幾個數量級,還能有更多精力用于全面探索模型結構。

其流程包括四個核心部分:全注意力層放置、選擇最優的線性注意力模塊、設計更優的線性注意力模塊、硬件感知架構搜索。

全注意力層放置

大多數團隊會在模型的所有層里統一使用全注意力,但這會浪費算力資源。

因此,英偉達團隊希望保留少量關鍵的全注意力層,以維持復雜任務的準確性,同時剔除冗余層以提升效率。

PostNAS的做法是:先構建一個同時包含兩種注意力機制的超級網絡,再通過特征蒸餾來訓練子網絡,最后用beam search找到最優的注意力層放置方案。

圖片

事實證明,的確并非所有注意力層都重要,不同任務依賴不同層,少量關鍵層即可覆蓋大部分任務需求。

實驗結果顯示,PostNAS優于均勻放置策略——在只使用2層全注意力的情況下,PostNAS的準確率約49%,而均勻放置的準確率約40%。

選擇最優的線性注意力模塊

在確定了全注意力層后,英偉達團隊開始進行注意力模塊搜索,旨在找到目前最優的線性注意力模塊。

論文評估了六種當前最先進的線性注意力模塊,包括RWKV7、RetNet、Mamba2、GLA、DeltaNet和Gated DeltaNet。

圖片

這六個之中,Gated DeltaNet的準確率最高,這主要歸功于兩個因素:

1、數據依賴門控機制(Data-Dependent Gating Mechanism):可以理解成一個路由器。模型會根據輸入的內容,決定是更重視新信息,還是之前的歷史狀態,從而在不同任務里找到平衡。

2、Delta規則(Delta Rule):不是每次都把記憶里的東西全部覆蓋,而是只更新新變化的部分。這樣能減少不必要的重復存儲,節省內存,同時保持信息的連續性。

更優解:JetBlock

不過,英偉達并不打算止步于Gated DeltaNet,而是設計了一款比它更強的線性注意力模塊——JetBlock。

卷積對線性注意力模塊的準確率至關重要,然而,以往方法大多使用的是靜態卷積核,它們無法根據輸入自動調整特征提取方式。

相比之下,JetBlock使用動態卷積,通過在線性注意力中引入一個卷積核生成器模塊,JetBlock能根據輸入特征動態地產生卷積核。

圖片

結果顯示,JetBlock在數學推理和檢索任務上的準確率優于Gated DeltaNet,而且仍然保持了不錯的生成效率。

要是跟表現最差的Mamba2比起來,JetBlock的優勢就更明顯了。

圖片

硬件感知架構搜索

在確定了宏觀架構以及選擇了線性注意力模塊之后,英偉達團隊進一步進行了硬件感知架構搜索,用于優化核心超參數(key/value的維度、注意力頭的數量…)。

過去,參數規模通常被作為衡量模型效率的主要指標,用來指導架構設計。

但英偉達團隊認為這種方法并不理想,因為參數量并不能直接反映真實硬件上的效率。

對此,他們改進的方法是:以生成吞吐量作為直接目標來選擇超參數。

英偉達團隊發現,相比起參數量,KV緩存大小才是影響長上下文和長文本生成吞吐量的最關鍵因素。而當KV緩存大小固定時,不同參數規模的模型,其生成吞吐量表現相似。

基于此,英偉達團隊選擇保持KV緩存大小與原始設計一致,然后在key維度、value維度和注意力頭數上進行小規模網格搜索。

圖片

實驗證明,優化后的版本在保持吞吐量不變的情況下,參數量增加(1.84億 vs 1.7億),同時數學準確率得到提升(34.8% vs 32.8%)(藍色行代表實驗組,灰色行代表對照組。)

綜上,PortNAS有望為目前的AI行業帶來三點影響。

1、推理階段GPU使用時長減少47倍,這讓LLM能夠以更快的速度完成高質量任務。

2、更小的內存需求,這使得更廉價的硬件部署成為可能。

3、更高吞吐量,意味著模型廠商可在現有基礎設施規模下服務更多用戶。

而且,PostNAS提供低成本、高效率的架構探索方式,適用于任何預訓練Transformer

所以基本上,任何廠商都可以在不重新訓練模型的情況下嵌入PortNAS,模型的成本可以大幅降低,同時準確率幾乎不會受到影響。

此外,Jet-Nemotron居然還是開源的。

通訊作者Han Cai在Github上表示Jet-Nemotron的代碼和預訓練模型將在法律審查完成后發布。

圖片

感興趣的朋友可以查看文末的鏈接~

Grok-4-fast的背后是英偉達?

同時看到Grok-4-fast和Jet-Nemotron二者同樣驚艷且高度相似的表現,很難不讓人懷疑老馬和老黃這一次是不是聯手了。

在Reddit上,有網友推測Grok-4-Fast應該就是基于Jet-Nemotron創造的。

圖片

Jet-Nemotron可以在不犧牲模型性能的情況下,大幅減少推理所需的計算量,這與Grok-4-fast所展現出來的能力高度相似。

這一觀點能從數據上得到支撐——從Grok-4-fast的定價來看,其價格下降水平與NVIDIA對這種架構模型的預測相符(論文預計會便宜20倍到50倍)。

更重要的是,如果Jet-Nemotron能夠應用于Grok,那它同樣能被OpenAI、Anthropic、Google等公司部署。

也有網友不同意這種說法,認為Grok此次的降價也許只是一種營銷手段,并不能從中推斷出xAI是否采用了什么新技術。

圖片

他們可能只是在燒錢獲取市場份額,我不認為你可以從中推斷出是采用了某種特定架構。

但是,即便Grok-4-fast沒有采用英偉達的技術,這篇論文也是極有價值的,因為Jet-Nemotron同樣可以被用來進一步降低成本。而且,xAI也不太可能在這么短時間研究出來了另一種和Jet-Nemotron一樣效果顯著的技術。

當然,也可能是其他算法上的突破。如果真是這樣,那仍然是極具突破性的,因為Jet-Nemotron也可以被用來進一步降低成本。但說實話,XAI真的又發現了一個能讓價格再下降20倍以上的算法改進的可能性有多大呢?

圖片

不過,上述觀點都只是猜測,目前這些說法都未得到xAI驗證…

華人學者的又一力作

Grok-4-fast是否真的采用了這項技術我們不得而知,可以明確的是,在這項突破性研究成果背后,是華人學者的又一次集中發力——論文作者全部為華人。

圖片

論文的一作是顧煜賢,他是清華大學計算機科學與技術系交互式人工智能(CoAI)課題組的四年級博士生,師從黃民烈教授。

圖片圖片

顧煜賢致力于提升LLM在整個生命周期中各個環節的效率,包括預訓練、下游適配以及推理階段。

近期,他的工作重點放在LLM的數據策劃策略研究、高效模型架構設計,以及運用知識蒸餾技術(knowledge distillation)進行語言模型壓縮。

此前,他曾在微軟亞洲研究院實習,由董力博士指導。他還曾作為訪問學生赴麻省理工學院HAN實驗室,導師為韓松教授。

論文的通訊作者是Han Cai,他目前是NVIDIA Research的一名研究科學家

圖片圖片

在加入NVIDIA之前,Han Cai麻省理工學院EECS獲得了博士學位,他的本科和碩士均就讀于上海交通大學。

Han Cai的研究重心在于高效的基礎模型(擴散模型、LLM等)、EdgeAI和AutoML,除了Jet-Nemotron,他還參與了不少英偉達的重要項目,包括ProxylessNAS、Once-for-all…

目前,他的論文在Google Scholar上累計被引用超1萬次。

圖片


論文:https://arxiv.org/pdf/2508.15884v1
Github:https://github.com/NVlabs/Jet-Nemotron

參考鏈接:
[1]https://pub.towardsai.net/jet-nemotron-nvidias-new-ai-architecture-achieves-53x-speed-improvement-71a5cf2baeeb
[2]https://www.reddit.com/r/singularity/comments/1nmzqj5/there_is_a_very_real_possibility_that_google/
[3]https://t1101675.github.io/
[4]https://han-cai.github.io/

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-09-16 09:02:00

AI馬斯克模型

2025-10-13 09:37:58

2025-02-24 13:00:00

2022-05-23 15:57:18

加密貨幣黑客網絡攻擊

2025-10-23 16:38:30

2022-01-23 10:53:47

星鏈互聯網衛星

2023-11-03 15:38:26

網絡安全人工智能數字化轉型

2023-08-26 19:14:21

開源算法Linux

2025-02-11 09:20:00

LLM模型AI

2022-04-15 10:55:59

Web3反壟斷元宇宙

2024-04-07 11:25:54

2021-06-11 17:14:26

黑客馬斯克加密貨幣

2025-07-01 04:45:00

馬斯克腦機接口

2025-01-16 11:55:00

2024-03-11 15:57:45

OpenAI

2025-02-11 11:46:48

OpenAI奧特曼馬斯克

2024-03-18 14:17:06

大模型開源人工智能

2023-04-18 15:03:24

模型數據

2023-08-14 08:07:46

ChatGPTAI

2021-12-09 10:18:29

芯片半導體技術
點贊
收藏

51CTO技術棧公眾號

免费看国产曰批40分钟| 国产日韩三区| 欧美成人777| 欧美日韩午夜电影网| 午夜精品久久一牛影视| 欧洲亚洲一区二区| 国产激情视频在线播放 | 国产美女av一区二区三区| 国模精品系列视频| www.黄色com| 女人抽搐喷水高潮国产精品| 欧美影院一区二区三区| 福利在线一区二区| av大片在线看| 99国产精品久| 91中文字幕在线| 国产一级淫片a视频免费观看| 正在播放日韩欧美一页| 精品亚洲国产视频| 无码人妻一区二区三区一| 草民电影神马电影一区二区| 亚洲成人一二三| 黄瓜视频免费观看在线观看www| 无码国产精品高潮久久99| 激情五月激情综合网| 国产97色在线| 国产午夜精品无码| 亚洲五月综合| 中文字幕日韩在线观看| 五级黄高潮片90分钟视频| 榴莲视频成人app| 欧美日韩在线不卡| 黄色a级片免费| rebdb初裸写真在线观看| 亚洲色图视频免费播放| 亚洲精品中文综合第一页| 青青国产在线| 91一区二区三区在线观看| 444亚洲人体| 国产乱码一区二区| 久久97超碰色| 国产美女扒开尿口久久久| 4438国产精品一区二区| 亚洲国产婷婷| 97精品国产97久久久久久免费| 久久久久噜噜噜亚洲熟女综合| 国产精品久久久久久| 色妞色视频一区二区三区四区| 国产免费一区二区三区网站免费| 神马日本精品| 亚洲精品一区二区三区不| 中文字字幕码一二三区| 天海翼精品一区二区三区| 日韩电影大片中文字幕| 黄色免费看视频| 全国精品免费看| 亚洲精品电影久久久| 小毛片在线观看| 欧美黄色录像| 亚洲欧美综合精品久久成人| 国产ts在线播放| 欧美在线观看视频一区| 夜夜嗨av一区二区三区四区 | 欧美女同在线观看| 免费视频成人| 日韩一区二区三区视频在线 | 久久蜜桃香蕉精品一区二区三区| 精品国产乱码久久久久久久软件 | 777久久精品| 精品国产成人系列| 国产精品国产一区二区| av男人天堂av| 成人做爰69片免费看网站| 国产高清自拍一区| 欧美性孕妇孕交| 国产嫩草影院久久久久| 一区二区不卡在线视频 午夜欧美不卡' | 日韩和欧美一区二区| 国产精品视频公开费视频| 国产精品毛片一区视频播| 成人免费高清在线| 欧美午夜免费| 福利在线视频网站| 香蕉成人伊视频在线观看| 黄色一级二级三级| 57pao成人永久免费| 亚洲成人精品久久| x88av在线| 欧美日本在线| 国产97色在线| 成人av免费播放| 国产亚洲制服色| 亚洲成人动漫在线| 涩涩涩在线视频| 欧美精品国产精品| 精品中文字幕在线播放| 久久影院100000精品| 欧美黑人视频一区| 午夜一区二区三区四区| 国产麻豆成人传媒免费观看| 精品一区久久| av观看在线| 色88888久久久久久影院按摩 | 无码人妻精品一区二区三区蜜桃91 | 国产91网红主播在线观看| 精品乱子伦一区二区| 久久久精品人体av艺术| 草草草视频在线观看| www成人在线视频| 精品国产欧美一区二区| 性爱在线免费视频| 宅男噜噜噜66国产日韩在线观看| 国产欧美精品日韩精品| 香蕉视频黄色片| 一区二区三区四区中文字幕| 国产xxxxx视频| 懂色av一区二区| 久久精品最新地址| 香蕉污视频在线观看| 成人精品一区二区三区中文字幕| 一区二区在线高清视频| 手机看片久久| 亚洲精品乱码久久久久久按摩观| 黄色在线观看免费| 精品一区二区三区影院在线午夜| 免费在线观看91| 日本黄色免费在线| 亚洲精品在线免费播放| 亚洲色图综合区| 精品中文字幕一区二区| 翔田千里亚洲一二三区| 欧美日韩视频网站| 日韩精品在线观看一区| 国产一卡二卡在线播放| 国产精品888| 精品国产无码在线| 久久三级毛片| 中文综合在线观看| 一区二区三区免费观看视频| 国产清纯美女被跳蛋高潮一区二区久久w | 亚洲国产精品久| 韩国一区二区视频| 综合久久国产| 成人乱码手机视频| 欧美成人精品激情在线观看 | 亚洲国产中文字幕久久网 | 91精品国产调教在线观看| 国产精品久久久久久超碰 | 香蕉一区二区| 欧美与欧洲交xxxx免费观看| 亚洲区小说区图片区| 偷偷要91色婷婷| 中文在线永久免费观看| 一区二区国产精品| 老牛影视免费一区二区| 欧洲av不卡| 国产一区二区三区三区在线观看 | 九九九在线视频| 成人免费精品视频| 日韩av三级在线| 国产精选一区| 国产欧洲精品视频| 99在线视频观看| 精品国一区二区三区| 国产一级中文字幕| 久久蜜桃一区二区| 一路向西2在线观看| 91综合在线| 成人av播放| 三妻四妾的电影电视剧在线观看 | 成人欧美一区二区三区黑人免费| 国产丝袜在线观看视频| 日韩精品在线观看视频| 中文字幕免费视频观看| 1024精品合集| 女同性恋一区二区三区| 水野朝阳av一区二区三区| 一区在线电影| 粉嫩的18在线观看极品精品| 日本久久亚洲电影| 黄色网在线免费观看| 精品国产伦一区二区三区观看方式| 日本少妇毛茸茸高潮| 久久精品综合网| 欧美专区第二页| 国产精品日韩| 中文字幕人成一区| 欧美日韩大片免费观看| 国产色视频一区| f2c人成在线观看免费视频| 国产一区二区日韩| 性生活视频软件| 91精品办公室少妇高潮对白| 精品国产视频在线观看| 久久久久久久一区| 欧美日韩理论片| 久久久久久网| 欧美一级爱爱视频| 菠萝蜜一区二区| 国产日韩三区| 日本亚州欧洲精品不卡| 国产精品成人v| 黄视频网站在线观看| 在线丨暗呦小u女国产精品| 高h放荡受浪受bl| 精品视频在线免费| 日本视频免费在线| 亚洲视频小说图片| 老头老太做爰xxx视频| 99久久久精品| 亚洲熟妇一区二区| 蜜桃一区二区三区在线观看| 日本网站免费在线观看| 欧美影院一区| 自拍偷拍一区二区三区| 精品99在线| 精品国产免费人成电影在线观...| 2019中文亚洲字幕| 国产精品91久久久| 亚洲精品动漫| 午夜精品视频在线| av免费在线免费| 日韩三级成人av网| av大片在线看| 夜夜躁日日躁狠狠久久88av| 午夜视频免费看| 日韩欧美国产系列| 国产av精国产传媒| 制服丝袜亚洲色图| 国产又粗又猛又爽又黄视频| 欧美午夜寂寞影院| 日本视频免费观看| 欧美性猛交xxxx乱大交3| 日本少妇激情视频| 亚洲1区2区3区4区| 日韩欧美三级在线观看| 亚洲午夜在线观看视频在线| 手机在线免费看片| 亚洲人成亚洲人成在线观看图片| www.日本高清视频| 欧美国产日韩亚洲一区| 波多野结衣av在线观看| 久久亚洲综合av| 国产精品久久AV无码| 成人aaaa免费全部观看| 男男一级淫片免费播放| 不卡的av网站| 午夜久久久久久久| 91丨九色丨黑人外教| 国产三级视频网站| 久久亚洲二区三区| 手机看片福利视频| 国产精品三级久久久久三级| 亚洲一级理论片| 中文字幕一区免费在线观看| 国产高潮流白浆| 一区二区三区在线视频播放 | 亚洲国产美女 | 国产麻豆精品95视频| 自拍偷拍激情视频| 99久久精品国产观看| 国产熟妇久久777777| 日本一二三不卡| 免费成人深夜夜行网站| 亚洲精品国产无套在线观| 久久伊人成人网| 精品福利免费观看| 亚洲成人av网址| 777久久久精品| 黑人精品一区二区三区| 日韩电影免费观看中文字幕| 国产主播福利在线| 日韩专区中文字幕| 超黄网站在线观看| 国产成人一区二区三区| 伊人久久大香| 国内成+人亚洲| 青青草国产免费一区二区下载 | 99视频网站| 亚洲小说图片| 五月天综合婷婷| 国产欧美91| 91国内在线播放| 99久久国产综合精品色伊| 成人18视频免费69| 亚洲丰满少妇videoshd| 波多野结衣一本一道| 欧美一二区视频| 酒色婷婷桃色成人免费av网| 久久精品中文字幕电影| 成人福利av| 91在线观看网站| 伊人成综合网yiren22| 亚洲一区 在线播放| 另类国产ts人妖高潮视频| 在线视频观看91| 久久久久久免费| 久久久一区二区三区四区| 欧美在线影院一区二区| 二区三区在线视频| 久久精品人人做人人爽| 波多野结衣亚洲| 成人三级在线| 日韩在线观看| 成人在线免费在线观看| 国产成人午夜99999| 日本人亚洲人jjzzjjz| 亚洲不卡在线观看| 国产熟女一区二区丰满| 国产一区二区三区视频| 中文不卡1区2区3区| 97人人澡人人爽| 91日韩在线| 欧在线一二三四区| www.欧美日韩国产在线| 久久久久久久久毛片| 欧美三级日韩在线| 欧美日韩伦理片| 性色av香蕉一区二区| 日韩成人在线观看视频| 在线一区日本视频| 香蕉视频成人在线观看| 久久精品女同亚洲女同13| 亚洲精品伦理在线| 国产精品久久久久久久久久久久久久久久久久 | 久久久99免费| 天天操天天干视频| 日韩欧美国产wwwww| 精品国产丝袜高跟鞋| 国产精品一区二区三区免费视频| 亚洲女娇小黑人粗硬| 玩弄中年熟妇正在播放| 成人动漫精品一区二区| 久久黄色小视频| 精品日本一线二线三线不卡| 国产写真视频在线观看| 成人激情视频在线观看| 国产精品成人a在线观看| 亚洲最大天堂网| 国产精品青草综合久久久久99| 波多野结衣一二区| 一区二区三区国产在线观看| 日韩免费va| 丝袜足脚交91精品| 日本欧美一区二区三区| 亚洲天堂最新地址| 6080yy午夜一二三区久久| 超碰免费公开在线| 99久久精品无码一区二区毛片| 欧美1区视频| 日韩大尺度视频| 亚洲线精品一区二区三区八戒| 成人毛片视频免费看| 国模精品系列视频| 一呦二呦三呦国产精品| 色多多视频在线播放| 国产精品国产馆在线真实露脸| 在线观看日批视频| 久久这里有精品| 在线视频亚洲欧美中文| 国产中文字幕二区| 久久久久久久久久久黄色| 中文字幕 欧美激情| 久久精品国产免费观看| 天堂av一区| 免费在线激情视频| 国产精品视频第一区| 国产人妻精品一区二区三区| 高清在线视频日韩欧美| 女厕嘘嘘一区二区在线播放| 三上悠亚av一区二区三区| 亚洲精品国久久99热| 亚洲欧美日韩免费| 成人免费看片视频| 在线不卡亚洲| 欧洲性xxxx| 亚洲精品一区二区三区福利 | 快射av在线播放一区| 国产91视觉| 日精品一区二区三区| 日韩一级片大全| 亚洲精品福利在线观看| 国产综合色激情| 黄色a级片免费看| 国产亚洲一区字幕| www国产一区| 国产经典一区二区| 欧美破处大片在线视频| 国精品无码人妻一区二区三区| 欧美日本一区二区三区四区| 91九色国产在线播放| 天堂√在线观看一区二区| 国产高清在线观看免费不卡| 影音先锋在线国产| 欧美日韩国产色综合一二三四| 美媛馆国产精品一区二区| 国产在线视频精品一区| 国产精品久久久久久人| 欧美日本亚洲视频| 久久中文视频|