精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型步入「推理Scaling」時代,SambaNova如何挑戰英偉達的霸主地位?

人工智能 新聞
在深度學習引發的第三次人工智能浪潮中,算力對人工智能發展的決定作用已成共識。一系列極具影響力的 AI 研究,如 AlexNet、ResNet 和 Transformer 都是在 GPU 上實現和評估的,這也讓英偉達十年來始終處于 AI 硬件市場的主導地位。

OpenAI o1 的發布,再次給 AI 領域帶來了一場地震。

o1 能像人類一樣「思考」復雜問題,擁有優秀的通用推理能力。在未經專門訓練的情況下,o1 能夠直接拿下數學奧賽金牌,甚至能在博士級別的科學問答環節上超越人類專家。

在性能躍升之外,更重要的是,它揭示了大模型進化范式的轉變:通過更多的強化學習(訓練時計算)和更多的推理(Test-Time 計算),模型可以獲得更強大的性能。

這又一次讓我們想起 Richard Sutton 在《The Bitter Lesson》中所說的,利用計算能力的一般方法最終是最有效的方法。這類方法會隨著算力的增加而繼續擴展,搜索和學習似乎正是兩種以此方式隨意擴展的方法。連山姆?奧特曼也坦言,在未來的一段時間里,新范式進化的曲線會非常陡峭。

從「訓練 Scaling」到「推理 Scaling」的范式轉變,也引發了關于計算資源分配和硬件選擇的重新思考。

圖片

領域內的研究者和從業者認識到,一方面,更多的計算資源應該投入到推理階段,另一方面,優化硬件配置以提升大模型推理的效率將是下一階段的攻關重點。而大模型要進行推理 Scaling,實際上比訓練 Scaling 對芯片并行處理能力的要求更高。

GPU 最初設計用于圖形渲染,由于其并行處理能力,過去數年一直是以海量數據集訓練大模型的熱門選擇。雖然 GPU 非常適合實現神經網絡的訓練工作,但在全新的范式下,由于其在延遲、功耗等方面表現不佳, 并不是進行大規模推理的最好選擇。

在 GPU 之外,什么是大模型推理的更好選擇?現在的 AI 芯片有各種流派:ASIC、FPGA、DSP、Neuromorphic Chip,以及大量 DSA (Domain-specific architectures)芯片。其中,以 SambaNova RDU(Reconfigurable Dataflow Unit)為代表的動態可重構數據流(Dataflow)架構的芯片,能夠通過并行處理和高效數據移動來優化性能和效率,近年越來越被認為是一個重要的發展方向。

數倍于 GPU 推理性能

來自 SambaNova 最新一代 RDU SN40L

近日的芯片盛會 Hot Chips 上,圍繞大模型的議題比以往任何一屆都更加活躍。SambaNova 的最新一代 RDU 產品 SN40L 也在這場大會上引發持續討論。大家也充分了解到,Sambanova 如何實現大模型的快速推理以及提供 GPU 之外的更優方案。

我們知道,大模型在推理時會逐步生成輸出序列的 Token,每生成每一個 token 都會需要把模型的參數從 HBM(High Bandwidth Memory)搬運到片上進行計算。對于利用 HBM 來推理的芯片來說,HBM 的利用率是推理速度的關鍵,越快從內存中訪問數據,就越能縮短處理時間。

SambaNova 的 RDU 既有 GPU 10 倍以上的片上分布 SRAM,也有適用于需要快速數據傳輸的大規模計算任務的 HBM。其架構可以自動做到極致的算子融合,達到 90% 以上的 HBM 利用率,使得 RDU 對 GPU 有了 2-4 倍的性能優勢。

當前的 AI 推理平臺中,SambaNova 是唯一能在 Llama 3.1 405B 上提供每秒超過 100 個 Token 推理速度的平臺。

圖片

如下圖所示,每個框都是一個算子。一般來說,多個算子會同時運行,并將數據保存在芯片上以重復使用。但在 RDU 中,整個解碼器是一個 Kernel 調用。

圖片

這意味著調用開銷會顯著減少,芯片對數據進行有效工作的時間則增加了。

圖片

另外一方面,極致的算子融合使 RDU 能夠達到類似 GPU 的批處理能力。GPU 有很好的批處理能力(比如從 BS1 到 BS16),可將吞吐量提高 12 到 15 倍。比如在上圖中,當 decoder0 在進行批處理運算時,可以同時從 HBM 讀取 decoder1 的參數。

圖片

SambaNova 的研究者觀察到,SN40L 在 Llama 3.1 70B 上可以實現較好的吞吐量 Scaling。

為什么業內普遍看好數據流架構?

SN40L 讓我們重新認識了 SambaNova RDU 相對于主流 GPU 的速度優勢,而數據流架構的價值也在被越來越多的從業者重新發現。

與 GPU 本質上不同的是,數據流架構通過數據流動來驅動計算過程,而非常規指令流動。在該架構中,程序被表示為一個 Dataflow Graph,其中節點代表計算操作,邊代表數據依賴關系。每個節點在其所有輸入數據準備好后立即執行,并將結果傳遞給下游節點。這種架構天然支持并行處理,多個獨立的計算操作可以同時執行,從而顯著提高了計算性能。

從下圖可以看到,SambaNova RDU 的片上空間數據流可以做自動的算子融合 (kernel fusion),與 GPU 的傳統 kernel-by-kernel 運行相比,明顯消除了大量的內存流量和開銷。

圖片

圖片

近年來,GPU 廠商明顯意識到非 Dataflow 架構的短板,并為 GPU 部分引入一些 Dataflow 的功能。例如,從 H100 開始,GPU 開始加入分布式共享內存(Distributed Shared Memory) ,也加入了新的張量內存加速器 (Tensor Memory Accelerator) 單元,使其某種程度上模仿了片上空間流水線運行的「范式」。

但這種程度的改動遠遠不夠,GPU 追趕的速度恐怕已經跟不上 AI 領域推理需求的暴漲。畢竟 GPU 最初不是專門為 AI 而設計的,廠商們很難在不影響主營業務的情況下對基本架構做完全的重新設計,即使增加了上述的「修補」工作,也無法完全采用高效的數據流架構,這從根本上限制了 GPU 推理的提速。

當前的幾家主流 AI 芯片 Startup,都選擇了數據流架構。其中來自 SambaNova 的 RDU 展現出了獨特優勢,也被視為 GPU 的最有力競爭者 。與英偉達相比,Sambanova 最新 Llama 3.1 模型上生成 token 的性能快了 10 倍以上,并且通過 cloud.sambanova.ai 公開供開發人員使用。

圖片

RDU 能夠實現更快的推理速率,更利于大模型的部署。連人工智能專家吳恩達也驚嘆 SambaNova 的推理速率: 

圖片

從最基礎的成本上說,由于 Sambanova 的數據流架構 RDU 不僅擁有大的片上 SRAM,同時擁有 HBM 層面的優勢,相比于其他的幾個單純依靠片上 SRAM 的數據流企業,用戶需要支持大型語言模型的基礎設施更少。例如,想在 Llama 70B 上推理,對于有些 AI 芯片來說需要五百多個芯片,或者相當于三百多個芯片的 4 個 wafer ,而 SambaNova 只需要 擁有 16 個芯片的 1 個機架。(https://sambanova.ai/blog/sn40l-chip-best-inference-solution)

圖片

更進一步說,RDU 所帶來推理速度提升的意義不只是體現在效率上,更能體現在質量上,也體現對 AGI 探索的加速上。

基于 OpenAI o1 帶來的推理 Scaling Law 的啟發,人們意識到,在推理端,更多的算力同樣會帶來更強的智能。因為在同一時間單位內,推理速度越快,就能實現越復雜的推理,就能解鎖越多復雜任務,大模型應用的天花板就越高。

這意味著,如果我們想更快實現 AGI,我們本質上最需要建設足夠的基礎設施并持續降低計算成本。與此同時,計算資源還要更多地向推理側增加。但在目前的條件下,算力往往是大模型廠商們拓展技術上限的頭道難關,即使對于實力雄厚的玩家們也一樣。

OpenAI 在發布 o1 時似乎就遇到了這個問題。機器學習研究員 Nathan Lambert 在博客《逆向工程  OpenAI 的 o1》中寫到,在已發布的基準測試分數和曲線圖中,o1 preview 并非是能力最強的,但 OpenAI 并未立即發布最強版本的 o1 (詳情見下圖),原因是「最強配置」過于昂貴,他們沒有對應的基礎設施支持大規模的部署。

圖片

但推理算力需求并非天塹不可跨越。在 o1 發布后不久,SambaNova 便在 Hugging Face 上發布了 Llama 3.1 Instruct-O1 演示 。這個項目由 SambaNova 的 SN40L RDU 提供算力支持,用戶可與 LLama 3.1 405B-instruct 模型進行實時對話,體驗風馳電掣般類 o1 的推理過程。

項目地址:https://huggingface.co/spaces/sambanovasystems/Llama3.1-Instruct-O1

這意味著,在強大算力的支持下,開源大模型推理能力會不斷提升,復現完整 o1 甚至觸達更高級的智能是指日可待的。

一個新的時代正在開啟,當大模型 Scaling Law 的重心從預訓練向后訓練和推理側轉移,廠商們在算力層面的分配與設計也會更深刻影響大模型領域的競爭格局。而對于 SambaNova 或其他以提供算力和計算基礎設施見長的公司來說,接下來會迎來前所未有的機遇。

英偉達的挑戰者

在 AI 芯片賽道的諸多初創公司中,SambaNova 是目前估值最高的一家獨角獸。

SambaNova 成立于 2017 年,擁有三位資深的聯合創始人:Rodrigo Liang、Kunle Olukotun、Christopher Ré。CEO Rodrigo Liang 畢業于斯坦福大學,在創立 SambaNova 之前,Rodrigo 領導了甲骨文和 Sun Microsystems 的工程團隊,負責 SPARC 處理器和 ASIC 的開發。Kunle Olukotun 和 Christopher Ré 都來自斯坦福大學。

圖片

從左到右分別為 Kunle Olukotun、Rodrigo Liang、Christopher Ré。

此外,被譽為「芯片風險投資教父」的陳立武,自創立之初便作為創始投資人和董事會主席加入 SambaNova,并于 2024 年 5 月出任執行主席,以加速和擴大公司的發展。自 1987 年創立華登國際(Walden International)以來,陳立武投資了許多公司(包括 SambaNova),在推動半導體創新和發展方面發揮了重要作用。

圖片

在深度學習引發的第三次人工智能浪潮中,算力對人工智能發展的決定作用已成共識。一系列極具影響力的 AI 研究,如 AlexNet、ResNet 和 Transformer 都是在 GPU 上實現和評估的,這也讓英偉達十年來始終處于 AI 硬件市場的主導地位。

不過,時代可能真要變了。正如 Transformer 會迎來新的挑戰者,比如 Mamba;英偉達和 GPU 也會迎來下一階段的強勁競爭者,比如 SambaNova 的 RDU。

o1 發布之后,AI 推理市場正處于爆炸式增長的新起點。從 SambaNova 的 RDU 開始,人工智能領域可能正在翻開全新的一頁。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-28 13:20:18

2023-11-14 07:37:21

芯片英偉達

2025-06-04 13:56:06

英偉達訓練模型

2024-11-06 14:00:00

蘋果英偉達

2012-12-27 10:12:22

Google微軟Office

2012-11-12 10:01:35

2012-05-11 09:56:54

2025-07-30 09:05:00

2022-06-01 16:47:53

AI模型開源

2023-09-12 10:22:30

英偉達AI芯片

2024-11-04 09:07:00

2025-11-04 16:01:56

英偉達模型AI

2016-11-21 16:25:10

5G霸主中國

2025-02-21 13:20:00

2023-10-31 19:20:29

語言模型英偉達芯片

2025-05-30 15:52:05

訓練代碼推理

2024-11-12 13:07:44

2024-09-09 16:22:51

2025-04-07 09:45:00

點贊
收藏

51CTO技術棧公眾號

一区二区在线免费看| 欧美日本韩国在线| 欧美日韩成人免费观看| 欧美调教在线| 欧美视频三区在线播放| 裸体大乳女做爰69| 三级网站在线看| 亚洲综合社区| 伦理中文字幕亚洲| 特大黑人巨人吊xxxx| 色狠狠一区二区三区| 亚洲一区二区视频在线观看| 美女被啪啪一区二区| 国产日韩在线观看一区| 一本色道久久精品| 日韩中文av在线| 国产精品久久久免费观看| 日本免费成人| 一本高清dvd不卡在线观看| 中文字幕av导航| 青青久草在线| 国产九色精品成人porny| 欧美在线不卡区| 国产一二三区精品| 欧美最新另类人妖| 亚洲精品国精品久久99热一| 一道本在线免费视频| 色偷偷偷在线视频播放| 亚洲欧美日本在线| 午夜一区二区三区| 亚洲人成色777777精品音频| 国产乱码精品一区二区三区五月婷| 亚州国产精品久久久| www深夜成人a√在线| 国产精品欧美日韩一区| 日韩精品免费在线| 中文字幕一区二区三区人妻在线视频| 欧美a一级片| 91黄视频在线观看| 国产精品无码一区二区在线| 日本理论片午伦夜理片在线观看| 国产精品乱人伦中文| 免费h精品视频在线播放| 亚洲欧美另类视频| 国产精品自产自拍| 亚洲自拍中文字幕| 国产精品久久久久精| 男男成人高潮片免费网站| 国产成人精品免费视频| 久久一区二区三区视频| 亚洲日本免费| 韩国精品久久久999| 欧美黄色一区二区三区| 欧美成熟视频| 久久97久久97精品免视看| 国产又粗又硬又长又爽| 国产高清久久| 久久久av一区| 日韩女优一区二区| 欧美国产专区| 欧美激情videoshd| 精品少妇久久久| 一区在线视频| 97国产一区二区精品久久呦 | 国产精品欧美一级免费| 欧美日韩成人一区二区三区| 国内三级在线观看| 欧美国产一区二区在线观看| 午夜老司机精品| 免费在线观看av网站| 亚洲色图制服诱惑| 日韩a级黄色片| 99thz桃花论族在线播放| 激情懂色av一区av二区av| 黄色动漫在线免费看| 国产经典一区| 91精品国产综合久久精品性色| www.色.com| 狠狠一区二区三区| 精品亚洲夜色av98在线观看| 特级西西www444人体聚色| 98精品视频| 久久久久久久久久久国产| 久久青青草原亚洲av无码麻豆| 石原莉奈在线亚洲三区| 成人精品视频99在线观看免费| 国产日产亚洲系列最新| 91在线码无精品| 亚洲精品视频一二三| av在线导航| 欧美性xxxxx极品娇小| mm131国产精品| heyzo欧美激情| 亚洲免费中文字幕| 国产精品嫩草影院俄罗斯| 亚洲精品偷拍| 国产欧美 在线欧美| 国产18精品乱码免费看| 久久久久久亚洲综合| 日本a级片在线观看| 蜜桃麻豆影像在线观看| 欧美日本高清视频在线观看| 国产精品伦子伦| 国产精品91一区二区三区| 97超级碰碰人国产在线观看| 伊人免费在线观看| 91丨国产丨九色丨pron| 中文字幕中文字幕在线中心一区 | 无吗不卡中文字幕| 一区二区在线免费看| 日韩极品在线| 欧美高跟鞋交xxxxhd| 最新黄色网址在线观看| 不卡av在线免费观看| 在线免费观看成人| 韩国成人动漫| 亚洲国产精品推荐| ass极品国模人体欣赏| 亚洲综合国产| 国产98在线|日韩| 91精品人妻一区二区三区蜜桃2| 黄色一级免费视频| 日韩午夜激情| 91手机在线播放| 超碰免费97在线观看| 精品人伦一区二区三区蜜桃网站 | 成人激情黄色小说| 小说区视频区图片区| 精品视频在线一区二区在线| 亚洲国产97在线精品一区| 欧美黑人性猛交xxx| 免费看精品久久片| 欧美三级网色| 综合毛片免费视频| 亚洲精品成人久久| 久久久久久久国产精品毛片| 精品亚洲免费视频| 亚洲国产日韩欧美| 欧美黄色网页| 亚洲另类图片色| 在线观看免费国产视频| 国产在线一区二区| 一本二本三本亚洲码| 精品久久久网| 日韩在线视频导航| 亚洲视频在线观看一区二区 | 亚洲黄色在线看| 免费网站看av| 成人在线视频首页| 日韩av在线播放不卡| 亚洲综合网站| 欧美精品videosex性欧美| 亚洲精品国产片| 亚洲中国最大av网站| 麻豆免费在线观看视频| 狠色狠色综合久久| 国产欧美日韩一区二区三区| aa视频在线观看| 日韩激情视频在线| 欧美激情黑白配| 国产女同性恋一区二区| 黑森林精品导航| 91九色精品| 2019国产精品视频| 超碰99在线| 亚洲欧美一区二区三区在线| 男操女视频网站| 亚洲天堂免费看| 韩国一区二区三区四区| 中文精品视频| 日本视频一区二区不卡| 亚洲精品伦理| 欧美剧在线观看| 午夜在线视频观看| 欧美性受极品xxxx喷水| 日本爱爱小视频| 成人免费视频国产在线观看| 精品99在线视频| 久久国产亚洲| 国产精品久久国产精品| 亚洲成人不卡| 久久这里有精品| 午夜性色福利影院| 欧美高清视频www夜色资源网| 欧美成欧美va| 久久久久久久电影| 国产免费中文字幕| 99成人在线| 在线观看福利一区| 国产伦精品一区二区三区免费优势| 欧美专区在线观看| caopeng在线| 亚洲精品自在久久| 国产日韩欧美一区二区东京热| 婷婷六月综合网| 战狼4完整免费观看在线播放版| 国产成人综合在线| 黑森林福利视频导航| 综合天堂av久久久久久久| 快播亚洲色图| 精品视频在线观看网站| 国产成人一区三区| 欧美xxxx视频| 最近2019年手机中文字幕| 亚洲欧美另类一区| 制服丝袜激情欧洲亚洲| 黄色片中文字幕| 一区二区三区毛片| 五月天免费网站| 久久综合色播五月| 中文字幕一区二区三区人妻在线视频 | 欧美freesex8一10精品| 国产日韩欧美视频在线| 最新欧美色图| 欧美日本亚洲视频| 网友自拍视频在线| 亚洲系列中文字幕| 日韩偷拍自拍| 亚洲第一色中文字幕| 精品国产一级片| 欧美日韩激情一区二区| 久久精品视频2| 偷拍与自拍一区| 加勒比av在线播放| 亚洲人成7777| www中文在线| 国产欧美一区二区在线| 黑人巨大精品欧美| 9人人澡人人爽人人精品| 国产人妻精品午夜福利免费| 久久99在线观看| 国产精品一区二区小说| 日日摸夜夜添夜夜添国产精品| 又粗又黑又大的吊av| 欧美区国产区| 日本久久高清视频| 国产精品久久久久久久久妇女| 日韩影片在线播放| 蜜桃一区二区三区| 麻豆精品视频| 精品影片在线观看的网站| 韩日午夜在线资源一区二区| 波多野结衣在线一区二区| 99c视频在线| jazzjazz国产精品久久| av激情久久| 精品欧美午夜寂寞影院| 国产精品久久国产三级国电话系列 | 国产精品一区二区三区精品| 亚洲综合网狠久久| 国产麻豆乱码精品一区二区三区| 成人激情自拍| 国产精品毛片一区视频| 高清日韩中文字幕| 久久精品一二三区| 亚洲都市激情| 欧美重口乱码一区二区| 国产一区二区三区天码| 水蜜桃一区二区| 91综合久久一区二区| 熟女熟妇伦久久影院毛片一区二区| 一区二区中文| 欧美人成在线观看| 亚洲综合激情| 日韩一级片播放| 美腿丝袜亚洲一区| 一卡二卡三卡四卡五卡| 成人av电影免费在线播放| 国产高清自拍视频| 久久久高清一区二区三区| 天天舔天天操天天干| 中文字幕日韩av资源站| 久久久久久欧美精品se一二三四 | 在线观看国产区| 欧美嫩在线观看| 国模无码一区二区三区| 亚洲欧美日韩成人| 黄视频在线观看网站| 欧美激情亚洲国产| 日韩av中字| 91天堂在线观看| 欧美大片网址| 亚洲日本理论电影| 欧美三级特黄| 日本va中文字幕| 国产成人精品免费一区二区| 国产手机在线观看| 亚洲三级在线播放| 黑人一级大毛片| 欧美一区二区视频在线观看2022 | 精品国产欧美一区二区五十路| 日本伦理一区二区| 国产精品夫妻激情| 一区二区三区在线免费看| 日本免费高清一区| 欧美亚韩一区| 看欧美ab黄色大片视频免费| 国产老肥熟一区二区三区| 久久精品视频18| 一区2区3区在线看| 国产真人无遮挡作爱免费视频| 欧美一区二区三区视频在线| 欧美挠脚心网站| 欧美国产精品人人做人人爱| 日韩不卡免费高清视频| 国产精品sss| 日韩免费久久| 国产麻花豆剧传媒精品mv在线| 国产一区二区不卡老阿姨| 亚洲a v网站| 亚洲第一成年网| 国产乱人乱偷精品视频| 亚洲欧洲午夜一线一品| 丁香花在线观看完整版电影| 91精品久久久久久久久久入口| 天海翼精品一区二区三区| 看一级黄色录像| 麻豆精品一区二区三区| 国产三级国产精品| 亚洲国产中文字幕| 国产精品永久久久久久久久久| 日韩精品久久久久久福利| 超碰在线最新网址| 5g国产欧美日韩视频| 欧美疯狂party性派对| 久章草在线视频| caoporn国产一区二区| 欧美成人精品一区二区免费看片| 欧美在线免费视屏| 中文字幕美女视频| 欧美调教网站| 一本久久a久久精品亚洲| 久草免费在线观看视频| 欧美精品丝袜中出| 二区三区在线| 欧美专区国产专区| 日韩高清三区| 狠狠爱免费视频| 91丨九色porny丨蝌蚪| 亚洲男人的天堂在线视频| 亚洲激情 国产| 国产h片在线观看| 国产伦精品一区二区三区视频黑人| 午夜欧美理论片| 亚洲av午夜精品一区二区三区| 一区二区三区在线观看欧美| 99在线观看精品视频| 久久国产精品久久精品| 久久伊人影院| 天天做天天躁天天躁| 成人亚洲精品久久久久软件| 久久婷婷一区二区| 亚洲成av人乱码色午夜| 成人国产电影在线观看| 九色视频成人porny| 久久aⅴ国产紧身牛仔裤| 成年人免费观看视频网站| 欧美日韩在线免费| 国产区视频在线| 成人a在线视频| 国内成人在线| 亚洲av成人片色在线观看高潮| 色综合咪咪久久| 成人免费在线电影| 亚洲伊人第一页| 日韩亚洲在线| 波多野在线播放| 这里只有精品免费| 美女精品导航| 欧美极品一区二区| 美女在线观看视频一区二区| 免费三级在线观看| 亚洲成人激情在线观看| 性欧美hd调教| 欧美美女黄色网| 91丨porny丨蝌蚪视频| 中文字幕在线观看国产| 欧美猛交ⅹxxx乱大交视频| 人妖一区二区三区| 中文字幕亚洲欧洲| 午夜精品久久久久久不卡8050| 黄色网址在线播放| 91在线观看免费高清| 一本色道久久| 亚洲一级生活片| 日韩精品高清视频| 韩国三级大全久久网站| 午夜肉伦伦影院| 亚洲美女区一区| 欧美孕妇孕交| 91久久精品国产91久久性色tv | 日韩中文在线中文网三级| 亚洲精品影片| 黄色一级二级三级| 亚洲一卡二卡三卡四卡无卡久久 | 久久国产精彩视频| 美女毛片一区二区三区四区| 三大队在线观看| 欧美性受xxxx| 1024在线看片你懂得|