精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

并行革命,32倍吞吐量躍升!英偉達(dá)Helix架構(gòu)突破百萬Token推理瓶頸

人工智能 新聞
長期以來,大模型受限于有限的上下文窗口,在處理長任務(wù)或?qū)υ挄r(shí)不得不忘記早期信息,英偉達(dá)近日推出的Helix并行技術(shù)受DNA結(jié)構(gòu)啟發(fā),分割顯存和處理任務(wù),顯著提升大模型的上下文長度,并發(fā)能力,并可降低響應(yīng)延遲。

想象一個(gè)使用大模型的任務(wù),需要一次處理百萬字符的文檔,例如從百科全書中獲取信息,或是分析數(shù)百頁的法律卷宗,異或追蹤持續(xù)數(shù)月的對(duì)話記錄,都需要越來越長的上下文。

而大模型生成的每個(gè)詞都需要掃描存儲(chǔ)在所謂的KV緩存中存儲(chǔ)的過去標(biāo)記。

反復(fù)讀取這個(gè)緩存會(huì)消耗GPU內(nèi)存帶寬。大模型還需要從內(nèi)存中重新加載大量的前饋網(wǎng)絡(luò)(FFN)權(quán)重來處理每個(gè)新詞。

這個(gè)過程會(huì)減慢效應(yīng)速度,從而導(dǎo)致用戶與大模型對(duì)話時(shí)出現(xiàn)卡頓。

傳統(tǒng)的解決方案,是使用張量并行(Tensor Parallelism, TP)將此負(fù)載分散到多個(gè)GPU上。但這僅能起到一定作用。

當(dāng)規(guī)模超過一定限度后,GPU開始復(fù)制KV緩存,導(dǎo)致內(nèi)存壓力進(jìn)一步增大。

而Helix這一英偉達(dá)針對(duì)其最新的Blackwall開發(fā)的并行策略,通過將模型Transformer層的注意力機(jī)制和前饋網(wǎng)絡(luò)部分分開處理來解決卡頓問題。

Helix受DNA雙螺旋結(jié)構(gòu)的啟發(fā),Helix將KV、張量和專家等多個(gè)維度的并行性交織到一個(gè)統(tǒng)一的執(zhí)行循環(huán)中。

每個(gè)階段在其自身的瓶頸配置下運(yùn)行,同時(shí)復(fù)用相同的GPU池。

圖片

論文鏈接:https://d1qx31qr3h6wln.cloudfront.net/publications/Helix_0.pdf

Helix是怎么做到百萬上下文不卡頓

在注意力階段,Helix使用一種名為KV并行(KVP)的新方法,將龐大的KV緩存分散到多個(gè)GPU上。

當(dāng)TP超過KV頭的數(shù)量時(shí),張量并行會(huì)進(jìn)行復(fù)制,從而增加了內(nèi)存和帶寬開銷,如圖1a到c描述的過程。

Helix通過將TP=2與KVP=2相結(jié)合,形成2D布局來避免內(nèi)存和帶寬開銷的增加,對(duì)應(yīng)圖1d。

圖片

圖1:傳統(tǒng)的張量并行(TP)與Helix的不同注意力分片策略KVP的對(duì)比示意圖

同時(shí),由于KVP GPU持有與其本地KV頭相關(guān)聯(lián)的所有查詢頭,并冗余地計(jì)算QKV投影。

這使得每個(gè)KV分片能夠進(jìn)行完全本地的FlashAttention,確保了模型的推理精度。

之后KVP GPU之間沿著查詢頭維度進(jìn)行單對(duì)單的全連接通信,通信的成本和KV緩存的大小無關(guān),因此大模型的上下文長度即使擴(kuò)展到百萬token,也不會(huì)影響查詢效率。

此外,Helix還通過重疊通信和計(jì)算,一旦計(jì)算出一個(gè)token的注意力輸出,Helix就會(huì)啟動(dòng)該token的全對(duì)全交換,同時(shí)計(jì)算下一個(gè)token的注意力。

這種緊密的重疊將通信延遲隱藏在有用的工作之后,保持GPU利用率高,并進(jìn)一步加速實(shí)時(shí)解碼。

圖2中上圖的八個(gè)請(qǐng)求會(huì)同步執(zhí)行注意力計(jì)算。隨后進(jìn)行順序的全對(duì)全通信。

圖2表底部對(duì)應(yīng)使用HOP-B時(shí),一個(gè)請(qǐng)求的通信與下一個(gè)請(qǐng)求的計(jì)算重疊,通過細(xì)粒度流水線減少了token間的延遲。

圖片

圖2:Helix通過細(xì)粒度流水線技術(shù)加速大模型的響應(yīng)

引入Helix帶來的高并發(fā)和低延遲

根據(jù)英偉達(dá)官網(wǎng)給出的計(jì)算,使用DeepSeek-R1 671B模型,在給定延遲下,當(dāng)并發(fā)的用戶數(shù)增大時(shí),Helix相比傳統(tǒng)方法體現(xiàn)出優(yōu)勢。

而到了圖中第一個(gè)箭頭標(biāo)注的點(diǎn)時(shí),其單GPU產(chǎn)出的token數(shù)是傳統(tǒng)方法的32倍,這意味著可以將并發(fā)用戶數(shù)量提高高達(dá)32倍。

圖片

圖3:使用100萬上下文長度的DeepSeek-R1,評(píng)估使用經(jīng)過最新NVIDIA GB200 NVL72(Blackwell)在固定延遲下的并發(fā)能力

在低并發(fā)設(shè)置下,Helix可以通過減token與token間的最低延遲時(shí)間,來提高用戶交互體驗(yàn),如圖3右下方的對(duì)比所示。

該研究的參與者St-Maurice指出「Helix正在重塑我們處理LLM交互和設(shè)計(jì)的方式?!?/span>

他指出,Helix并行處理和優(yōu)化的KV緩存分片正在為大模型提供可擴(kuò)展的顯存外掛,這與開發(fā)者改進(jìn)舊處理器(如奔騰)的方式高度相似。

該技術(shù)能允許大模型應(yīng)用擴(kuò)展其用戶規(guī)模的同時(shí),保證其快速響應(yīng)。

對(duì)于虛擬助手、法律機(jī)器人以及AI Copolit等應(yīng)用,Helix的引入可以做到既處理大量工作負(fù)載,同時(shí)還保持低延遲響應(yīng)能力。

Helix是否為畫靶射箭的爭論

對(duì)于這項(xiàng)技術(shù)突破,西北人工智能咨詢公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Wyatt Mayham表示:「英偉達(dá)的數(shù)百萬個(gè)token的上下文窗口是一項(xiàng)令人印象深刻的工程里程碑,但對(duì)于大多數(shù)公司來說,它是一個(gè)尋找問題的解決方案,它解決了現(xiàn)有模型如長上下文推理和二次擴(kuò)展等真實(shí)限制,但技術(shù)可能性和實(shí)際實(shí)用性之間存在差距?!?/span>

Mayham承認(rèn)Helix在特定領(lǐng)域中很有用,例如需要完整文檔保真度的合規(guī)性強(qiáng)的行業(yè),或醫(yī)療系統(tǒng)一次性分析患者終身病史。

但這只是部分特例,大多數(shù)組織最好是構(gòu)建更智能的流水線,而不是購買helix所需的Blackwell架構(gòu)下的GB200機(jī)架。

且通常情況下,檢索增強(qiáng)生成(RAG)系統(tǒng)能夠在百萬個(gè)token的范圍內(nèi),表現(xiàn)的比將上下文長度提升到100k更好。

而Info-Tech研究集團(tuán)技術(shù)顧問Justin St-Maurice則指出:在當(dāng)今世界,為人類生成百科全書大小的回答并不是勝利。

相反,關(guān)鍵在于使大模型的輸出對(duì)其他人工智能相關(guān)且可用。

這種能力可能成為未來智能體進(jìn)步的推手。

有了當(dāng)大模型的輸出能具有對(duì)應(yīng)的認(rèn)知框架,智能體可以保持更豐富的內(nèi)部狀態(tài),參與更復(fù)雜、更長時(shí)間的聊天,并執(zhí)行更深入文檔分析。

St-Maurice指出:Helix帶來的長上下文窗口,能夠支持context engineer(上下文工程)在龐大的上下文窗口中管理和優(yōu)化信息,以最大限度地提高智能體的有效性和可靠性。

憑借在擴(kuò)展的上下文窗口中處理和交換更大數(shù)據(jù)量的能力,AI智能體可以以以前不切實(shí)際的方式溝通和協(xié)作,從而改變多智能體應(yīng)用的設(shè)計(jì)框架。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-08-19 09:14:44

2012-09-11 09:35:42

Office 2013

2025-11-19 07:59:57

2025-02-27 09:09:45

2023-09-10 12:37:38

模型英偉達(dá)

2025-07-30 08:40:00

AI編程模型

2025-03-19 09:52:50

2025-03-20 09:00:00

2025-06-18 08:51:28

2025-04-09 10:40:32

2023-03-22 13:53:26

芯片英偉達(dá)

2022-12-23 09:49:42

算法開源

2009-03-04 17:44:47

域名

2025-05-09 02:00:00

代碼接口吞吐量

2024-11-08 13:36:09

2024-12-13 13:58:53

2024-05-23 16:41:40

2013-04-19 09:45:20

AMPLabHadoopHDFS

2025-06-05 03:00:00

Spring異步接口
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品福利av | 成人免费91在线看| 久久一二三四区| 亚洲小说图片视频| 欧美精品三级日韩久久| 欧美极品欧美精品欧美| 77777影视视频在线观看| 国产一区二区精品久久| 欧美影院在线播放| 欧美成欧美va| 国产一区二区三区四区大秀| 日韩一区二区免费在线电影| 18禁男女爽爽爽午夜网站免费| 米奇777四色精品人人爽| 91亚洲国产成人精品一区二三| 成人国产在线视频| 特级西西444www大精品视频免费看| 婷婷久久综合| 亚洲老司机av| 性活交片大全免费看| 国产极品一区| 一本大道av伊人久久综合| 潘金莲一级淫片aaaaa免费看| 免费福利在线观看| 粉嫩蜜臀av国产精品网站| 国产精品香蕉国产| 精品国产一区二区三区四| 国产一区亚洲| 精品国产一区二区三区久久| 最近中文字幕免费| 日韩福利视频一区| 成人小视频在线| 国产精品久久久久久久久久新婚 | 激情av一区二区| 黄频视频在线观看| 大胆av不用播放器在线播放| caoporn国产一区二区| 亚洲一区二区免费| 亚洲一区二区人妻| 日日摸夜夜添夜夜添国产精品| 97精品伊人久久久大香线蕉| 欧美交换国产一区内射| 天天影视综合| 波霸ol色综合久久| 在线观看黄网址| 日韩精品看片| 最近2019中文字幕第三页视频| 性欧美13一14内谢| 精品在线观看入口| 亚洲女在线观看| 欧美一区二区三区成人精品| 蜜桃成人av| 亚洲桃花岛网站| 中文字幕在线观看免费高清| blacked蜜桃精品一区| 亚洲视频综合网| 四虎影视1304t| 四虎成人av| 久久网福利资源网站| 日韩女优一区二区| 国产精品激情电影| 性欧美在线看片a免费观看| 日产欧产va高清| 国产视频一区免费看| 日韩美女免费视频| 日韩黄色片网站| 麻豆精品久久久| 91久久久久久久一区二区| 国产视频在线观看免费| 懂色av中文字幕一区二区三区| 高清免费日韩| 欧美孕妇孕交| 亚洲欧洲成人av每日更新| 国产精品88久久久久久妇女| 在线观看的网站你懂的| 亚洲成人av电影| 欧美牲交a欧美牲交aⅴ免费真| 黑人巨大精品欧美一区二区桃花岛| 色婷婷久久综合| 一级淫片在线观看| 国偷自产av一区二区三区| 亚洲老司机av| 91精品一区二区三区蜜桃| 国产综合自拍| 热久久美女精品天天吊色| 亚洲欧美日韩第一页| 天天做天天爱综合| 久久久亚洲影院你懂的| 99re这里只有精品在线| 黑人巨大精品欧美一区| 精品久久精品久久| 成年人在线看| 亚洲一区二区三区视频在线| 国产成人无码一二三区视频| 91精品网站在线观看| 日韩av网址在线观看| 国产视频不卡在线| 亚洲啪啪91| 成人免费激情视频| 日本免费不卡| 一区二区三区在线播放| 欧美日韩大尺度| 99久久香蕉| 色噜噜狠狠狠综合曰曰曰| 日韩精品一卡二卡| 国产在线精品一区在线观看麻豆| 久久久久网址| 日本一本在线免费福利| 欧美日韩二区三区| 欧美高清性xxxx| 午夜久久黄色| 国产欧美 在线欧美| 香蕉视频黄色片| 亚洲欧美日韩中文播放 | 午夜免费激情视频| 久久动漫亚洲| 韩国成人一区| 亚洲wwwww| 51精品秘密在线观看| 四虎永久免费在线观看| 亚洲精选久久| 99在线视频首页| 日本黄色片在线观看| 色婷婷av一区二区三区大白胸| 午夜视频在线观看国产| 在线看片不卡| 成人精品在线视频| 欧美日韩午夜爽爽| 在线观看福利片| 影视亚洲一区二区三区| 日韩av片电影专区| 午夜视频1000| 激情懂色av一区av二区av| 日本成人在线免费| 亚洲成人精选| 91麻豆桃色免费看| 日本电影全部在线观看网站视频| 在线观看欧美精品| 免费看黄色的视频| 天堂va蜜桃一区二区三区漫画版| 精品无人乱码一区二区三区的优势| 色呦呦呦在线观看| 日韩免费成人网| 九九九免费视频| 国产a级毛片一区| 国产视频在线观看网站| 99国产精品免费网站| 精品中文字幕在线观看| 国产成人精品一区二三区四区五区 | 亚洲狠狠丁香婷婷综合久久久| 四季av一区二区三区| 免费看污黄网站在线观看| 国产wwwxx| 精品人妻一区二区乱码| 天然素人一区二区视频| 亚洲男人天堂2023| av资源免费观看| 99久久夜色精品国产网站| 久久视频这里有精品| 久久久久高潮毛片免费全部播放| 久久久久久97| 三级视频在线| 欧美日韩国产大片| 午夜精品福利在线视频| 国产成人综合在线播放| 丝袜人妻一区二区三区| 亚洲精品蜜桃乱晃| 国产精品大片wwwwww| 中文日本在线观看| 这里只有精品视频在线观看| 91n在线视频| 国产成人综合亚洲网站| 欧美 日韩 国产 高清| 精品国产一区二区三区四区| 国产精品美女免费| www.在线视频| 亚洲精品720p| 中日韩在线观看视频| 亚洲私人影院在线观看| 日本三级日本三级日本三级极| 亚洲综合国产激情另类一区| 亚洲激情一区二区| 伊人精品综合| 日本亚洲欧美成人| 国产成人l区| 日韩精品视频在线| 国产永久免费视频| 亚洲成人高清在线| 奇米网一区二区| 成人免费视频caoporn| 无码日韩人妻精品久久蜜桃| 欧美永久精品| 欧美精品成人一区二区在线观看| 欧美综合影院| 欧美与黑人午夜性猛交久久久| 91大神在线网站| 亚洲韩国日本中文字幕| 这里只有久久精品视频| 一区二区高清视频在线观看| 日本人亚洲人jjzzjjz| 国产精品456露脸| 成人中文字幕av| 在线精品福利| 超级碰在线观看| 国产探花在线精品| 国产精品久久久久久久久婷婷| 台湾成人免费视频| 91国内在线视频| www久久日com| 中文字幕欧美国内| 神马久久精品| 国产午夜一区二区三区| gogo亚洲国模私拍人体| 日本视频在线一区| 国产中文字幕视频在线观看| 亚洲精品久久| 亚洲人成网站在线观看播放| 欧美亚视频在线中文字幕免费| 亚洲iv一区二区三区| 91精品店在线| 日本精品在线视频| yellow字幕网在线| 欧美国产日韩在线| 韩国中文字幕在线| 中文字幕日韩在线观看| 每日更新在线观看av| 亚洲爱爱爱爱爱| 精品国产av鲁一鲁一区| 欧美日韩第一区日日骚| 探花国产精品一区二区| 日韩欧美亚洲成人| 国产精品免费av一区二区| 亚洲综合色噜噜狠狠| 日本在线一级片| 国产精品久久精品日日| 高清国产在线观看| 久久精品综合网| 精品人妻一区二区三区香蕉| 99久久精品国产导航| www.17c.com喷水少妇| 成人黄色a**站在线观看| 亚洲黄色小说在线观看| 国产成人av资源| 亚洲AV成人精品| 国产精品一区二区在线播放| 四虎成人在线播放| 国产美女一区二区三区| 国产美女视频免费看| 国内国产精品久久| 国产不卡的av| 国产激情视频一区二区三区欧美 | 精品久久久久久久久久久院品网| 国产婷婷一区二区三区久久| 欧美一级二级三级蜜桃| 国产aⅴ爽av久久久久成人| 日韩一区二区影院| 亚洲黄色小说网址| 亚洲成人xxx| 青青草视频在线免费观看| 亚洲日本中文字幕免费在线不卡| 国产h在线观看| 中文字幕日韩欧美在线| 成人看av片| 欧美国产日韩一区二区在线观看| av毛片午夜不卡高**水| 国产91在线播放九色快色| 久久xxx视频| 91热精品视频| 中文字幕一区二区三区四区久久 | 亚洲图片自拍偷拍| 三级黄色在线视频| 色爱区综合激月婷婷| 一级黄色大片网站| 日韩免费看网站| 日本在线视频1区| 色av吧综合网| wwww亚洲| 色小说视频一区| av网站在线看| 91大神福利视频在线| 国产激情久久| 国产超碰91| 国际精品欧美精品| 大地资源网在线观看免费官网| 在线午夜精品| 欧美一级视频在线| 99久久久久久| 91av手机在线| 精品国产乱码久久久久久婷婷| 怡红院成永久免费人全部视频| 日韩欧美国产精品一区| 成人综合影院| 韩日精品中文字幕| 欧美午夜三级| 久久久99爱| 欧美一区二区| 在线观看av日韩| 成人一区二区三区在线观看| 亚洲一级片在线播放| 亚洲成av人影院在线观看网| 中国一区二区视频| 日韩精品久久久久久久玫瑰园| 黄色免费在线网站| 国产成人久久久| 噜噜噜狠狠夜夜躁精品仙踪林| 一区二区免费电影| 媚黑女一区二区| 亚洲av成人片色在线观看高潮| 亚洲欧洲国产日本综合| 波多野结衣高清视频| 欧美精品一区在线观看| 黄a在线观看| 国产精品久久二区| 香蕉久久夜色精品国产使用方法| 色呦呦网站入口| 免费在线观看精品| 亚洲黄色免费在线观看| 一区二区欧美国产| av综合在线观看| 中文字幕精品一区二区精品| 黑人巨大精品欧美一区二区桃花岛| 国产精品污www一区二区三区| 91精品国产麻豆国产在线观看| 999精品网站| 久久综合色婷婷| 91午夜视频在线观看| 日韩三级免费观看| 免费日本一区二区三区视频| 国产精品久久网| 神马影视一区二区| 99蜜桃臀久久久欧美精品网站| 成人av影院在线| www.youjizz.com亚洲| 日韩免费在线观看| av片在线观看网站| 波多野结衣精品久久| 午夜精品久久久久99热蜜桃导演| 99999精品| 亚洲激情五月婷婷| 国产成人精品a视频| 欧美成人免费全部| 欧美2区3区4区| 亚洲激情免费视频| 国产伦精品一区二区三区视频青涩| 97精品在线播放| 欧美精三区欧美精三区| 求av网址在线观看| 亚洲一区二区三区香蕉| 午夜精彩国产免费不卡不顿大片| 香蕉在线观看视频| 亚洲高清免费在线| 天天色天天操天天射| 欧美一区二区影院| 国产一区二区精品久| 男操女免费网站| 亚洲日本一区二区| 性欧美videos另类hd| 久久久亚洲欧洲日产国码aⅴ| 久久精品福利| 大香煮伊手机一区| 国产精品欧美一区喷水| 国产精品欧美激情在线| 久久91亚洲精品中文字幕奶水| 丁香5月婷婷久久| 逼特逼视频在线| 国产欧美精品一区| 国产三级精品在线观看| 欧美精品电影在线| 久久综合色占| 免费av不卡在线| 亚洲高清三级视频| 成人影院免费观看| 亚洲www视频| 国产日韩1区| 老司机福利在线观看| 欧美大片在线观看一区二区| 手机在线观看av| 夜夜爽99久久国产综合精品女不卡 | 国产综合在线播放| 日本91av在线播放| 希岛爱理一区二区三区| 精品人妻一区二区免费视频| 欧美午夜在线一二页| 亚洲奶汁xxxx哺乳期| 日本精品免费一区二区三区| 99久久久久国产精品| 亚洲精品国产成人av在线| 欧美午夜寂寞影院| 国产福利在线免费观看| 日韩欧美一区二区视频在线播放| 国产精品1区二区.| 69国产精品视频免费观看| 久久综合五月天| 亚洲人成精品久久久 | 亚洲经典视频| 日韩一二三四区| 国产精品扒开腿做爽爽爽a片唱戏| 天美av一区二区三区久久| 欧美成人伊人久久综合网| 一本在线免费视频|