精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何在 LLM 推理中戰(zhàn)勝不確定性

人工智能
矩陣乘法是 LLM 的核心計算,快的關(guān)鍵是把大矩陣切成小 tile(比如 128x128),讓 GPU 高效算。原來的問題:批次小的時候,tile切得不一樣(比如批次 1 時不用大tile,批次 10 時用大tile),乘法順序變了,結(jié)果差了。解決辦法:不管批次大小,都用同一種 “tile大小” 算。

最近thinkingmachines的一篇博文在內(nèi)外網(wǎng)引起了無數(shù)的關(guān)注和轉(zhuǎn)載,這篇文章的核心內(nèi)容先是解釋了一下為什么LLM推理會有不確定性,隨后文章還給出了具體的解決方案。

在詳細(xì)介紹文章的內(nèi)容之前,我們先來說一下thinkingmachines這家公司。它是由前OpenAI首席技術(shù)官Mira Murati與多位前OpenAI高管聯(lián)合創(chuàng)立。Murati 這個人經(jīng)歷也比較神奇,首先她并不是AI科班出身,最早是在Tesla擔(dān)任model X的產(chǎn)品經(jīng)理。然后在2016年加入openAI,并一路升到了openai的CTO,你不得不佩服在牛人面前行業(yè)或者說專業(yè)門檻似乎根本不存在。

說完上面的八卦之后,我們開始進(jìn)入正題,先來聊一下LLM推理過程當(dāng)中的不確定性是如何產(chǎn)生的。

在這篇文章出現(xiàn)之前,大多數(shù)人認(rèn)為之所以產(chǎn)生不確定性主要是以下兩個原因?qū)е碌?

  1. 浮點數(shù)不滿足結(jié)合律:以加法運算為例,咱們平時覺得(a+b)+c 和 a+(b+c)結(jié)果肯定一樣,但用電腦里的 “浮點數(shù)”(比如表示 0.1、1e20 這種數(shù)的格式)算,還真不一樣!
(0.1 + 100000000000000000000)- 100000000000000000000,結(jié)果是 0;
0.1 +(100000000000000000000 - 100000000000000000000),結(jié)果是 0.1。

其實,這個很好理解,因為因為浮點數(shù)只能存有限位數(shù)的精度,加超大數(shù)再減,小數(shù)的 “精度” 就被丟掉了。這就導(dǎo)致了如果一堆浮點數(shù)加的順序不一樣,最后結(jié)果可能就不一樣。

2. GPU并行計算:很多人會覺得GPU 是多核心并行計算,誰先算完不一定,所以結(jié)果不一樣。

針對上面的兩個誤解,文章也一一給了回應(yīng)。首先,浮點數(shù)由于計算順序不同而導(dǎo)致丟精度確實不假,但是這個不是導(dǎo)致推理不確定性的直接原因;其次,GPU并行計算的這個說法壓根就是錯誤的,因為現(xiàn)在的 GPU kernel早就能避免 “誰先算完影響結(jié)果” 了。只有一種情況會讓 GPU 算得不一樣 —— 用 “原子加法”(多個核心往同一個數(shù)上加,誰先加不確定)。但 LLM 推理時,根本不用 “原子加法”!所以 GPU 并行不是罪魁。

文章中為了更好的解釋這個問題,提出了一個叫“batch-invariance”中文可以譯為“批次不變性”。而之所以LLM在推理時會產(chǎn)生不確性主要是因為很多的計算內(nèi)核(kernel)不滿足“批次不變性”。簡單來說就是,用戶提交的同一個推理請求單獨算和跟別人一起打包算,結(jié)果可能不一樣。文章當(dāng)中舉了一個具體的實際例子。

import torch  
torch.set_default_device('cuda')   
B = 2048
D = 4096
a = torch.linspace(-1000, 1000, B*D).reshape(B, D)
b = torch.linspace(-1000, 1000, D*D).reshape(D, D)
# Doing a matrix vector multiplication by taking
# the first element of the batch
out1 = torch.mm(a[:1], b)
# Doing a matrix matrix multiplication and then taking  
# the first element of the batch
out2 = torch.mm(a, b)[:1]
print((out1 - out2).abs().max()) # tensor(1669.2500, device='cuda:0')

上述例子當(dāng)中,用 GPU 算矩陣乘法,先取第一個請求的矩陣單獨算(out1),再把所有請求打包算完后取第一個結(jié)果(out2),兩者差了 1669 多 —— 這可不是小誤差!文章還提到一個叫運行間確定性,意思是說同一批次運算結(jié)果是一樣的。

但是現(xiàn)在很多時候,為了提高LLM推理時GPU的利用率,一都使用動態(tài)批次調(diào)度的算法。也就是說,會根據(jù)當(dāng)時服務(wù)器的繁忙程度來動態(tài)調(diào)整批次的大小。

既然問題已經(jīng)找到了,那如何解決呢?文章提到,要讓 LLM 推理穩(wěn)定,就得讓每個計算步驟(主要是 3 個關(guān)鍵步驟)不管批次大小多少,算出來都一樣。這三個步驟按難度從低到高排序依次是:

1. 歸一化(RMSNorm):給每個請求 “專屬核心”

RMSNorm 是給數(shù)據(jù)做歸一化的步驟,計算時需要 “求和取平均”。原來的問題:批次小的時候,GPU 核心用不完,就會讓多個請求共享一個核心,算的時候求和順序變了,結(jié)果也就不一樣了。解決辦法:不管批次大小,每個請求分配一個核心,讓每個請求的求和順序固定。就算批次小、有些核心空閑,也不共享 —— 大不了慢一點,換結(jié)果穩(wěn)定。

2. 矩陣乘法:固定 “計算瓷磚大小”

矩陣乘法是 LLM 的核心計算,快的關(guān)鍵是把大矩陣切成小 tile(比如 128x128),讓 GPU 高效算。原來的問題:批次小的時候,tile切得不一樣(比如批次 1 時不用大tile,批次 10 時用大tile),乘法順序變了,結(jié)果差了。解決辦法:不管批次大小,都用同一種 “tile大小” 算。哪怕批次小的時候有點浪費算力,也不換tile —— 性能會降一點(比如比最快的情況慢 20%),但結(jié)果穩(wěn)定。

3. 注意力機制(Attention):固定 “拆分大小”

注意力是 LLM 理解上下文的關(guān)鍵,計算時要處理 “查詢(Q)” 和 “鍵值(KV)” 的匹配,需要求和。原來的問題:處理長文本時,KV 會存在緩存里,批次不同時,緩存里的 KV 和新算的 KV 結(jié)合方式不一樣(比如批次 1 時拆成 3 段算,批次 5 時拆成 2 段算),求和順序變了。解決辦法:不管批次和緩存里有多少 KV,都按 “固定大小拆分”(比如每次拆 256 個元素),哪怕最后一段不夠 256 個,也按這個規(guī)則拆 —— 確保求和順序永遠(yuǎn)一樣。

文章中基于上述的方法實現(xiàn)了相應(yīng)的batch-invariant 相關(guān)實現(xiàn),具體結(jié)果如下:

  1. 用 Qwen3-235B 在溫度 0、同一提示詞采 1000 次,默認(rèn)內(nèi)核得到 80 種不同結(jié)尾;換成 batch-invariant 內(nèi)核后,1000 次完全一致。
  2. 性能上,在單 GPU、Qwen-3-8B 的例子里:vLLM 默認(rèn) 26s,未經(jīng)深度優(yōu)化的“確定性模式” 55s,改進(jìn)注意力后 42s。可見“可用、不至于災(zāi)難”。

當(dāng)然,上面主要是從我自己的視角對這篇博文的提煉,我強烈建議大家去讀一下原文。具體地址見引用。

責(zé)任編輯:武曉燕 來源: 技不辱你
相關(guān)推薦

2025-09-11 12:29:28

2023-11-13 08:00:00

Python開發(fā)

2022-05-11 09:00:00

人工智能金融犯罪機器學(xué)習(xí)

2024-02-23 14:31:19

云計算云優(yōu)化

2025-09-23 08:56:00

2020-08-24 07:04:57

邊緣計算云計算網(wǎng)絡(luò)

2022-09-14 22:51:08

機器學(xué)習(xí)模型高斯過程

2020-10-22 11:42:06

服務(wù)器

2024-01-25 16:18:38

人工智能數(shù)據(jù)

2020-05-25 10:45:48

曙光

2022-11-24 14:45:18

物聯(lián)網(wǎng)邊緣計算

2025-01-03 15:37:11

2023-04-13 11:34:49

亞馬遜云科技Serverless

2019-01-10 09:47:22

2019-05-22 14:42:40

華為谷歌挑戰(zhàn)

2022-11-04 12:27:35

2025-04-15 07:00:00

勒索軟件金融欺詐網(wǎng)絡(luò)安全

2021-01-18 15:25:46

比特幣資金私鑰

2020-12-08 10:53:36

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT
點贊
收藏

51CTO技術(shù)棧公眾號

蜜桃精品视频在线| 欧美成人基地| 亚洲免费观看高清完整版在线观看| 国产日本欧美一区二区三区在线| 三级黄色在线观看| 视频一区国产| 日韩欧美在线视频观看| 亚洲国产精品毛片| 亚洲精品字幕在线| 首页综合国产亚洲丝袜| 久久久999成人| 国产a级黄色片| 久久精品97| 亚洲福利视频导航| 视频一区二区综合| 国产综合无码一区二区色蜜蜜| 羞羞答答国产精品www一本 | 中文字幕视频在线免费观看| 国产日产一区二区| 97超碰欧美中文字幕| 国产日韩中文字幕在线| 一级片中文字幕| 在线精品小视频| 亚洲性线免费观看视频成熟| 潘金莲一级淫片aaaaa| 欧美特大特白屁股xxxx| 一二三四社区欧美黄| 秋霞毛片久久久久久久久| www.精品视频| 日本成人中文字幕在线视频| 久久琪琪电影院| 69夜色精品国产69乱| 天天久久夜夜| 欧美zozozo| 久久精品亚洲天堂| 91看片一区| 亚洲h动漫在线| 五月天色婷婷综合| 精品美女视频在线观看免费软件 | 一区二区三区四区毛片| 中文在线а√在线8| 亚洲图片有声小说| 男女激烈动态图| 免费大片在线观看www| 国产亚洲欧美日韩在线一区| 精品久久精品久久| 亚洲国产精彩视频| 国产麻豆午夜三级精品| 国产在线视频不卡| 亚洲一区二区视频在线播放| 国产一区导航| 91av视频在线免费观看| 久草视频精品在线| 欧美精品日本| 久久99久久99精品中文字幕 | 亚洲AV无码一区二区三区少妇| 美女国产一区二区| 国产精品网站入口| 中文人妻熟女乱又乱精品| 久久综合网络一区二区| 日本精品va在线观看| xxxx.国产| 免费亚洲视频| 国产精品成人v| 69视频免费看| 日本中文字幕一区二区视频| 日本在线观看天堂男亚洲| 国产精品suv一区| 日韩精品乱码免费| 国产精品久久久久77777| 成人一二三四区| 另类调教123区 | 91精品久久久久久综合五月天| 欧美一区二区啪啪| 极品人妻一区二区| gogo人体一区| 亚洲欧美精品一区| 极品尤物一区二区| 影音先锋成人在线电影| 欧美激情手机在线视频| 五月婷婷亚洲综合| 免费视频一区二区| 亚洲最大福利网站| 天天干天天做天天操| 久久久午夜电影| 伊人精品久久久久7777| 中文字幕中文字幕在线中高清免费版| 亚洲亚洲精品在线观看| 青青视频在线播放| 免费成人黄色网| 欧美一区二区三区小说| 国产精品扒开腿做爽爽爽a片唱戏| 麻豆一区二区麻豆免费观看| 亚洲区免费影片| 婷婷国产成人精品视频| 激情综合中文娱乐网| 欧美亚洲一级片| 这里只有精品999| 国产寡妇亲子伦一区二区| 国产亚洲二区| 婷婷免费在线视频| 亚洲国产成人av好男人在线观看| 99热成人精品热久久66| 在线播放成人| 国产视频自拍一区| 中日韩一级黄色片| 99人久久精品视频最新地址| 国产剧情日韩欧美| 手机看片福利永久| 成人欧美一区二区三区视频网页| 激情伊人五月天| 精品久久在线| 日韩电影免费观看在线观看| 老司机精品免费视频| 亚洲精选在线| 成人在线免费观看视视频| 午夜一区在线观看| 亚洲免费资源在线播放| jizz欧美激情18| 精品中国亚洲| 久久综合伊人77777尤物| 亚洲天堂一区在线观看| 国产麻豆精品theporn| 清纯唯美一区二区三区| aa视频在线观看| 日韩午夜激情av| 女教师淫辱の教室蜜臀av软件| 国产日韩一区| 国产日韩一区欧美| 26uuu亚洲电影在线观看| 欧美日韩免费不卡视频一区二区三区 | 成人免费在线看片| 国产乱子伦三级在线播放| 午夜精品久久久久| 无码国产精品久久一区免费| 888久久久| 国产欧美一区二区三区久久| 久久精品国产亚洲a∨麻豆| 亚洲成人av免费| 久久黄色一级视频| 一区二区三区四区在线观看国产日韩| 日韩av黄色在线观看| 无码国产精品96久久久久| 夜夜嗨av一区二区三区中文字幕| 天天操精品视频| 欧美好骚综合网| 国产精品女人网站| av在线电影免费观看| 在线视频综合导航| 成人国产精品久久久网站| 亚洲欧美成人综合| 久久精品99| xxxxx性欧美特大| 日韩激情第一页| 日韩免费一级片| 99国产欧美另类久久久精品| 亚洲熟妇无码另类久久久| 老司机精品在线| 26uuu国产精品视频| 污污网站在线免费观看| 欧美日韩国产在线| 国产精品jizz| 日韩av中文在线观看| 奇米精品在线| 日韩三级成人| 久久综合五月天| www.色呦呦| 午夜精品久久久久久久99水蜜桃| 黄色短视频在线观看| 亚洲综合三区| 亚洲高清视频一区| 国产一区二区三区| 欧美黑人国产人伦爽爽爽| 欧美一级免费片| 色噜噜久久综合| 刘亦菲国产毛片bd| 国产一区二区在线电影| 日韩精品一区二区三区四| 136福利精品导航| 2018日韩中文字幕| www.91在线| 日韩一区国产二区欧美三区| 国产精品suv一区二区69| 久久综合色天天久久综合图片| 亚洲男人天堂色| 久久精品一区二区不卡| 国产91免费视频| 亚洲最大成人| 色妞一区二区三区| 欧美自拍偷拍第一页| 欧美在线你懂得| 国产波霸爆乳一区二区| 91网站在线播放| 国产3p在线播放| 亚洲久久在线| 亚洲欧洲中文| 动漫av一区| 国产精品久久久久久久久久ktv| 成人短视频在线| 日韩电影在线观看永久视频免费网站| www.久久网| 亚洲va欧美va国产va天堂影院| 天天操天天舔天天射| 国产不卡视频在线播放| 中文字幕在线导航| 亚洲精品精选| 中文字幕免费高| 免费视频一区三区| 亚洲自拍偷拍在线| 高清不卡av| 久久91亚洲人成电影网站 | av色综合久久天堂av综合| 国产三级三级看三级| 亚洲黄色成人| 国产日产欧美一区二区| 国产欧美久久一区二区三区| 国产精品久久亚洲| 成人在线视频www| 国产成人精品视频| 9999热视频在线观看| 久久视频中文字幕| seseavlu视频在线| 亚洲风情亚aⅴ在线发布| 国产麻豆一精品一男同| 色婷婷av一区二区三区软件| 国产一级二级三级视频| 国产精品久久久久aaaa樱花 | 首页亚洲中字| 不卡视频一区二区| 亚洲男男av| 国产成人精品免高潮费视频| 国产免费拔擦拔擦8x在线播放| 久热在线中文字幕色999舞| 国产爆初菊在线观看免费视频网站| 亚洲成avwww人| 99久久精品无免国产免费| 欧美色大人视频| av一级在线观看| 午夜精品久久久久久久| 国产无遮挡又黄又爽在线观看 | 国产污视频在线看| 一区二区三区免费| 潘金莲一级黄色片| 国产精品毛片久久久久久| 久久久久久国产免费a片| 久久夜色精品国产噜噜av| 自拍视频一区二区| 岛国精品一区二区| 色哟哟网站在线观看| 国产精品一区二区久久精品爱涩| 特级黄色片视频| 寂寞少妇一区二区三区| 国产精品久久久久久久av福利| 麻豆freexxxx性91精品| 日韩一区二区三区久久| 喷水一区二区三区| 欧美午夜aaaaaa免费视频| 免费人成网站在线观看欧美高清| 亚洲精品久久久中文字幕| 麻豆高清免费国产一区| 在线看免费毛片| 国产麻豆精品视频| 秘密基地免费观看完整版中文 | 欧美a在线看| 日韩在线免费av| 麻豆最新免费在线视频| 久久久精品2019中文字幕神马| 国产二区三区在线| 欧美日韩国产成人高清视频| 91超碰免费在线| 琪琪第一精品导航| 搜成人激情视频| 成人av在线天堂| 久久丁香四色| 国产精品入口免费| 在线亚洲a色| 亚洲精品乱码久久久久久蜜桃91| 欧美激情理论| 女人被男人躁得好爽免费视频| 亚洲毛片一区| 韩国视频一区二区三区| 国产自产高清不卡| 人妻av一区二区| 国产亚洲欧美日韩日本| 中日韩一级黄色片| 污片在线观看一区二区| 国产一级片一区二区| 日韩午夜电影在线观看| 四虎影院在线播放| 色偷偷88888欧美精品久久久| 在线观看小视频| 欧美在线视频观看免费网站| 国产精品诱惑| 福利视频久久| 精品不卡一区| 白白操在线视频| 视频一区二区欧美| 天天爽夜夜爽视频| www国产精品av| 亚洲色偷偷综合亚洲av伊人| 亚洲第一福利一区| 一级片在线观看视频| 日韩成人在线电影网| 蜜芽在线免费观看| 欧美中文字幕精品| 中文字幕一区二区三区四区久久| 欧美一区二区视频17c| 欧美日韩一区二区高清| 中文字幕无码不卡免费视频| 国产高清在线观看免费不卡| 欧美福利第一页| 亚洲第一搞黄网站| 国产农村妇女毛片精品| 亚洲人成电影网站| av有码在线观看| 成人在线视频网站| 红桃视频在线观看一区二区| 国产av熟女一区二区三区| 久久66热re国产| 男生草女生视频| 亚洲国产精品久久久久秋霞影院| 91黄色在线视频| 精品亚洲一区二区三区在线观看| 91小视频xxxx网站在线| 国产欧美日韩中文字幕在线| 亚洲宅男一区| 欧美极品欧美精品欧美| 国产成人午夜片在线观看高清观看| www.99热| 色婷婷av一区二区三区大白胸 | 伊人久久免费视频| 在线看片福利| 精品蜜桃一区二区三区| 国产一区二区三区四区三区四| 91精品999| 国产精品三级av在线播放| 久久久久久亚洲av无码专区| 日韩av最新在线观看| 国产啊啊啊视频在线观看| 亚洲free性xxxx护士白浆| 国产精品成人av| 日韩在线一区视频| 国产精品久久久久久久久免费相片 | 亚洲精品免费在线观看| 国产乱淫a∨片免费观看| 中文字幕视频一区二区在线有码 | 东热在线免费视频| 国产成+人+综合+亚洲欧美丁香花| 人体久久天天| 免费黄色福利视频| 91丨porny丨国产| 亚洲综合久久网| 亚洲欧美精品一区| gogo亚洲高清大胆美女人体| 欧美一级片免费观看| 日韩高清在线不卡| 影音先锋男人看片资源| 欧美男男青年gay1069videost | 国产成人精品a视频| 久久夜色撩人精品| 亚洲成人五区| 日韩视频在线视频| 99精品国产99久久久久久白柏| 97久久久久久久| 亚洲免费视频在线观看| a一区二区三区| 亚洲人成人77777线观看| 精品亚洲国产成人av制服丝袜 | 少妇性l交大片7724com| 一区二区三区在线视频观看58 | 成人午夜免费电影| 国产乡下妇女做爰视频| 亚洲乱码av中文一区二区| 97欧美成人| 经典三级在线视频| 懂色av噜噜一区二区三区av| 在线观看 中文字幕| 亚洲三级av在线| 亚洲色图综合| 免费视频爱爱太爽了| 久久日一线二线三线suv| 中文字幕在线视频第一页| 欧美成人剧情片在线观看| 电影一区二区在线观看| 女人另类性混交zo| 一区在线中文字幕| 亚洲乱色熟女一区二区三区| 人人爽久久涩噜噜噜网站| 欧美国产一级| 人妻换人妻a片爽麻豆| 色综合网站在线| a级网站在线播放| 美日韩免费视频| 久久99精品久久久久久久久久久久| 青青操国产视频| 亚洲日本中文字幕| 欧美h版在线观看| 日韩 欧美 高清| 亚洲综合成人在线| 国产福利小视频在线|