精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理成本驟降75%!gpt-oss用新數據類型實現4倍推理速度,80GB顯卡能跑1200億參數大模型

人工智能 新聞
MXFP4在把內存占用降為同規模BF16模型的四分之一的同時,還把生成token的速度提升了整整4倍。

OpenAI在最新的開源模型gpt-oss上采用的MXFP4數據類型,直接讓推理成本暴降75%!

更驚人的是,MXFP4在把內存占用降為同規模BF16模型的四分之一的同時,還把生成token的速度提升了整整4倍。

換句話說,這一操作直接把1200億參數的大模型塞進80GB顯存的顯卡,哪怕是只有16GB顯存的顯卡也能跑200億參數的版本。

圖片

(注:顯存容量通常會大于Checkpoint Size)

相比以往的數據類型,MXFP4提供了極高的性價比,模型運行所需的硬件資源僅為之前的四分之一。

MXFP4有什么魔力?

在gpt-oss中,OpenAI將MXFP4量化應用于大約90%的權重,這一操作的直接動機(收益)就是讓模型運行成本變得更加便宜。

將gpt-oss模型量化為MXFP4 后,大語言模型的占用內存僅為等規模BF16模型的1/4,而且生成token的速度最高可提升4倍。

圖片

如何通過改變數據類型降低模型運行成本?這里的邏輯是這樣的:

模型的運行成本主要由權重存儲內存帶寬兩個部分組成。

前者是模型參數存放和占用的空間,也就是存儲它們所需要的字節數。

后者則是模型在推理時,數據讀寫速度和容量的限制。

數據類型的變化將直接影響權重存儲和內存帶寬的占用。

例如,傳統模型權重通常用FP32(32位浮點數)存儲,每個參數占用4字節內存。

如果用MXFP4,那么每個權重只有半字節權重存儲大小是FP32的1/8,這就極大地壓縮了權重數據量的大小。

這一壓縮不僅降低了模型的存儲空間,還能讓模型在同樣的帶寬下完成更快地數據讀取和寫入,從而提高推理速度。

由此,通過改變數據類型就能實現推理成本的降本增效。

那么,MXFP4是怎么實現這一點的?

MXFP4

MXFP4的全稱是微縮放4位浮點數(Micro-scaling Floating Point 4-bit),是由Open Compute Project (OCP) 定義的4位浮點數據類型。

(注:OCP是Facebook于2011年發起的超大規模數據中心合作組織,旨在降低數據中心組件成本并提高可獲取性。)

在深度學習領域中,數據類型的精度和效率一直是研究者取舍的重點。

例如,傳統的FP4只有四位,1位符號位(表示正負),2位指數位(決定數值的量級),1位尾數位(表示小數部分)。

這種表示方法雖然壓縮了數據量,但也導致了非常有限的可表示的數值范圍,它只能表示8個正數和8個負數。

相較之下,BF16(1位符號位,8位指數位和7 位尾數位)則能表示 65,536個數值,不過表示范圍的增加也帶來了計算成本的上升。

如果為了提高計算效率,直接把這4個BF16數值:0.0625、0.375、0.078125、0.25直接轉換成FP4,那么它們會變成 0、0.5、0、0.5。

不難看出,這樣的誤差顯然是無法接受的。

于是,為了在減少數據量的同時確保一定的精度,MXFP4通過將一組高精度數值(默認32個)乘以一個公共縮放因子(這個縮放因子是一個8位二進制指數)。這樣,我們前面那4個BF16數值就會變成 1、6、1.5、4。

圖片

這樣就既實現了極致的數據大小,又維持了數值間大小關系的精度。

此外,這一過程的實現還與計算硬件相關

一般規律是,每將浮點精度減半,芯片的浮點吞吐量就能翻倍。

比如,一個B200SXM模塊的稠密BF16運算性能約為2.2 petaFLOPS,降到FP4(Nvidia Blackwell 芯片提供硬件加速)后,就能提升到9petaFLOPS

雖然這會在吞吐量上帶來一些提升,但在推理階段,更多FLOPS的意義主要是減少模型開始生成答案的等待時間

值得注意的是,運行MXFP4模型并不要求硬件必須原生支持FP4

用于訓練gpt-oss的Nvidia H100就不支持原生FP4,不過它依然可以運行,只是無法享受該數據類型的全部優勢。

低精度與計算量的取舍

事實上,MXFP4并不是新概念。早在2023年的報告中,OCP就在報告《OCP Microscaling Formats (MX) Specification Version 1.0》中詳細介紹過這一數據類型。

圖片

然而,這種低精度的數據類型通常被認為是對性價比的妥協,因為精度下降會導致質量損失。損失的程度取決于具體的量化方法。

不過,已經有足夠多的研究表明,將數據精度從16位降到8位,在大語言模型場景下幾乎沒有質量損失,這種精度已經足夠支撐模型的正常工作。

事實上,一些模型開發者,例如DeepSeek已經開始直接用FP8進行訓練。

此外,雖然MXFP4比標準FP4好得多,但它也有缺陷

例如,英偉達就認為這種數據類型相比FP8仍可能出現質量下降,部分原因是其縮放塊大小(Scaling Block Size)為32,不夠細粒化。

為此,英偉達推出了自己的微縮放數據類型NVFP4,通過將縮放塊大小降至16和使用FP8縮放因子來提高質量。

這幾乎等同于FP8的工作方式。只不過MXFP4是在張量內部的小塊上應用縮放因子,而不是作用于整個張量,從而在數值之間實現更細的粒度。

最后,在gpt-oss上,OpenAI只使用了MXFP4。

鑒于OpenAI在AI領域上的影響力,這基本上就等于在說:

如果MXFP4對我們夠用,那對你也應該夠用。

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-05-15 15:38:59

AI模型

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-08 04:11:00

GPT-OSS大模型算法

2025-03-14 11:56:52

2024-07-19 09:26:12

2024-07-08 13:04:01

2024-07-19 09:59:31

2024-02-01 12:43:16

模型數據

2025-06-11 14:39:50

AILLMMistral

2025-02-19 15:17:24

2025-02-12 09:20:12

2023-01-18 09:51:56

模型開源

2025-08-18 09:15:00

2024-01-24 13:11:00

AI模型

2025-01-08 13:15:02

2024-01-26 13:18:00

AI訓練

2025-10-06 01:00:00

DeepSeekV3.2-Exp

2025-04-16 09:46:46

點贊
收藏

51CTO技術棧公眾號

色94色欧美sute亚洲13| 91丝袜美腿高跟国产极品老师| 日韩一区二区三区国产| 毛片毛片毛片毛片毛| 白浆在线视频| 中文字幕乱码久久午夜不卡 | 日韩在线视频线视频免费网站| 91插插插影院| 毛片免费看不卡网站| 日韩一区中文字幕| 欧美精品123| 国产精品无码久久av| 性感少妇一区| 九九久久精品一区| 一级在线观看视频| 老司机成人在线| 欧美日本在线观看| 无码人妻精品一区二区三区在线| 91av资源在线| 91一区一区三区| 91九色在线观看| 这里只有久久精品视频| 韩国久久久久| 久久伊人精品天天| 亚洲一区二区三区日韩| 精品人妻一区二区三区日产乱码卜| 毛片在线看片| 久久久99久久| 久久久精品有限公司| 99国产精品久久久久久久成人| 视频一区欧美精品| 97在线观看视频国产| 婷婷在线精品视频| 欧美电影免费播放| 亚洲女人被黑人巨大进入| 中文字幕一区二区三区人妻在线视频| 91九色综合| 日本道免费精品一区二区三区| 日本欧美视频在线观看| 欧美理论电影| 亚洲国产aⅴ天堂久久| 亚洲激情免费视频| 黄在线免费观看| 国产精品久久久久影院色老大| 日韩欧美亚洲日产国产| 欧美日本网站| 久久先锋影音av| 另类视频在线观看+1080p| 天天综合永久入口| 92精品国产成人观看免费| 国产一区二区三区av在线| 亚洲成人av综合| 国产91精品一区二区麻豆网站| 91视频免费进入| 性生交生活影碟片| 国产mv日韩mv欧美| 国产女人水真多18毛片18精品| 亚洲第一视频在线| av在线一区二区| 久久精品国产精品国产精品污| 国产小视频免费观看| 成人网页在线观看| 国产在线播放一区二区| 四虎在线观看| 国产欧美一区二区三区网站| 亚洲精品一区二区三区av| 最新97超碰在线| 亚洲欧洲99久久| 一级性生活视频| 日本动漫同人动漫在线观看| 天天综合网 天天综合色| 成年人网站免费视频| 夜鲁夜鲁夜鲁视频在线播放| 色综合中文字幕国产| 日本va中文字幕| 高清一区二区中文字幕| 日韩欧美一区在线观看| 日本一级片在线播放| 国产欧美日韩免费观看 | 国产免费一区二区三区| 免费在线黄色网址| 国产精品超碰97尤物18| 欧美黄色免费网址| 吉吉日韩欧美| 欧美乱妇20p| 久久久老熟女一区二区三区91| 亚洲丝袜美腿一区| www欧美日韩| 日韩av黄色片| 美女一区二区久久| 成人av中文| www.亚洲视频| 亚洲专区一二三| 91网址在线播放| 日韩不卡在线视频| 亚洲人成网站999久久久综合| av最新在线观看| 999亚洲国产精| 国产欧美 在线欧美| 蜜臀久久99精品久久久| 国产欧美一区二区精品性色超碰 | 欧美成人a视频| 人妻在线日韩免费视频| 五月天久久777| 2018日韩中文字幕| a级片在线免费看| 久久久久久免费毛片精品| 中文字幕一区二区三区精彩视频| 久久影院午夜精品| 91精品国产91久久久久久最新毛片 | 亚洲天堂电影网| 国产不卡人人| 成人精品国产免费网站| 亚洲欧美激情另类校园| 日韩欧美国产成人精品免费| 久久成人一区| 国内视频一区| caoporm免费视频在线| 在线亚洲人成电影网站色www| 国产a级片视频| 久久精品亚洲欧美日韩精品中文字幕| 国产成人精品在线视频| 水莓100国产免费av在线播放| 亚洲日本欧美天堂| 青青草原国产在线视频| 伊人久久大香线蕉| 午夜精品在线视频| 老司机午夜福利视频| 亚洲女女做受ⅹxx高潮| 老司机久久精品| 激情五月综合网| 欧美中文字幕在线观看| 天堂av资源网| 午夜精品福利一区二区三区蜜桃| 免费欧美一级片| 亚洲女同中文字幕| 成人免费在线网址| 激情影院在线观看| 欧美二区三区的天堂| 中文字幕美女视频| 久久精品国内一区二区三区| 午夜午夜精品一区二区三区文| 另类激情视频| 伊人亚洲福利一区二区三区| 日韩黄色片网站| 国产婷婷精品av在线| 欧美日韩在线成人| 国产亚洲电影| 日韩av电影在线网| 国产黄在线看| 欧美色视频在线观看| 在线免费看视频| 激情深爱一区二区| 日韩一级免费看| 精品精品国产毛片在线看| 久久久久久亚洲| 外国精品视频在线观看| 亚洲成a人在线观看| 99热超碰在线| 老司机久久99久久精品播放免费| 欧美主播一区二区三区美女 久久精品人| 天堂av在线| 亚洲性69xxxbbb| 中文字幕在线观看国产| 综合久久一区二区三区| 欧美精品色视频| 亚洲日韩成人| 欧洲亚洲一区二区三区四区五区| 国产精品高潮久久| 蜜臀久久99精品久久久无需会员| 99免费在线视频| 欧美日韩国产综合视频在线观看中文| 欧美老熟妇乱大交xxxxx| 日本不卡视频一二三区| 欧洲美女和动交zoz0z| 综合成人在线| 国产999在线观看| 免费av在线网站| 3d成人h动漫网站入口| 久久综合综合久久| 久久久精品影视| 福利视频999| 亚洲另类黄色| 一区二区不卡在线| 狼人天天伊人久久| 国产精品主播视频| 97人澡人人添人人爽欧美| 伊人av综合网| 亚洲男人第一天堂| 欧美午夜精品久久久久久孕妇| 特级片在线观看| 久久久久久麻豆| 永久看看免费大片| 日韩成人精品视频| 日韩网站在线免费观看| 日韩情爱电影在线观看| 精品国产一区二区三区麻豆小说 | 国产精品12| 草民电影神马电影一区二区| 欧美激情一级欧美精品| 97电影在线| 亚洲第一页在线| 国产精品免费无遮挡| 在线精品亚洲一区二区不卡| 欧美日韩人妻精品一区二区三区| 国产色一区二区| a级一a一级在线观看| 激情五月婷婷综合网| 亚洲人成无码www久久久| 欧美婷婷在线| 在线成人性视频| 精品中文一区| 国产精品日韩一区二区| 国产高清亚洲| 国产美女久久精品| 成人免费看视频网站| 韩国三级日本三级少妇99| 欧美13一16娇小xxxx| 亚洲视频999| 天堂av手机版| 精品99一区二区| av中文字幕在线免费观看| 欧美亚洲高清一区| 销魂美女一区二区| 狠狠综合久久av一区二区小说 | 在线视频你懂得一区| 日本少妇激情视频| 亚洲一区二区3| 欧美色图亚洲天堂| 亚洲美女屁股眼交| av成人免费网站| 亚洲女人的天堂| 91视频综合网| 亚洲色图一区二区三区| jizz日本在线播放| 国产精品久久久久aaaa| 欧美成人久久久免费播放| 久久精品视频免费观看| 亚洲综合色一区| 久久精品视频免费| 人人爽人人爽人人片| 国产三区在线成人av| 黄色国产在线播放| 国产精品三级视频| 成人欧美一区二区三区黑人一 | 国产成人a v| 色噜噜狠狠成人网p站| 亚洲国产精品无码久久久| 色婷婷亚洲精品| 懂色av蜜臀av粉嫩av分享吧最新章节| 色综合视频在线观看| 免费观看日批视频| 欧美日韩大陆一区二区| 国产乱叫456在线| 日韩亚洲欧美一区二区三区| www夜片内射视频日韩精品成人| 日韩视频一区在线观看| 国产 日韩 欧美 精品| 亚洲激情第一页| 欧美日韩在线中文字幕| 自拍偷拍亚洲区| 国产福利视频在线观看| 欧美成人精品一区二区三区| 麻豆福利在线观看| 日韩免费不卡av| 精品自拍视频| av蓝导航精品导航| 欧美大胆视频| 亚洲黄色成人久久久| 亚洲有吗中文字幕| 成人一区二区免费视频| 久久午夜电影| 日本网站在线看| 成人免费观看男女羞羞视频| 亚洲最大成人网站| 亚洲视频一区在线| 日韩毛片在线播放| 精品视频在线看| 亚洲第一页视频| 亚洲欧美一区二区三区在线| 国产精品一区二区三区视频网站| 欧美激情欧美狂野欧美精品| 国产精品亚洲d| 操人视频欧美| 波多野结衣的一区二区三区| 欧美精品在欧美一区二区| 久久亚洲国产精品一区二区| 亚洲欧美aaa| 99久久精品免费看国产免费软件| 91精品久久久久久久久久久久| 亚洲黄色性网站| 中文字幕天堂在线| 精品日韩99亚洲| 成人全视频高清免费观看| 欧美激情视频网站| 素人啪啪色综合| 国产精品我不卡| 香蕉视频国产精品 | 日韩三级小视频| 欧美日韩国产美| 日本韩国一区| 久久久久国色av免费观看性色| 日韩美女在线看免费观看| 亚洲综合自拍一区| 欧美三级美国一级| 国产精品国产亚洲精品看不卡 | 人妻少妇精品视频一区二区三区| 亚洲免费在线观看| 波多野结衣二区三区| 亚洲国产精品资源| 超碰人人在线| 国产精品一区二区三| 妖精视频一区二区三区免费观看| 日韩精品免费一区| 激情图区综合网| 老司机精品免费视频| 黑人欧美xxxx| 香蕉视频国产在线| 欧美国产视频一区二区| 精品视频在线观看网站| 一区二区三区精品国产| 日日摸夜夜添夜夜添精品视频| 亚洲一级av无码毛片精品| 亚洲国产另类av| www.黄色一片| 久久中文字幕国产| 亚洲欧洲一二区| 亚洲午夜精品一区二区| 免费成人在线影院| 男人的天堂av网| 欧美在线|欧美| 成年网站在线| 国产精品老女人精品视频| 国产一区二区三区四区大秀| 日本精品www| 久久久久久久综合| 免费黄色av片| 亚洲视频欧美视频| 欧美性理论片在线观看片免费| 久久久婷婷一区二区三区不卡| 99精品热视频只有精品10| 99久久人妻精品免费二区| 午夜精品视频在线观看| 十八禁一区二区三区| 97视频在线免费观看| 窝窝社区一区二区| 日本黄色三级大片| 久久久精品国产免费观看同学| 中文字幕在线看人| 在线观看视频亚洲| 涩涩涩久久久成人精品| 一区精品视频| 国产毛片精品一区| 国产在线视频卡一卡二| 亚洲第一页在线| 欧美人体一区二区三区| 亚洲激情一区二区| 国产福利不卡视频| 一区二区三区视频免费看| 日韩国产激情在线| 91p九色成人| 51xx午夜影福利| www.欧美精品一二区| 国内自拍视频在线播放| 日韩中文字幕网站| 亚洲精品一区在线| 日韩黄色片视频| 国产精品污www在线观看| av免费观看在线| 欧美亚洲视频在线看网址| 欧美色图一区| 无码人妻一区二区三区一| 精品免费在线视频| 天堂аⅴ在线地址8| 国产精品9999久久久久仙踪林| 免费在线播放第一区高清av| 日本女人性生活视频| 欧美变态tickling挠脚心| 亚洲精品日产| 在线观看视频黄色| 91网站最新网址| 国产精品无码专区av免费播放| 国色天香2019中文字幕在线观看| 蜜桃精品噜噜噜成人av| 黄色片免费网址| 欧美日韩一区二区免费在线观看 | 自拍一级黄色片| 精品女同一区二区三区在线播放| 91porn在线观看| 美女黄毛**国产精品啪啪| 国产精品一级片在线观看| 黄色在线免费观看| 欧美老女人性视频| 国产精品三级| 精品人妻在线视频| 欧美日韩一区二区三区在线 | 99热精品在线观看| 福利视频第一页| 亚洲激情小视频| 国产精品毛片aⅴ一区二区三区|