精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

KTransformers入選計算機系統頂會、與主流框架合作,趨境&清華讓「異構」成為推理新范式

人工智能 新聞
這是一個高性能異構推理框架,專注于高效利用底層GPU、CPU、內存等多樣化算力,讓大模型在更低算力、更靈活的硬件架構上高效運行。

全球AI基礎設施快速演進的浪潮中,一個誕生自中國的開源項目,正在被世界看見。

它就是KTransformers,由趨境科技與清華大學KVCache.AI團隊聯合研發,聚焦大模型推理階段的系統創新。

這是一個高性能異構推理框架,專注于高效利用底層GPU、CPU、內存等多樣化算力,讓大模型在更低算力、更靈活的硬件架構上高效運行,項目論文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》入選了剛剛落幕的“計算機系統領域奧斯卡” SOSP 2025。

SOSP是計算機系統領域最具影響力的國際頂會之一。過去幾十年間,從虛擬化到分布式文件系統,無數里程碑式的技術成果都曾首次亮相于此。

如今,KTransformers也在這個舞臺上獲得了全球系統學術界的最高背書。

幾乎在同一時間,KTransformers宣布與主流推理框架SGLang合作,雙方架構合入同一分支。這次合作意味著全GPU推理與異構推理的融合,推動大模型推理架構變得更加完善,將邁向更廣泛的產業落地。

在更遠的未來,它即將成為更多AI產品背后能跑得起大模型的底層路徑。

加入核心創新“專家延遲機制”,異構架構實現MoE模型高效推理

大模型推理領域,算力瓶頸正在成為全球技術界的核心問題。

尤其是當MoE(Mixture of Experts,專家混合)架構成為主流后,這個瓶頸更顯突出。MoE模型以“稀疏激活”為特征,每次推理只會調用部分專家子網絡,從而在不犧牲模型能力的前提下降低計算負擔。

問題隨之而來,如何高效調度這些專家從而避免資源浪費與設備空轉,成了產學研三界共同的新挑戰。

《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》正是在這一背景下誕生的。它提出了一條不同以往的道路:一套面向CPU+GPU異構架構的MoE推理系統方案,讓原本只能依賴昂貴多卡GPU的大模型,能在CPU參與的硬件環境中實現接近同等性能的推理體驗。

KTransformers的初衷是通過創新的異構推理的架構,充分釋放底層所有的硬件算力資源,優化計算調度,擺脫對單一硬件的依賴,從而實現更普惠、更高效的大模型部署與應用。

技術層面上,它通過一系列系統級創新,讓GPU負責注意力和主干網絡的高并行計算,CPU則承擔稀疏專家模塊的推理任務,實現了高效的CPU+GPU協同執行。

KTransformers的核心創新首先體現在底層算子優化上。

通過針對Intel AMX指令集開發的高吞吐計算核,結合自定義的tile-aware內存布局,KTransformers在單路Xeon上實現了PyTorch實現近4倍的提速,極大釋放了CPU在專家計算中的性能。至此,CPU成為推動系統吞吐提升的關鍵一環。

此外,KTransformers在異構任務協調方面也進行了系統性重構,為減少CPU與GPU之間的協調成本,KTransformers引入了NUMA感知張量并行和基于CUDA Graph的調度,以確保兩個設備以最小的同步延遲運行。

值得一提的是,在論文中KTransformers還提出了另一個創新技術——Expert Deferral(專家延遲機制)。

傳統MoE推理嚴格遵循層級順序,GPU必須等待CPU完成專家計算后才能繼續下一步,這種串行依賴導致了大量性能浪費。KTransformers打破了這一限制。

KTransformers研究團隊發現,Transformer模型的殘差連接具有一定的延遲容忍性,部分中間結果的計算并不需要嚴格同步完成。于是團隊提出讓部分專家計算延遲執行——也就是在GPU執行注意力模塊時,CPU專家仍在計算上一層結果,兩者并行推進。

這樣就使得CPU與GPU的負載得以動態重疊,模型吞吐提升約1.45倍,單卡decode速度最高超過30+ tokens/s,而模型精度變化低于0.5%,幾乎無損。

Expert Deferral是MoE推理異構化落地的關鍵突破,真正讓CPU與GPU實現了平等協作。

得益于這些設計,KTransformers能夠在一臺RTX 4080+雙路Xeon的單機環境中成功運行DeepSeek-V3-671B模型,單路性能接近多卡GPU集群水準。

推動推理架構融合,助力全球開發者高效創新

到今天,論文的全部思想已被完整工程化,衍生為開源系統KTransformers。

這其實是推理生態流變分化的一個具象化體現:一邊是以SGLang為代表的高吞吐、高并發全GPU路線;另一邊,則是仍在探索中的讓CPU與GPU協同工作的異構路線,嘗試用更靈活、成本更低的方式支持大模型運行。

KTransformers正是后者的代表之一。

KTransformers與SGLang的合作,是雙方基于各自推理引擎能力展開深度對接,聯合推動大模型推理向更高性能、更低成本的方向演進。

SGLang,全稱Structured Generation Language,是一種專為大型語言模型(LLM)和視覺語言模型(VLM)設計的高效推理與服務框架,它通過聯合設計前端語言和后端運行時來提升模型推理的速度和靈活性。

由于在多輪對話、復雜任務規劃和結構化輸出方面表現突出,在當下的大模型推理框架生態中,SGLang成為了最主流、最具工程實用性的開源推理引擎之一。

SGLang的優勢在于通用性和工程落地能力,全GPU推理思路也更適用于高吞吐量高并發等需求,KTransformers作為算子庫合入SGLang之后,雙方互為補充,開發者用戶可以直接獲得全GPU推理與異構推理兩種能力,不再需要手動集成、單獨調用。尤其是在GPU資源受限但本地CPU富余的場合,許多原本無法落地的模型都有了新的可行路徑。

例如通過KTransformers與SGLang合作實現的Multi-GPU+CPU混合推理能力,將更多專家放置在GPU上,這減少了帶寬瓶頸下的CPU內存訪問,相對單GPU的場景極大提升吞吐量。

此次合作實現了異構推理方案與主流推理框架的深度融合。這推動了雙方底層架構的協同進化,使其邁向更成熟、更工程化的新階段;同時使開發者能夠更便捷地調用各類模型,在硬件選擇上也更具靈活性。

KTransformers,想做的不止是“在本地跑得動”

技術成果背后,是持續構建生態的決心。

如今的KTransformers已成為一個被開發者、廠商與開源社區廣泛復用的共建式底層框架。

目前,其GitHub Star數已突破15.2K,成為全球Star數排名前列的大模型推理框架。

全球頭部開源模型方,如Qwen、Kimi、智譜 AI等多個主流大模型,都在模型發布首日就推薦KTransformers作為推理引擎支持;其工程實踐與兼容性也被多家一體機產品線采納。

在這條異構路線逐漸成型的過程中,趨境科技始終是最核心的推動者之一。

在KTransformers的架構設計、核心實現、算子優化、框架適配以及社區維護等多個關鍵層面,趨境科技始終處于一線角色——

在與清華大學KVCache.AI團隊聯合研發的基礎上,趨境負責了項目中的大量底層開發、接口對接、系統調度和社區推廣工作。

這一次與SGLang的對接合作中,趨境科技也作為主要實現方與維護貢獻者,完成了從對接設計、功能聯調,到主分支合入的全部工程閉環。

對趨境來說,KTransformers輸出的是一種價值理念的承載,更是一個更長期的目標:

在大模型時代,需要有人站出來為推理基礎設施提供新的可能性。大模型落地不能只有精英算力路徑,也需要一條更廣譜的路線:以異構協同釋放本地硬件的潛力,以開源能力幫助更多團隊和組織用得起、調得動、融得進自己的業務中。

正因此,趨境已經與多個國產CPU、GPU硬件平臺合作,共同推進全國產高性價比方案;為數十家行業開發伙伴提供算力底座,逐步實現算力普惠,讓大模型真正能夠為業務所用。

今天的KTransformers,已經讓大模型推理不再專屬于高端算力;未來,趨境希望讓AI能力也不再專屬于少數企業。

Gossip time

KTransformers已經可以在一張消費級GPU上穩定運行千億參數大模型。那么,下一步呢?

給大家附上一個圈內人最近才剛知道的小道消息:

研究團隊好像已經有人在內部試水微調了。而且是在不擴卡、不改架構的前提下來做輕量調優。

從KTransformer的設計思路來看,確實是順理成章的一步:

既然推理已經解決了,那接下來的方向,不就是能跑也能調么。

大家期待的小手手可以隨時搓起來了哈!

論文鏈接:

https://madsys.cs.tsinghua.edu.cn/publication/ktransformers-unleashing-the-full-potential-of-cpu/gpu-hybrid-inference-for-moe-models/SOSP25-chen.pdf

技術細節詳見SGLang博客:

https://lmsys.org/blog/2025-10-22-KTransformers/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-29 09:13:00

2022-03-30 15:25:28

鏈接過程計算機系統程序

2014-04-10 09:40:51

System 360計算機計算機系統

2025-07-01 13:52:19

2021-09-02 10:15:50

計算平臺MaxCompute 阿里云

2018-07-05 09:25:07

系統存儲層次

2022-10-31 08:17:04

內存計算機cpu

2025-05-29 03:00:00

混合推理模型LHRMAI

2022-07-12 10:37:08

阿里巴巴達摩院機器學習

2020-10-15 14:23:30

計算機互聯網 技術

2012-09-12 09:59:26

云計算超級計算機數據中心

2025-04-08 09:16:00

推理模型AI

2023-09-07 11:16:15

GPU機器學習

2012-06-20 10:40:36

量子計算機

2020-06-04 11:52:09

阿里云

2013-12-18 13:35:22

微軟頂新信息化

2024-08-13 14:00:00

AI訓練

2009-07-04 09:38:07

2020-06-19 10:33:16

阿里AIICML

2014-05-14 16:46:47

點贊
收藏

51CTO技術棧公眾號

亚洲天堂中文在线| 国内精品久久99人妻无码| 超碰在线网址| 成人亚洲一区二区一| 欧美在线不卡区| 日韩免费成人av| av一级亚洲| 欧洲一区在线观看| 国产曰肥老太婆无遮挡| 久草视频在线看| 国产成人av电影在线| 国产精品91在线观看| 中国毛片直接看| 女厕嘘嘘一区二区在线播放 | 欧美高清影院| 五月天婷婷综合| 国产精品亚洲天堂| 邻家有女韩剧在线观看国语| 国产精品综合在线视频| 国产999精品久久久| 久久久国产精华液| 欧美韩国日本在线观看 | 91丝袜脚交足在线播放| 中文字幕xxxx| 国产精品视区| 久久久久久久爱| 超碰手机在线观看| 日韩大片在线观看| 亚洲欧美精品一区二区| 白丝校花扒腿让我c| 亚洲人成777| 91久久精品网| 黄色动漫网站入口| www.超碰在线| 中文字幕制服丝袜成人av| 欧美二区在线看| 亚洲av综合色区无码一区爱av| 久久成人免费电影| 国产精品v片在线观看不卡| av大片免费在线观看| 国内自拍视频一区二区三区| 色吧影院999| 国产欧美一区二区三区在线观看视频 | 欧美性猛交xxxx乱大交蜜桃| 97视频在线免费| 国产精品偷拍| 亚洲线精品一区二区三区| 一区二区国产精品视频| av网站有哪些| 看全色黄大色大片免费久久久| 日韩精品一区二区三区四区 | 69视频免费看| 久久蜜桃资源一区二区老牛| 欧美在线免费观看| 日韩在线播放中文字幕| 免费中文字幕日韩欧美| 欧美在线观看网址综合| 国产精品视频一区在线观看| 欧美综合国产| 国产精品电影网站| 国产偷人爽久久久久久老妇app| 久久精品123| 国产精品久久久久久网站| 国产一级片av| 精品一区二区三区日韩| 97se亚洲综合在线| 亚洲精品成人电影| 本田岬高潮一区二区三区| 国产一区二区精品免费| 欧洲亚洲在线| 国产精品青草综合久久久久99| 亚洲一区在线免费| 一二三四区在线观看| 亚洲成av人片一区二区三区| 99精品在线免费视频| 日韩高清成人| 91精品黄色片免费大全| 亚洲啪av永久无码精品放毛片 | 免费在线观看av网址| 伊人久久婷婷| 日韩暖暖在线视频| 国产精品嫩草影院桃色| 国产成人鲁色资源国产91色综| 国产视频精品网| 电影av一区| 一区二区三区成人在线视频| 哪个网站能看毛片| 二区三区在线观看| 亚洲国产一区视频| 久久精品网站视频| 日本超碰一区二区| 亚洲女人天堂色在线7777| 欧美性生交大片| 亚洲乱码久久| 成人乱色短篇合集| 午夜18视频在线观看| 国产精品美女久久久久久2018| 九一免费在线观看| 视频二区不卡| 日韩欧美国产综合一区| 极品人妻videosss人妻| 国产综合网站| 国产日韩欧美电影在线观看| 熟妇高潮一区二区三区| 国产精品嫩草99a| 国产精品无码人妻一区二区在线| 国产精品xxx| 亚洲第一综合天堂另类专| 2017亚洲天堂| 久久久久久一区二区| 91网站免费观看| 国产女人在线观看| 黄网动漫久久久| 国产裸体视频网站| 水蜜桃精品av一区二区| 午夜精品视频网站| 99在线小视频| 国产精品久久久久桃色tv| 男人和女人啪啪网站| av日韩在线播放| 久久中文字幕视频| 极品美妇后花庭翘臀娇吟小说| 亚洲大胆av| 91免费国产网站| 91免费在线| 一本到高清视频免费精品| 午夜影院福利社| 亚洲欧美综合久久久| 国产精品嫩草视频| 国产精品视频一区二区久久| 精品久久久久久中文字幕大豆网 | 少妇精69xxtheporn| 久久久久99精品成人片我成大片| 成人午夜视频在线| 日本福利视频网站| 国产视频一区二| 久久夜色精品国产亚洲aⅴ| 中文字幕乱码在线观看| 国产日韩高清在线| 别急慢慢来1978如如2| 亚洲动漫精品| 欧洲日韩成人av| 同心难改在线观看| 欧美日韩国产一区二区| 粉嫩av懂色av蜜臀av分享| 亚洲国产电影| 国产区欧美区日韩区| 51漫画成人app入口| 精品国产制服丝袜高跟| 青青操国产视频| 国产传媒日韩欧美成人| www.亚洲视频.com| 66精品视频在线观看| 欧美激情按摩在线| 手机av在线免费观看| 精品国产老师黑色丝袜高跟鞋| 国产精品无码在线| 性欧美videos另类喷潮| 日本精品二区| 日韩成人在线电影| 久久的精品视频| 亚洲精选一区二区三区| 精品成人久久av| 欧美另类z0zx974| 麻豆91精品91久久久的内涵| 中文字幕乱码一区二区三区| www一区二区三区| 欧美激情一区二区三区在线视频观看| 黄色a在线观看| 一本一道久久a久久精品综合蜜臀| 一区二区伦理片| 韩国精品在线观看| 欧美人成在线观看| 九色精品91| 91免费的视频在线播放| 97人澡人人添人人爽欧美| 亚洲美女视频网| 在线观看日韩一区二区| 一二三区精品福利视频| 成人精品999| 狠狠色2019综合网| 天天夜碰日日摸日日澡性色av| 国产精品一国产精品| 成人午夜小视频| 偷拍自拍在线看| 欧美一区二区三区免费大片| 久久久国产成人| 国产欧美日韩精品一区| 中文字幕在线视频一区二区| 国产精品久久久久久久久久妞妞| 图片区小说区区亚洲五月| 日韩精品一区二区三区中文字幕| 97成人超碰免| 黄网站app在线观看| 日韩成人在线网站| 国产一区二区三区三州| 欧美日韩国产综合新一区 | 国产精品草莓在线免费观看| 2020国产在线视频| 一本色道久久综合亚洲精品小说| 性中国xxx极品hd| 在线观看一区二区视频| 国产无精乱码一区二区三区| 国产精品欧美经典| 国产人妻人伦精品1国产丝袜| 国产在线乱码一区二区三区| 欧美成人精品欧美一级乱| 欧美日韩mv| 夜夜爽99久久国产综合精品女不卡| 国产精品chinese在线观看| 国产综合久久久久| 欧美精品总汇| 69国产精品成人在线播放| 18网站在线观看| 中文字幕在线精品| 九九九伊在人线综合| 精品av久久707| 精品黑人一区二区三区国语馆| 在线免费观看日韩欧美| 欧美日韩综合在线观看| 亚洲一区二区三区四区五区中文 | 欧美日韩蜜桃| 99亚洲精品视频| 三区四区不卡| 少妇精品久久久久久久久久| 日韩av网址大全| 国内精品久久国产| 成人福利一区| 国产精品v欧美精品v日韩精品 | 美女视频一区二区| 国产一级不卡毛片| 六月天综合网| 国产真实乱子伦| 99riav国产精品| 国产精品又粗又长| 亚洲看片一区| 国产精品专区在线| 在线播放精品| 成人网站免费观看入口| 亚洲黄色影院| 婷婷五月综合缴情在线视频| 狠狠入ady亚洲精品| 日韩黄色片在线| 亚洲性人人天天夜夜摸| 99色这里只有精品| 一区视频在线| 欧美精品一区免费| 性高湖久久久久久久久| 国模杨依粉嫩蝴蝶150p| 日韩精品电影在线观看| 午夜两性免费视频| 免费高清在线一区| 中文av字幕在线观看| 国产伦精品一区二区三区在线观看| 五月天视频在线观看| 国产麻豆日韩欧美久久| 色哟哟在线观看视频| 懂色一区二区三区免费观看| 免费看毛片的网站| 久久色成人在线| 岛国片在线免费观看| 日韩美女啊v在线免费观看| 性感美女一区二区三区| 国产超碰在线一区| 欧类av怡春院| 国产拍欧美日韩视频二区| 91视频最新网址| 亚洲一卡二卡三卡四卡五卡| 午夜精品久久久久久久久久久久久蜜桃| 欧美性xxxx| 亚洲无码久久久久| 欧美tk丨vk视频| 日本五码在线| 久久久91精品| 成入视频在线观看| 国产精品青青在线观看爽香蕉| 不卡的国产精品| 久久精品aaaaaa毛片| 日韩欧美高清| 亚洲理论电影在线观看| 日韩av网站免费在线| 中文字幕在线播放一区二区| 99久久免费精品高清特色大片| 粉嫩精品久久99综合一区| 一区二区三区国产豹纹内裤在线| 亚洲天堂五月天| 欧美一级免费大片| 蝌蚪视频在线播放| 精品中文字幕视频| 韩国成人在线| 岛国视频一区免费观看| 精品国产乱码久久久久久蜜坠欲下| 五月天男人天堂| 国产精品久久久亚洲一区| 日韩欧美亚洲另类| 久久综合狠狠综合久久激情| 三级在线观看免费大全| 精品久久久国产| a天堂在线视频| 这里只有精品视频| 岛国av在线播放| 成人激情av在线| 真实原创一区二区影院| 999久久欧美人妻一区二区| 日韩av一区二| 国产精品第七页| 亚洲欧美另类图片小说| 欧美特黄aaaaaa| 精品久久久久久综合日本欧美| aaa在线免费观看| 2021久久精品国产99国产精品| 国产区一区二| 在线观看精品视频| 视频一区视频二区中文| 久久人妻少妇嫩草av无码专区| 伊人色综合久久天天人手人婷| a片在线免费观看| 亚洲情综合五月天| 国产精品一区二区日韩| 官网99热精品| 午夜精品视频| 伊人精品视频在线观看| 国产精品久久一卡二卡| 国产精品xxxxxx| 亚洲欧美另类在线观看| 啊啊啊久久久| 国产精品久久亚洲7777| 韩国亚洲精品| 日本中文字幕有码| 亚洲精品国产成人久久av盗摄| 亚洲天堂中文字幕在线| 少妇激情综合网| 欧美亚洲福利| 在线免费观看成人网| 蜜桃一区二区三区四区| 欧美午夜激情影院| 欧美亚洲精品一区| sese一区| 国产日韩欧美中文在线播放| 久久精品国产99久久| 亚洲欧美视频二区| 国产精品免费观看视频| 91美女精品网站| 久久综合电影一区| 国产美女精品视频免费播放软件| 一本—道久久a久久精品蜜桃| 精久久久久久久久久久| 老熟妇高潮一区二区三区| 日韩一区二区精品| 污污影院在线观看| 国产欧美亚洲日本| 亚洲深爱激情| 国产真人做爰视频免费| 欧美日韩一区久久| 久cao在线| 国产91aaa| 男女av一区三区二区色多| 日本少妇xxxxx| 欧美精品视频www在线观看| 在线三级电影| 激情小说网站亚洲综合网| 午夜在线精品偷拍| 国产精品无码无卡无需播放器| 欧美群妇大交群的观看方式| a毛片在线看免费观看| 国产高清在线一区二区| 亚洲自啪免费| 麻豆一区在线观看| 欧美成人video| 久久久久久久| 黄色www在线观看| 成人精品gif动图一区| 特级西西444www大精品视频免费看| 国产一区二区欧美日韩| 国产不卡精品在线| 色综合久久久久无码专区| 欧美国产精品久久| www.亚洲黄色| 青青青国产精品一区二区| 日韩综合在线| 荫蒂被男人添免费视频| 欧美日韩一级黄| 第一中文字幕在线| 亚洲v国产v| 成人激情av网| 正在播放亚洲精品| 欧美极品在线播放| 欧美理论电影大全| 国产免费a级片| 欧美午夜视频网站| gogo高清午夜人体在线| 亚洲一区二区三区乱码| 成年人网站91| 国产一区二区三区黄片| 热久久免费视频精品| 欧美96在线丨欧| 天天干天天舔天天操| 亚洲大尺度美女在线| 日本电影久久久| 欧美不卡在线播放|