精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MoE那么大,幾段代碼就能穩(wěn)穩(wěn)推理 | 開源

人工智能 新聞
華為一個(gè)新項(xiàng)目,直接把推理超大規(guī)模MoE背后的架構(gòu)、技術(shù)和代碼,統(tǒng)統(tǒng)給開源了!

混合專家網(wǎng)絡(luò)模型架構(gòu)(MoE)已經(jīng)成為當(dāng)前大模型的一個(gè)主流架構(gòu)選擇,以最近開源的盤古Pro MoE為例,其基于MoGE架構(gòu)構(gòu)建的混合專家架構(gòu),總參數(shù)量達(dá)720億,激活參數(shù)量為160億,專門針對(duì)昇騰硬件優(yōu)化,在性能與效率上表現(xiàn)突出。

盤古還實(shí)現(xiàn)了在推理時(shí)做到又快又穩(wěn)。

在技術(shù)特性上,盤古模型引入 “快思考” 和 “慢思考” 雙系統(tǒng),可根據(jù)問題復(fù)雜度自動(dòng)切換響應(yīng)模式,并在推理性能上實(shí)現(xiàn)突破——在昇騰800I A2上單卡推理吞吐性能達(dá)1148 tokens/s,經(jīng)投機(jī)加速技術(shù)可提升至1528 tokens/s,顯著優(yōu)于同等規(guī)模稠密模型。

那么讓盤古、DeepSeek、Qwen這些開源的MoE模型在昇騰硬件上推理,能夠達(dá)到易維護(hù)、高性能,并且全面開源的技術(shù)項(xiàng)目有沒有呢?

現(xiàn)在,這個(gè)問題似乎有了標(biāo)準(zhǔn)答案——

華為一個(gè)新項(xiàng)目,直接把推理超大規(guī)模MoE背后的架構(gòu)、技術(shù)和代碼,統(tǒng)統(tǒng)給開源了!

這個(gè)新開源項(xiàng)目名叫Omni-Infer,整體來看,它對(duì)于企業(yè)用戶來說是非常利好的。

例如它可以給企業(yè)提供PD分離部署方案,針對(duì)QPM進(jìn)行系統(tǒng)級(jí)優(yōu)化,還會(huì)分享大規(guī)模商用過程中硬件使用的“方法論”。

而且對(duì)于開發(fā)者和開源社區(qū),華為這“一呼”也是起到了“百應(yīng)”的效果。

GitHub地址:https://github.com/FlagOpen/FlagScale/pull/630

北京智源研究院副院長兼總工程師林詠華表示:

北京智源研究院一直以來致力于人工智能開源生態(tài)建設(shè),很高興看到Omni-infer項(xiàng)目開源,智源團(tuán)隊(duì)打造的面向多芯片的FlagScale框架也在第一時(shí)間接入了Omni-infer,期待后續(xù)有更多生態(tài)合作。

上海人工智能實(shí)驗(yàn)室系統(tǒng)平臺(tái)中心負(fù)責(zé)人王輝認(rèn)為:

DeepLink致力于打造最開放兼容的人工智能計(jì)算體系,十分期待能與Omni-infer項(xiàng)目攜手,繁榮自主軟硬件協(xié)同開源社區(qū)、拓展生態(tài)版圖。

以及OpenI啟智社區(qū)運(yùn)營中心主任余躍也給出了響應(yīng):

OpenI啟智社區(qū)堅(jiān)持創(chuàng)新為本,面向未來與Omni-Infer項(xiàng)目一起打造基于算力網(wǎng)的開源共創(chuàng)協(xié)作生態(tài)。

據(jù)了解,華為Omni-Infer社區(qū)的定位是 “加速套件+最佳實(shí)踐”,未來提供開箱即用能力,支持昇騰推理集群快速部署。

圖片

而對(duì)于這次Omni-Infer的開源,其實(shí)是華為兌現(xiàn)了一個(gè)月前在發(fā)布重磅技術(shù)報(bào)告之際所做出的承諾。

那么接下來,我們就來一同深入了解一下華為的Omni-Infer。

一個(gè)框架和一個(gè)套件

從整體來看,Omni-Infer可以拆成兩大塊來看:一個(gè)是推理框架,一個(gè)是推理加速套件。

圖片

從框架角度來看,Omni-Infer能和業(yè)界主流的開源大模型推理框架(如vLLM)完美兼容,就像不同品牌的零件可以組裝在同一臺(tái)機(jī)器上。

并且據(jù)了解,它的功能還將不斷擴(kuò)展,會(huì)持續(xù)為昇騰硬件平臺(tái)上的大模型推理提供更強(qiáng)大的支持(例如SGLang等主流開源LLM推理框架)。

值得一提的是,Omni-Infer是與vLLM/SGLang等等這些主流大模型推理開源框架是解耦的,獨(dú)立安裝。

這就意味著用戶只需維護(hù)vLLM等的主版本即可,大大降低了軟件版本維護(hù)的成本。

至于Omni-Infer的加速套件,若是用較為形象的比喻,它的“打開方式”是這樣的:

  • 企業(yè)級(jí)的 “調(diào)度員”:它有一套智能的調(diào)度系統(tǒng),就像交通警察指揮車輛一樣,能合理安排任務(wù)(xPyD調(diào)度)。而且支持大規(guī)模分布式部署,就像多個(gè)交通崗?fù)f(xié)同工作,不管任務(wù)量多大,都能保證最低的延遲,讓響應(yīng)更及時(shí)。
  • 精準(zhǔn)的 “負(fù)載平衡器”:對(duì)于不同長度的任務(wù)序列,它在預(yù)填充和解碼這兩個(gè)關(guān)鍵階段都做了優(yōu)化。比如,就像快遞分揀中心針對(duì)不同大小的包裹采用不同的分揀策略,讓整個(gè)處理過程的吞吐量達(dá)到最大,同時(shí)還能保持低延遲。
  • MoE模型的 “專屬搭檔”:它對(duì)混合專家(MoE)模型特別友好,支持EP144/EP288等多種配置??梢韵胂蟪梢粋€(gè)大型的 “專家團(tuán)隊(duì)”,每個(gè)專家負(fù)責(zé)不同的任務(wù),它能讓這些專家高效協(xié)作。
  • 智能的 “資源分配者”:具備分層非均勻冗余和近實(shí)時(shí)動(dòng)態(tài)專家放置功能。就像在一個(gè)大型工廠里,根據(jù)實(shí)時(shí)的生產(chǎn)需求,動(dòng)態(tài)調(diào)整各個(gè)生產(chǎn)線的工人分配,讓資源得到最充分的利用。
  • 注意力機(jī)制的 “強(qiáng)化器”:專門為LLM、MLLM和MoE等模型優(yōu)化了注意力機(jī)制。這就好比給模型的 “注意力” 裝上了 “放大鏡”,讓它在處理信息時(shí)更聚焦、更高效,提升了模型的性能和可擴(kuò)展性。

如何“食用”?

在聊完Omni-Infer的特點(diǎn)之后,我們繼續(xù)來看下該如何去體驗(yàn)。

首先對(duì)于它的使用環(huán)境是有一定的要求:

  • 硬件:目前僅支持CloudMatrix384推理卡
  • 操作系統(tǒng):Linux Python: >=3.9, <= 3.11

其次在安裝方式上,目前僅支持通過Docker鏡像方式進(jìn)行安裝:

docker pull swr.cn-southwest-2.myhuaweicloud.com/omni-ai/omniinfer:202506272026

這個(gè)鏡像已預(yù)先集成所需的CANN及Torch-NPU依賴包,同時(shí)內(nèi)置可直接運(yùn)行的Omni-Infer與vLLM工具包,開箱即可使用。

可以使用下面這個(gè)命令檢查是否可用:

pip list | grep omni_infer

PD分離自動(dòng)化部署(4機(jī)2P1D)為例,它的部署框架如下所示:

圖片

再接下來,只需文檔教程,僅少量代碼和步驟,即可完成安裝和部署:

圖片

整體來看,此次華為面向超大規(guī)模MoE開源的項(xiàng)目,是做到了簡單幾步就可以讓AI推理這事變得又快又穩(wěn)。

極致開源

Omni-Infer除了將此前《華為昇騰服務(wù)器 DeepSeek V3/R1 推理部署最佳實(shí)踐》技術(shù)報(bào)告中的關(guān)鍵技術(shù)開源出來之外,也同步進(jìn)行了更加專業(yè)的開源社區(qū)建設(shè)。

首先,在獨(dú)立的社區(qū)倉庫中,將社區(qū)治理、社區(qū)會(huì)議、社區(qū)活動(dòng)、生態(tài)合作、代碼規(guī)范、設(shè)計(jì)文檔等社區(qū)信息全部開放出來,讓開發(fā)者能夠最直接深入的參與到社區(qū)發(fā)展中。

其次,參照業(yè)界主流大型開源社區(qū)的最佳實(shí)踐,采用開放的社區(qū)治理機(jī)制,通過項(xiàng)目管理委員會(huì)(Project Management Committee)和特別興趣小組(Special Interest Group)兩級(jí)機(jī)制,提供公正透明的討論與決策機(jī)制。

再次,針對(duì)業(yè)界同類開源項(xiàng)目大多存在的“一頭熱”的“被動(dòng)適配”生態(tài)合作模式問題,Omni-Infer社區(qū)則采取了“主動(dòng)適配”的社區(qū)構(gòu)筑路徑,尤其是主動(dòng)擁抱國內(nèi)正在逐步成長的人工智能開源項(xiàng)目,讓生態(tài)真正實(shí)現(xiàn)多方共贏。

作為長期與業(yè)界幾大主流開源基金會(huì)(Linux基金會(huì)、OpenInfra基金會(huì)、Apache基金會(huì)等)保持緊密合作關(guān)系的社區(qū)團(tuán)隊(duì),Omni-infer剛開源的首個(gè)活動(dòng)就將參與OpenInfra基金會(huì)在蘇州的Meetup,感興趣的同學(xué)可以到現(xiàn)場(chǎng)交流,也順路可參加有特色的全球性開源社區(qū)的生日活動(dòng)。

圖片

最后,所有相關(guān)的地址放下面了,感興趣的小伙伴可自取哦~

技術(shù)報(bào)告及可分析代碼包:https://gitcode.com/ascend-tribe/ascend-inference-cluster

源代碼開發(fā)協(xié)作:
https://gitee.com/omniai/omniinfer

社區(qū)治理、運(yùn)作等內(nèi)容:
https://gitee.com/omniai/community

【其他托管平臺(tái)】

Github:
https://github.com/omni-ai-npu/omni-infer

OpenI啟智社區(qū):
https://git.openi.org.cn/omni-ai/omni-infer

GitLink確實(shí)平臺(tái):https://gitlink.org.cn/omni-ai/omniinfer

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2018-08-30 15:32:32

NVIDIAGPU顯卡

2018-08-01 18:13:53

人工智能AI

2015-09-16 11:16:25

微軟安卓占領(lǐng)

2018-09-27 18:52:13

人工智能AI

2015-04-24 15:24:39

搜狗手機(jī)輸入法

2018-07-12 12:13:55

華為

2020-04-20 08:41:38

工資職場(chǎng)加薪

2025-07-02 08:55:00

開源模型代碼

2025-02-25 12:08:26

2015-08-31 10:19:44

2020-05-17 16:15:49

RPCJava代碼

2025-04-30 16:48:07

2024-05-06 07:58:23

MoE模型系統(tǒng)

2020-03-24 14:32:17

漢化編程英文

2025-02-19 15:17:24

2024-02-06 10:38:10

昆侖萬維大模型

2025-02-25 11:35:36

2025-02-12 09:20:12

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

天堂中文字幕在线| 中文字幕日韩av| 国精产品一区一区三区有限在线| 97在线播放视频| 欧美三级日本三级| 香蕉成人av| 欧美三区视频| 欧美裸体一区二区三区| 秋霞久久久久久一区二区| 国产精品99精品| 日本高清精品| 中文字幕亚洲成人| 国产成人精品av在线| 无码精品一区二区三区在线播放| av网站导航在线观看免费| 奇米影视在线99精品| 亚洲精品天天看| 国产老熟妇精品观看| 亚洲精品18p| 午夜欧美精品久久久久久久| 欧美乱熟臀69xxxxxx| 精品无码国产一区二区三区av| 国产黄色大片网站| 婷婷久久一区| 7777精品伊人久久久大香线蕉经典版下载 | 久久99久久99精品蜜柚传媒| 九九免费精品视频| 午夜精品在线| 欧美日韩一级视频| 一本一生久久a久久精品综合蜜| jizz国产在线| 日韩精品中文字幕第1页| 色老头久久综合| 欧美在线日韩精品| 免费的黄色av| 久久亚洲二区| 中文字幕免费国产精品| 自拍视频一区二区| 亚洲视频精选| 岛国视频午夜一区免费在线观看| 99久久一区三区四区免费| 毛片aaaaa| 亚洲电影影音先锋| 欧美tk—视频vk| 欧美变态另类刺激| 国产女人在线观看| 麻豆一区二区99久久久久| 久久精品99无色码中文字幕| 99久久综合网| 亚洲电影观看| 中文字幕在线观看不卡视频| 99国产在线观看| 在线观看亚洲国产| 国产精品a级| 久久色在线播放| 风间由美一二三区av片| 成人在线不卡| 亚洲国产精品麻豆| 日韩妆和欧美的一区二区| 4438国产精品一区二区| 成人影院在线| 精品国产乱码久久久久久蜜臀| 日本在线观看a| 天堂av在线| 欧美色播在线播放| 中文字幕一区二区三区四区五区人| www.黄色小说.com| 久久亚洲美女| 国产精品人成电影在线观看| 国产精品成人aaaa在线| 国产在线日韩| 中文字幕精品在线| 欧美性生给视频| 任我爽精品视频在线播放| 欧美电影一区二区| 99999精品| 欧美free嫩15| 午夜精品爽啪视频| 成年人黄色在线观看| 成人欧美在线| 国产精品国产三级国产aⅴ原创| 亚洲自拍的二区三区| www.欧美日本韩国| 亚洲3atv精品一区二区三区| 亚洲中文字幕无码不卡电影| 久久久精品一区二区毛片免费看| 狠狠色狠狠色综合日日五| 日韩av黄色网址| 青草在线视频| 欧美 日韩 国产 一区二区三区| 欧美zzoo| 国产成人免费视频一区| 国产成人91久久精品| 久久国产香蕉视频| 国产精品美女| 欧美极品在线视频| 波多野结衣久久久久| 免费欧美视频| 日韩av在线免费观看| 天天av天天操| 日韩电影精品| 欧美在线制服丝袜| 欧美激情国产精品日韩| 国产乱色在线观看| 国产精品天干天干在观线 | 麻豆精品在线| 欧美日韩激情一区| 韩国一区二区av| 日本久久久久| 亚洲精品国精品久久99热一| 第一页在线视频| 亚洲欧洲自拍| 91精品婷婷国产综合久久性色| 精品国产一区在线| 女同久久另类99精品国产| 在线观看欧美日韩| 91麻豆制片厂| 欧美成人激情| 久久精品中文字幕免费mv| 国产主播在线播放| 久久99精品网久久| 成人黄色中文字幕| 国产乱淫片视频| 狠狠色综合播放一区二区| 成人精品视频久久久久| 天堂中文在线官网| 久久影院视频免费| 久久免费看av| 欧美1234区| 91精品一区二区三区在线观看| 欧美狂猛xxxxx乱大交3| 狠狠色狠狠色综合婷婷tag| 亚洲欧美日韩天堂| 亚洲一二三四视频| 国产精品久久久免费| 成人免费在线一区二区三区| 日本毛片在线观看| 亚洲人成网站色在线观看| 真人做人试看60分钟免费| 18视频在线观看| 欧美日韩一区不卡| 亚洲第一综合网| 91精品国产麻豆国产在线观看| 国产精品激情自拍| 国产日韩免费视频| av中文字幕亚洲| 日韩性感在线| 色尼玛亚洲综合影院| 日韩av在线免费| 亚欧视频在线观看| 美女在线视频一区| 国产精品日韩一区二区三区| 裸体xxxx视频在线| 欧美午夜片在线免费观看 | 久久久91精品国产一区二区精品| 亚洲国产精品一区二区第四页av| 国产高清一区二区三区视频| 欧美丝袜第三区| 亚洲av综合色区无码另类小说| 亚洲h色精品| 91在线看www| 毛片在线能看| 欧美在线视频不卡| 9.1片黄在线观看| 激情久久久久久| 国产精品久久久久久中文字| 国产中文字幕在线| 一区二区三区日韩欧美| 国产精品333| 久久超碰99| 国产精品一区二区3区| 色哟哟中文字幕| 欧美午夜性色大片在线观看| 久久精品国产亚洲av久| 男男成人高潮片免费网站| 在线播放豆国产99亚洲| 成人观看网址| 日韩一区二区三区四区| 中国女人特级毛片| 久久精品国产精品亚洲综合| 黄黄视频在线观看| 精品五月天堂| 欧美成人三级视频网站| 在线观看你懂的网站| 亚洲欧洲日韩一区二区三区| 伊人av在线播放| 国产欧美精品| 亚洲狠狠婷婷综合久久久| 国产精品一区二区三区av| 亚洲网站在线看| 国产成人自拍视频在线| 久久久久久99久久久精品网站| www.精品在线| 国产精品免费不| 国产欧美日韩精品在线观看| 日本在线观看高清完整版| 欧美日韩视频在线观看一区二区三区 | 日韩一区二区高清视频| 国产精品无码久久久久| 欧美激情极品视频| 99热这里精品| 粉嫩老牛aⅴ一区二区三区| 亚洲女同二女同志奶水| 高清av一区二区| 久久亚洲国产成人精品无码区 | 精品午夜一区二区三区在线观看| 国产精彩视频一区二区| 色综合天天综合网中文字幕| 精品国产乱码久久久久久丨区2区| 影音先锋中文在线视频| 亚洲剧情一区二区| 成人av无码一区二区三区| 色综合久久久久综合体桃花网| chinese麻豆新拍video| 六月丁香婷婷久久| 国产免费毛卡片| 国产精品99一区二区| 一区二区不卡在线视频 午夜欧美不卡'| 国产日韩三级| 69国产精品成人在线播放| 五月婷婷丁香网| 日韩欧美在线视频观看| 亚洲欧美卡通动漫| 久久综合给合久久狠狠狠97色69| 亚洲美女爱爱视频| 综合一区av| 国产精品久久久久免费| 亚洲欧美在线人成swag| 欧美精品午夜视频| av在线电影网| 欧美一区二区网站| 欧美日韩中文视频| 日韩理论片在线| 免费成人深夜蜜桃视频| 久久久91精品国产一区二区三区| 欧美日韩一区二区三区四区五区六区| 日韩一区二区免费看| 精品亚洲欧美日韩| 91夜夜蜜桃臀一区二区三区| 88国产精品欧美一区二区三区| 色屁屁www国产馆在线观看| 久久精品视频va| 欧美18一19xxx性| 精品福利一二区| 国内精品国产成人国产三级| 777久久久精品| 91精东传媒理伦片在线观看| 伊人一区二区三区| 顶级黑人搡bbw搡bbbb搡| 中文字幕第一区二区| 黄色正能量网站| 狠狠久久亚洲欧美| 男生操女生视频在线观看 | 国产福利免费在线观看| 亚洲女人天堂视频| 你懂的在线视频| 亚洲一区999| 成人高清免费观看mv| 中文国产成人精品久久一| 在线a免费看| 亚洲精品999| 天天操天天干天天| 日韩精品极品在线观看播放免费视频| 亚州精品国产精品乱码不99按摩| 日韩av在线最新| 国产二区视频在线观看| 久久久91精品国产一区不卡| 丝袜在线观看| 91高清免费视频| 日韩精品免费观看视频| 久久久久久久999| 超碰99在线| 国产精品6699| 性欧美video另类hd尤物| 亚洲影院在线看| 国产亚洲欧美日韩精品一区二区三区| 国产精品一区二区性色av| 成人在线视频www| 国产精品国产一区二区| 欧美一级三级| 亚洲日本精品一区| 国户精品久久久久久久久久久不卡| cao在线观看| 欧美成人tv| 欧美啪啪免费视频| 免费日本视频一区| 午夜影院福利社| 欧美激情中文字幕一区二区| 国产精品久久不卡| 亚洲国产高清在线观看视频| 久草网站在线观看| 欧美体内谢she精2性欧美| 亚洲天堂中文字幕在线| 精品电影一区二区三区| 超碰免费在线观看| 久久久亚洲网站| 欧美激情福利| 久久涩涩网站| 综合精品一区| 三级在线视频观看| 日日摸夜夜添夜夜添亚洲女人| 国产男女免费视频| 天堂精品中文字幕在线| 巨乳女教师的诱惑| 国产日韩欧美综合在线| 午夜理伦三级做爰电影| 中文字幕一区二区三区蜜月| 日韩av电影网| 欧美日韩免费在线| 97视频免费在线| 亚洲欧美激情一区| 五月天激情在线| 国产精品一久久香蕉国产线看观看 | 韩国av一区| 亚洲a级黄色片| 国产午夜精品福利| 免费毛片一区二区三区| 欧美精品少妇一区二区三区| 久久这里精品| 国模精品视频一区二区| 99热这里有精品| 无遮挡亚洲一区| 午夜在线观看免费一区| 日本网站免费在线观看| 国产美女久久久久| 深夜视频在线观看| 国产精品国产精品国产专区不片| 日本午夜视频在线观看| 欧美午夜精品伦理| 囯产精品一品二区三区| 亚洲丁香久久久| 国产精品视频一区二区久久| 国产69精品久久久久9| 精品久久国产一区| 在线观看福利一区| 奇米精品一区二区三区四区| 中文字幕av网址| 偷窥国产亚洲免费视频| 无码人妻久久一区二区三区不卡| 欧美午夜一区二区三区| 四虎影视精品成人| 亚州成人av在线| 亚洲国产欧美日本视频| 国产欧美欧洲| 日韩精品一区二区久久| 成年人小视频网站| 国产一区二区三区av电影| 国产又粗又长免费视频| 日本丶国产丶欧美色综合| 人成免费电影一二三区在线观看| 在线亚洲男人天堂| 成人国产激情在线| 亚洲日本一区二区三区在线不卡| 美女网站视频久久| 国产日产在线观看| 欧美久久久久免费| 黄网站免费在线观看| 成人网在线观看| 中文精品久久| 中文在线字幕观看| 午夜精品久久久久久久| 香港三日本三级少妇66| 日本高清不卡的在线| www.久久久久爱免| 青青草原国产免费| 国产精品亚洲а∨天堂免在线| a毛片毛片av永久免费| 狠狠做深爱婷婷久久综合一区| 男人的天堂av高清在线| 国产极品jizzhd欧美| 91免费精品| 国产人妖在线观看| 高跟丝袜一区二区三区| 国产高清一级毛片在线不卡| 国产综合视频在线观看| 国产99精品一区| 在线黄色免费观看| 亚洲激情av在线| 日韩三级电影网| 国产日本欧美一区| 亚洲香蕉网站| 国产精品扒开腿做爽爽| 在线不卡一区二区| gogo高清在线播放免费| 成人网中文字幕| 黄色日韩在线| 法国空姐电影在线观看| 天天影视色香欲综合网老头| 精彩国产在线| 亚洲综合av影视| 老司机精品久久| 青青草原在线免费观看| 亚洲男人天堂视频| 警花av一区二区三区| 成人观看免费完整观看| 亚洲日本护士毛茸茸| 偷拍自拍在线视频| 91久久中文字幕| 久久九九99| 亚洲精品国产91|