精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

把MLA和稀疏激活帶到端側!港科大廣州和倫敦大學學院團隊聯合發布軟硬協同設計的邊緣語言模型PLM

人工智能 新聞
學術界在大規模模型結構實驗方面面臨諸多挑戰,而堅持從頭預訓練的團隊更是少之又少。

本文由 PLM 團隊撰寫,PLM 團隊是由香港科技大學(廣州)的校長倪明選教授,倫敦大學學院(UCL)AI 中心汪軍教授,香港科技大學(廣州)信息樞紐院長陳雷教授聯合指導。第一作者鄧程是香港科技大學(廣州)的研究助理,研究方向為端側大模型和高效模型推理;參與成員包括中科院自動化所的孫羅洋博士,曾勇程博士,姜紀文碩士,UCL 吳昕鍵,港科大廣州的博士生肖慶發和趙文欣,港科大的博士后王嘉川以及香港理工的助理教授(研究)李昊洋。通訊作者為鄧程博士,陳雷教授和汪軍教授。

在大模型「卷參數」的浪潮中,一個亟待解決的課題始終存在:如何讓百億級能力的 AI 跑進手機、嵌入設備、實現萬物互聯?內存墻、算力墻、I/O 墻這三座邊緣設備的「大山」令許多大模型鎩羽而歸。

近日,香港科技大學(廣州)倪明選校長和陳雷教授聯合 UCL 汪軍教授團隊以及中科院自動化所團隊聯合提出 PLM(Peripheral Language Model),通過算法 - 系統協同設計,選擇了適合邊緣設備的模型架構。

PLM 是首個結合 MLA 注意力機制與 ReLU2 激活 FFN 的架構。評估結果表明,PLM 的表現優于現有在公開數據上訓練的小型語言模型,性能接近利用 18T tokens 訓練的 Qwen2.5-1.5B 模型,同時保持最低激活參數數量。

其中,PLM 在通用知識理解(ARC)、數學(GSM8K)任務中表現出色,在代碼能力評測(HumanEval)基準上更是以 64.6 分位居榜首。

圖片

  • 項目論文:https://arxiv.org/abs/2503.12167
  • 項目網站:https://www.project-plm.com
  • 項目地址:https://github.com/plm-team/PLM
  • 模型地址:Hugging Face: https://huggingface.co/PLM-Team

團隊還將模型適配至多種邊緣設備,在 Snapdragon 等芯片上展現出優于同層數模型的吞吐優勢。PLM 團隊不僅開源模型權重,還提供了從架構設計到部署的完整技術報告,并計劃逐步開源訓練數據集及相關代碼腳本。

圖片

剖析 PLM:1+1 能否大于 2?

圖片

核心模塊一:Multi-head Latent Attention(MLA)—— 把 KV 緩存壓縮到極致

PLM 采用了 Deepseek 提出的 MLA(Multi-Head Latent Attention)注意力機制,并首次將其應用于 2B 參數以下的模型中。為適應端側系統的需求,PLM 對 Deepseek 的 MLA 進行了適度優化,去除了訓練階段用于降低成本的 Q 矩陣壓縮過程,同時保留了 KV 矩陣的 512 維度。此外,PLM 通過解耦的位置編碼機制,確保了模型對長程依賴信息的有效捕捉。

核心模塊二:平方 ReLU 激活 —— 讓計算「稀疏化」

PLM 通過去除門控機制簡化了前饋神經網絡,從而有效降低了計算復雜度和內存消耗。傳統 SwiGLU 激活函數導致 MLP 層計算密集,而 PLM 采用了 ReLU2 作為替代。ReLU2 是一種在性能和稀疏性之間實現最優平衡的激活函數,特別適合稀疏計算場景。其定義如下:

圖片

這個設計使得 MLP 層激活稀疏度達到 90.9%,整體計算量減少 26%。此外,從硬件角度出發,零值激活能夠觸發指令級優化。這一設計理念成功地將模型與系統的聯合優化整合到大語言模型架構中。

訓練策略:充分利用開源數據

三階段鍛造 PLM-1.8B

PLM 團隊精心設計了一條訓練流水線,僅使用未精細設計與配比的 2.48B 預訓練數據,PLM 性能就達到企業級水平。所有訓練數據均來自開源社區。

圖片

預訓練

圖片

第一階段累計約 1.65T 的 Token。這個階段中,學習率是屬于預熱和穩定的階段,模型的 Loss 也在 2.3 附近有收斂趨勢。第二階段累計約 550B 的 Token。在這個階段,模型的 Loss 隨著學習的衰減快速下降。第三階段累計約 280B 的 Token。

這個階段里,保持第二階段的最小學習率訓練,模型進行最后的高質量知識吸收,直到 loss 逐漸收斂。整個預訓練中,始終保持中英數據比例 5:2。  

圖片

SFT 階段

監督微調數據遵循「由淺入深」的數據準備方法,以漸進的方式進行監督微調過程。PLM 的 SFT 訓練分為基本指令微調和高難度指令微調。下面是各個階段的提升效果。

圖片

強化學習階段

PLM 在偏好訓練階段沿用了團隊先前提出的 ARIES 訓練方法,以解決經過一般的對齊學習會經多輪自我改進后,性能會顯著下降的問題。

圖片

性能實測:真的可以

PLM 采用獨特的模型架構,對比的基線模型涵蓋了當前最先進的 2B 參數量級模型,具體對比如下。 

圖片

實驗表明,PLM 表現頗具競爭力,平均分(57.29)位列第三,僅次于 Qwen2.5-1.5B(59.25)和 Yulan-Mini-2.4B(57.51)。PLM-1.8B 在 HumanEval 中獲得了所有模型中的最高分,在 ARC-C、ARC-E、MBPP 和 BoolQ 中排名第二,略遜于行業領先的 Qwen2.5-1.5B,需指出的是,Qwen 系列使用了 18T 閉源語料庫。

另一方面,與 Yulan-Mini-2.4B 相比,PLM-1.8B 在編碼和邏輯推理任務中旗鼓相當。此外,PLM 僅包含 1.8B 參數和 32 層(Yulan-Mini 為 56 層),推理延遲會較低。綜上所述,PLM-1.8B 在基本知識理解、編碼和簡單推理任務中表現強勁且可靠,是一款值得關注的模型。

圖片

場景實測:從服務器到樹莓派,全場景通吃

除了基本的模型能力評估,PLM 團隊還在在 5 類硬件平臺完成部署驗證,并給出了實際的吞吐量數據。

圖片

文章全面評估了不同硬件平臺和量化級別的各種邊緣大小 LLM 的推理延遲,包括高性能 GPU(NVIDIA A10、Orin NX)、Apple 的 M3 芯片、Qualcomm 的 Snapdragon 8 Gen 3 和 BCM2712 等嵌入式系統。

評估數據揭示了幾個顯著特征:MLA 的確增加了計算量,ReLU2 的確可以提升模型推理速度,模型層數會顯著影響端側設備上推理的速度。

PLM 團隊的實驗表明,這些關鍵點恰好觸及了端側計算中最需要關注的內存、算力和 I/O 三個核心維度。PLM 團隊通過模型與硬件的協同設計,在這一領域展現了其獨特的優勢。

算法層面,PLM 做到了稀疏性與低秩的平衡:MLA 壓縮 KV 緩存,ReLU2 激活削減計算,二者互補突破內存 - 算力瓶頸。系統層面,PLM 深度適配 TVM、llama.cpp 等框架,實現高效的量化與編譯優化。

理解 PLM 的 MLA 和稀疏激活

在實際探索中,MLA 的引入會顯著增加計算量。然而,PLM 通過舍棄 Q 矩陣的低秩壓縮來降低推理計算復雜度,并結合稀疏激活函數,成功避免了 MiniCPM3 在預填充或解碼階段的低效問題,從而在特定場景中展現出明顯優勢。

圖片


PLM 團隊在較長文本序列上評估了其模型性能,結果表明,當序列長度達到一定閾值后,PLM 的表現優于同深度的 GQA 模型 Fox。

因此,盡管 MLA 增加了計算負載,其對緩存利用率、推理效率和內存消耗的優化,使得 PLM 在邊緣設備上展現出高效、低延遲的性能,為實際應用提供了顯著優勢。

再來看 PLM 的稀疏化設計,在邊緣模型中展現出了更高的普適性與高效性。從系統角度來看,零計算已被高度優化,使得稀疏化在邊緣設備上的部署帶來顯著性能提升。

此外,由于邊緣設備的計算資源有限,模型通常無法完全加載到 GPU 或 RAM,需要 OffLoad 到緩存甚至存儲中。在此情況下,深度學習模型可采用分層加載,將當前所需參數調入計算單元。

因此,最小化每層計算量至關重要。PLM 通過 KV 緩存存儲與稀疏激活減少計算開銷,有效緩解該問題。

PLM 團隊實驗驗證了推理所需的最小參數量。他們對所有模型進行相同稀疏化(即將激活函數后的最小值設為 0),并測試保持建模性能(困惑度下降 1)所需的最少參數量(如下圖)。

圖片

具體而言,PLM 團隊繪制了稀疏率(0~1)與困惑度差異的關系圖,以分析神經激活減少的性能成本。不同模型的曲線揭示了各自對稀疏度的敏感性。理論上的「理想點」—— 完全稀疏且困惑度不增加 —— 是無法實現的,因為 MLP 層完全停用將損害模型質量。

圖片

在此背景下,PLM 展現出顯著優勢,僅需激活 74.3% 參數,MLP 稀疏率達 90.9%,遠低于同等規模模型,推理所需參數量最低。

PLM 團隊已全面開放資源,為社區提供了一個小型且易于使用的 MLA 模型,使科研工作者能夠在消費級顯卡上開展對 MLA 的研究。同時,PLM 為端側應用廠商提供了一個高性能的端側模型,拓寬了選擇范圍,并支持基于 PLM 稀疏激活架構的高效模型部署與開發。

結語

學術界在大規模模型結構實驗方面面臨諸多挑戰,而堅持從頭預訓練的團隊更是少之又少。PLM 團隊在計算資源有限和數據質量參差不齊的情況下,始終堅信開源社區提供的數據和技術能夠為學術界的持續探索提供強大支持。

未來,PLM 團隊將繼續致力于探索適用于邊緣設備的大模型,訓練更具創新性的架構,并實現更高效的邊緣設備部署。PLM 團隊認為,未來的語言模型不應僅僅是參數的堆砌,而應是效率與智能的精密平衡。PLM的探索,正是向著這一理想邁出的關鍵一步。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-14 13:40:00

2024-10-08 15:20:00

AI安全

2024-06-24 08:25:00

2025-07-04 08:47:00

大模型AI信息

2024-11-29 14:10:00

神經網絡AI

2025-03-19 09:10:00

2023-12-26 12:12:01

模型訓練

2025-05-26 09:16:00

2017-11-28 11:34:29

深度學習樹搜索二元處理機制

2022-04-12 15:05:22

機器人研究人工智能

2024-07-10 12:38:22

2025-01-02 13:41:53

2025-05-06 15:32:23

模型AI測試

2025-09-15 14:50:03

AI機器人開發

2023-12-07 06:52:54

AI化學

2020-08-06 09:51:38

人工智能犯罪技術

2022-01-17 17:34:38

人工智能機器學習技術

2024-11-04 10:20:00

模型數據

2025-06-30 08:51:00

2021-03-22 10:05:03

算法可視化大數據
點贊
收藏

51CTO技術棧公眾號

日韩av字幕| 9765激情中文在线| 国产最新精品精品你懂的| 久久中文字幕视频| 国产精品九九视频| 国产综合av| 伊人性伊人情综合网| 精品一区二区三区日本| 一区不卡在线观看| 一区二区亚洲| 上原亚衣av一区二区三区| 麻豆精品国产传媒| 国产另类xxxxhd高清| 一区二区三区中文在线观看| 蜜桃av久久久亚洲精品| 99久久国产热无码精品免费| 毛片一区二区| 欧美大片va欧美在线播放| 免费观看av网站| 精品中文字幕一区二区三区四区| 高跟丝袜一区二区三区| 7777在线视频| √新版天堂资源在线资源| 不卡av免费在线观看| 国产欧美精品一区二区三区介绍| 久久夜靖品2区| 欧美在线日韩| 中文字幕免费国产精品| 一起草在线视频| 韩国三级大全久久网站| 欧美特级限制片免费在线观看| 僵尸世界大战2 在线播放| 国产视频在线播放| 欧美激情在线观看视频免费| 精品欧美一区二区精品久久| 性中国xxx极品hd| 黄色小说综合网站| 国产免费成人av| 91视频在线视频| 亚洲免费在线| 97色在线视频| 日本一级一片免费视频| 午夜久久黄色| 欧美成人免费观看| 欧美肥妇bbwbbw| 日本午夜一区| 一区二区三区回区在观看免费视频| 国产激情第一页| 久久久久高潮毛片免费全部播放| 日韩免费在线观看| 亚洲一区二区三区三州| 9999精品视频| 91精品国产综合久久精品麻豆| 91亚洲免费视频| 国产精品成人国产| 欧美三级日韩三级| 五月婷婷六月丁香激情| 日韩伦理一区二区| 欧美日韩aaaaaa| 中文字幕一区久久| 玖玖玖电影综合影院| 日韩欧美综合在线| 国产吃瓜黑料一区二区| 久久草在线视频| 日韩av在线网址| 久久久久久亚洲中文字幕无码| 曰本一区二区三区视频| 一区二区欧美激情| 2014亚洲天堂| 国产精品videossex久久发布| 欧美—级a级欧美特级ar全黄| 免费一级a毛片夜夜看 | 免费福利视频一区二区三区| 日韩欧美在线视频日韩欧美在线视频| 日av中文字幕| 亚洲精品伊人| 精品999在线播放| 极品白嫩丰满美女无套| 欧美伦理影院| 欧美剧在线观看| 永久免费无码av网站在线观看| 日本中文在线一区| 91视频免费进入| 日本又骚又刺激的视频在线观看| 欧美国产日韩一二三区| 一区二区视频在线观看| 国精产品一区一区三区mba下载| 亚洲成人1区2区| 99热手机在线| 一区二区三区在线免费看| 日韩av资源在线播放| 少妇人妻好深好紧精品无码| 欧美在线免费| 国产精品久久精品| 亚洲乱码国产乱码精品精软件| 久久亚洲综合色一区二区三区| 伊人情人网综合| 97人人在线视频| 欧美日韩亚洲丝袜制服| 少妇精品无码一区二区三区| 成人羞羞网站入口免费| 久久久久久久久网站| 国产女主播喷水视频在线观看| 国产乱码精品一区二区三区五月婷| 国产三级精品在线不卡| 天天综合视频在线观看| 欧美日韩亚洲精品一区二区三区 | 国产一级淫片a| 免费观看在线色综合| 国产九色精品| 老司机av在线免费看| 色综合天天视频在线观看| 黄色a级三级三级三级| 欧美日韩色图| 欧美一区二区大胆人体摄影专业网站| 99视频免费看| 中文字幕精品综合| 国产l精品国产亚洲区久久| 精品国产不卡一区二区| 色yeye香蕉凹凸一区二区av| 日本视频在线观看免费| 成人免费不卡视频| 99re99热| 国产精品99| 亚洲天堂男人的天堂| 国产无套粉嫩白浆内谢| 国产专区欧美精品| 一本一生久久a久久精品综合蜜 | av在线不卡一区| 中国日本在线视频中文字幕| 欧美日韩一区二区在线| 亚洲女则毛耸耸bbw| 天天综合网91| 国产精品色悠悠| 黄色av网站在线看| 岛国av午夜精品| bl动漫在线观看| 亚洲欧洲午夜| 久久66热这里只有精品| 国产盗摄一区二区| 亚洲福利视频久久| 日本少妇激情视频| 国产成人福利片| av久久久久久| 8848成人影院| 久久久噜久噜久久综合| 亚洲风情第一页| 亚洲一区二区高清| zjzjzjzjzj亚洲女人| 韩日精品视频| 国产呦系列欧美呦日韩呦| 2020国产在线| 亚洲精品一区二三区不卡| 一级免费在线观看| 久久免费偷拍视频| 久久国产色av免费观看| 精品国产一区二区三区久久久蜜臀 | 国产精品国产三级国产专业不| 午夜一区不卡| 亚洲成人在线视频网站| 亚洲人成777| 欧美成人激情视频免费观看| 精品国产av一区二区| 亚洲影院免费观看| 国产激情视频网站| 久久久久一区| 亚洲日本japanese丝袜| 国语精品视频| 91国产美女在线观看| 免费在线稳定资源站| 欧美日韩一级黄| 校园春色 亚洲| 91视频在线观看免费| 天堂在线资源视频| 一区二区三区四区日韩| 国产精品一码二码三码在线| 九九色在线视频| 国产丝袜一区二区三区免费视频 | 手机在线理论片| 一本一道久久a久久精品逆3p| 一级特黄特色的免费大片视频| 亚洲免费观看高清完整版在线观看熊| 欧美图片自拍偷拍| 另类av一区二区| 黄色一级片网址| 日韩高清影视在线观看| 国产精欧美一区二区三区| 国产黄a三级三级三级av在线看 | 99在线视频播放| 最新欧美色图| 久久福利视频导航| 日韩大片b站免费观看直播| 欧美日韩精品欧美日韩精品一| 国产精品6666| 1000部国产精品成人观看| 精品影片一区二区入口| 久久91精品国产91久久小草| 国产96在线 | 亚洲| 精品视频免费| 精品欧美一区二区久久久伦| 欧洲精品久久久久毛片完整版| 久久久亚洲精品视频| 在线播放毛片| 国产午夜精品久久久| 国产欧美第一页| 在线观看一区日韩| 日本三级黄色大片| 亚洲免费av在线| 一区二区三区久久久久| 成人av网站在线| 99999精品| 久久精品久久99精品久久| 国产h视频在线播放| 欧美1区2区| 一区二区三区四区在线视频| 嫩草一区二区三区| 国产精品一区二区免费| 粉嫩一区二区三区在线观看| 日韩av电影中文字幕| h片在线观看视频免费| 久久高清视频免费| 69xxxx欧美| 在线视频中文亚洲| 日夜干在线视频| 亚洲国模精品一区| 成人av一区二区三区在线观看 | 国产精品第七十二页| 欧美激情20| 91禁外国网站| 97超碰免费在线| 午夜免费日韩视频| 女人黄色免费在线观看| 久久久av免费| 动漫一区在线| 欧美成人黄色小视频| 成人福利网站| 久久躁狠狠躁夜夜爽| 黄色成人在线观看| 久久久国产精彩视频美女艺术照福利| 国产福利在线视频| 国产午夜精品视频| 国产在线视频网| 亚洲午夜未删减在线观看| 黄色片在线看| 亚洲午夜女主播在线直播| 巨骚激情综合| 在线日韩中文字幕| 在线观看a视频| 精品国产一区二区三区四区在线观看 | 国产精品成人一区二区| yiren22亚洲综合| 国产精品人成电影| 欧美视频免费看| 92国产精品视频| 日韩精品免费视频一区二区三区 | 成人黄色影片在线| 高清精品久久| 国产91视觉| 日本一区福利在线| 欧美在线播放一区| 97精品97| 国产一二三区在线播放| 亚洲精品影视| 99久久国产宗和精品1上映| 天堂av在线一区| 九色porny自拍| 国产精品99久久久久久宅男| 图片区偷拍区小说区| 99久久99精品久久久久久| 美女洗澡无遮挡| 国产精品久久久久久一区二区三区| 国产免费美女视频| 亚洲一区电影777| 波多野结衣在线电影| 91精品国产福利| 日本福利片高清在线观看| 最近2019年手机中文字幕| 污污的网站在线看| 97久久久久久| 免费成人毛片| 国产欧美一区二区三区另类精品| 国产日产一区| 国产人妻人伦精品| 久久成人国产| a级大片免费看| 91麻豆免费在线观看| 美女网站视频色| 亚洲成人免费av| 在线免费观看一区二区| 亚洲福利视频免费观看| 欧美r级在线| 97人人做人人爱| 亚洲午夜剧场| 欧美一二三四五区| 欧美午夜视频| 天天爽人人爽夜夜爽| 福利91精品一区二区三区| 蜜桃av乱码一区二区三区| 亚洲国产aⅴ天堂久久| 一级特黄aa大片| 亚洲女成人图区| 成人超碰在线| 国产日韩换脸av一区在线观看| 久久365资源| 精品国产一区二区三区在线| 视频一区国产视频| 国产大尺度视频| 最近日韩中文字幕| 69av视频在线观看| 亚洲国产古装精品网站| caopo在线| 国产日韩欧美电影在线观看| 最新国产一区| 超碰成人免费在线| 国产一区二区调教| 人成免费在线视频| 欧美日韩一区二区精品| 亚洲精品97久久中文字幕| www.亚洲一区| 欧美天堂一区| 色一情一区二区三区四区| 国产精品久久久免费| 欧美极品jizzhd欧美仙踪林| 亚洲三级在线免费| 狠狠躁夜夜躁人人爽视频| 日韩大片在线观看视频| 欧美14一18处毛片| 亚洲影影院av| 婷婷综合伊人| 亚洲18在线看污www麻豆 | 精品五月天久久| 9999在线视频| 国外成人在线视频网站| 最新欧美人z0oozo0| 91丝袜超薄交口足| 亚洲欧美偷拍另类a∨色屁股| 亚洲中文字幕在线一区| 综合网日日天干夜夜久久| 久久野战av| 久久久一本精品99久久精品66| 99精品热6080yy久久| 亚洲一区二区在线免费| 亚洲成人777| 四虎国产精品永远| 色综合老司机第九色激情| 精品国产乱码一区二区三区| 亚洲一区 在线播放| 国产69精品久久777的优势| 欧美毛片在线观看| 亚洲第一精品夜夜躁人人爽| 18video性欧美19sex高清| 国产在线精品一区二区三区| 中文欧美日韩| 丰满少妇高潮一区二区| 91国偷自产一区二区三区成为亚洲经典| 免费成人av电影| 国产精品国产福利国产秒拍| 日韩欧美视频在线播放| www.国产福利| 一区二区激情小说| 蜜桃视频在线观看www| 国产91精品久久久久久久| 国产亚洲电影| 亚洲自拍第三页| 偷拍一区二区三区| 成人高清免费在线播放| 91精品国产综合久久香蕉922| 欧美国产91| 99久久久久久久久久| 欧美色综合久久| 三级福利片在线观看| 韩国成人一区| 日韩1区2区3区| 国语对白在线播放| 精品国产区一区| av激情成人网| www.av91| 欧美国产精品专区| av网站在线免费看| 91av在线播放| 日韩激情免费| 又色又爽又黄18网站| 色婷婷av一区二区三区大白胸| 在线观看黄色av| 国产99在线播放| 日韩av一级电影| 久久一二三四区| 国产性猛交xxxx免费看久久| 免费看日产一区二区三区| 国产一区二区三区精彩视频| 综合久久久久久久| 日本一本草久在线中文| 亚洲自拍偷拍区| 日韩综合在线视频| 国产在线观看你懂的| 亚洲午夜性刺激影院| 999国产精品一区| 91极品视频在线观看| 精品久久久国产| 五月花成人网|