精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

百元級硬件流暢運行百億參數大模型!上交&本智激活開源端側原生大模型

人工智能 新聞
今天,上海交通大學IPADS研究所、上海交通大學人工智能學院聯合初創公司本智激活(Zenergize AI),在HuggingFace開源了端側原生大模型SmallThinker。

AI的下一個戰場,不在云端,而在你的口袋里。

iPhone、華為、三星、小米、OPPO等各大手機廠商幾乎都在將大模型塞進手機,端側AI已然成為兵家必爭之地。

背后的邏輯清晰而堅定:最懂你的AI,必須能安全地訪問你的個人數據——郵件、照片、日程,而這一切的前提,就是將計算留在本地,將隱私還給用戶。

然而,想讓AI在本地流暢運行,遠比想象的要難得多。最好的證據,莫過于財力雄厚、軟硬一體的蘋果,其雄心勃勃的Apple Intelligence計劃也未能如期而至,核心AI功能不得不推遲到明年。

這無疑向整個行業釋放了一個清晰的信號:端側AI,是一塊難啃的硬骨頭。

正當全球科技巨頭在端側AI的道路上艱難探索時,一股產學研深度融合的新興力量,給出了獨有的解決路線。

今天,上海交通大學IPADS研究所、上海交通大學人工智能學院聯合初創公司本智激活(Zenergize AI),在HuggingFace開源了端側原生大模型SmallThinker。

該系列模型采用為端側算力、內存、存儲特性而原生設計的模型架構,并從零開始預訓練,具體包含兩個尺寸的稀疏模型,分別是SmallThinker-4B-A0.6B和SmallThinker-21B-A3B,模型也已開源,鏈接如下。

  • https://huggingface.co/PowerInfer/SmallThinker-21BA3B-Instruct
  • https://huggingface.co/PowerInfer/SmallThinker-4BA0.6B-Instruct

其顯著特征,就是用端側CPU即可快速推理,不再依賴高端GPU。其中,4B模型在1GB峰值內存下的推理速度達到驚人的19.41 tokens/s。

而更令人矚目的是,21B旗艦稀疏模型,在一塊百元級的國產RK3588開發板上,實現了相較于同等能力的主流模型(Qwen-14B)高達21倍的推理加速,將同類解決方案遠遠甩在身后。

SmallThinker:端側原生大模型

主流大模型,從出生起就是為云端成千上萬TOPS算力、TB級顯存的GPU集群“量身定制”的。想把它們塞進算力、內存等都不到云端5%的端側設備,傳統方法只有“壓縮”。

這就好比讓一個“博士生”模型,通過蒸餾、量化等手段,強行“降智”,最終變成一個只會簡單問答的“小學生”,犧牲了太多智能。

是否存在一種不做“模型降智”,而是一步到位的選擇?

為了實現這一目標,SmallThinker系列針對端側的弱算力、小內存、慢存儲,設計了創新的大模型架構,并從零開始預訓練,實現了與端側硬件的“精巧匹配”。

圖片

具體來說,這一端側原生的大模型架構主要擁有三大核心技術特性:

第一,端側算力原生的雙層稀疏架構,稀疏度提升5倍。

傳統的MoE(混合專家模型)只在專家層面是稀疏的。而SmallThinker在此基礎上,增加了專家內部的神經元稀疏。

這就好比,模型不僅能精準調用最相關的專家知識,還能只激活專家知識庫里最核心的部分,避免“復述全部所學”,對端側算力的要求大大降低。

圖片

第二,端側存儲原生的專家路由前置,顯著隱藏IO開銷。 

在內存資源受限的端側,通常模型權重不能完全放置在內存里,需要在推理過程中動態從慢速存儲(比如SSD、UFS等)加載模型專家權重,而在這個過程中,端側的慢速I/O會嚴重影響推理速度。

傳統方案是算完注意力,再計算路由,最后排隊等待加載專家。

而SmallThinker在模型架構中就原生提供了機制,幫助預判需要哪個專家,在進行注意力計算的同時,就去異步加載專家。

做到了“邊檢查邊傳喚”,將I/O等待時間隱藏在注意力計算的過程中。

圖片

第三,端側內存原生的混合稀疏注意力,KV緩存占用下降76%。 

針對長文本場景,SmallThinker設計了“略讀”+“精讀”的混合注意力機制。它使用滑動窗口注意力(Sliding Window)進行高效的“略讀”,同時保留全局注意力的能力進行“精讀”。

兩種方式組合,在處理16K文本時,相比傳統GQA機制,KV緩存占用降低76%,讓端側設備也能輕松處理長文檔

圖片

生態兼容性與極致性能:SmallThinker與PowerInfer的完美結合

一個真正優秀的開源模型,不僅自身要強大,更要擁抱廣闊的開放生態。SmallThinker模型系列在設計上充分考慮了開發者的使用習慣,能夠無縫兼容HuggingFace Transformers、vLLM、SGLang、llama.cpp、KTransformers等一系列主流推理框架。

在硬件適配上,它實現了對英特爾、英偉達、高通等主流芯片,甚至已經可以在國產鴻蒙操作系統上進行推理。這種開箱即用的靈活性,極大地降低了開發者的使用門檻。

而要體驗SmallThinker最極致的端側加速與內存優化效果,則需要使用團隊為其量身打造的端側原生Infra——PowerInfer(https://github.com/SJTU-IPADS/PowerInfer/blob/main/smallthinker/README.md)。

PowerInfer是團隊于2023年12月開源的業界首個稀疏大模型端側推理框架,發布后迅速獲得全球開發者的高度關注,目前GitHub星標已達8.2K,并曾連續兩天蟬聯GitHub全球項目趨勢榜第一。

它能夠深度激活SmallThinker原創的雙層稀疏架構,在推理時只調用必要的專家及神經元,并能在不影響推理速度的情況下降低內存占用。

它就像是為SmallThinker這臺“F1賽車”專門打造的引擎,為開發者提供了一套從模型到部署、真正完整的全棧優化解決方案。

SmallThinker模型智力與推理性能兼具

理論再好,也要看療效。SmallThinker團隊交出的,是一份模型能力與端側推理性能兼備的答卷。

為了真正實現“端側原生”,團隊從零開始預訓練,基于高質量數據語料,訓練了兩種規模的模型:

  • SmallThinker-4B-A0.6B:基于2.5T Tokens數據預訓練,擁有40億參數,激活6億參數,主打極速響應。
  • SmallThinker-21B-A3B:基于7.5T Tokens數據預訓練,擁有210億參數,激活30億參數,主打旗艦性能。它能夠在百元級RK3588上流暢部署,全內存情況下的CPU推理速度也能達到10.84 tokens/s。

口說無憑,評測見真章。

在MMLU、GPQA等多個權威評測基準上,SmallThinker的智力水平均超越了同尺寸甚至更大尺寸的開源模型,充分證明了其“原生”架構設計的優越性。

圖片

而在更關鍵的實際運行性能上,當SmallThinker與PowerInfer結合時,其在內存約束場景下的優勢盡顯。團隊在旗艦移動平臺和個人電腦PC上,對業界主流模型進行了正面硬剛。

場景一: 手機極限內存瓶頸 (1GB RAM)

在主流手機上,SmallThinker-4B-A0.6B模型的Q4量化版本,在僅調用4個CPU核心的情況下,推理速度便高達79 tokens/s。

而在對模型架構與推理框架構成終極考驗的極限內存瓶頸(1GB)場景下,SmallThinker的優勢則體現得淋漓盡致;4B模型依然跑出了19.91 tokens/s的流暢速度。

作為對比,Qwen3-1.7B模型速度僅為1.07 tokens/s,幾乎無法正常使用。

近19倍的性能差距,充分證明了SmallThinker在極端資源受限環境下的卓越運行能力。這不僅是一次技術的勝利,更是將高端AI平民化的關鍵一步。

場景二: 主流PC配置(8GB RAM)

當內存放寬到旗艦PC的8GB時,SmallThinker的架構優勢依然顯著。

SmallThinker-21B-A3B的4核CPU(Intel i9 14990K)推理速度達到20.30 tokens/s,而Qwen3-30B-A3B的4核CPU速度為 10.11 tokens/s,加速比達到2倍。

未來展望:不止于此,通往端側原生智能

在這訓練過程中,團隊發現;即使在如此龐大的數據投喂之后,模型的loss曲線仍在穩步下降,仍未達到飽和。

未來,團隊會圍繞兩條路線演進。

第一條路線,繼續Scaling:更大更強。

既然模型尚未“吃飽”,那么最直接的路徑就是——繼續投喂。

團隊的下一步計劃,將繼續遵循被驗證有效的Scaling Law,利用更多的高質量Tokens進行進一步訓練。進一步壓榨模型潛力,在知識儲備、邏輯推理和代碼生成等核心能力上,將SmallThinker推向新的高度,打造出更強大的端側基礎模型。

第二條路線,打造“個人賈維斯”:從模型到可信賴的智能體。

如果說Scaling Law是讓模型變得更“博學”,那么團隊的終極野心,則是打造一個真正屬于每個人的“賈維斯式”智能體。

這個智能體的獨特之處在于,它完全運行在你的個人設備上,能夠安全、完整地理解你的全部數字生命——從郵件、日程,到聊天記錄和相冊。正是在這片獨一無二的私有數據土壤之上,才能生長出“千人千面”、真正懂你的可信賴AI。

相信未來,隨著端側原生AI能力的不斷進步,未來的AI能力就會像今天的水和空氣一樣,主動融入我們每個人的日常工作和生活,提供安全私密、成本低廉、充滿智慧的AI體驗。

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-08-20 07:52:56

語言模型參數PaLM

2023-12-01 12:31:22

AI模型

2024-02-02 21:42:41

2025-08-27 16:05:39

2025-07-08 03:22:00

大模型參數AI

2023-10-31 17:26:09

2025-09-24 03:00:00

2024-09-10 12:11:18

2025-04-30 16:48:07

2024-08-07 13:00:00

2024-11-06 09:47:00

2023-09-19 21:09:18

百度人工智能

2024-06-03 08:30:00

點贊
收藏

51CTO技術棧公眾號

国产无遮挡又黄又爽又色| 中文字幕中文在线| 欧洲天堂在线观看| 日产国产欧美视频一区精品| 久久国产一区二区三区| 95视频在线观看| av成人在线观看| 亚洲不卡av一区二区三区| 日韩电影免费观看在| www.五月婷婷| 青草国产精品久久久久久| 久久久久久久av| 潮喷失禁大喷水aⅴ无码| 一区二区三区高清在线观看| 91福利在线播放| 日韩国产小视频| h视频在线播放| 成人毛片老司机大片| 国产原创欧美精品| 国产 日韩 欧美 在线| 久久久久久久久久久9不雅视频| 亚洲国产精品欧美一二99| 日产精品高清视频免费| 黄色片网站免费在线观看| 久久国产综合精品| 奇米影视亚洲狠狠色| 久久久无码精品亚洲国产| 日韩精品永久网址| 亚洲欧美精品伊人久久| 在线中文字日产幕| 成人黄色91| 欧美色区777第一页| 男人添女荫道口图片| www.在线视频.com| 久久综合丝袜日本网| 国产精品视频在线免费观看| 国产乱人乱偷精品视频| 日韩福利视频网| 欧美亚洲在线播放| 日韩av在线播放观看| 韩国一区二区三区在线观看| 久久久国产视频91| 国精产品一区一区二区三区mba| 欧美美女被草| 在线观看av不卡| 成人免费毛片播放| 成人欧美大片| 午夜一区二区三区视频| 波多野结衣av一区二区全免费观看 | 国语自产精品视频在线看| 国产精品99久久久久久成人| 日韩欧美视频专区| 中文字幕欧美日韩va免费视频| 嫩草影院国产精品| 78精品国产综合久久香蕉| 色香蕉成人二区免费| 国产91在线视频观看| 男人天堂视频在线观看| 亚洲va韩国va欧美va精品| www.亚洲成人网| 欧美日韩在线视频免费观看| 一区二区三区视频在线看| 男人的天堂avav| 国产丝袜在线播放| 精品国产1区2区| 国产精品免费观看久久| 中文在线а√天堂| 色天使色偷偷av一区二区| 国产精品涩涩涩视频网站| 日本综合视频| 7777女厕盗摄久久久| 久久精品一卡二卡| 91国内精品| 亚洲国产精彩中文乱码av在线播放| 丰满少妇在线观看| 久久亚洲精品中文字幕| 9191国产精品| 色欲欲www成人网站| 日本福利一区| 三级精品视频久久久久| 精国产品一区二区三区a片| 亚洲欧洲日本mm| 国产精品国产三级国产aⅴ浪潮| 国产一级特黄aaa大片| 国产美女一区| 国产日韩精品视频| 亚洲成人久久精品| 91美女在线观看| 亚洲综合欧美日韩| 草草视频在线观看| 欧美最猛黑人xxxxx猛交| 91aaa精品| 午夜精品福利影院| 色妞一区二区三区| 日韩精品国产一区二区| 蜜臀久久久久久久| 99中文字幕| wwwxxx在线观看| 午夜久久电影网| 国产日韩欧美久久| 国内精品麻豆美女在线播放视频| 日韩欧美亚洲国产另类| 欧美日韩一区二区三区四区五区六区| 成人在线视频区| 日韩国产高清污视频在线观看| 农村末发育av片一区二区| 蜜桃tv一区二区三区| 另类美女黄大片| 福利网址在线观看| 高清不卡在线观看| 中文字幕一区二区三区最新| 欧美久久天堂| 欧美一区二区三区系列电影| 欧美18—19性高清hd4k| 欧美性久久久| 91精品视频播放| 亚洲日本香蕉视频| 一区二区三区鲁丝不卡| 亚洲成人av免费看| 少妇久久久久| 欧美激情极品视频| 一区二区三区黄| 国产色综合一区| 欧美成人免费在线观看视频| 日韩欧美中文在线观看| 日韩一区二区三区xxxx| www.av88| 久久九九久久九九| 男人操女人逼免费视频| 国产一区二区三区| 久久精品视频在线观看| 中日韩av在线| 久久久精品影视| 欧美色图另类小说| 欧美丝袜足交| 午夜精品久久久久久久久久久久久 | 性久久久久久久久久久久久久| 日韩一二三区在线观看| www.欧美免费| 国产精品国产精品国产专区| 国产精品免费aⅴ片在线观看| 中文字幕乱码一区二区三区| 欧美1级2级| 国产视频自拍一区| 日韩色图在线观看| 久久亚洲二区三区| 丰满少妇被猛烈进入高清播放| 国产一区影院| 最近中文字幕mv在线一区二区三区四区 | 美女毛片一区二区三区四区| 97在线观看免费| 欧美熟妇另类久久久久久不卡| 国产日韩欧美综合一区| 18岁网站在线观看| 天堂网av成人| 国产精品99久久久久久白浆小说| 国产av精国产传媒| 一区二区三区高清在线| 人妻 日韩 欧美 综合 制服| 伊人蜜桃色噜噜激情综合| 激情伦成人综合小说| 亚洲黄色中文字幕| 国产小视频91| 国产一区二区女内射| 中文字幕综合网| 久久黄色一级视频| 伊人久久大香线蕉综合热线 | 能在线观看的av| 精品视频网站| 91美女福利视频高清| 五月天激情在线| 日韩久久免费电影| 影音先锋国产资源| 亚洲欧美日韩系列| 日本50路肥熟bbw| 蜜乳av另类精品一区二区| 亚洲激情电影在线| 日韩中文在线| 欧美性受xxxx白人性爽| 国产毛片av在线| 日韩三区在线观看| 亚洲久久在线观看| 1024国产精品| 超碰97在线资源站| 免费观看在线色综合| 屁屁影院ccyy国产第一页| 欧美人与牛zoz0性行为| 1卡2卡3卡精品视频| 亚洲精品动漫| 欧美久久精品一级黑人c片| 五月婷婷伊人网| 在线播放视频一区| 精品不卡一区二区| 亚洲黄色小说网站| 欧美日韩高清丝袜| 国产suv一区二区三区88区| aaa毛片在线观看| 欧美人成在线| 亚洲国产成人不卡| 精品人人人人| 91性高湖久久久久久久久_久久99| 超碰在线影院| 精品国产91久久久久久久妲己 | 亚洲啊v在线观看| 精品日本一区二区三区在线观看| 2020国产在线| 一区二区福利视频| 日本黄色不卡视频| 337p亚洲精品色噜噜噜| 亚洲天堂一区在线| 一区二区高清视频在线观看| avhd101老司机| 97成人超碰视| 中文字幕在线播放一区二区| 青娱乐精品在线视频| 少妇人妻在线视频| 狠狠综合久久| 91xxx视频| blacked蜜桃精品一区| 精品一区久久| av不卡一区二区| 亚洲综合精品一区二区| 色999韩欧美国产综合俺来也| 爱福利视频一区| 黄色av网站在线看| 日韩高清欧美高清| 全国男人的天堂网| 欧美变态凌虐bdsm| www.激情五月| 欧美一区二区视频在线观看2022| 强乱中文字幕av一区乱码| 国产精品午夜免费| 亚洲无人区码一码二码三码的含义| 久久国产欧美| 精品少妇在线视频| 在线国产日韩| 男女猛烈激情xx00免费视频| 女同性一区二区三区人了人一| 国产在线视频2019最新视频| 四虎4545www精品视频| 55夜色66夜色国产精品视频| 国产美女高潮在线观看| 97精品视频在线| 蜜桃视频动漫在线播放| 97视频在线观看视频免费视频| 日本亚洲精品| 在线观看日韩av| www.成人.com| 丝袜美腿精品国产二区| 欧美三级理伦电影| 久久精品国产一区二区电影| 麻豆传媒视频在线| 久久97久久97精品免视看| 狂野欧美激情性xxxx欧美| 欧美大片在线免费观看| 超级碰碰不卡在线视频| 午夜精品一区二区三区视频免费看| 91网在线播放| 久久九九国产精品怡红院| 动漫一区在线| 欧美成人小视频| 丰满诱人av在线播放| 2023亚洲男人天堂| 精品3atv在线视频| 国产精品爽爽爽| 深夜福利一区| 国内成+人亚洲| 免费久久久久久久久| 日韩欧美视频一区二区三区四区| 国产精品x8x8一区二区| 免费看成人片| 欧美一区三区| a级片一区二区| 日韩视频精品在线观看| 成人在线激情网| 狠狠色丁香婷综合久久| 无码人妻aⅴ一区二区三区玉蒲团| 免费成人av资源网| 9191在线视频| 久久久蜜桃精品| 黄色录像免费观看| 精品久久久一区二区| 精品人妻一区二区色欲产成人| 亚洲综合区在线| 在线精品免费视| 欧美性色黄大片| 成人毛片在线精品国产| 亚洲人成毛片在线播放| 成人免费网站在线观看视频| 5566成人精品视频免费| 亚洲欧美一级| 久久久久网址| 亚洲国产精品日韩专区av有中文 | 97久久天天综合色天天综合色hd| 欧美大片1688网站| 99电影在线观看| 成人区精品一区二区婷婷| 极品粉嫩国产18尤物| 美女网站一区二区| 国产一级伦理片| 亚洲精品成人在线| 日韩一级片中文字幕| 精品乱人伦一区二区三区| 日本视频在线| 国产成人精品一区二区三区| 欧美久久一区二区三区| 日本成人看片网址| 亚洲激精日韩激精欧美精品| 91丝袜超薄交口足| 国产精品三级久久久久三级| 女人十八岁毛片| 日韩免费观看高清完整版在线观看| 亚洲a视频在线观看| 一区二区三欧美| 不卡一本毛片| 不卡视频一区二区三区| 日韩精品影视| 精品久久久久久久无码| 99久久777色| 欧美成人国产精品高潮| 欧美日韩高清影院| 美女做暖暖视频免费在线观看全部网址91 | 亚洲人在线观看视频| 欧美日韩国产va另类| 999精品嫩草久久久久久99| 日本亚洲自拍| 久久亚洲精品伦理| 99久久人妻无码中文字幕系列| 26uuu亚洲| 国产91精品一区| 日韩电影中文字幕在线观看| 国产盗摄一区二区| 91手机在线视频| 欧美日韩亚洲一区三区| 五月天视频在线观看| 中文文精品字幕一区二区| 无码一区二区三区在线观看| 亚洲欧洲在线视频| 久九九久频精品短视频| 欧美极品一区二区| 噜噜噜久久亚洲精品国产品小说| 欧美午夜aaaaaa免费视频| 久久蜜桃香蕉精品一区二区三区| 国产探花视频在线| 欧美三级视频在线播放| 大地资源中文在线观看免费版| 久久久精品免费| 国产剧情一区二区在线观看| 丰满女人性猛交| 国产精品系列在线播放| 黄页网站免费观看| 亚洲第一精品夜夜躁人人躁| 乱插在线www| 欧美lavv| 蘑菇福利视频一区播放| 国产人妻大战黑人20p| 欧美日韩一区二区在线视频| 日本网站在线免费观看视频| 91日本在线视频| 亚洲先锋成人| 亚洲中文字幕一区| 色婷婷久久久久swag精品| av大片在线看| 97人人模人人爽视频一区二区| 国产在线日韩精品| 欧美美女一级片| 一区二区三区中文字幕| 天天干天天干天天干| 国产精品91免费在线| 亚洲国产日韩欧美在线| 国产精品99精品无码视亚| 婷婷开心激情综合| 成人免费高清在线播放| 51国产成人精品午夜福中文下载 | 久色乳综合思思在线视频| 国产美女视频一区二区 | 国产精品无码一区二区三区| 色哟哟精品一区| av电影免费在线观看| 国产一区二区视频在线免费观看| 91精品99| yy6080午夜| 欧美色窝79yyyycom| 午夜羞羞小视频在线观看| 欧美亚洲国产免费| 国产一区二区免费看| 丁香六月婷婷综合| 久久手机精品视频| 夜色77av精品影院| 又色又爽又黄视频| 精品久久久在线观看| а√中文在线8| 日韩aⅴ视频一区二区三区| 国精品**一区二区三区在线蜜桃| 国产wwwwxxxx| 国产视频久久久| 成人av动漫| 欧美日韩亚洲自拍| 亚洲不卡av一区二区三区| 欧美日韩在线资源|