精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Google Gemma 3:性能“炸裂”還是榜單優化?

發布于 2025-3-27 07:18
瀏覽
0收藏

一、背景

最近幾天 Google 發布了最新的 Gemma 3 系列開源模型,迅速成為業界熱議的焦點,其中,Gemma 3 27B IT 模型尤為引人注目。如下圖所示為 Google 廣泛宣傳的 Gemma 3 27B IT 模型在 Chatbot Arena Leaderboard  [1]上的表現,以 27B 的參數量,不僅超越了更大參數量的 DeepSeek V3(實際激活參數量差不多),并且接近頂尖的 DeepSeek R1。事實上性能真的這么“炸裂”嗎?還是面向 Chatbot Arena 的優化?值得注意的是,Chatbot Arena 的排名基于用戶盲測投票,容易受到寫作風格、響應速度以及特定用戶群體偏好的影響——例如,用戶往往更青睞反應迅速、語言自然且能靈活應對多樣化問題的模型。因此,這一榜單未必能全面反映模型的真實能力。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

事實上,當前大模型評測體系的混亂已是不爭的事實:測試基準五花八門切缺乏不一致,許多基準與實際業務需求脫節,數據污染與過擬合問題更是屢見不鮮。這使得挑選一個真正實用的模型變得很有挑戰性,用戶不得不在真實場景中要反復試錯,浪費大量人力與算力資源。很期待未來有一些更全面、更權威的基準。同時,也真的期待有一個 30B 左右規模的 Dense 模型,在性能上全面媲美 DeepSeek R1,將無疑是開源社區和實際應用的一大福音。本文將簡要探討 Gemma 3 27B IT 模型的技術亮點與潛在局限。

相關工作可以參考我們之前的文章:

二、Gemma 3 模型

2.1 概覽

如下圖 Table 1 所示,Gemma 3 總共包含 4 個模型:

  • 1B 為純 LLM 模型,4B、12B 和 27B 為多模態模型
  • 1B 使用 2T Token 預訓練;4B 使用 4T Token;12B 和 27B 使用 14T Token(PS:目前看 14T - 15T Token 基本成為標配)。
  • 現在 32K 序列長度預訓練,然后擴展到 128K 的序列長度
  • 支持 140 種語言
  • 支持 Function Call 和結構化輸出
  • 總詞表大小為 262K,相對而言,常見的開源模型的詞表通常是 128K 左右。
  • Vision Encoder 相同,都是 SigLIP 417M,輸入分辨率為 896x896
  • Pan & Scan(P&S):如果圖像比較大,則會采用無重疊的切分,然后分別 Resize 到 896x896(PS:這個也是非常常規的手段)。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

對應的論文:Gemma 3 Technical Report [2]

對應的模型:google/gemma-3-27b-it at main [3]

2.2 模型結構

現在 LLM 處理的序列越來越長,為了降低 KV Cache 存儲空間以及 Attention 的計算復雜度,最近一段時間很多模型都采用“混合模型”優化方案:

  • MiniMax 01:采用 Linear Attention 和 Softmax Attention 混合方案。為了彌補 Linear Attention 長距離序列建模能力不足的問題,每隔 M 層會采用一個標準的 Full Softmax Attention。
  • Hunyuan Turbo S:采用 Mamba + Full Softmax Attention + MoE 的方式,Mamba 作用和 Linear Attention 類似。
  • Gemma 3 27B:GQA + 5:1 交錯的 local/global layers。其中的 5:1 交錯是指:5 層為滑動窗口 Attention,1 層為 Full Softmax Attention,交錯排列。

如下圖配置所示為其中 LLM 的具體配置,可以看出,總共 62 層;GQA 中 Attention Head 與 KV Head 的比例為 2:1;滑動窗口的大小為 1024。也就是只要序列長度大于 1024,就可以節約 KV Cache 空間以及 Attention 計算量。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

PS:除了上述的混合模型外,最近 Inception Labs 的 Mercury [10] 模型也很值得關注。其不是使用傳統的基于自回歸的 Transformer 模型,而是采用了類似圖像、視頻生成中常用的擴散模型,從噪聲開始逐步優化整個文本序列,而不是逐個生成 token。雖然其在各種基準測試上還無法達到第一梯隊,但是在速度和成本效率上具有非常明顯的優勢,在個別場景上可能也是個不錯的選擇。如下圖所示為其在個別任務上的精度以及吞吐數據:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

2.3 量化

除了模型結構的創新外,量化也是降低存儲空間需求、提升處理速度的有效手段。Gemma 3 中,作者除了提供原始模型外,還提供了不同量化精度的量化版本,這些模型都是采用量化感知訓練(Quantization Aware Training, QAT)方法,通過少量 Step(通常是 5000)微調而來。如下圖所示為 32K 序列長度時不同精度下的顯存開銷,FP8 精度時總的顯存開銷也只有 46GB:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

2.4 消融實驗

即使滑動窗口層(Local)與標準 Transformer 層(Global)的比例為 7:1,損失依然很小,作者采用了 5:1。

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

滑動窗口大小為 1024 時幾乎無損,但是小于 1024 時損失開始變大:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

更小的滑動窗口,更大的 Local:Global,可以有效降低 KV Cache 開銷:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

如下圖 Table 7 所示,作者也進一步評估了不同圖像分辨率對于視覺任務的影響。可以看出,較大的分辨率能明顯提升在視覺基準上的性能:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

三、評估

3.1 概覽

如下圖 Table 6 所示,作者僅提供了與自家 Gemini 和 Gemma 模型的比較,而未提供更多開源模型的結果(PS:聲稱是無法保持公平性??)。因此,我們從一些比較可信的數據源收集到一些 DeepSeek 的基準數據以作對比:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

如下圖所示為 Grok 3 的 DeepSearch 收集到的部分數據:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.2 MMLU-Pro

參考:MMLU-Pro Leaderboard - a Hugging Face Space by TIGER-Lab [4]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.3 LiveCodeBench

參考:

  • Introducing Gemini 2.0: our new AI model for the agentic era [5]
  • Gemini 2.0 is now available to everyone [6]
  • LiveCodeBench Leaderboard [7]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.4 GPQA Diamond

參考:LLM Leaderboard 2025 [8]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.5 FACTS Grounding

這個看著是 Google 自己的榜單:https://www.kaggle.com/facts-leaderboard/leaderboard [9]

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

3.6 評估細節

雖然說 Google 在宣傳上有點雞賊,但是其一般都會比較準確列出基準評估的細節,比如采用的 n-shot 配置,是否使用 CoT 等等,如下圖 Table 19 所示:

Google Gemma 3:性能“炸裂”還是榜單優化?-AI.x社區

四、參考鏈接

  1. ???https://huggingface.co/spaces/lmarena-ai/chatbot-arena-leaderboard???
  2. ???https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf???
  3. ???https://huggingface.co/google/gemma-3-27b-it/tree/main???
  4. ???https://huggingface.co/spaces/TIGER-Lab/MMLU-Pro???
  5. ???https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/???
  6. ???https://blog.google/technology/google-deepmind/gemini-model-updates-february-2025/???
  7. ???https://livecodebench.github.io/leaderboard.html???
  8. ???https://www.vellum.ai/llm-leaderboard???
  9. ???https://www.kaggle.com/facts-leaderboard/leaderboard???
  10. ???https://www.inceptionlabs.ai/news????

 

本文轉載自??AI閑談??,作者:AI閑談

收藏
回復
舉報
回復
相關推薦
毛片免费在线| 中文字幕无码日韩专区免费| 国产精品13p| 久久久亚洲高清| 国产精品一区久久久| 婷婷伊人五月天| 国产精品香蕉| 色哟哟一区二区在线观看| 先锋在线资源一区二区三区| 99在线精品视频免费观看软件| 亚洲电影在线| 中文字幕精品一区久久久久 | 黄瓜视频污在线观看| 久草手机视频在线观看| 日韩大胆视频| 极品少妇一区二区三区精品视频| 欧美激情视频一区| av黄色在线免费观看| 亚洲开心激情| 欧美色欧美亚洲另类二区| 欧美美女黄色网| 精品电影在线| 成人av网站在线观看| 国产色综合天天综合网| 久久国产视频播放| 亚洲综合中文| 永久免费精品影视网站| 少妇一级淫免费观看| 四虎视频在线精品免费网址| 精品成人久久av| 五月天综合婷婷| 超碰国产在线| 久久综合丝袜日本网| 亚洲www在线观看| 在线视频精品免费| 中文日韩欧美| 欧美精品久久久久久久| 97成人资源站| 久久看人人摘| 中文亚洲视频在线| 色欲av无码一区二区三区| av一级亚洲| 91精品国产综合久久福利| 国产视频在线视频| 亚洲第一影院| 欧美性猛交99久久久久99按摩| 国产精品国产三级国产专区51| 男女啪啪在线观看| 国产精品久线观看视频| 色乱码一区二区三在线看| 视频三区在线观看| 2020国产精品自拍| 久久综合中文色婷婷| 少妇精品视频一区二区 | 亚洲二区自拍| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 国产精品久久久久av福利动漫| 国产又粗又猛视频免费| 日韩av一级片| 国产精品日韩专区| 成人黄色三级视频| 免费av网站大全久久| 国产精品第一区| 中文字幕天堂在线| 男人的天堂久久精品| 国产精品你懂得| 日韩乱码一区二区三区| 日本不卡不码高清免费观看| 国产精品第1页| 中文文字幕一区二区三三| 美女视频黄久久| 国产在线观看精品| 99久久夜色精品国产亚洲| 国产麻豆视频精品| 国产精品一区二区不卡视频| 蜜臀久久99精品久久久| 2024国产精品| 婷婷久久伊人| gogo在线高清视频| 亚洲一级二级在线| 国产精品秘入口18禁麻豆免会员| 三级成人黄色影院| 4438成人网| 免费看黄色片的网站| 理论片一区二区在线| 亚洲欧美日韩一区在线| 99在线视频免费| 中文av一区| 2018中文字幕一区二区三区| 无码人妻aⅴ一区二区三区有奶水| 日本不卡中文字幕| 91九色蝌蚪嫩草| 日韩欧美在线番号| 国产精品久久久久影院色老大| 欧美 日韩 国产精品| 1234区中文字幕在线观看| 国产精品一区二区精品视频观看| 亚洲福中文字幕伊人影院| 亚洲激情免费视频| 黄色片网站在线免费观看| 爽好久久久欧美精品| 国产精品永久免费视频| 国产免费不卡av| www.99精品| 色一情一乱一伦一区二区三区丨 | 成人黄色综合网站| 欧美一进一出视频| 国产美女av在线| 狠狠操狠狠色综合网| 激情五月俺来也| 久久夜色电影| 久久精品在线播放| 免费看一级视频| 国产99久久久精品| 神马影院午夜我不卡| 丁香花高清在线观看完整版| 欧美午夜一区二区三区免费大片| 亚洲成人福利视频| 欧美一区二区三区粗大| 中国av一区| 欧美高清视频一区二区| 中文字幕一二三四| 91一区二区三区在线观看| 国产成年人在线观看| 亚洲高清黄色| 亚洲精品电影久久久| 久久高清内射无套| 日本欧美一区二区| 久久亚洲一区二区| h片在线观看下载| 在线91免费看| 国产又粗又硬视频| 亚洲一区二区三区四区五区午夜| 2欧美一区二区三区在线观看视频| 懂色av中文字幕一区二区三区| 欧美亚洲精品日韩| 国产高潮久久久| 全亚洲第一av番号网站| 欧美刺激脚交jootjob| 欧美日韩成人在线一区| 男人午夜视频在线观看| 国产欧美日韩精品高清二区综合区| 亚洲激情综合网| 国产精选一区二区| 国产精品实拍| 91精品免费在线| 国产传媒免费在线观看| 麻豆精品新av中文字幕| 日韩资源av在线| 日韩精品专区| 亚洲一区二区福利| 天码人妻一区二区三区在线看| 97se狠狠狠综合亚洲狠狠| 国产精品裸体瑜伽视频| 欧美调教在线| 欧美怡春院一区二区三区| 欧美熟妇另类久久久久久不卡 | 精品一区二区三区日本| 国产羞羞视频在线播放| 亚洲国产成人爱av在线播放| 国产一级片网址| 成人99免费视频| 青青青免费在线| 日本一道高清一区二区三区| 91av视频在线观看| 欧美日韩国产综合视频| 91福利在线导航| 国产精品18在线| 国产精品一色哟哟哟| 免费在线黄网站| 九九热视频免费| 午夜视频精品| 国产在线精品一区| 伊人色综合一区二区三区影院视频| 亚洲欧洲在线看| 伊人网视频在线| 亚洲人妖av一区二区| 日本中文字幕有码| 国产欧美二区| 视频一区国产精品| 国产精品亚洲综合在线观看| 欧美激情一区二区三区久久久| 亚洲av成人无码久久精品老人| 色94色欧美sute亚洲线路二| 日本美女黄色一级片| 国产91色综合久久免费分享| 国产精品无码人妻一区二区在线| 亚洲警察之高压线| 国产日韩欧美夫妻视频在线观看 | 久久久久国产精品免费| 欧美黄色小说| 69久久99精品久久久久婷婷| 国产精品99无码一区二区| 久久嫩草精品久久久精品| 麻豆三级在线观看| 国产中文一区| 视频一区二区在线| 超碰精品在线| 国产精品亚洲综合天堂夜夜| 青春草在线免费视频| 亚洲视频日韩精品| 亚洲精品久久久久avwww潮水| 色哟哟欧美精品| 波多野结衣不卡视频| 2023国产精品自拍| 日本一区二区三区在线免费观看| 亚洲一区免费| 日韩不卡视频一区二区| 国产成人精品三级高清久久91| 亚洲在线免费视频| 欧美xxx视频| 欧美精品电影免费在线观看| 91高清在线| 日韩电影中文字幕| 国产浮力第一页| 欧美视频你懂的| 亚洲视频免费播放| 玉米视频成人免费看| 99精品全国免费观看| 99re热这里只有精品免费视频| www.色.com| 日本美女视频一区二区| 国产成人无码一二三区视频| 欧美在线二区| 制服诱惑一区| 欧美精选一区二区三区| 好看的日韩精品视频在线| 欧美视频精品全部免费观看| 国产精品欧美日韩久久| 亚洲色图官网| 7777免费精品视频| 久久电影网站| 欧美精品在线视频观看| 免费a级在线播放| 视频一区视频二区国产精品| 好男人免费精品视频| 亚洲欧美激情精品一区二区| 天天干,天天操,天天射| 精品国产91久久久久久久妲己| 国产高清视频免费观看| 欧美高清视频一二三区| 一个人看的www日本高清视频| 在线观看免费视频综合| 亚洲第一网站在线观看| 色综合天天综合网国产成人综合天 | 可以免费观看av毛片| 国产免费成人| 国产成人久久婷婷精品流白浆| 国产婷婷精品| 美女av免费在线观看| 久久精品卡一| 六月激情综合网| 男女精品网站| 日韩手机在线观看视频| 视频在线观看一区二区三区| 国产精品亚洲二区在线观看| 久久综合伊人| 搡女人真爽免费午夜网站| 青青青伊人色综合久久| 中文字幕av专区| 精品一区二区精品| 三级网站免费看| 成人一区在线看| 99re久久精品国产| 国产人久久人人人人爽| 人妻熟人中文字幕一区二区| 亚洲丝袜自拍清纯另类| 私库av在线播放| 亚洲午夜免费电影| 视频一区二区三区四区五区| 色综合天天综合网天天狠天天| 欧美性受xxx黑人xyx性爽| 欧美日韩国产综合一区二区| av免费在线观看不卡| 欧美mv和日韩mv的网站| 无码国产色欲xxxx视频| 一区二区亚洲欧洲国产日韩| 成人黄色网址| 欧美亚洲国产精品| 精品久久福利| 国产精品免费一区二区三区四区 | 国产一级精品视频| 欧美最猛黑人xxxxx猛交| 国产情侣在线播放| 亚洲国产精品大全| 中文字幕在线观看日本| 欧美国产日韩中文字幕在线| 在线女人免费视频| 国产精品99蜜臀久久不卡二区| 精品一区二区三区免费看| 国偷自产av一区二区三区小尤奈| 经典一区二区| 日韩a级黄色片| 三级久久三级久久久| 深爱五月综合网| 久久欧美中文字幕| 2021亚洲天堂| 日本久久精品电影| 99久久久无码国产精品免费| 日韩精品久久久久久久玫瑰园| 欧美高清视频| 欧美一级大胆视频| 精品国产鲁一鲁****| 久久综合九色99| 欧美视频亚洲视频| 九九热在线免费| 成人精品国产免费网站| 日本裸体美女视频| 日本国产一区二区| 日本高清视频免费看| 日韩一区二区三区xxxx| 小h片在线观看| 亚洲自拍偷拍色图| 色琪琪久久se色| 成人黄色片视频| av一区二区三区黑人| 全网免费在线播放视频入口| 欧美日韩一区二区三区在线| 四虎电影院在线观看| 欧美精品激情在线| 免费欧美网站| 宅男一区二区三区| 日韩成人一级片| 日本黄色片在线播放| 亚洲在线成人精品| aa视频在线免费观看| 日韩中文字幕在线观看| 日本免费一区二区三区四区| 国产一区精品视频| 狠狠88综合久久久久综合网| 999在线观看| 国产精品国产三级国产三级人妇| 亚洲av无码不卡| 亚洲精品永久免费精品| 国产资源在线观看入口av| 91精品久久香蕉国产线看观看| 亚洲国产精品91| 午夜视频在线网站| 中文成人av在线| 中文在线最新版天堂| 一个人看的www久久| 粉嫩一区二区三区| 日本午夜一区二区三区| 天堂午夜影视日韩欧美一区二区| 亚洲精品理论片| 色视频成人在线观看免| 精彩国产在线| 国产精品精品久久久| 国产精品美女久久久久久不卡| 成人羞羞国产免费网站| 久久久久99精品一区| 久久久久久久久久一级| 色综合影院在线| 亚洲精品一区二区在线播放∴| 一区二区在线观| 国内精品在线播放| 全网免费在线播放视频入口 | 午夜精品成人在线视频| 天堂av在线免费| 奇米4444一区二区三区 | 精品久久福利| 国产盗摄视频在线观看| 国产成人在线看| 国产性xxxx高清| 国产午夜一区二区| 一区在线不卡| 天堂8在线天堂资源bt| 99精品视频中文字幕| 黄色污污网站在线观看| 日韩中文视频免费在线观看| 精品国产亚洲一区二区三区在线| 国产欧美久久久久| 久久综合资源网| 影音先锋国产在线| 久久久91精品国产| 91综合精品国产丝袜长腿久久| 欧美三级在线观看视频| 国产欧美日本一区视频| jizz中国少妇| 欧美孕妇孕交黑巨大网站| 清纯唯美综合亚洲| gogo亚洲国模私拍人体| 精品久久久久久久久久ntr影视| 国产小视频免费在线观看| 国产美女扒开尿口久久久| 在线中文一区| 在线观看日本中文字幕| 日韩一区二区三区在线视频| 麻豆免费在线| 欧美 日韩 国产 在线观看| www.欧美.com| 一级黄色片在线播放| 高清一区二区三区四区五区| 国产一区二区三区91| 被黑人猛躁10次高潮视频| 精品久久久久久久久中文字幕| 欧美一区二区三区| 国产欧美日韩综合一区在线观看| 免费人成黄页网站在线一区二区 | 在线免费看黄网站|