精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一夜小模型王座易主!英偉達(dá)發(fā)布超強(qiáng)小模型,新混合架構(gòu)威力超Transformer,性能、速率、緩存全面超越Llama3.2!

原創(chuàng) 精選
開發(fā) 架構(gòu) 人工智能
日前,NVIDIA剛剛發(fā)布了Hymba-1.5B-Base,這是一個將Transformer注意力機(jī)制與狀態(tài)空間模型(SSM)集成的小型語言模型。

編輯 |言征

小模型王座一夜易主了!冷不防,英偉達(dá)就丟出了一個新混合架構(gòu),以后不再只是Transformer的天下了。

日前,NVIDIA剛剛發(fā)布了Hymba-1.5B-Base,這是一個將Transformer注意力機(jī)制與狀態(tài)空間模型(SSM)集成的小型語言模型。

這種全新的混合架構(gòu)只使用1.5T的Tokens進(jìn)行訓(xùn)練,性能、速度卻全面超越了市面上主流的所有小模型!英偉達(dá)的科學(xué)家兼研究經(jīng)理Pavlo Molchanov在X上宣布了這一最新發(fā)展。

圖片圖片

Hugging Face 的技術(shù)負(fù)責(zé)人及大型語言模型(LLMs)專家 Philipp Schmid 對此發(fā)展發(fā)表評論說:“Hymba 在僅使用1.5萬億個標(biāo)記進(jìn)行訓(xùn)練的條件下,性能超越了其他小型大型語言模型,如Meta 3.2或SmolLM v2。”

圖片圖片

1.雙重架構(gòu)、精確回憶、高效上下文

據(jù)“抱抱臉”上公開資料顯示,Hymba-1.5B-Base是在今年年9月1日至2024年11月10日期間進(jìn)行訓(xùn)練的,許可證方面則根據(jù)NVIDIA開放模型許可協(xié)議發(fā)布。

Hymba模型使用雙重結(jié)構(gòu),具有精確回憶的注意力頭和高效上下文總結(jié)的SSM頭。

具體來講,其特點(diǎn)在于采用了混合頭并行架構(gòu),該架構(gòu)將Transformer注意力機(jī)制與狀態(tài)空間模型(SSM)相結(jié)合,以提高效率。注意力頭提供高分辨率的回憶能力,而SSM頭則實現(xiàn)高效的上下文總結(jié)。此外,模型還引入了可學(xué)習(xí)的Meta標(biāo)記,這些標(biāo)記被添加到提示之前,用于存儲關(guān)鍵信息,并減輕與注意力機(jī)制相關(guān)的“被迫關(guān)注”負(fù)擔(dān)。通過引入跨層鍵值(KV)共享和部分滑動窗口注意力,該模型得到了進(jìn)一步優(yōu)化,從而實現(xiàn)了緊湊的緩存大小。

在一項對比相同設(shè)置下不同架構(gòu)的受控研究中,Hymba-1.5B-Base 展現(xiàn)出了顯著優(yōu)勢。

它在所有公開可用的、參數(shù)少于20億的模型中表現(xiàn)優(yōu)異,并以平均準(zhǔn)確率高出1.32%、緩存大小減少11.67倍、吞吐量提升3.49倍的成績超越了Llama-3.2-3B。

圖片

2.模型架構(gòu)非常巧妙

Hymba-1.5B-Base是一款基礎(chǔ)文本到文本的模型,可用于多種自然語言生成任務(wù)。論文《Hymba: A Hybrid-head Architecture for Small Language Models》進(jìn)一步闡述了模型的思想和實驗對比。

論文地址:https://arxiv.org/pdf/2411.13676

該模型采用混合架構(gòu),其中Mamba和注意力頭并行運(yùn)行。每個提示前都會添加一組可學(xué)習(xí)的標(biāo)記(稱為Meta標(biāo)記),以提高模型的有效性。該模型在兩層之間以及單層內(nèi)的各個頭之間共享鍵值(KV)緩存。90%的注意力層采用滑動窗口注意力機(jī)制。

Hymba-1.5B-Base的模型嵌入大小為1600,擁有25個注意力頭,MLP中間維度為5504,總層數(shù)為32層,16個SSM狀態(tài),3個全注意力層,其余為滑動窗口注意力層。與標(biāo)準(zhǔn)Transformer不同,Hymba中的每個注意力層都并行結(jié)合了標(biāo)準(zhǔn)注意力頭和Mamba頭的混合組合。此外,它還使用了分組查詢注意力(GQA)和旋轉(zhuǎn)位置嵌入(RoPE)。

圖片圖片

概括來講,這架構(gòu)有三個值得注意的特點(diǎn):

首先,在同一層內(nèi)融合注意力頭和SSM頭,對相同輸入進(jìn)行并行且互補(bǔ)的處理;此外,還引入了元標(biāo)記(meta tokens),這些標(biāo)記被添加到輸入序列的前面,并與所有后續(xù)標(biāo)記進(jìn)行交互,從而存儲重要信息并減輕注意力中“必須關(guān)注”的負(fù)擔(dān);最后,還結(jié)合了跨層KV共享和全局-局部注意力,進(jìn)一步提升內(nèi)存和計算效率。

圖片圖片

3.性能超越所有主流小模型,包括Llama3.2

Hymba-1.5B-Base在所有低于20億的公開模型中表現(xiàn)優(yōu)異。

圖片圖片

研究人員從準(zhǔn)確率、緩存大小、處理速度三個方面綜合評估了現(xiàn)在主流的小語言模型,比如Meta的Llama3.2-1B、Apple的OpenELM-1B、微軟的Phi-1.5B、抱抱臉的SmoILM2-1.7B、阿里巴巴的Qwen2.5-1.5B等。 

綜合評估和消融研究表明,Hymba不僅在眾多具有代表性的任務(wù)中樹立了新的最優(yōu)(SOTA)基準(zhǔn)性能,而且在效率方面相比Transformer和之前的混合模型也更高。例如,在常識推理任務(wù)中,Hymba-1.5B的平均準(zhǔn)確率比Llama-3.2-3B高出1.32%,而所需的緩存大小卻小了11.67倍,速度快了3.49倍。

圖片圖片

NVIDIA 還提供了一個設(shè)置腳本,以簡化環(huán)境配置,支持CUDA 12.1和12.4版本。

4.不過,需要小心

英偉達(dá)承認(rèn)該模型是利用從互聯(lián)網(wǎng)上原始抓取的數(shù)據(jù)進(jìn)行訓(xùn)練的,這就意味著訓(xùn)練數(shù)據(jù)包含有毒語言、不安全內(nèi)容和社會偏見。因此,該模型可能會放大這些偏見,并在接收到有毒提示時返回有毒的回應(yīng)。

即使提示本身不包含任何明顯冒犯性的內(nèi)容,該模型也可能生成不準(zhǔn)確、遺漏關(guān)鍵信息或包含不相關(guān)或冗余文本的答案,從而產(chǎn)生社會不可接受或不受歡迎的文本。

除了有毒內(nèi)容方面需要注意,工程方面也需要注意:

用戶應(yīng)在生成期間將批處理大小設(shè)置為1,因為當(dāng)前設(shè)置不完全支持帶有滑動窗口注意的填充元標(biāo)記。然而,任何批次大小都適用于訓(xùn)練和預(yù)填充。

5.本月25日公開模型權(quán)重,可商用

英偉達(dá)非常強(qiáng)調(diào)在創(chuàng)建值得信賴的人工智能方面分擔(dān)責(zé)任的重要性,并為其發(fā)展制定了道德準(zhǔn)則。建議用戶負(fù)責(zé)任地使用該模型,同時注意其局限性。

“在按照我們的服務(wù)條款下載或使用時,開發(fā)者應(yīng)與內(nèi)部模型團(tuán)隊合作,確保該模型滿足相關(guān)行業(yè)和使用場景的要求,并解決產(chǎn)品濫用等不可預(yù)見的問題。”

Molchanov 評論道:“我不確定我們是否應(yīng)該為使用1.5萬億個標(biāo)記的訓(xùn)練感到自豪。原因是我們要追求速度;在接下來的兩周里,就會有人做得更好。”

不過好消息是,Hymba模型已準(zhǔn)備好用于商業(yè)用途了,而且模型權(quán)重也即將推出,預(yù)計11月25日發(fā)布!

相信大家這兩天就可以快速用上這款非常nice的小模型了。

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2024-08-22 18:58:27

英偉達(dá)微軟小語言模型

2024-06-11 07:03:00

大模型開源Qwen2

2024-10-17 13:30:00

2025-08-19 09:10:00

AI模型智能體

2024-02-20 12:30:53

AI訓(xùn)練

2025-03-24 13:04:12

2024-07-22 07:50:00

模型英偉達(dá)

2024-07-24 11:30:04

2024-08-29 10:47:27

2023-02-16 13:48:56

模型論文

2025-05-21 09:40:11

2024-02-22 10:09:00

開源模型

2024-03-18 13:21:13

2023-07-19 09:00:00

模型AI

2024-07-19 12:45:23

2023-10-31 19:20:29

語言模型英偉達(dá)芯片

2021-08-20 15:32:14

機(jī)器人人工智能系統(tǒng)

2023-10-28 13:29:27

2025-09-26 08:03:41

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

国产欧美一区二区精品性色| 国产精品传媒精东影业在线| 欧美性xxxxhd| 日韩免费电影一区二区三区| 国产视频一区二区三区四区五区| 国产综合网站| 伊人精品在线观看| 在线观看一区二区三区视频| 伊人久久视频| 亚洲欧美另类综合偷拍| 久久国产主播精品| 国产丝袜视频在线观看| 亚洲永久免费精品| 久久天天躁狠狠躁夜夜爽蜜月| 中文字幕在线国产| 狠狠久久综合| 精品久久久久久亚洲精品| 在线不卡视频一区二区| 手机看片福利在线观看| 精品中文字幕一区二区| 日本免费一区二区三区视频观看 | 国产亚洲高清在线观看| 色综合视频一区二区三区高清| 99久re热视频精品98| 九色在线视频| av一区二区不卡| 亚洲xxxxx| 最好看的日本字幕mv视频大全| 影音先锋中文字幕一区二区| 久久久国产精品一区| 国产毛片久久久久久久| 久久夜色电影| 精品久久久久久久久久久久久久久久久 | 涩爱av在线播放一区二区| 国产精品自拍在线| 91精品久久久久久综合乱菊| 精品乱码一区内射人妻无码| 久久不射网站| 日本精品在线视频| 久久青青草原亚洲av无码麻豆| 国产综合精品一区| 欧美日本国产在线| 欧美成人精品欧美一级私黄| 成人情趣视频网站| 国产亚洲激情视频在线| 亚洲国产av一区| 免费av一区| 亚洲精品自拍第一页| 大尺度做爰床戏呻吟舒畅| 91成人福利| 亚洲国产精品资源| 欧美精品欧美极品欧美激情| 国产福利资源一区| 亚洲第一福利网站| 少妇户外露出[11p]| 精品三级av| 亚洲国产精品悠悠久久琪琪| 成人手机在线免费视频| 欧美人成在线观看ccc36| 亚洲国产成人精品女人久久久| 午夜福利三级理论电影| 精品欠久久久中文字幕加勒比| 亚洲第一福利网站| 爱爱的免费视频| 国产欧美日韩一区二区三区四区| 亚洲天堂av在线免费| 特黄一区二区三区| 伊人成综合网| 久久久久久久久国产| 日本视频免费在线| 丝袜诱惑制服诱惑色一区在线观看| 国产成人精品久久二区二区| 在线观看色网站| 国产精品一区二区果冻传媒| 国产精品日韩高清| 手机看片福利在线观看| 国产精品久久国产精麻豆99网站| 免费观看黄色大片| 超清av在线| 在线观看视频91| www.久久com| 日韩mv欧美mv国产网站| 中文字幕日韩av电影| 国产探花在线免费观看| 日韩一区二区久久| 国产精品亚洲片夜色在线| 精品欧美在线观看| 久久久久久久久岛国免费| 资源网第一页久久久| 91九色在线看| 欧美日韩和欧美的一区二区| 老司机免费视频| 国产剧情一区| 欧美成人第一页| 特黄视频免费看| 免费一级欧美片在线观看| 99久久国产免费免费| 国产精品99999| 亚洲图片欧美色图| 色综合色综合色综合色综合| 国产伦精品一区二区三区免费优势| 亚洲人成人99网站| 久久久精品一区二区涩爱| 视频一区欧美日韩| 国外成人在线视频网站| 9色在线视频| 激情av一区二区| 先锋资源在线视频| 色综合色综合| 欧美一区深夜视频| 蜜臀久久99精品久久久| 亚洲欧美综合另类在线卡通| 日韩久久一级片| 91精品尤物| 久久精品国产一区| 波多野结衣一区二区三区四区| 成人av网址在线| 青青草综合视频| 综合久久伊人| 一区二区欧美日韩视频| 一级免费在线观看| 成人福利视频在线看| 91成人在线视频观看| 成人一区视频| 亚洲人成电影网站| 91美女免费看| 不卡高清视频专区| 毛片av在线播放| 国产精品日本一区二区三区在线 | 九色91在线| 91精品久久久久久久99蜜桃| 国产美女免费网站| 免费视频久久| 久久久久久精| 伊人网在线播放| 日韩av在线免费观看一区| 久久免费在线观看视频| 国产激情视频一区二区三区欧美 | av网站免费在线看| 久久久精品日韩| 欧美精品一区二区三区在线四季 | 91精品久久久久久久久久久久久久| 男同在线观看| 色综合久久中文综合久久牛| 国产艳俗歌舞表演hd| 一本不卡影院| 精品一区二区日本| 无遮挡爽大片在线观看视频| 日韩精品在线免费播放| 日本一区二区三区免费视频| 不卡av免费在线观看| 国产在线播放观看| 欧美中文一区| 国产91九色视频| 国产福利免费在线观看| 在线看不卡av| 亚洲熟女少妇一区二区| 韩国av一区二区三区| 久久久久久久久影视| 国产毛片久久久| 人人澡人人澡人人看欧美| 国产区在线视频| 欧美日韩成人激情| 欧洲猛交xxxx乱大交3| 国产91丝袜在线播放九色| www.av片| 国产一区二区三区四区二区| 国产日韩在线精品av| 在线观看操人| 日韩不卡在线观看| 正在播放木下凛凛xv99| 亚洲激情图片一区| 黄色免费视频网站| 日本vs亚洲vs韩国一区三区二区| 中文字幕在线亚洲精品| 理论片一区二区在线| 国产精品mp4| 超碰人人在线| 日韩精品在线第一页| 亚洲精品一区二区二区| 亚洲精品你懂的| 丰满少妇中文字幕| 亚洲综合激情| 国产美女视频免费| 日韩在线你懂的| 国产欧美一区二区三区久久人妖| 中文字幕免费高清电视剧网站在线观看 | 午夜激情久久久| 国产毛片欧美毛片久久久| 国产一级精品在线| wwwxxx黄色片| 欧美日韩亚洲一区| 日韩免费av一区二区三区| av成人综合| 国产精选久久久久久| 国产白丝在线观看| 色偷偷av一区二区三区乱| 免费a级片在线观看| 欧美日精品一区视频| 日韩av在线电影| 自拍偷拍国产亚洲| 亚洲欧美va天堂人熟伦| 国产91色综合久久免费分享| 免费一区二区三区在线观看| 亚洲乱码久久| 日韩video| 成人vr资源| 久久久久久久久久久久久9999| 欧美高清hd| 国产欧美久久久久久| 国产精品专区免费| 欧美黑人极品猛少妇色xxxxx| jizz在线观看中文| 日韩av在线一区| 丰满熟妇人妻中文字幕| 欧美精品自拍偷拍| 男操女视频网站| 色偷偷成人一区二区三区91| 国产精彩视频在线观看| 懂色aⅴ精品一区二区三区| 26uuu久久天堂性欧美| 在线看免费毛片| 免费在线亚洲| www.日本少妇| 亚洲欧美偷拍自拍| 国产高清精品软男同| 日韩精品四区| 日本在线免费观看一区| 日韩欧美四区| 久久久福利视频| 黄色欧美网站| 国产精品二区在线| 亚洲天堂中文字幕在线观看| 91香蕉国产在线观看| 久久爱.com| 国产精品入口免费视| 黄色精品视频| 国产精品久久久久久久久久小说| 色成人免费网站| 国产mv免费观看入口亚洲| sis001欧美| 日韩av大片在线| 亚州一区二区三区| 国产精品wwwwww| 欧美成人毛片| 亚洲一区二区三区四区在线播放 | 亚洲欧美清纯在线制服| av免费观看大全| 夜夜精品视频| 国产免费人做人爱午夜视频| 狠狠88综合久久久久综合网| 精品无码一区二区三区爱欲| 在线日韩电影| 久久精品午夜福利| 美日韩一级片在线观看| 亚洲三级在线观看视频| 国产福利精品导航| 男人网站在线观看| 2020国产精品自拍| 少妇av片在线观看| 亚洲三级久久久| 妺妺窝人体色www在线下载| 亚洲不卡一区二区三区| 特级毛片www| 欧美日韩精品欧美日韩精品一 | 日韩不卡一二区| 欧美日韩视频| 国内外成人激情视频| 日韩精彩视频在线观看| 亚洲xxx在线观看| 国产成人aaa| 国产精品成人一区二区三区电影毛片| 国产欧美日韩视频一区二区| 亚洲一级生活片| 精品国产91久久久久久老师| 日韩一级片中文字幕| 在线播放视频一区| 少妇又色又爽又黄的视频| 亚洲天堂av在线免费观看| 巨大荫蒂视频欧美另类大| 国内精品免费午夜毛片| 国产成人a视频高清在线观看| **亚洲第一综合导航网站| 日韩人体视频| 永久免费看av| 丝袜诱惑亚洲看片 | 91免费看视频| 麻豆一区在线观看| 午夜精品123| 在线观看不卡的av| 亚洲成人黄色网| 2019中文字幕在线视频| 欧美精品久久久久a| 国产精品字幕| 国产偷国产偷亚洲高清97cao| 欧美一区二区三区高清视频| 女人被男人躁得好爽免费视频| 久久资源在线| 亚洲美女在线播放| 亚洲欧洲日韩女同| 久久精品视频7| 精品久久国产97色综合| 色网站免费在线观看| 欧美在线视频观看| 免费观看亚洲天堂| 四虎一区二区| 久久精品毛片| 久久久午夜精品福利内容| 日韩理论片网站| 国产精品午夜一区二区| 日韩av综合网站| 蜜乳av一区| 亚洲综合精品一区二区| 色狮一区二区三区四区视频| www黄色av| 成人av在线观| 日本少妇xxxx动漫| 欧美一级片在线| 精品孕妇一区二区三区| 国产精品视频在线播放| 欧美禁忌电影网| 欧美v在线观看| 26uuu亚洲综合色欧美| 国产乡下妇女做爰毛片| 日韩视频在线一区二区| 亚洲s色大片| 国产精品视频精品视频| 国产99久久| 人人爽人人av| 久久精品欧美一区二区三区麻豆| 亚州国产精品视频| 亚洲第一av在线| 爱啪视频在线观看视频免费| 99精品国产高清在线观看| 午夜精品剧场| 自拍视频第一页| 亚洲美女视频在线| 国产aⅴ一区二区三区| 裸体女人亚洲精品一区| 国产日韩一区二区三免费高清| 欧美一级免费在线观看| 激情文学综合丁香| 最新一区二区三区| 日韩欧美中文字幕一区| 性欧美猛交videos| 国产精品二区在线| 亚洲精品九九| 最新在线黄色网址| 色综合中文字幕| 高清中文字幕一区二区三区| 国产精品美腿一区在线看| 日韩一区二区中文| 亚洲一区二区三区三州| 亚洲一二三区不卡| 色网站在线免费观看| 日韩av免费网站| 色乱码一区二区三区网站| 日本美女久久久| 亚洲成人免费影院| 欧美视频综合| 国产精品视频在线播放| 亚洲精品久久| 亚洲一区二区在线免费| 欧美性猛交xxxx免费看漫画| 成人三级黄色免费网站| 成人国产在线视频| 亚洲午夜黄色| 欧美黄色激情视频| 欧美精品在线观看播放| 黄污视频在线观看| 欧美精品一区二区三区在线四季| 捆绑紧缚一区二区三区视频| 老湿机69福利| 亚洲精品在线三区| 国产v综合v| 日本中文字幕一级片| 久久综合狠狠综合久久综合88 | 中文字幕一区二区三区乱码| 国产高清久久久久| 黄色免费av网站| 久久成人一区二区| 日韩在线你懂的| 992kp免费看片| 黑人巨大精品欧美一区二区三区 | 欧美偷拍视频| 亚洲a中文字幕| 久久久久久穴| 免费麻豆国产一区二区三区四区| 亚洲精品一区二区网址| 4438五月综合| 99热成人精品热久久66| 亚洲精品你懂的| 久草在线网址| yellow视频在线观看一区二区| 日韩va欧美va亚洲va久久| 精品在线视频观看| 日韩中文字幕久久| 亚洲尤物av| 日本一卡二卡在线| 欧美一区二区三区视频在线|