精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Qwen和DeepSeek為何都選YaRN?

人工智能
YaRN 可以直接和修改注意力機(jī)制的庫(kù)兼容,比如 Flash attention,因此不會(huì)有額外的實(shí)現(xiàn)成本和推理成本。Flash 在目前的主流底層框架實(shí)現(xiàn)基本是標(biāo)配了,所以這一點(diǎn)很重要。

這篇文章,我們還是從面試官的視角出發(fā),一起來分析一下,如果你在面試現(xiàn)場(chǎng)被問到這個(gè)題目,應(yīng)該如何回答?

1.面試官心理分析

首先還是分析一下面試官的心理,面試官問這個(gè)問題,主要是想考察三點(diǎn):

  • 第一,你知不知道長(zhǎng)度外推這個(gè)概念?很多同學(xué)可能聽都沒聽過這個(gè)概念,那這個(gè)問題當(dāng)然也就無(wú)從答起了。
  • 第二,deepseek 采用了哪種長(zhǎng)度外推方案?面試官希望你能講清楚這個(gè)外推算法的底層細(xì)節(jié)。
  • 第三,這種方案相比之前的方法,它好在哪里?這就更進(jìn)一層了,需要你通過自己的理解總結(jié)概括一下。

好,那接下來我們就沿著面試官的心理預(yù)期,來分析一下這道題目!

2.面試題解析

首先回答第一層,什么是長(zhǎng)度外推?

顧名思義,長(zhǎng)度外推,就是不需要用長(zhǎng)序列數(shù)據(jù)進(jìn)行額外的訓(xùn)練,只用短序列語(yǔ)料對(duì)模型進(jìn)行訓(xùn)練,就可以得到一個(gè)能夠處理和預(yù)測(cè)長(zhǎng)序列的模型,也就是我們所說的“Train Short,Test Long”。

那么如何判斷一個(gè)模型能否用于長(zhǎng)序列呢?最基本的指標(biāo),就是模型的長(zhǎng)序列 Loss 或者 PPL 不會(huì)爆炸。

更加符合實(shí)踐的評(píng)測(cè),則是輸入足夠長(zhǎng)的 Context,讓模型去預(yù)測(cè)答案,然后跟真實(shí)答案做對(duì)比,計(jì)算 BLEU、ROUGE,LongBench 這幾個(gè)指標(biāo)。

然后回答第二層,deepseek 采用了一種叫 YaRN 的長(zhǎng)度外推算法。

具體來說,YaRN 是基于 NTK-aware 方法的進(jìn)一步拓展,通過結(jié)合溫度縮放和 NTK-by-parts 插值,來提升長(zhǎng)文本外推能力。

即 YaRN = NTK-aware + NTK-by-parts + Dynamic NTK。

然后我們看一下,這個(gè)算法是怎么做的。我們首先回顧一下 ROPE 的公式:

圖片圖片

從公式中可以看到,m-n 是相對(duì)位置的距離,θi 是旋轉(zhuǎn)的頻率。

那怎么理解這個(gè)公式呢?

我們知道,對(duì)于三角函數(shù),不同取值本質(zhì)上就等于在一個(gè)單位圓上的點(diǎn)。

如果 m-n 逐漸變大,也就是相對(duì)距離越來越遠(yuǎn),則相當(dāng)于在圓上旋轉(zhuǎn),如果 θ 越大,則代表在圓上旋轉(zhuǎn)越快。theta 對(duì)應(yīng)頻率,根據(jù)頻率和周期的關(guān)系,頻率越大,周期越小。

我們來看這張圖,左右分別代表一個(gè)大的 θ 和一個(gè)小的 θ 的旋轉(zhuǎn)情況。大 θ 旋轉(zhuǎn)超過一周了,小 θ 才旋轉(zhuǎn)一個(gè)半圓。

圖片圖片

然后我們來看一下 YaRN 的核心思想,假設(shè)訓(xùn)練的長(zhǎng)度是 L,那 m-n 的取值范圍是 [0,L-1]。

θ 越大,則轉(zhuǎn)速越快,也就是 m-n 從 0 到 L-1 的期間,已經(jīng)轉(zhuǎn)了很多圈,也就是說圓上的每一個(gè)點(diǎn)幾乎都被訓(xùn)練過,這類 theta 不存在長(zhǎng)度外推的問題。也就是對(duì)于高頻信息,不動(dòng)。

對(duì)于小的那些 θ,也就是 m-n 從 0 到 L-1 的期間,可能轉(zhuǎn)了還沒有一圈,圓上還存在很多空白。

那這種情況,如果測(cè)試長(zhǎng)度 M 大于 L,則很有可能就超出了訓(xùn)練過的那一段圓弧,從而造成長(zhǎng)度外推失敗。

YaRN 的做法也很直接,直接把此時(shí)的 θ 壓回到訓(xùn)練過的那一段圓弧范圍內(nèi),這樣就減少了實(shí)際預(yù)測(cè)時(shí)跑到空白的地方。也就是 θ 會(huì)乘一個(gè)縮放因子 L/M。

我們可以設(shè)一個(gè)圈數(shù)的閾值 τ,如果圈數(shù)超過 τ 的,就認(rèn)為已經(jīng)充分訓(xùn)練了,可以不加改動(dòng);

圈數(shù)少于 1 的,θ 改為 θ*L/M,也就是要把超出弧范圍的重新縮放到弧內(nèi),至于二者之間的部分,就在兩者之間線性插值過渡。

也就是論文這個(gè)公式所表達(dá)的含義:

圖片圖片

YaRN 的第二個(gè)點(diǎn)是解決線性內(nèi)插導(dǎo)致的 self-attention 點(diǎn)積的值增大的問題。

由于線性內(nèi)插會(huì)改變旋轉(zhuǎn)向量轉(zhuǎn)動(dòng)的幅度,也就是隔得更近了。原來距離較遠(yuǎn)的 q,k 點(diǎn)積由于旋轉(zhuǎn)幅度變小,他們的點(diǎn)積結(jié)果會(huì)增大,進(jìn)而導(dǎo)致 Softmax 操作過于“銳化”,使得注意力分布集中于少數(shù)位置,削弱了模型對(duì)全局上下文的關(guān)注能力。

Yarn 在 NTK-by-parts 基礎(chǔ)上,引入了注意力溫度因子,來調(diào)整注意力分布。

我們看公式:

圖片圖片

3.總結(jié)

最后總結(jié)一下,這個(gè)算法有哪些優(yōu)勢(shì)呢?

首先,YaRN 可以直接和修改注意力機(jī)制的庫(kù)兼容,比如 Flash attention,因此不會(huì)有額外的實(shí)現(xiàn)成本和推理成本。Flash 在目前的主流底層框架實(shí)現(xiàn)基本是標(biāo)配了,所以這一點(diǎn)很重要。

第二個(gè)是效果拔群,YaRN 這個(gè)算法目前在各種大模型和和不同架構(gòu)上對(duì)比實(shí)驗(yàn)表明,是一個(gè)非常強(qiáng)的 SOTA。

所以目前主流的大模型,如 LLaMA 的改進(jìn)系列,Qwen2.5 和 DeepSeek,都選擇了用 YaRN 來做長(zhǎng)度外推。

責(zé)任編輯:武曉燕 來源: 丁師兄大模型
相關(guān)推薦

2013-08-27 13:46:17

喬布斯蓋茨微軟

2025-02-24 08:10:00

2025-02-14 09:50:00

DeepSeekAI

2018-07-31 12:04:00

顯示器

2010-08-25 10:35:31

微軟

2013-07-30 17:26:11

科技公司科技巨頭IT公司

2010-08-26 17:24:47

2025-02-08 09:30:00

2025-02-27 08:00:00

DeepSeek大模型人工智能

2009-09-23 18:15:15

wifi通信

2025-05-06 00:35:33

2017-11-29 12:06:07

2011-05-07 09:38:03

打印機(jī)耗材正品

2025-02-08 11:31:17

DeepseekR1模型

2018-09-26 17:16:28

VR游戲體驗(yàn)虛擬現(xiàn)實(shí)

2025-04-01 08:10:00

JavaScripteval()函數(shù)代碼

2025-10-11 09:21:35

2025-08-08 09:06:00

2011-05-23 16:12:39

私有云

2025-10-20 08:17:01

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美少妇一级片| 国产97免费视| 国产婷婷在线观看| 日韩一区二区三区在线免费观看 | 第一福利永久视频精品| 亚洲高清在线播放| 欧美天堂在线视频| 美女视频免费一区| 97香蕉久久超级碰碰高清版| 日本一二三不卡视频| 波多野结衣欧美| 欧美私模裸体表演在线观看| 欧美又粗又长又爽做受| av网站在线播放| 成人av资源站| 国产一区在线播放| 国产无套丰满白嫩对白| 欧美一区二区三区另类| 亚洲性猛交xxxxwww| 18禁一区二区三区| 自拍偷拍亚洲| 欧美视频一区二区在线观看| 99精品在线免费视频| 成人影院在线观看| 日本一区二区视频在线| 国产欧美一区二区三区另类精品| 一级做a爱片久久毛片| 西西裸体人体做爰大胆久久久| 久久久精品在线| 婷婷色一区二区三区| 国产精品99久久免费观看| 欧美日韩国产大片| 一区二区xxx| 男人皇宫亚洲男人2020| 亚洲一区二区四区蜜桃| 肉大捧一出免费观看网站在线播放 | 亚洲天堂av中文字幕| 欧美成人一区在线观看| 精品国产三级电影在线观看| 亚洲在线观看网站| 综合久久伊人| 欧美久久久久免费| 色噜噜狠狠一区二区| 巨胸喷奶水www久久久| 日韩欧美黄色动漫| 2022亚洲天堂| 美女露胸视频在线观看| 亚洲国产精品久久人人爱| 五月天在线免费视频| 黄色网页在线免费观看| 毛片在线不卡| 狠狠色狠狠色综合日日91app| 日韩av免费在线播放| 五月天综合激情网| 欧美亚洲一区| 日本欧美一级片| 成人午夜淫片100集| 久久久综合网| 国产精品成熟老女人| 69视频免费看| 日本成人在线视频网站| 国产免费一区二区三区在线观看| 无码久久精品国产亚洲av影片| 国产亚洲永久域名| 国产精品成人一区二区| 亚洲一区中文字幕在线| 韩国成人在线视频| 成人免费视频视频在| 亚洲免费视频网| 99视频有精品| 青青草成人激情在线| av资源网站在线观看| 中文字幕一区二区三区不卡| 午夜探花在线观看| 91av久久| 91精品福利视频| 中文字幕成人免费视频| 日韩成人久久| 亚洲精品永久免费| 亚洲黄色网址大全| 中文字幕av亚洲精品一部二部| 久久久久久久国产| 波多野结衣人妻| 国模无码大尺度一区二区三区| 99视频免费观看蜜桃视频| 婷婷在线免费观看| 国产精品久久久久天堂| 国产尤物av一区二区三区| 欧美日韩国产观看视频| 欧美午夜精品理论片a级按摩| 黄色片免费网址| 亚洲黄页在线观看| 久久久国产91| 久久99国产综合精品免费| 蜜桃精品视频在线| 国产精品国产三级国产专区53| 理论在线观看| 亚洲精品中文在线| 国产精品-区区久久久狼| 日韩伦理一区二区| 日韩高清a**址| 国产大片免费看| 三级亚洲高清视频| 国产成人亚洲欧美| www.亚洲视频| 精品欧美aⅴ在线网站| 亚洲另类第一页| 美女一区二区在线观看| 久久精品国产99国产精品澳门| 色婷婷在线观看视频| 精品中文字幕一区二区| 久久久久网址| 搞黄网站在线看| 欧美酷刑日本凌虐凌虐| 久久久久久久久免费看无码 | 热久久最新网址| 亚洲第一影院| 亚洲精品国精品久久99热一| 暗呦丨小u女国产精品| 日韩电影在线一区二区| 精品亚洲欧美日韩| 成人免费高清观看| 欧美一级淫片007| 精品丰满少妇一区二区三区| 国产精品一页| 国产综合色一区二区三区| 黄色网址在线免费| 欧美乱妇一区二区三区不卡视频| 亚洲一区二区自偷自拍| 国产欧美日本| 国产精品久久久久久久久婷婷| 成人日韩欧美| 欧美理论片在线| 99热这里只有精品4| 人妖欧美一区二区| 视频在线观看成人| 超碰这里只有精品| 在线日韩日本国产亚洲| 日本黄色中文字幕| 国产喂奶挤奶一区二区三区| 欧美日韩在线不卡视频| 欧美有码在线| 77777少妇光屁股久久一区| 国产91久久久| 亚洲综合免费观看高清完整版| 黄色a级三级三级三级| 日韩影院二区| 国产自产女人91一区在线观看| 阿v免费在线观看| 欧美日韩免费高清一区色橹橹| 欧美a在线播放| 麻豆精品一区二区综合av| 亚洲精品日韩成人| 国产精品美女久久久久人| 久热爱精品视频线路一| 精品人妻午夜一区二区三区四区 | 免费欧美一级视频| 美女久久久久| 国产精品自产拍高潮在线观看| 在线观看二区| 欧美一区二区三区视频在线观看| 亚洲成人生活片| 成人一级片在线观看| 97国产精东麻豆人妻电影| 亚洲aaa级| 国产精品视频yy9099| 欧美性猛交xxx乱大交3蜜桃| 在线播放中文字幕一区| 午夜爱爱毛片xxxx视频免费看| 国产一区 二区 三区一级| 免费观看亚洲视频| 美女视频亚洲色图| 国产精品直播网红| 欧美videossex| 亚洲剧情一区二区| 亚洲性生活大片| 亚洲综合999| 美女100%无挡| 国产在线不卡一区| 五十路熟女丰满大屁股| 国产精品一区二区99| 成人福利在线视频| 男人天堂视频在线观看| 色噜噜狠狠狠综合曰曰曰| 精品人妻一区二区三区麻豆91 | 精品999在线| 欧美日韩18| 欧美12av| 精品中文字幕一区二区三区| 2019中文字幕在线| 久久久久久久久免费视频| 亚洲第一精品夜夜躁人人爽| 日日骚av一区二区| 亚洲乱码国产乱码精品精可以看 | 一区二区三区波多野结衣在线观看 | 二区三区精品| 7777精品久久久久久| 久操视频在线免费播放| 日韩高清a**址| www.成人在线观看| 在线观看亚洲成人| 日本少妇久久久| 亚洲青青青在线视频| 免费a级黄色片| 国产河南妇女毛片精品久久久 | 99精品视频99| 亚洲人精品一区| 毛片网站免费观看| 成人晚上爱看视频| 亚洲欧美日韩一二三区| 免费看欧美美女黄的网站| 精品无码国产一区二区三区av| 欧美丰满日韩| 四虎永久国产精品| 偷拍精品福利视频导航| 国产精品久久久一区二区三区| 日本成人在线网站| 国产精品久久久久999| 秋霞伦理一区| 国模视频一区二区三区| dy888亚洲精品一区二区三区| 国产午夜精品视频| 美丽的姑娘在线观看免费动漫| 欧美精品一区二区三区高清aⅴ| 亚洲熟妇无码久久精品| 色成人在线视频| 日本中文在线播放| 午夜精品影院在线观看| 免看一级a毛片一片成人不卡| 亚洲欧美综合另类在线卡通| 久久久久亚洲AV成人无在| 国产校园另类小说区| 李宗瑞91在线正在播放| av一区二区三区| 好男人香蕉影院| 99久久婷婷国产综合精品| 黄色国产在线视频| 成人免费视频播放| 亚洲天堂2024| bt7086福利一区国产| 国模私拍在线观看| 97精品电影院| 五月婷婷综合在线观看| 久久蜜桃一区二区| 无码熟妇人妻av| 国产欧美精品日韩区二区麻豆天美| 极品粉嫩小仙女高潮喷水久久| 91老师国产黑色丝袜在线| 人妻少妇一区二区| 欧美韩国日本一区| 亚洲一二三四五六区| 国产精品国产三级国产普通话蜜臀| 免费看的黄色录像| 亚洲欧美日韩国产一区二区三区| 国产成人综合在线视频| 亚洲天堂中文字幕| 久久艹精品视频| 午夜影院久久久| 天干夜夜爽爽日日日日| 欧美日韩一区二区三区免费看| 亚洲一区二区三区高清视频| 欧美精品亚洲一区二区在线播放| 国产夫绿帽单男3p精品视频| 精品日韩一区二区三区| 日韩国产福利| 在线亚洲欧美视频| 综合图区亚洲| 欧美孕妇与黑人孕交| 99只有精品| 91久久国产自产拍夜夜嗨| 国产精品17p| 清纯唯美一区二区三区| 国产精品成人a在线观看| 日本三级中文字幕在线观看| 99视频在线精品国自产拍免费观看| 人妻无码视频一区二区三区| 久久国产精品72免费观看| 无码国产精品一区二区高潮| 99久久精品国产一区| 91精品国自产在线| 亚洲免费资源在线播放| 欧美精品亚洲精品日韩精品| 欧美色手机在线观看| 丰满人妻一区二区三区无码av| 精品亚洲一区二区三区| 麻豆视频网站在线观看| 97视频在线观看网址| 免费一级欧美在线观看视频| 国产精品日韩欧美一区二区| 国产尤物久久久| 国产尤物av一区二区三区| 日日摸夜夜添夜夜添国产精品| 亚洲综合在线一区二区| 久久免费看少妇高潮| 欧美成欧美va| 欧美综合亚洲图片综合区| www.黄色小说.com| 这里只有精品久久| 日本不卡1234视频| 亚洲最大福利视频网站| 精品亚洲成人| 免费毛片网站在线观看| 国内精品视频666| 久久成人激情视频| 午夜精品一区二区三区免费视频| 在线观看国产精品入口男同| 日韩精品电影网| 中文字幕在线观看播放| 国产精品白嫩初高中害羞小美女 | 成人精品国产| 久久久久久草| 欧美日本不卡| 污视频在线观看免费网站| 国产片一区二区| 久久久午夜影院| 日韩精品专区在线影院重磅| 91在线看黄| 国产精品扒开腿做爽爽爽视频| 三级小说欧洲区亚洲区| 欧美中日韩在线| 国产精品18久久久久| 97在线观看免费高| 欧美伦理视频网站| 日本在线观看免费| 日本久久久久久久久| 全球av集中精品导航福利| 波多野结衣av一区二区全免费观看| 久久精品国产免费看久久精品| 日韩女同一区二区三区| 欧洲视频一区二区| 国产一级免费在线观看| 日本免费在线精品| 国产麻豆一区二区三区精品视频| 国产av无码专区亚洲精品| 99久久99久久综合| 日韩免费av片| 亚洲成人av在线播放| www.8ⅹ8ⅹ羞羞漫画在线看| 99爱精品视频| 亚洲婷婷在线| 喷水视频在线观看| 精品久久久香蕉免费精品视频| 日本高清视频免费观看| 97视频在线观看网址| 日韩三级av| 国产一级不卡毛片| 亚洲国产精品精华液ab| 国产偷人爽久久久久久老妇app| 亚洲图中文字幕| 高清欧美日韩| 日本xxxxx18| 福利视频网站一区二区三区| 国产亚洲精品久久久久久无几年桃| 日韩欧美一区在线观看| av中文资源在线资源免费观看| 国产一区二区三区免费不卡| 一本色道久久综合| 天天躁日日躁aaaa视频| 欧美色中文字幕| 成人av免费| 国语精品中文字幕| 丝袜国产日韩另类美女| 青青青视频在线播放| 欧美一区二区在线不卡| 国产v日韩v欧美v| 日韩久久不卡| 国产一区二区在线看| 日韩高清精品免费观看| 亚洲欧洲自拍偷拍| 日韩精品一页| 人妻久久久一区二区三区| 久久久久久99久久久精品网站| 涩涩视频在线观看| 欧美情侣性视频| 久久av综合| 国产精品igao网网址不卡| 亚洲成人手机在线| 成年网站在线| 999视频在线免费观看| 免费久久99精品国产自在现线| 日本黄色激情视频| 精品播放一区二区| 日本在线中文字幕一区二区三区| 公共露出暴露狂另类av| 91在线观看地址| 国产男女裸体做爰爽爽| 91成品人片a无限观看| 国产精品99久久精品| 日本69式三人交| 欧美日韩国产一二三| 岛国av在线网站| 伊人久久大香线蕉午夜av| thepron国产精品| 国产精品久久久久久免费免熟| 国产91|九色| 欧美区日韩区| 国产大屁股喷水视频在线观看| 亚洲第一偷拍网| 国产精品一区免费在线| 91黄色小网站|