精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+ 精華

發(fā)布于 2024-5-21 09:23
瀏覽
0收藏

讓大神Andrej Karpathy一鍵三連??(點(diǎn)贊+轉(zhuǎn)發(fā)+評(píng)論),一個(gè)教你從頭開始實(shí)現(xiàn)Llama3的代碼庫(kù)爆火。


X上轉(zhuǎn)贊收藏量超6.8k,GitHub攬星2k+。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

火就火在,它教你從頭用Meta開源的權(quán)重進(jìn)行推理,詳細(xì)解釋和展開了注意力機(jī)制中多個(gè)頭的矩陣乘法、位置編碼以及所有中間層


換句話說,他解釋了每行代碼都在干啥。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

Karpathy看后直呼打造者Nishant Aklecha(后文暫稱“納哥”)是個(gè)有品的人:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

完全展開后,比起模塊相互嵌套和調(diào)用時(shí),更容易理解每一步具體在做什么。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

網(wǎng)友們對(duì)其也是贊不絕口,紛紛致敬:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

話不多說,一起來看納哥是如何手把手教的。


(量子位在不改變?cè)獾幕A(chǔ)上,進(jìn)行了編譯整理)

從頭實(shí)現(xiàn)llama3

在運(yùn)行納哥提供的文件前,大伙兒需要預(yù)先下載Meta官方提供的Llama3模型權(quán)重。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

納哥表示自己沒搞分詞器,推薦用Karpathy的現(xiàn)成簡(jiǎn)潔版BPE代碼。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

PS:

“字節(jié)級(jí)(byte-level)”BPE算法,在UTF-8編碼的字符串上運(yùn)行,廣泛應(yīng)用于大模型分詞。Karpathy提供的這個(gè)代碼庫(kù)包含兩個(gè)分詞器,都能在給定文本上訓(xùn)練分詞器的詞匯表和合并規(guī)則、將文本編碼為token、將token解碼為文本。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

讀取模型文件的方式通常取決于model classes的編寫方式以及class中變量的命名。但由于納哥是從頭開始實(shí)現(xiàn)Llama3,所以將逐個(gè)張量地讀取文件內(nèi)容。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

通過此配置可以推斷出模型的結(jié)構(gòu)和參數(shù)信息,例如模型包含的Transformer層數(shù)、多頭注意力塊中的頭數(shù),以及詞匯表的大小等細(xì)節(jié)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

將文本轉(zhuǎn)換為token時(shí),納哥使用tiktoken作為分詞器。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來,納哥展示了在代碼中將token轉(zhuǎn)換為高維的嵌入表示。這是代碼庫(kù)中唯一使用內(nèi)置神經(jīng)網(wǎng)絡(luò)模塊的部分。


[17x1]的token矩陣變成了[17x4096]的嵌入矩陣。也就是說,每個(gè)token被轉(zhuǎn)換為一個(gè)長(zhǎng)度為4096的嵌入向量,總共有17個(gè)這樣的嵌入向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后,納哥對(duì)嵌入進(jìn)行RMS歸一化。經(jīng)過這一步后,嵌入的形狀不會(huì)改變,只有數(shù)值被歸一化了。納哥強(qiáng)調(diào)需要一個(gè)norm_eps,避免意外將RMS值設(shè)為0導(dǎo)致除以0的錯(cuò)誤。


以下是公式:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

構(gòu)建Transformer的第一層,進(jìn)行歸一化處理,從模型字典中訪問layer.0(即第一層)。歸一化之后,張量的形狀仍然是[17x4096],與嵌入時(shí)相同,但數(shù)值已被歸一化。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

跟著納哥從頭實(shí)現(xiàn)注意力機(jī)制,加載Transformer第一層的注意力頭。


從模型中加載query、key、value和output向量時(shí),它們的形狀分別是 [4096x4096]、[1024x4096]、[1024x4096] 和 [4096x4096]。


納哥表示乍一看有點(diǎn)奇怪,因?yàn)槔硐肭闆r是每個(gè)注意力頭的q、k、v和o向量是獨(dú)立的。而代碼作者將它們捆綁在一起,是為了方便并行計(jì)算注意力頭的矩陣乘法。


把所有這些向量解包開來:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

下一步,納哥將從多個(gè)注意力頭中解包query,解包后的形狀是[32x128x4096],32是Llama3中的注意力頭數(shù)量,128是query向量的大小,4096是token嵌入的大小。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

在這里,納哥訪問了第一層第一個(gè)注意力頭的query權(quán)重矩陣,query權(quán)重矩陣的大小是[128x4096]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

將query權(quán)重矩陣與token嵌入相乘,獲得每個(gè)token的query向量。結(jié)果的形狀為[17x128],有17個(gè)token,每個(gè)token對(duì)應(yīng)一個(gè)長(zhǎng)度為128的query向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來需要位置編碼。


現(xiàn)在已經(jīng)為prompt中的每個(gè)token生成了query向量,但每個(gè)單獨(dú)的query向量并不知道它在prompt中的具體位置。


例如,query:“the answer to the ultimate question of life, the universe, and everything is ”(生命、宇宙和一切的終極問題的答案是)。


在這個(gè)prompt中,使用了三次”the”,需要根據(jù)它們?cè)趐rompt中的位置,使這三個(gè)”the”token的query向量有所不同(每個(gè)向量的大小為[1x128])。


通過使用RoPE(旋轉(zhuǎn)位置嵌入)來進(jìn)行這些旋轉(zhuǎn)操作。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

上一步中,納哥將query向量分成對(duì),并對(duì)每一對(duì)應(yīng)用一個(gè)旋轉(zhuǎn)角度偏移。


由此,得到的向量大小為 [17x64x2],這是將長(zhǎng)度為128的query向量對(duì)每個(gè)prompt中的token分成64對(duì)。這64對(duì)中的每一對(duì)都會(huì)根據(jù)m*(theta) 進(jìn)行旋轉(zhuǎn),其中m是要旋轉(zhuǎn)query的token的位置。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

使用復(fù)數(shù)的點(diǎn)積來旋轉(zhuǎn)一個(gè)向量:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在每個(gè)token的query元素都有一個(gè)復(fù)數(shù)(角度變化向量),可以將query向量(之前分成的對(duì))轉(zhuǎn)換為復(fù)數(shù),然后通過點(diǎn)積根據(jù)位置旋轉(zhuǎn)query向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

獲得旋轉(zhuǎn)后的向量后,可以通過將復(fù)數(shù)重新視為實(shí)數(shù)來得到成對(duì)的query向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

旋轉(zhuǎn)后的對(duì)現(xiàn)在已經(jīng)合并,有一個(gè)新的query向量(旋轉(zhuǎn)后的query向量),其形狀為[17x128],其中17是token的數(shù)量,128是query向量的維度。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

key與query幾乎相同。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

納哥表示自己不會(huì)詳細(xì)講解key的數(shù)學(xué)原理,只需要記住以下幾點(diǎn):


key生成的key向量維度也是128;key的權(quán)重只有query的四分之一,這是因?yàn)閗ey的權(quán)重在同一時(shí)間內(nèi)被4個(gè)頭共享,來減少計(jì)算量;key也會(huì)旋轉(zhuǎn)添加位置信息,原因與query相同。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

此時(shí),納哥已經(jīng)為每個(gè)token獲得了旋轉(zhuǎn)后的query和key。每個(gè)query和key現(xiàn)在的形狀都是[17x128]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

下一步,納哥將對(duì)query矩陣和key矩陣進(jìn)行相乘操作。這樣做會(huì)生成一個(gè)評(píng)分矩陣,將每個(gè)token關(guān)聯(lián)起來。這些評(píng)分描述了每個(gè)token的query與每個(gè)token的key之間的相關(guān)性,這就是自注意力機(jī)制。


注意力評(píng)分矩陣(qk_per_token)的形狀為[17x17],其中17是prompt中的token數(shù)量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來需要對(duì)query key評(píng)分進(jìn)行掩碼處理。在Llama3的訓(xùn)練過程中,未來token的qk評(píng)分是被掩碼的,只通過過去的token來預(yù)測(cè)token。


因此,在推理時(shí),要將未來的token評(píng)分設(shè)置為0。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來是value,接近注意力機(jī)制的最后一步。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

這些評(píng)分(0-1)用于確定每個(gè)token使用多少value矩陣。

和key一樣,value的權(quán)重也在每4個(gè)注意力頭之間共享,所以下面value權(quán)重矩陣的形狀是[8x128x4096]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

第一層,第一個(gè)注意力頭的value權(quán)重矩陣如下所示:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后是value向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

使用value權(quán)重來獲取每個(gè)token的注意力值,矩陣的大小是[17x128],其中17是prompt中的token數(shù)量,128是每個(gè)token的value向量的維度。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

注意力:與每個(gè)token的value相乘后得到的注意力向量的形狀為[17x128]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在有了第一層第一個(gè)頭的注意力value。然后納哥運(yùn)行一個(gè)循環(huán),對(duì)第一層的每個(gè)頭執(zhí)行與上面的計(jì)算完全相同的數(shù)學(xué)運(yùn)算。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后得到了第一層所有32個(gè)頭的qkv_attention矩陣,接下來將所有注意力得分合并成一個(gè)大小為[17x4096]的大矩陣。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

對(duì)于第0層注意力機(jī)制的最后步驟,其一是將注意力得分矩陣與權(quán)重矩陣相乘。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

這是一個(gè)簡(jiǎn)單的線性層,所以只需進(jìn)行矩陣乘法。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在得到了注意力機(jī)制后的嵌入value變化,應(yīng)該被添加到原始的token嵌入中。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

對(duì)嵌入增量進(jìn)行歸一化處理,然后通過嵌入增量運(yùn)行一個(gè)前饋神經(jīng)網(wǎng)絡(luò)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

在Llama3中,加載前饋權(quán)重并實(shí)現(xiàn)前饋網(wǎng)絡(luò)。使用了一種名為SwiGLU的前饋網(wǎng)絡(luò),這種網(wǎng)絡(luò)結(jié)構(gòu)在模型需要的時(shí)候,能夠有效地增加非線性。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在完成了第一層之后每個(gè)token的新嵌入。現(xiàn)在只剩下31層了,只需通過一個(gè)循環(huán)來完成。


納哥表示可以將這個(gè)編輯后的嵌入想象成包含了第一層中所有查詢信息的嵌入。隨著層數(shù)的增加,每一層都會(huì)對(duì)輸入的信息進(jìn)行越來越復(fù)雜的處理,直到最終得到一個(gè)能夠全面了解下一個(gè)需要預(yù)測(cè)的token的嵌入。


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

之前做的所有事情,對(duì)每一層都重復(fù)一次。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后得到了最終的嵌入,這是模型對(duì)下一個(gè)token的最優(yōu)預(yù)測(cè)。這個(gè)嵌入的形狀與常規(guī)的token嵌入相同,為[17x4096],其中17是token的數(shù)量,4096是嵌入的維度。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

最后,將嵌入解碼成token值。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

使用輸出解碼器將最終的嵌入轉(zhuǎn)換成一個(gè)token。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來看納哥使用最后一個(gè)token的嵌入來預(yù)測(cè)下一個(gè)value,希望預(yù)測(cè)的結(jié)果是42。


因?yàn)楦鶕?jù)《銀河系漫游指南》一書中的說法,42是“生命、宇宙及一切的終極問題的答案”。大多數(shù)LLM在這里都會(huì)回答42,這將驗(yàn)證整個(gè)代碼的正確性。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

模型預(yù)測(cè)下一個(gè)token的編號(hào)為2983。這個(gè)編號(hào)對(duì)應(yīng)數(shù)字42嗎?

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

OK,結(jié)束。

“讓研究變得更加觸手可及”

簡(jiǎn)單介紹一下Nishant Aklecha。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

Nishant Aklecha是構(gòu)建和改進(jìn)定制語言模型平臺(tái)Glaive AI的研究員,曾任職于摩根士丹利,負(fù)責(zé)訓(xùn)練和微調(diào)大語言模型。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

此外,他還和朋友一同創(chuàng)立了一個(gè)研究實(shí)驗(yàn)室,名為A10(AAAAAAAAAA)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

他們的目標(biāo)可以總結(jié)成一句話:讓研究變得更加觸手可及。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

除了放出這個(gè)代碼庫(kù),Nishant Aklecha可謂好人做到底。


網(wǎng)友想更好地理解這個(gè)代碼庫(kù)的內(nèi)容,Nishant直接一個(gè)YouTube視頻甩了過來:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

之前Nishant Aklecha還曾寫過一篇Blog,詳解了潛在一致性模型(LCM),同樣收獲了不少好評(píng)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

啥也不說了,感興趣的家人們趕緊碼住吧。


GitHub鏈接:https://github.com/naklecha/llama3-from-scratch


本文轉(zhuǎn)自 量子位 ,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/z2lvKwZYSzi_35YOeVWWjw??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产精品网站在线看| 91精品久久| 日本中文一区二区三区| 日韩亚洲欧美中文在线| 一个人看的视频www| 在线观看wwwxxxx| 91免费看`日韩一区二区| 国产精品久久久亚洲| 欧美三级免费看| 免费视频一区三区| 欧美一区二区三区在线| 动漫av网站免费观看| 含羞草www国产在线视频| av不卡免费电影| 国产日本欧美在线观看| 日韩少妇裸体做爰视频| 日韩伦理视频| 精品视频偷偷看在线观看| av中文字幕网址| 综合另类专区| 亚洲在线中文字幕| 亚洲一区二区三区加勒比 | 亚洲二区精品| www.欧美三级电影.com| 亚洲AV无码国产成人久久| 日韩免费高清视频网站| 欧美日韩中文国产| 草草草在线视频| 97超碰在线免费| 亚洲美女屁股眼交3| 五月天国产一区| 欧美zzoo| 91美女片黄在线| 国产欧美日韩综合精品二区| 国产黄色片免费| 韩国av一区二区三区| 国产精品日日做人人爱| 精品国产一区二区三区四| 精品动漫3d一区二区三区免费| 久久激情五月丁香伊人| 美国精品一区二区| 国产九一精品| 亚洲欧美成人一区二区在线电影| 精品熟女一区二区三区| 91蝌蚪精品视频| 日韩欧美123| 岛国大片在线免费观看| 久久久久毛片免费观看| 欧美一区二区三区影视| 午夜影院免费版| 国产视频一区二区在线播放| 欧美一区二区视频在线观看2020| 怡红院亚洲色图| 四虎精品在线观看| 欧美乱熟臀69xxxxxx| 国产美女18xxxx免费视频| 国产成人久久精品麻豆二区| 欧美日韩国产首页| 岛国av免费在线| 亚洲午夜剧场| 日韩欧美视频在线| 美女网站视频在线观看| 牛牛视频精品一区二区不卡| 亚洲精品第一页| 香蕉网在线播放| japanese国产精品| 最近中文字幕日韩精品| 99久久99久久精品国产| 欧美a级在线| 91精品国产成人| 国产一区二区视频免费| 美女尤物国产一区| 亚洲福利精品在线| 亚洲国产综合av| silk一区二区三区精品视频| 亚洲国产欧美自拍| 超碰97人人干| 欧美a级片视频| 另类色图亚洲色图| 日产精品久久久久久久| 久久亚洲二区| 国产日韩在线免费| 亚洲av无码国产精品永久一区| 成人国产精品免费观看动漫 | 东京干手机福利视频| aaa国产一区| 五月天亚洲综合情| 欧洲一区二区三区| 色偷偷88欧美精品久久久| 日韩一级理论片| 久久久久久久久成人| 日韩精品一二三四区| 天堂资源在线视频| 狠狠色丁香久久综合频道| 日本一区二区三区四区视频| 国产男男gay网站| 91亚洲大成网污www| 亚洲午夜精品久久久中文影院av| а_天堂中文在线| 色婷婷久久综合| 日韩av福利在线观看| 天堂99x99es久久精品免费| 神马久久久久久| www.av麻豆| 国产在线视视频有精品| 激情欧美一区二区三区中文字幕 | 久久精品亚洲国产| 你懂的国产在线| 国产精品乡下勾搭老头1| 久久综合久久久| www国产在线观看| 黑人狂躁日本妞一区二区三区 | 精品视频一区二区三区| 亚洲精品自拍偷拍| 激情视频在线播放| 蜜桃av噜噜一区| 免费在线国产精品| 免费男女羞羞的视频网站在线观看| 色8久久精品久久久久久蜜| 日韩av影视大全| 成人羞羞网站入口| 欧美在线一级视频| 亚洲精品字幕在线| 中文字幕一区二区三区视频| 激情网站五月天| 麻豆一区二区麻豆免费观看| 美女国内精品自产拍在线播放| 亚洲永久精品一区| 26uuu国产电影一区二区| 欧美极品少妇无套实战| 永久免费观看精品视频| 中文字幕国产精品| 国产一区二区视频网站| 91丨九色丨黑人外教| 美女扒开大腿让男人桶| 欧美a在线观看| 日韩视频免费大全中文字幕| 正在播放亚洲精品| 国产婷婷一区二区| 91av俱乐部| 国内精品久久久久久久久电影网| 91国在线精品国内播放| 色wwwwww| 精品国产乱码久久久久久虫虫漫画| 肉丝美足丝袜一区二区三区四| 精品国产aⅴ| 国产成人一区三区| 精品乱码一区二区三四区视频| 欧美性精品220| 波多野结衣av在线免费观看| 天使萌一区二区三区免费观看| 久久久人人爽| 中文字幕日本一区二区| 亚洲一区二区黄| 日韩乱码一区二区三区| 国产精品美女久久久久av爽李琼| 波多结衣在线观看| 99久久婷婷| 999视频在线观看| 人交獸av完整版在线观看| 精品成人佐山爱一区二区| 日本三级2019| 久久精品一区八戒影视| 欧美自拍小视频| 色综合天天爱| 91亚色免费| h片在线观看下载| 精品国产百合女同互慰| 天天做天天爱夜夜爽| 久久久久久久久岛国免费| 91n.com在线观看| 一区二区中文| 久久99精品久久久久久秒播放器| 日本不卡一二三| 色一情一乱一区二区| av手机免费看| 福利精品视频在线| 91香蕉国产视频| 成人综合在线观看| 国产a视频免费观看| 欧美好骚综合网| 国产精品久久久久久久久久久久午夜片 | 欧美影院在线| 欧洲中文字幕国产精品| 尤物视频在线免费观看| 欧美sm极限捆绑bd| 无码人妻久久一区二区三区| 国产精品麻豆视频| japanese在线观看| 免费高清在线视频一区·| 老司机午夜网站| 午夜精品福利影院| 91精品视频在线看| 自拍一区在线观看| 欧美成人精品一区二区| 精品乱码一区二区三四区视频| 欧美一区二区三区在线观看| 色屁屁影院www国产高清麻豆| 亚洲欧美综合色| 手机在线看片日韩| 精品亚洲成av人在线观看| 可以在线看的av网站| 日韩a一区二区| 麻豆av一区二区三区| 视频精品二区| 国产精品午夜一区二区欲梦| 菠萝蜜视频在线观看www入口| 一本色道久久综合亚洲精品小说 | 免费观看日批视频| 亚洲愉拍自拍另类高清精品| 一级黄色片网址| 97久久精品人人做人人爽50路| 中文字幕 欧美日韩| 米奇777在线欧美播放| 日韩成人手机在线| 亚洲精品一二三区区别| 欧美1o一11sex性hdhd| 中文字幕亚洲在线观看| 91九色综合久久| 草莓视频成人appios| 国语自产精品视频在线看一大j8| 黄色大片在线播放| 色哟哟入口国产精品| 国产视频网址在线| 日韩久久精品成人| 欧洲av在线播放| 日韩欧美国产wwwww| 国产精品无码一区二区桃花视频| 91成人在线精品| 91国产丝袜播放在线| 亚洲一区欧美一区| 日韩a级片在线观看| 国产精品美女久久久久av爽李琼| 国产美女永久免费无遮挡| 91麻豆免费视频| 国产极品一区二区| 成人h版在线观看| avtt中文字幕| 成人免费观看视频| 中文字幕永久免费| 高清成人免费视频| 无码国产精品久久一区免费| 国产成人免费av在线| 国产伦理在线观看| 成人午夜av电影| 国产又粗又猛又色| 95精品视频在线| 美女爆乳18禁www久久久久久| 久久色中文字幕| 国产精品密蕾丝袜| 欧美激情一区二区三区全黄| 手机看片日韩av| 中文字幕av一区二区三区高| 天天舔天天操天天干| 国产精品麻豆网站| 婷婷激情四射网| 亚洲欧美日韩系列| 九九视频免费观看| 亚洲国产成人高清精品| 日本亚洲色大成网站www久久| 黄色一区二区三区| 日本一区二区免费电影| 色诱视频网站一区| 亚洲一区二区天堂| 欧美一区二区三级| 蜜臀av中文字幕| 亚洲欧美日韩一区二区在线| av天在线观看| 欧美久久精品午夜青青大伊人| 久久香蕉av| 欧美在线日韩在线| 国产精品诱惑| 7777精品伊久久久大香线蕉语言| 国产精品调教| 亚洲高清不卡一区| 欧美不卡高清| 日av中文字幕| 国产麻豆一精品一av一免费| 国产不卡一二三| 国产欧美精品一区二区色综合| 欧美人禽zoz0强交| 高跟丝袜一区二区三区| 国产又粗又猛又爽又黄的| 精品国产1区二区| 国产女主播在线直播| 麻豆成人在线看| 天堂在线中文网官网| 成人高h视频在线| 欧美挤奶吃奶水xxxxx| 亚洲精品一区二区毛豆| 久久久久亚洲| 日本精品一区二区三区四区| 精品制服美女丁香| 给我看免费高清在线观看| 中文字幕视频一区| 日韩精品视频免费播放| 欧美欧美欧美欧美| 三级av在线| 色综合久久88| 日韩制服诱惑| 激情小说综合网| 亚洲国产一区二区在线观看 | 欧美xxx视频| av蓝导航精品导航| 成人羞羞在线观看网站| 大j8黑人w巨大888a片| 国产一区二区在线观看视频| 国产全是老熟女太爽了| 亚洲午夜免费视频| 亚洲天天综合网| 亚洲视频在线播放| 丰满大乳少妇在线观看网站 | 亚洲一区二区影视| 亚洲精品一区二区三区不| 精品精品导航| 91色中文字幕| 日本午夜一区| 国产av无码专区亚洲精品| 粉嫩绯色av一区二区在线观看| 少妇高潮一区二区三区喷水| 色呦呦国产精品| 涩涩视频免费看| 欧美精品电影在线| 精品一区二区三区四区五区| 无遮挡亚洲一区| 久久中文欧美| 欧美色图亚洲激情| 精品久久久久久国产| 亚洲成a人片77777精品| 美女精品视频一区| 99tv成人影院| 免费成人深夜夜行网站视频| 欧美aa在线视频| 一区二区三区在线观看免费视频| 欧美日韩在线视频一区二区| 日本黄色不卡视频| 97视频在线观看免费高清完整版在线观看 | 欧美亚洲自拍偷拍| 久久米奇亚洲| 国产97在线|日韩| 欧美精品第一区| 18禁男女爽爽爽午夜网站免费| 99精品视频在线观看免费| 日本在线观看视频网站| 亚洲第一精品夜夜躁人人爽| 草美女在线观看| 国精产品一区二区| 国产一区导航| 中文字幕一区二区三区人妻| 色噜噜狠狠一区二区三区果冻| 狠狠v欧美ⅴ日韩v亚洲v大胸| 日本精品久久久久影院| 一本色道久久综合亚洲精品酒店| 日韩毛片在线免费看| 国产拍欧美日韩视频二区| 最近中文字幕av| 久久久精品免费视频| 精品一区二区三区在线观看视频| 日本一二三区视频在线| 国产成人h网站| 黄色片视频网站| 亚洲欧美制服第一页| 99热播精品免费| 日韩视频一二三| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 伊人成人222| 亚洲免费在线看| 天天操天天操天天操| 日本久久久久久久| 国产一区二区三区不卡视频网站| 波多结衣在线观看| 一区二区三区毛片| 全部免费毛片在线播放一个| 日本高清+成人网在线观看| 成人激情开心网| 精品人妻无码中文字幕18禁| 都市激情亚洲色图| 尤物网在线观看| 精品国产乱码久久久久久久软件 | 日韩欧美在线观看| gogogo高清在线观看免费完整版| 成人中文字幕+乱码+中文字幕| 一区久久精品| 日本美女bbw| 精品久久五月天| 日本精品不卡| 欧美大片免费播放| 久久久不卡影院| 99久久精品国产成人一区二区 | 久久综合九色综合97婷婷| 中国一级片黄色一级片黄| 欧美老妇交乱视频| 欧美精品久久久久久| 中文字幕制服丝袜| 欧美三区在线观看| 黄色软件视频在线观看| 夜夜爽www精品| 91在线视频在线| 精品人妻少妇嫩草av无码专区| 国产99久久精品一区二区|