精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Karpathy離職OpenAI,首發2小時AI大課!從頭開始構建GPT分詞器

人工智能 新聞
果不其然,繼放出BPE的GitHub代碼后,Karpathy終于上線了「從頭構建GPT分詞器」的課程,引來大波網友關注。

離職OpenAI的技術大神karpathy,終于上線了2小時的AI大課。

——「讓我們構建GPT Tokenizer(分詞器)」。

圖片

其實,早在新課推出兩天前,karpathy在更新的GitHub項目中,就預告了這件事。

圖片

這個項目是minbpe——專為LLM分詞中常用的BPE(字節對編碼)算法創建最少、干凈以及教育性的代碼。

目前,GitHub已經狂攬6.1k星,442個fork。

圖片項目地址:https://github.com/karpathy/minbpe

網友:2小時課程含金量,相當于大學4年

不得不說,karpathy新課發布依然吸引了業內一大波學者的關注。

他總是可以把相當復雜的LLM概念,用非常好理解的方式講出來。

有網友直接取消了晚上的約會,去上課了。

圖片

與karpathy的約會之夜。

AI機器學習研究員Sebastian Raschka表示,「我喜歡從頭開始的實現,我真的很期待看到這個視頻」!

圖片

英偉達高級科學家Jim Fan表示,「Andrej的大腦是一個大模型,它能將復雜的事物標記化為簡單的token,讓我們小型思維語言模型可以理解。

圖片

還有UCSC的助理教授Xin Eric Wang表示,「就個人而言,我非常欣賞他多年前發表的關于RL的文章:http://karpathy.github.io/2016/05/31/rl/,這篇文章幫助我進入了RL領域」。

圖片

還有人直言這兩個小時課程的含金量,堪比4年制大學學位。

圖片

「Andrej是最好的AI老師」。

圖片

為什么是分詞器?

為什么要講分詞器?以及分詞器為什么這么重要?

正如karpathy所言,分詞器(Tokenizer)是大模型pipeline中一個完全獨立的階段。

它們有自己的訓練集、算法(字節對編碼BPE),并在訓練后實現兩個功能:從字符串編碼到token,以及從token解碼回字符串。

圖片

另外,大模型中許多怪異行為和問題,其實都可以追溯到分詞器。

就比如:

- 為什么LLM拼不出單詞?

- 為什么LLM無法完成超級簡單的字符串處理任務,比如反轉字符串?

- 為什么LLM不擅長非英語語言方面的任務?

- 為什么LLM不擅長簡單算術?

- 為什么GPT-2在用Python編碼時遇到了超出必要的麻煩?

- 為什么LLM在看到字符串<lendoftextl>時突然停止?

- 為什么大模型實際上并不是端到端的語言建模

......

圖片

視頻中,他將討論許多這樣的問題。討論為什么分詞器是錯誤的,以及為什么有人理想地找到一種方法來完全刪除這個階段。

兩小時大課走起

在本講座中,他將從頭開始構建OpenAI GPT系列中使用的Tokenizer。

根據YouTube課程章節介紹,一共有20多個part。

其中包括引言介紹、字節對編碼 (BPE) 算法演練、分詞器/LLM 圖:這是一個完全獨立的階段、minbpe練習時間!編寫自己的GPT-4分詞器等等。

從講解到習題演練貫穿了全部課程。

以下是從演講內容中總結的部分要點。

在視頻結尾,Karpathy重新回顧了LLM分詞器帶來的怪異問題。

首先,為什么LLM又時拼不正確詞,或者做不了其他與拼寫相關的任務?

從根本上說,這是因為我們看到這些字符被分割成了一個個token,其中有些token實際上相當長。

因此,我懷疑這個單個token中塞進了太多的字符,而且我懷疑該模型在與拼寫這個單個token相關的任務方面應該不是很擅長。

當然,我的提示是故意這樣做的,你可以看到默認風格將是一個單一的token,所以這就是模型所看到的。

事實上,分詞器不知道有多少個字母。

那么,為什么大模型在非英語任務中的表現更差?

這不僅是因為LLM在訓練模型參數時,看到的非英語數據較少,還因為分詞器沒有在非英語數據上得到充分的訓練。

就比如,這里「hello how are you」是5個token,而它的翻譯是15個token,相當與原始的3倍大。

「?????」在韓語中代表著「你好」,但最終只有3個token。

事實上,我對此感到有點驚訝,因為這是一個非常常見的短語,只是典型的問候語,如你好,最終是三個token。

而英語中的「你好」是一個單一的token。這是我認為LLM在非英語任務中表現差的原因之一便是分詞器。

另外,為什么LLM會在簡單的算術上栽跟頭,也是與數字的token有關。

比如一個類似于字符級別的算法來進行加法,我們先會把一加起來,然后把十加起來,再把百加起來。

你必須參考這些數字的特定部分,但這些數字的表示完全是任意的,主要是基于在分詞過程中發生的合并或不合并。

你可以看看,它是一個單一的token,還是2個token,即1-3、2-2、3-1的組合。

因此,所有不同的數字,都是不同的組合。

不幸的是,有時我們會看到所有四位數字的四個token,有時是三個,有時是兩個,有時是一個,而且是以任意的方式。

但這也并不理想。

所以這就是為什么我們會看到,比如說,當訓練Llama 2算法時,作者使用句子片段時,他們會確保把所有的數字都分割開來,作為Llama 2的一個例子,這部分是為了提高簡單算術的性能。

最后,為什么GPT-2在Python中的表現不佳,一部分是關于架構、數據集和模型強度方面的建模問題。

但也有部分原因是分詞器的問題,可以在Python的簡單示例中看到,分詞器處理空格的編碼效率非常糟糕。

每個空格都是一個單獨的token,這大大降低了模型可以處理交叉的上下文長度,所以這幾乎是GPT-2分詞的錯誤,后來在GPT-4中得到了修復。

圖片

課后習題

在課程下方,karpathy還給在線的網友們布置了課后習題。

快來打卡吧。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-02-26 00:40:00

AIGPT

2024-06-12 13:27:58

2024-02-22 07:29:31

OpenAIKarpathy分詞器

2024-03-01 13:49:00

數據訓練

2024-02-21 14:07:00

2013-01-08 11:02:26

IBMdW

2023-08-11 17:30:54

決策樹機器學習算法

2013-05-23 10:10:53

PHP5.5PHP編譯php

2022-11-14 10:49:33

Linux發行版

2024-09-26 16:51:23

2022-07-22 07:18:53

代碼DeepMind

2009-05-08 09:40:07

網易魔獸暴雪

2020-11-17 08:09:01

webpack配置項腳手架

2022-11-23 16:20:12

GPU編程流和事件開發

2021-06-04 22:43:32

Python本地搜索

2023-05-24 16:20:39

DevOpsCI/CD 管道軟件開發

2022-06-01 23:21:34

Python回歸樹數據

2025-01-13 08:00:00

2021-02-20 21:29:40

GitHub代碼開發者

2024-06-24 07:50:00

代碼機器學習
點贊
收藏

51CTO技術棧公眾號

久久天天狠狠| 欧美激情欧美激情在线五月| 亚欧无线一线二线三线区别| 亚洲欧美日韩动漫| 日韩电影一二三区| www.亚洲成人| www.四虎在线| www成人在线视频| 亚洲蜜臀av乱码久久精品蜜桃| 91九色国产在线| 黄色激情视频在线观看| 啄木系列成人av电影| 欧美性色欧美a在线播放| 佐佐木明希av| 国产高清视频在线观看| 国产精品亚洲视频| 欧亚精品中文字幕| 日韩精品123区| 97久久精品| 欧美日韩视频第一区| 欧美成人精品免费| 天天在线视频色| 91捆绑美女网站| 亚洲淫片在线视频| 欧美男人天堂网| 亚洲福利久久| 久久亚洲国产精品| 色综合99久久久无码国产精品| 无码国模国产在线观看| 欧美最猛性xxxxx直播| 国内少妇毛片视频| 精品国产99久久久久久| 久久久久久久久蜜桃| 成人午夜电影免费在线观看| 中文字幕在线观看1| 亚洲久久成人| 欧美激情18p| 日本午夜在线观看| 日韩在线黄色| 亚洲的天堂在线中文字幕| 做a视频在线观看| 日本在线中文字幕一区二区三区| 亚洲国产欧美在线| 欧美在线观看黄| 精品欧美色视频网站在线观看| 国产女人18水真多18精品一级做| 国产一区免费视频| 精品久久国产视频| 国内精品伊人久久久久影院对白| 国产精品18久久久久久麻辣| 国产真实夫妇交换视频| 欧美日韩爆操| 美女久久久久久久久久久| 最新日韩免费视频| 成人三级视频| 中文字幕视频一区二区在线有码 | 亚洲欧洲另类精品久久综合| 十八禁一区二区三区| 国产黄人亚洲片| 亚洲在线视频福利| 精品人妻一区二区三区三区四区 | 成年人黄视频在线观看| 国产精品国产自产拍高清av| 日本一区二区久久精品| 国产污视频在线| 国产无一区二区| 性高潮久久久久久久久| 中文字幕在线视频区| 国产婷婷色一区二区三区在线| 欧美精品一区二区三区在线四季| 男人的天堂在线免费视频| 久久伊99综合婷婷久久伊| 久久精品一二三区| 国产在线网站| 中文子幕无线码一区tr| 一区二区精品在线观看| 麻豆传媒在线完整视频| 亚洲在线视频一区| 全黄性性激高免费视频| 裤袜国产欧美精品一区| 色激情天天射综合网| 久久久精品麻豆| av在线精品| 精品国产欧美一区二区| aaaaa一级片| 日韩国产欧美| 欧美极品少妇xxxxⅹ裸体艺术 | 伊人久久亚洲美女图片| 777精品视频| 无码免费一区二区三区| 久久99九九99精品| 岛国视频一区免费观看| 四虎成人免费在线| 亚洲欧美综合网| 99国产揄拍国产精品| 成人亚洲一区| 久久亚洲成人精品| 久久精品一二区| 男女性色大片免费观看一区二区| 亚洲一区二区在线播放| 欧美一级在线免费观看| 久久精品人人爽人人爽| 精品一区二区成人免费视频| 麻豆蜜桃在线| 在线观看亚洲精品| 特级特黄刘亦菲aaa级| 久久99影视| 久久不射热爱视频精品| 国产一级精品视频| 狠狠色丁香婷婷综合| 精品国产一区二区三区久久久久久 | 中文字幕在线播放一区| 青青草91久久久久久久久| 欧美成人一区二区三区电影| 黄色av一级片| 国产99精品视频| 亚洲视频小说| 午夜欧美激情| 欧美成人video| 欧美另类69xxxx| 国产精品色网| av一区二区三区免费| av在线电影院| 一本大道综合伊人精品热热 | 美女久久久久久| 亚洲福利视频免费观看| 男人的午夜天堂| 日韩av一区二区在线影视| 国产精品一区二区三区在线观 | 日本福利一区| 久99久在线视频| 一级成人免费视频| 久久麻豆一区二区| 国产婷婷一区二区三区| 精品国产亚洲一区二区在线观看| 国产一区二区三区欧美| 国产成人精品一区二三区| 国产成人8x视频一区二区| 一区二区日本| 欧洲亚洲精品久久久久| 国产亚洲精品久久久久久牛牛| 久久夜色精品亚洲| 国产成a人无v码亚洲福利| 国产精品美女在线播放| 99久久久国产精品免费调教网站 | ts人妖另类在线| 精品国产99久久久久久| 欧美日韩国产123区| 少妇人妻好深好紧精品无码| 午夜在线a亚洲v天堂网2018| 精品无人区一区二区三区| jizz一区二区三区| 精品久久久久av影院| 青娱乐免费在线视频| 国产精品一区二区三区乱码| 综合视频免费看| 欧美亚洲二区| 久久中文字幕国产| 国产成人免费看一级大黄| 亚洲免费在线播放| 18深夜在线观看免费视频| 欧美日本中文| 国产免费一区| 一区一区三区| 在线观看日韩www视频免费| 精品国产www| 亚洲丝袜另类动漫二区| 成人欧美精品一区二区| 亚洲国产精品第一区二区三区| 国外成人在线视频网站| 小视频免费在线观看| 亚洲天堂av在线播放| 中文字幕在线观看你懂的| 国产精品久久久久久久久免费樱桃 | 亚洲情侣在线| 亚洲综合精品一区二区| 美足av综合网| 亚洲欧洲国产一区| 一级黄色片在线播放| 一区二区三区在线视频观看| 特级特黄刘亦菲aaa级| 国产精品入口66mio| 欧美一区免费视频| www.久久99| 久久久久久久91| 青青青免费视频在线2| 欧美性xxxxxxxx| 九九热只有精品| 99久久er热在这里只有精品15| 免费男同深夜夜行网站 | 91在线播放网址| 欧美激情国产精品日韩| 忘忧草精品久久久久久久高清| 91成人在线看| 欧美天堂视频| 欧美成人剧情片在线观看| 嫩草精品影院| 欧美mv日韩mv国产网站app| 无码人妻久久一区二区三区| 亚洲特级片在线| 欧美狂猛xxxxx乱大交3| 国产老肥熟一区二区三区| av免费播放网址| 最新精品国产| 深夜福利成人| 欧美jizz19性欧美| 成人黄色免费在线观看| 中文字幕在线看片| 欧美人与性动交a欧美精品| 你懂的视频在线免费| 日韩视频一区二区三区在线播放 | 日韩av官网| 国产亚洲欧美日韩美女| 欧洲av在线播放| 欧美人与z0zoxxxx视频| 国产在线观看黄色| 夜夜嗨av一区二区三区中文字幕| 夜夜春很很躁夜夜躁| av在线免费不卡| 性久久久久久久久久久久久久| 久久精品电影| a天堂资源在线观看| 日韩精品永久网址| 欧美吻胸吃奶大尺度电影| 免费网站在线观看视频| 久久91麻豆精品一区| 国产在线一区二区三区欧美| 99视频有精品高清视频| 国产精品欧美日韩| 欧美极度另类| 91大神福利视频在线| 免费不卡av| 久久99国产综合精品女同| 五月婷婷在线观看| 一区二区三欧美| 国产在线你懂得| 亚洲美女av电影| 日韩av免费观影| 亚洲国语精品自产拍在线观看| 亚洲第一免费视频| 日韩视频免费直播| 亚洲av无码乱码在线观看性色| 欧美另类videos死尸| 中文字幕日本人妻久久久免费| 日韩人在线观看| av毛片在线免费观看| 欧美日韩激情视频| 国产区一区二区三| 粉嫩av一区二区三区免费野| 成年人午夜视频| 天天综合日日夜夜精品| 精品无码人妻一区二区三区品 | av中文字幕亚洲| 漂亮人妻被黑人久久精品| 成人av电影在线观看| 国产成人精品综合久久久久99| 国产自产高清不卡| 一级片免费在线观看视频| 国产精品综合视频| av在线天堂网| 99re8在线精品视频免费播放| 一级欧美一级日韩片| 久久影院视频免费| 五月天精品在线| 中文字幕在线不卡| 久久久精品国产sm调教网站| 亚洲电影激情视频网站| 日韩欧美一级视频| 在线视频欧美精品| 97超碰资源站| 日韩精品中午字幕| 四虎精品在线| 日韩一级裸体免费视频| av网站网址在线观看| 高清亚洲成在人网站天堂| 理论片午夜视频在线观看| 日韩av色在线| а天堂中文最新一区二区三区| 成人av蜜桃| 天美av一区二区三区久久| 亚洲精品乱码久久久久久蜜桃91| 91视频综合| 欧美 日韩 亚洲 一区| 久久不射中文字幕| av噜噜在线观看| 91在线精品秘密一区二区| 青青草自拍偷拍| 亚洲最色的网站| 五月天中文字幕| 欧美成人免费网站| 国产在线一二| 久久久久久久香蕉网| 写真福利精品福利在线观看| 成人疯狂猛交xxx| 欧美色图婷婷| 男插女免费视频| 亚洲影视在线| 色哟哟免费视频| 久久久亚洲精品石原莉奈| 久久久久久久久久久久久女过产乱| 亚洲h精品动漫在线观看| 中文字幕第一页在线播放| 精品国产一区二区亚洲人成毛片| 九色视频网站在线观看| 欧美噜噜久久久xxx| 色综合天天色| 国产日韩二区| 婷婷伊人综合| 老司机午夜av| 99精品视频一区二区三区| 熟女av一区二区| 在线中文字幕一区| 欧美综合视频在线| 欧美老女人xx| 四虎国产精品成人免费影视| 免费观看成人高| 亚洲成人在线| 制服下的诱惑暮生| 自拍视频在线观看一区二区| 日韩综合在线观看| 亚洲第一网站免费视频| av免费网站在线| 国产伦精品免费视频| 欧美日韩播放| 777米奇影视第四色| 成人精品小蝌蚪| 黄色一级片中国| 欧美精品一二三| h视频在线观看免费| 日韩av电影国产| 啪啪国产精品| 被灌满精子的波多野结衣| 国产精品影音先锋| 在线观看亚洲网站| 欧美精品自拍偷拍| 91青青在线视频| 国产精品高清在线观看| 国产日韩视频在线| 不卡影院一区二区| 久久婷婷综合激情| 久久久久久少妇| 日韩av在线免费观看| 不卡视频观看| 国产一区二区视频在线免费观看| 亚洲精品1区| 国产黑丝在线观看| 无码av中文一区二区三区桃花岛| 丰满熟女一区二区三区| 欧美激情精品久久久久久免费印度 | 精品视频一区二区三区免费| 国产爆初菊在线观看免费视频网站| 欧美资源在线观看| 色综合中文网| 日本美女高潮视频| 国产精品剧情在线亚洲| 中文字幕精品一区二区精| 色偷偷偷亚洲综合网另类| 色噜噜成人av在线| 人人妻人人澡人人爽欧美一区| 国产成人aaa| 日韩三级免费看| 亚洲毛片在线看| 久久久久久久性潮| av影院在线播放| 99久久久久久99| 午夜精品久久久久久久蜜桃| 曰本色欧美视频在线| 日韩黄色在线| 99re6这里有精品热视频| a在线播放不卡| 国产成人a v| 久久久av亚洲男天堂| 成人在线tv视频| 日本三级免费观看| 国产精品黄色在线观看| 性欧美18一19性猛交| 欧美有码在线观看视频| 精品九九在线| 亚洲国产午夜精品| 精品成人在线视频| 午夜不卡视频| 国产伦精品一区二区三区| 美女国产一区| 国产传媒免费在线观看| 亚洲精品国产欧美| yiren22亚洲综合| 蜜臀精品一区二区| 国产区在线观看成人精品| 99久久精品无免国产免费| 91av在线看| 午夜免费一区| 成年人网站免费在线观看| 欧美日韩高清在线| 91福利在线免费| 一区二区在线观| 91一区一区三区| 99在线精品视频免费观看软件| 6080yy精品一区二区三区| 91综合在线| 免费在线观看你懂的|