精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT

原創 精選
人工智能
據卡神的在Github上的介紹,這套框架運行上,你只需要8個H100節點,關鍵在于,它的依懶性極低,安裝非常簡單。就連卡神自己都忍不住稱“這是我寫過的最瘋狂、最放飛自我的項目之一!”

編輯 | 云昭

復刻 ChatGPT 有多難?

商業層面看,很難。但對于眾多的開發者、甚至實驗室的研究生而言,從今天起,可能就要有標準答案了。

100美元,就能得到一個陪“幼兒園朋友”聊天,能寫詩、講故事,回答“天空為什么是藍的”簡單問題的模型。

300美元,就能讓你得到一個可以超過GPT-2的模型:翻譯、完形填空、閱讀理解都可以處理。

800美元,理解和推理能力就可以做到GPT-3 Small的水準;

1000美元左右,這個模型就已經可以解決簡單的數學和代碼問題以及多項選擇題了。(接近GPT4水平)

就在今天,知名大神Karpathy在X上宣布自己的新作:NanoChat!

圖片圖片

Karpathy:自己寫的最瘋狂項目之一

顧名思義,這個新項目炸裂之處,就在于他是一個類似 ChatGPT 的 LLM 的全棧實現。

圖像圖像

據卡神的在Github上的介紹,這套框架運行上,你只需要8個H100節點,關鍵在于,它的依懶性極低,安裝非常簡單。就連卡神自己都忍不住稱“這是我寫過的最瘋狂、最放飛自我的項目之一!”

與我之前類似的代碼庫 nanoGPT(僅涵蓋預訓練)不同,nanochat 是一個極簡的、從零開始的全棧訓練/推理流程,它基于一個單一且依賴性極低的代碼庫,是一個簡單的 ChatGPT 克隆版本。

你只需啟動一個云 GPU 設備,運行一個腳本,只需 4 小時,就可以在類似 ChatGPT 的 Web UI 中與你的 LLM 進行交流。

為什么說瘋狂呢?不僅僅是因為這個“100美元就可以買到一個最好的LLM模型”這個想法瘋狂,更關鍵的是,這個想法在實驗過程中得到了驗證。

訓練不到4個小時,8304行代碼,只有44個文件,卻擊敗了上億參數規模的GPT-2,甚至在部分評估集上以微弱優勢超過了GPT-4(預訓練分詞器的評估實驗)。

圖片圖片


比如,在訓練分詞器方面,卡神實現了約 4.8 的壓縮比(這意味著平均 4.8 個原文字符變成 1 個 token)。此外,還卡神將這個分詞器與 GPT-2 和 GPT-4 分詞器進行比較。與 GPT-2(擁有 50257 個 token)相比,NanoChat的分詞器在文本壓縮方面全面優于 GPT-2,而后者則在數學部分略勝一籌:

圖片圖片

與GPT-4的分詞器相比,NanoChat也有驚喜!

盡管我們在 fineweb 上的詞匯量較小,但我們實際上還是以一點點優勢擊敗了 GPT-4,因為那是我們實際訓練的數據集,所以我們的標記器非常匹配該文檔分布(例如,我們可能在壓縮英語方面具有優勢)。

圖片圖片

Github地址:https://github.com/karpathy/nanochat

討論地址:https://github.com/karpathy/nanochat/discussions/1

價值太高!連OpenAI背后訓練GPT的動作都曝出來了

大家之所以對于NanoChat項目呼聲如此之高。

除了上面提到的成本便宜,還有一點就是極大地降低了大家認知ChatGPT底層原理的門檻。

根據卡神在項目自述文件的描述,整個項目的訓練過程、使用到的技術都和OpenAI訓練ChatGPT的方法基本相同。

那么,這8304行代碼究竟是如何來復刻ChatGPT的?

  • 預訓練階段,使用全新的Rust實現訓練分詞器;
    卡神特別提到,在FineWeb上對TransformerLLM進行預訓練,評估多個指標下的CORE分數;
  • 中期訓練階段,卡神在來自SmolTalk的用戶-助手對話、多項選擇題、工具使用數據上進行中期訓練;
  • 接下來是SFT階段,在世界知識多項選擇題(ARC-E/C、MMLU)、數學(GSM8K)、代碼(HumanEval)上評估聊天模型
  • 然后是訓練的最后一個階段,使用「GRPO」在GSM8K上對模型進行強化學習微調(RL)
  • 推理方面,卡神選擇在帶有KV緩存的引擎中實現高效推理,只需要簡單的prefill/decode,tool-use(在輕量級沙箱中的Python解釋器),通過CLI或類ChatGPT的網頁界面與其交互。
  • 撰寫一份單一的Markdown成績單,總結并將整個過程游戲化。

最后一個酷似ChatGPT的Mini高級應用就躍然眼前了!

圖片圖片

為什么可以訓練如此之快?AI老鳥總結卡神的Trick

當然,成本能夠如此之低,自然還是卡神的智慧。在上面各個環節都設計得非常巧妙。

比如你去從文件結構去看,會發現比較有意思的是:有 data loader、data set engine,還有個叫 GPT pi 的東西,看起來挺有趣。還有 muon optimizer,這里還有 distributed muon,細心地網友稱:這估計是給 H100 GPU 用的。

另外,參數部分也挺吸引人。序列長度是 24,層數 12,768 維度,看起來是個中小型模型。因為我自己也在搭模型,所以看到這些配置挺有參考價值。

網友注意到一個trick的細節。他爆料到,一般來說,Karpathy 總喜歡讓數字“好看”——比如用 2 的平方倍數。

但其實這次,上面這些參數都不是嚴格的 2 的平方,但可能能被分解成一些平方的倍數。比如上面的這三個參數:24、12、768,都不是。所以他猜測卡神肯定是發現最后這幾個數字更合適。

“我本來預期 hidden size 會是 148,不知道他為什么選了 768。”

還有,正則方面,卡神沒有采用 Pytorch自帶的 RoPE(旋轉位置編碼),而是采用了自己寫的版本。

實現特別簡潔,簡直是我見過最優雅的代碼。他的思路是把向量一分為二,然后用旋轉矩陣分別處理,再拼接回來。雖然我還沒完全吃透旋轉矩陣的部分,但能看出這是個非常輕量、教學導向的實現。

這還沒完,在 自回歸注意力(causal self-attention) 模塊里,卡神把 query、key、value 的線性層分開實現。其實也可以優化成一次線性變換,然后再分割結果張量,這樣可以減少內存讀寫。

激活函數方面,他使用了一個叫 ReLU2(ReLUSquared) 的激活函數,據說在一些實驗中收斂更快。

卡神還提到了預計算 旋轉嵌入(rotary embeddings) 的技巧:提前把 cos 和 sin 值算好放在 GPU 內存里,因為它們不依賴訓練參數。

在優化器部分,他把參數拆成兩組:embedding 和 LM head 用 AdamW,矩陣參數用 Muon Optimizer。這個優化器是最近新出的,據說在特征學習(feature learning)上表現不錯。

當然,也有一些業界所公認的Trick,比如大框架還是經典的 Transformer 結構:自注意力 + MLP + 殘差。

再比如采用 KV cache,來加速推理。代碼里根據 cache 是否存在分支執行不同邏輯,這點和大多數 LLM 實現類似。

還有,MLP 部分,卡神沒用 Mixture of Experts,理由很合理:MoE 更適合推理階段,而不是研究階段。MLP 更易于理解和調試。

下一步:發展成一個研究工具或基準

卡神在X上表示,項目還沒完工,自己的目標是將完整的“強基線”堆棧整合到一個內聚、精簡、可讀、可修改且最大程度可分叉的倉庫中。

而NanoChat 將成為 LLM101n(仍在開發中)的頂點項目。

我認為它也有潛力發展成為一個研究工具或基準,類似于之前的 nanoGPT。它遠未完成、調整或優化(實際上我認為可能還有不少唾手可得的成果),但我認為它的整體框架已經足夠完善,可以上傳到 GitHub 上,以便所有部分都能得到改進。

寫在最后

當然,這套復刻框架,肯定不能真正意義上直接幫各位得到一個ChatGPT 1:1的復刻版。

因為局限就擺在那里。性能上,如果想要運行流暢度,就可能需要自己上手微調。那這就需要用戶得有點技術背景才能玩轉它。

比如,如果你的 顯存(VRAM) 比較小,就得調整超參數。這對新手來說可能是個門檻。

但小編看來,更多的意義,還是在于,讓“高在天上”的 LLM產品,變得更加評價、可及。

也就是說,卡神的這個項目繼續讓 AI 開發更大眾化了,讓更多人,尤其是算力不夠的學校、學生們能參與、實驗動手了起來。

而這則會進一步帶動AI應用的繁榮。

想一想,如果連大學學生、業余開發者都能低成本訓練模型,也許能催生很多有創意的應用。

因為這個項目是開源的,所有人按照自己需求進行調整、修改,得到自己想要的結果。

使用 nanochat,你幾乎可以調任何東西。無論是換 tokenizer、改訓練數據、調整超參數,還是優化算法,都可以自由嘗試——有很多潛在思路可以探索。

如果你希望訓練更大的模型,也很容易做到。

代碼庫的設計是完全可擴展的:你只需要通過參數 --depth 來改變模型層數,其他相關參數都會自動按比例調整。

這意味著它的“復雜度”只靠這一個滑桿就能控制。

正如一位網友所說,看起來,NanoChat雖然只是小步前進,但它可能引發大波浪。

項目提供了詳細的指導文檔,它還支持把文件打包成可查詢的數據塊,很友好。這一點我挺欣賞——能看出作者是站在用戶角度思考的。沒錯。

現在,大家都能理解Karpathy為什么會被稱之為“卡神”了吧!太牛了!

圖片圖片

寫完這篇稿子一看,哇塞,這個項目已經狂飆到了8.2K星!

參考鏈接:

https://www.youtube.com/watch?v=EFpDHdsITrg&t=419s

https://x.com/karpathy/status/1977755427569111362

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-05-09 08:18:51

2024-02-04 13:33:23

模型訓練

2025-11-10 09:09:00

2025-10-17 01:22:00

KarpathyChatGPTAI

2025-01-10 12:56:50

2023-04-15 20:29:19

ChatGPT人工智能

2013-04-11 09:43:15

Android創建項目Android開發

2024-02-19 08:56:00

AI模型

2025-03-24 12:42:52

2025-10-21 12:35:18

2022-12-12 13:10:25

2019-11-27 19:29:17

QQ微信移動應用

2024-02-22 11:56:36

ChatGPT調試OpenAI

2025-11-06 08:59:00

2016-11-10 10:07:28

新項目前端流程

2024-02-22 09:51:56

代碼AI

2024-02-22 07:29:31

OpenAIKarpathy分詞器

2025-04-02 03:55:00

MCPAI智能體

2024-08-27 00:00:03

2025-05-13 12:47:16

點贊
收藏

51CTO技術棧公眾號

av免费观看久久| 日韩小视频网址| www.av中文字幕| 日韩一二三四| 精品一区二区三区免费视频| 欧美美女操人视频| 性久久久久久久久久| 欧洲成人一区| 亚洲一区二区影院| 污视频在线免费观看一区二区三区| 中文字幕免费观看视频| 亚洲国产影院| 中文字幕日韩视频| 亚洲av成人精品一区二区三区 | 成人18精品视频| 青草青草久热精品视频在线网站| 国产传媒免费在线观看| 日韩一级电影| 欧美岛国在线观看| 日韩av片网站| 亚洲人体影院| 亚洲一区欧美一区| 在线观看国产一区| 免费一级在线观看播放网址| 国产成a人亚洲| 国产热re99久久6国产精品| 国产真人真事毛片| 91一区在线| 国产一区二区黄| 北京富婆泄欲对白| 精品中文字幕一区二区三区| 色欧美乱欧美15图片| www.成年人视频| 成人看av片| 国产精品麻豆网站| 欧美二区在线看| 天天综合天天色| 国产成人8x视频一区二区| 国产综合福利在线| 亚洲成人av网址| 香蕉亚洲视频| 2025国产精品视频| 欧美一级高潮片| 亚洲综合婷婷| 最好看的2019年中文视频| 中文幕无线码中文字蜜桃| 六月丁香久久丫| 精品蜜桃在线看| wwwxxxx在线观看| 精品国产亚洲一区二区三区大结局| 色999日韩国产欧美一区二区| 亚洲精品无码国产| 国产探花视频在线观看| 一区二区三区欧美日| 最近中文字幕免费mv| 免费av网站在线观看| 中文字幕在线观看不卡| 在线综合视频网站| 很黄的网站在线观看| 国产精品久久久久久久第一福利 | 亚洲综合色视频| 美女在线免费视频| av片在线观看| 亚洲在线视频一区| 免费看欧美一级片| aa国产成人| 狠狠躁18三区二区一区| 97在线免费公开视频| 日韩大尺度黄色| 在线观看视频一区二区欧美日韩| 别急慢慢来1978如如2| 日本黄色一区| 91精品黄色片免费大全| 日本中文字幕在线不卡| 国产精品sss在线观看av| 亚洲黄页网在线观看| 91精品人妻一区二区三区蜜桃欧美| 亚洲福利天堂| 中文字幕亚洲一区在线观看 | 欧美成人激情| 欧美精品一区三区| 国产精品999久久久| 性久久久久久| 成人两性免费视频| 成人午夜免费福利| 久久久天堂av| japanese在线视频| 国产精品一区二区日韩| 91久久奴性调教| 99九九精品视频| 乱亲女h秽乱长久久久| 国产亚洲福利一区| www.毛片com| 亚洲在线视频| 91视频国产精品| 亚洲aⅴ在线观看| 国产精品少妇自拍| 欧美日韩视频免费| 日本精品裸体写真集在线观看| 69p69国产精品| 男生裸体视频网站| 91综合在线| 38少妇精品导航| 97人妻精品一区二区三区视频| a美女胸又www黄视频久久| 亚洲精品在线免费| 麻豆免费在线| 91精品国产乱码久久蜜臀| 天堂久久久久久| 亚洲精品中文字幕乱码| 欧洲中文字幕国产精品| 国产99对白在线播放| 久久精品日产第一区二区三区高清版| 丰满女人性猛交| www成人在线视频| 亚洲激情视频在线| 欧美视频www| 男女男精品网站| 久久久精品动漫| 日韩欧美一起| 欧美日韩成人一区二区| 88久久精品无码一区二区毛片| 欧美96在线丨欧| 国产精品女人久久久久久| 天天干天天色天天| 一区二区三区在线免费视频| 欧美一级特黄a| 亚洲尤物av| 97精品视频在线观看| 精品国产无码一区二区| 亚洲国产精品精华液ab| 成年网站在线免费观看| 好吊妞国产欧美日韩免费观看网站| 日韩视频永久免费观看| 免费在线不卡av| 久久女同精品一区二区| 各处沟厕大尺度偷拍女厕嘘嘘| 亚洲精品国产九九九| 久久精品中文字幕电影| 亚洲熟妇无码久久精品| 国产精品情趣视频| mm1313亚洲国产精品无码试看| 欧美精品国产白浆久久久久| 午夜精品久久久久久久久久久久| 国产黄色片av| 亚洲黄色小视频| 麻豆传媒在线看| 女人天堂亚洲aⅴ在线观看| 成人黄色影片在线| 午夜视频在线看| 欧美亚洲图片小说| 综合 欧美 亚洲日本| 日本aⅴ精品一区二区三区 | 亚洲成人福利视频| 欧美在线观看天堂一区二区三区| 91久久精品美女| av在线看片| 欧美一级片在线观看| 懂色av懂色av粉嫩av| 国产精品自拍av| 91黄色在线看| 欧美成人专区| 日韩av男人的天堂| av在线播放av| 91麻豆精品91久久久久久清纯| 一区二区视频免费看| 成人免费毛片高清视频| 免费看又黄又无码的网站| 丝袜连裤袜欧美激情日韩| 日产日韩在线亚洲欧美| av在线第一页| 日韩一区二区三区在线视频| 久久久久久av无码免费网站| 99re66热这里只有精品3直播| 欧美色图另类小说| 91亚洲国产成人久久精品| 1卡2卡3卡精品视频| sm久久捆绑调教精品一区| 精品视频在线观看日韩| 中文在线最新版天堂| 亚洲摸摸操操av| av无码一区二区三区| 日日欢夜夜爽一区| 裸体裸乳免费看| 国产精品99久久免费观看| 国产成人精品电影久久久| 欧美成人hd| 日韩视频一区二区三区 | 欧美视频一区二区三区在线观看 | 日韩aaaa| 成人av资源| 欧美日韩美女| 欧美成人手机在线| 秋霞av在线| 91精品国产综合久久久久久漫画| 豆国产97在线 | 亚洲| 国产日产精品1区| 成人三级做爰av| 日韩国产在线一| 奇米777四色影视在线看| 免费看av成人| av色综合网| 欧美日韩五区| 午夜精品在线视频| 色三级在线观看| 日韩成人中文字幕| 国产区精品在线| 色婷婷国产精品综合在线观看| 国产女片a归国片aa| 久久精品夜色噜噜亚洲a∨| 日韩精品在线播放视频| 久久精品30| 国产av国片精品| 91精品推荐| 亚洲精品无人区| 欧美一性一交| 99精彩视频在线观看免费| 成人免费毛片嘿嘿连载视频…| 69精品小视频| 伊人春色在线观看| 深夜福利91大全| 激情福利在线| 日韩精品在线免费观看| 亚洲精品一区二区口爆| 欧美一级午夜免费电影| 中文字幕二区三区| 在线视频国内自拍亚洲视频| 久久艹免费视频| 亚洲在线观看免费| 18岁成人毛片| 国产精品传媒入口麻豆| 欧美成人国产精品一区二区| 99国产欧美另类久久久精品| 少妇献身老头系列| 国产一区欧美二区| 国产乱码一区二区三区四区| 日韩电影在线一区二区三区| 四虎永久在线精品无码视频| 99亚洲伊人久久精品影院红桃| 欧美 日韩 国产精品| 一区二区电影| 超级碰在线观看| 亚洲色图88| 天天干天天色天天爽| 99久久99久久精品国产片桃花| 日本在线观看一区二区| 欧美极品在线观看| 日本日本精品二区免费| 国产99精品一区| 日本免费高清一区| 狠狠做深爱婷婷综合一区| 视频一区二区精品| 青青一区二区三区| 曰韩不卡视频| 综合天堂av久久久久久久| 四虎4hu永久免费入口| 欧美 日韩 国产 一区| 亚洲啊啊啊啊啊| 欧美区一区二| 奇米影视亚洲色图| 亚洲影视综合| 亚洲三级视频网站| 精品一区二区三区在线观看国产| 精品亚洲视频在线| 国产不卡视频在线播放| 插我舔内射18免费视频| 26uuu精品一区二区在线观看| 中文字幕免费高清| 国产精品麻豆欧美日韩ww| www深夜成人a√在线| 亚洲宅男天堂在线观看无病毒| 日韩激情在线播放| 91成人免费在线视频| 91亚洲欧美激情| 日韩欧美亚洲国产精品字幕久久久| 亚洲va欧美va| 国产视频综合在线| 在线观看h片| 欧美激情精品久久久久久黑人| 超碰在线公开| 国产精品久久久久久久一区探花| 91成人app| 国产一区免费视频| 欧美三级美国一级| 国产成人免费高清视频| 国产毛片一区| 亚洲18在线看污www麻豆| 成人av动漫在线| 粉嫩精品久久99综合一区| 有码一区二区三区| 亚洲第一网站在线观看| 91麻豆精品国产91久久久久久| 天天操天天插天天射| 日韩中文在线观看| а√天堂资源官网在线资源| 国产精品爽爽爽| 精品深夜福利视频| 一区二区在线观看网站| 国产精品久久久亚洲一区| 欧美日韩精品区别| 91视频com| 91porn在线视频| 欧美亚洲精品一区| 懂色av一区二区三区四区| 影音先锋日韩有码| 都市激情国产精品| 成人深夜直播免费观看| 伊人久久大香线蕉综合网站| 99热都是精品| 另类国产ts人妖高潮视频| 日韩精品在线播放视频| 亚洲国产精品成人久久综合一区| 日本熟妇乱子伦xxxx| 欧美一区永久视频免费观看| 每日更新在线观看av| 久久久久在线观看| 99久久伊人| 欧美日韩亚洲综合一区二区三区激情在线| 91精品精品| 一区二区三区入口| 久久久91精品国产一区二区精品| 精品无码av在线| 欧美一区二区三区电影| 日本在线免费看| 国产成人精品综合久久久| 久久久久观看| 国产毛片久久久久久国产毛片| 日本va欧美va欧美va精品| 国产呦小j女精品视频| 亚洲成人av一区二区三区| 精品久久久久成人码免费动漫| 中文字幕亚洲自拍| www.成人在线视频| 色综合久久88色综合天天提莫| 免费亚洲视频| www.久久av| 精品久久久久久久久中文字幕 | 无码人妻h动漫| 成人黄色网址在线观看| 久草视频在线免费看| 欧美一二三四在线| 99热国产在线中文| 18成人在线| 国产精品hd| 无码人妻久久一区二区三区蜜桃| 亚洲精品一二三四区| 国产精品爽爽久久久久久| 久久天天躁狠狠躁夜夜躁| 欧一区二区三区| 一本色道久久88亚洲精品综合| 国产福利精品导航| 久久成人国产精品入口| 精品久久久久久综合日本欧美| 国产精品一区hongkong| 国产在线观看一区| 免费一区视频| 蜜桃传媒一区二区亚洲| 欧美色男人天堂| 国产精品刘玥久久一区| 97se国产在线视频| 亚洲一级网站| 黄色工厂在线观看| 在线视频中文字幕一区二区| 97电影在线| 亚洲专区国产精品| 亚洲一级黄色| 欧美老熟妇乱大交xxxxx| 在线看不卡av| 蜜桃视频网站在线| 风间由美一区二区三区| 中文日韩欧美| 亚洲区一区二区三| 日韩欧美中文字幕制服| 乱馆动漫1~6集在线观看| 日韩视频精品| 国产精品影视在线观看| 国产区在线观看视频| 一个人看的www久久| 二区三区精品| 男人添女人下部高潮视频在观看 | 久久国产欧美精品| 日韩激情在线观看| av成人免费网站| 日韩成人中文电影| 外国成人毛片| 欧美亚洲国产成人| 日韩一区欧美小说| 亚洲色图欧美视频| 91精品久久久久久久久久 | 国产精品少妇自拍| 高h调教冰块play男男双性文| 日本久久久久久久久| 中文一区一区三区免费在线观看| 黄色国产在线观看| 欧美一级久久久久久久大片| 综合日韩av| 国产911在线观看| 国产调教视频一区| 超碰人人人人人人| 国产日韩中文字幕|