精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT 原創

發布于 2025-10-15 07:00
瀏覽
0收藏

編輯 | 云昭

復刻 ChatGPT 有多難?

商業層面看,很難。但對于眾多的開發者、甚至實驗室的研究生而言,從今天起,可能就要有標準答案了。

100美元,就能得到一個陪“幼兒園朋友”聊天,能寫詩、講故事,回答“天空為什么是藍的”簡單問題的模型。

300美元,就能讓你得到一個可以超過GPT-2的模型:翻譯、完形填空、閱讀理解都可以處理。

800美元,理解和推理能力就可以做到GPT-3 Small的水準;

1000美元左右,這個模型就已經可以解決簡單的數學和代碼問題以及多項選擇題了。(接近GPT4水平)

就在今天,知名大神Karpathy在X上宣布自己的新作:NanoChat!

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

Karpathy:自己寫的最瘋狂項目之一

顧名思義,這個新項目炸裂之處,就在于他是一個類似 ChatGPT 的 LLM 的全棧實現。

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖像

據卡神的在Github上的介紹,這套框架運行上,你只需要8個H100節點,關鍵在于,它的依懶性極低,安裝非常簡單。就連卡神自己都忍不住稱“這是我寫過的最瘋狂、最放飛自我的項目之一!”

與我之前類似的代碼庫 nanoGPT(僅涵蓋預訓練)不同,nanochat 是一個極簡的、從零開始的全棧訓練/推理流程,它基于一個單一且依賴性極低的代碼庫,是一個簡單的 ChatGPT 克隆版本。

你只需啟動一個云 GPU 設備,運行一個腳本,只需 4 小時,就可以在類似 ChatGPT 的 Web UI 中與你的 LLM 進行交流。

為什么說瘋狂呢?不僅僅是因為這個“100美元就可以買到一個最好的LLM模型”這個想法瘋狂,更關鍵的是,這個想法在實驗過程中得到了驗證。

訓練不到4個小時,8304行代碼,只有44個文件,卻擊敗了上億參數規模的GPT-2,甚至在部分評估集上以微弱優勢超過了GPT-4(預訓練分詞器的評估實驗)。

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片


比如,在訓練分詞器方面,卡神實現了約 4.8 的壓縮比(這意味著平均 4.8 個原文字符變成 1 個 token)。此外,還卡神將這個分詞器與 GPT-2 和 GPT-4 分詞器進行比較。與 GPT-2(擁有 50257 個 token)相比,NanoChat的分詞器在文本壓縮方面全面優于 GPT-2,而后者則在數學部分略勝一籌:

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

與GPT-4的分詞器相比,NanoChat也有驚喜!

盡管我們在 fineweb 上的詞匯量較小,但我們實際上還是以一點點優勢擊敗了 GPT-4,因為那是我們實際訓練的數據集,所以我們的標記器非常匹配該文檔分布(例如,我們可能在壓縮英語方面具有優勢)。

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

Github地址:??https://github.com/karpathy/nanochat??

討論地址:??https://github.com/karpathy/nanochat/discussions/1??

價值太高!連OpenAI背后訓練GPT的動作的曝出來了

大家之所以對于NanoChat項目呼聲如此之高。

除了上面提到的成本便宜,還有一點就是極大地降低了大家認知ChatGPT底層原理的門檻。

根據卡神在項目自述文件的描述,整個項目的訓練過程、使用到的技術都和OpenAI訓練ChatGPT的方法基本相同。

那么,這8304行代碼究竟是如何來復刻ChatGPT的?

  • 預訓練階段,使用全新的Rust實現訓練分詞器;
    卡神特別提到,在FineWeb上對TransformerLLM進行預訓練,評估多個指標下的CORE分數;
  • 中期訓練階段,卡神在來自SmolTalk的用戶-助手對話、多項選擇題、工具使用數據上進行中期訓練;
  • 接下來是SFT階段,在世界知識多項選擇題(ARC-E/C、MMLU)、數學(GSM8K)、代碼(HumanEval)上評估聊天模型
  • 然后是訓練的最后一個階段,使用「GRPO」在GSM8K上對模型進行強化學習微調(RL)
  • 推理方面,卡神選擇在帶有KV緩存的引擎中實現高效推理,只需要簡單的prefill/decode,tool-use(在輕量級沙箱中的Python解釋器),通過CLI或類ChatGPT的網頁界面與其交互。
  • 撰寫一份單一的Markdown成績單,總結并將整個過程游戲化。

最后一個酷似ChatGPT的Mini高級應用就躍然眼前了!

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片


為什么可以訓練如此之快?AI老鳥總結卡神的Trick

當然,成本能夠如此之低,自然還是卡神的智慧。在上面各個環節都設計得非常巧妙。

比如你去從文件結構去看,會發現比較有意思的是:有 data loader、data set engine,還有個叫 GPT pi 的東西,看起來挺有趣。還有 muon optimizer,這里還有 distributed muon,細心地網友稱:這估計是給 H100 GPU 用的。

另外,參數部分也挺吸引人。序列長度是 24,層數 12,768 維度,看起來是個中小型模型。因為我自己也在搭模型,所以看到這些配置挺有參考價值。

網友注意到一個trick的細節。他爆料到,一般來說,Karpathy 總喜歡讓數字“好看”——比如用 2 的平方倍數。

但其實這次,上面這些參數都不是嚴格的 2 的平方,但可能能被分解成一些平方的倍數。比如上面的這三個參數:24、12、768,都不是。所以他猜測卡神肯定是發現最后這幾個數字更合適。

“我本來預期 hidden size 會是 148,不知道他為什么選了 768。”

還有,正則方面,卡神沒有采用 Pytorch自帶的 RoPE(旋轉位置編碼),而是采用了自己寫的版本。

實現特別簡潔,簡直是我見過最優雅的代碼。他的思路是把向量一分為二,然后用旋轉矩陣分別處理,再拼接回來。雖然我還沒完全吃透旋轉矩陣的部分,但能看出這是個非常輕量、教學導向的實現。

這還沒完,在 自回歸注意力(causal self-attention) 模塊里,卡神把 query、key、value 的線性層分開實現。其實也可以優化成一次線性變換,然后再分割結果張量,這樣可以減少內存讀寫。

激活函數方面,他使用了一個叫 ReLU2(ReLUSquared) 的激活函數,據說在一些實驗中收斂更快。

卡神還提到了預計算 旋轉嵌入(rotary embeddings) 的技巧:提前把 cos 和 sin 值算好放在 GPU 內存里,因為它們不依賴訓練參數。

在優化器部分,他把參數拆成兩組:embedding 和 LM head 用 AdamW,矩陣參數用 Muon Optimizer。這個優化器是最近新出的,據說在特征學習(feature learning)上表現不錯。

當然,也有一些業界所公認的Trick,比如大框架還是經典的 Transformer 結構:自注意力 + MLP + 殘差。

再比如采用 KV cache,來加速推理。代碼里根據 cache 是否存在分支執行不同邏輯,這點和大多數 LLM 實現類似。

還有,MLP 部分,卡神沒用 Mixture of Experts,理由很合理:MoE 更適合推理階段,而不是研究階段。MLP 更易于理解和調試。

下一步:發展成一個研究工具或基準

卡神在X上表示,項目還沒完工,自己的目標是將完整的“強基線”堆棧整合到一個內聚、精簡、可讀、可修改且最大程度可分叉的倉庫中。

而NanoChat 將成為 LLM101n(仍在開發中)的頂點項目。

我認為它也有潛力發展成為一個研究工具或基準,類似于之前的 nanoGPT。它遠未完成、調整或優化(實際上我認為可能還有不少唾手可得的成果),但我認為它的整體框架已經足夠完善,可以上傳到 GitHub 上,以便所有部分都能得到改進。

寫在最后

當然,這套復刻框架,肯定不能真正意義上直接幫各位得到一個ChatGPT 1:1的復刻版。

因為局限就擺在那里。性能上,如果想要運行流暢度,就可能需要自己上手微調。那這就需要用戶得有點技術背景才能玩轉它。

比如,如果你的 顯存(VRAM) 比較小,就得調整超參數。這對新手來說可能是個門檻。

但小編看來,更多的意義,還是在于,讓“高在天上”的 LLM產品,變得更加評價、可及。

也就是說,卡神的這個項目繼續讓 AI 開發更大眾化了,讓更多人,尤其是算力不夠的學校、學生們能參與、實驗動手了起來。

而這則會進一步帶動AI應用的繁榮。

想一想,如果連大學學生、業余開發者都能低成本訓練模型,也許能催生很多有創意的應用。

因為這個項目是開源的,所有人按照自己需求進行調整、修改,得到自己想要的結果。

使用 nanochat,你幾乎可以調任何東西。無論是換 tokenizer、改訓練數據、調整超參數,還是優化算法,都可以自由嘗試——有很多潛在思路可以探索。

如果你希望訓練更大的模型,也很容易做到。

代碼庫的設計是完全可擴展的:你只需要通過參數 --depth 來改變模型層數,其他相關參數都會自動按比例調整。

這意味著它的“復雜度”只靠這一個滑桿就能控制。

正如一位網友所說,看起來,NanoChat雖然只是小步前進,但它可能引發大波浪。

項目提供了詳細的指導文檔,它還支持把文件打包成可查詢的數據塊,很友好。這一點我挺欣賞——能看出作者是站在用戶角度思考的。沒錯。

現在,大家都能理解Karpathy為什么會被稱之為“卡神”了吧!太牛了!

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

寫完這篇稿子一看,哇塞,這個項目已經狂飆到了8.2K星!

參考鏈接:

??https://www.youtube.com/watch?v=EFpDHdsITrg&t=419s??

??https://x.com/karpathy/status/1977755427569111362??

本文轉載自??51CTO技術棧??,作者:云昭

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
五月婷中文字幕| 黄色录像免费观看| 欧美成人黄色| 国产精品国产三级国产aⅴ入口| 91精品久久久久久久久| 国产真实乱在线更新| 国内露脸中年夫妇交换精品| 日韩欧美在线一区| 99精品视频网站| 亚洲美女综合网| 97人人在线视频| 外国精品视频在线观看| 免费在线观看成年人视频| 欧美日韩国产网站| 伊人夜夜躁av伊人久久| 日韩av影视| √天堂中文官网8在线| 毛片无码国产| 伊人夜夜躁av伊人久久| 日韩偷拍一区二区| 色屁屁草草影院ccyycom| 美腿丝袜一区二区三区| 97香蕉超级碰碰久久免费软件| 女人裸体性做爰全过| 999久久久久久久久6666| 欧美性20hd另类| 91免费国产网站| 色91精品久久久久久久久| 精品自拍一区| 欧美国产日韩一二三区| 精品中文字幕一区| 永久免费在线看片视频| 久久99精品波多结衣一区| 农村少妇一区二区三区四区五区| 欧美久久久久免费| 无码人妻丰满熟妇区五十路百度| 国产区在线观看| 国产精品日日摸夜夜摸av| 久久久久网址| 亚洲欧美高清视频| 国产成人午夜电影网| 成人福利视频网| 精品国产www| 一区二区三区四区电影| 日韩av在线免费播放| 国产男女无遮挡猛进猛出| 中文成人在线| 欧美午夜片在线看| 青青在线免费观看视频| 无码人妻精品一区二区三区在线| 狠狠人妻久久久久久| 亚洲小说区图片区| 色中色综合影院手机版在线观看| 美国美女黄色片| 激情综合网站| 国产精品久久久久久久裸模| 精品一卡二卡三卡四卡日本乱码| 免费观看国产视频| 成人18精品视频| 国产一区二区三区高清视频| www.精品视频| thepron国产精品| 久久riav| 婷婷久久综合网| 欧美猛男男男激情videos| 亚洲精品理论电影| 美国黄色a级片| 国产一区二区三区站长工具| 亚洲色图15p| 一卡二卡三卡四卡| 麻豆国产欧美一区二区三区r| 亚洲第一区在线| 国产精品1000部啪视频| 久久99国内| 亚洲福利一二三区| 欧美一级精品大片| 少妇免费毛片久久久久久久久| 免费看av毛片| 91在线视频在线| 亚洲淫片在线视频| 视频一区二区免费| 免费日本视频一区| 成人黄色网免费| av手机免费看| 久久99国产精品久久| 国产91露脸中文字幕在线| 糖心vlog精品一区二区| 久久精品国产精品亚洲精品 | 午夜视频成人| 一区二区三区在线影院| 天堂…中文在线最新版在线| 日韩成人伦理| 欧美日韩亚洲天堂| 天天影视色综合| 黄色片一级视频| www在线播放| 欧美国产激情二区三区| 中国人体摄影一区二区三区| 成年视频在线观看| 狠狠久久五月精品中文字幕| 日韩欧美电影一区二区| 特级毛片在线| 欧美在线999| 无码国产精品一区二区免费式直播| 免费电影一区二区三区| 亚洲伦理中文字幕| 久久久精品国产sm调教网站| 亚洲乱亚洲高清| 68精品国产免费久久久久久婷婷| 97caocao| 国产亚洲综合在线| 亚洲人成人77777线观看| 国产后进白嫩翘臀在线观看视频 | 欧美久久精品一级黑人c片| 国产精品免费av一区二区| 国产精品美女久久久| 国产69精品久久久| 国产一区二区在线视频观看| 91视频国产资源| 欧美日韩福利视频| 不卡的在线视频| 免费看久久久| 久久影视免费观看| www激情五月| 精品国产一级毛片| 日韩欧美国产三级| 中文字幕网站在线观看| 激情综合久久| 亚洲综合在线播放| 久久黄色美女电影| 色婷婷精品大视频在线蜜桃视频| 涩涩日韩在线| 日韩av超清在线观看| 欧美一区二区三区免费在线看| 制服.丝袜.亚洲.中文.综合懂| 成人一区二区| 欧美日韩ab片| 亚洲第一天堂影院| 国产精品乱码一区二三区小蝌蚪| 国产中文字幕乱人伦在线观看| 巨大黑人极品videos精品| 偷偷要91色婷婷| 午夜视频在线观看国产| 激情丁香综合| 成人精品aaaa网站| 久久亚洲天堂| 在线播放国产精品二区一二区四区| 日韩黄色中文字幕| 日本不卡视频一二三区| 欧美日韩喷水| 日韩成人高清| 中文字幕日韩在线视频| 最新中文字幕第一页| 欧美激情一区三区| 在线观看高清免费视频| japanese国产精品| 国产精品网站视频| 好吊日视频在线观看| 日韩一区二区在线播放| 色欲人妻综合网| 国产电影精品久久禁18| www.在线观看av| 亚洲动漫在线观看| 国产成人综合精品| 午夜激情在线观看| 91精品国模一区二区三区| 久久视频一区二区三区| 国产在线精品视频| 成人av在线播放观看| 欧美一区二区三区红桃小说| 欧美专区国产专区| av影片在线看| 欧美一级国产精品| 国产成人在线播放视频| 久久久www成人免费毛片麻豆| 538在线视频观看| 久久精品免费一区二区三区| av日韩免费电影| 在线看片国产福利你懂的| 伊人久久久久久久久久| 91亚洲国产成人久久精品麻豆| 亚洲精品国产一区二区三区四区在线| 天堂va欧美va亚洲va老司机| aⅴ色国产欧美| 亚洲图片都市激情| 中文字幕日韩在线| 国产成人精品av| √天堂8在线网| 亚洲精品一区二三区不卡| 97国产精品久久久| 亚洲最新在线观看| 亚洲无人区码一码二码三码的含义| 卡一卡二国产精品| 国产91xxx| 91综合在线| 精品一卡二卡三卡四卡日本乱码| 婷婷激情成人| 欧美诱惑福利视频| 成人日日夜夜| 亚洲日韩中文字幕在线播放| 国产黄色av网站| 欧美无乱码久久久免费午夜一区| 欧美日韩人妻精品一区二区三区| 久久精品网站免费观看| 男人的天堂免费| 蜜乳av一区二区三区| 国产伦精品一区二区三区四区视频_| 成人av资源电影网站| 国产私拍一区| 另类视频一区二区三区| 国产成人午夜视频网址| av成人福利| 久久九九亚洲综合| 国产一二三在线观看| 精品日本一线二线三线不卡| 一本到在线视频| 色综合色综合色综合| 久久久无码一区二区三区| 中国av一区二区三区| 欧美极品jizzhd欧美仙踪林| 国产在线乱码一区二区三区| 五月婷婷之综合激情| 在线综合亚洲| 黄色激情在线视频| 欧美fxxxxxx另类| 一区二区三区四区| 成人精品天堂一区二区三区| 欧美激情国产日韩| 欧洲亚洲视频| 国产在线一区二区三区四区| 精品视频在线观看免费观看| 国产这里只有精品| 欧美爱爱视频| 国产精品欧美激情在线播放| 免费观看成人性生生活片| 91精品国产91久久久久久| 波多野结衣在线观看| 欧美大肥婆大肥bbbbb| 黄av在线播放| 欧美成人免费va影院高清| 日韩在线免费电影| 按摩亚洲人久久| 欧美日韩视频在线播放| 日韩亚洲第一页| 日韩成人影视| 久久色精品视频| 大地资源网3页在线观看| 久久亚洲精品视频| 91精品久久| 欧美高清视频一区二区| 国产在线拍揄自揄拍视频| 欧美激情亚洲综合一区| gogo高清在线播放免费| 97精品伊人久久久大香线蕉| www.综合| 国产97色在线|日韩| 黄色精品视频| 成人写真视频福利网| 美女精品久久| 国产精品日韩一区二区| 丝袜美腿综合| 丝袜美腿玉足3d专区一区| 欧美电影一区| 老司机激情视频| 亚洲经典三级| 在线视频日韩一区| 久久国产夜色精品鲁鲁99| 俄罗斯女人裸体性做爰| 99精品国产视频| 国产三级av在线播放| 中文字幕色av一区二区三区| 波多野结衣亚洲色图| 亚洲成av人影院在线观看网| 欧美a视频在线观看| 欧美日韩一区二区三区四区五区 | 日韩免费三级| 国产高清一区二区| 天堂8在线天堂资源bt| 亚洲伊人网站| 亚洲欧美日韩三级| 9人人澡人人爽人人精品| 日本一区二区视频在线播放| 亚洲少妇中出一区| 你懂的国产视频| 欧美色成人综合| 韩国av永久免费| 中日韩美女免费视频网站在线观看 | 成人性生交大片| 谁有免费的黄色网址| 亚洲精品美腿丝袜| 亚洲色成人www永久网站| 777午夜精品免费视频| 亚洲色图欧美视频| 日韩网站免费观看高清| 涩涩涩视频在线观看| 成人激情黄色网| 精品一区毛片| 女女百合国产免费网站| 日韩中文字幕亚洲一区二区va在线| 91网址在线观看精品| 久久久久久久久一| 久久久久久久久久久久久久久久久| 91极品美女在线| 理论片中文字幕| 久久韩国免费视频| 午夜欧美巨大性欧美巨大| 成人av片网址| 91精品国产麻豆国产在线观看| 久久国产亚洲精品无码| 国产乱色国产精品免费视频| 五月天综合视频| 欧美三级免费观看| 亚洲免费成人网| 另类图片亚洲另类| 成人看片毛片免费播放器| 久久国产精品久久| 国内精品久久久久久久影视蜜臀| 成人性生交免费看| 久久久久国产精品免费免费搜索| 国产一级性生活| 日韩无一区二区| 欧美尤物美女在线| 国产精品视频99| 欧美男同视频网| 欧美精品色婷婷五月综合| 成人丝袜高跟foot| 久草资源在线视频| 91精品国产欧美一区二区| 免费在线午夜视频| 国产精品视频999| 成人综合一区| 久久久精品三级| 久久尤物电影视频在线观看| 国产性猛交普通话对白| 日韩三级高清在线| 在线观看中文字幕的网站| 成人欧美一区二区三区黑人孕妇| 日韩精品一卡| 日本中文字幕精品—区二区| 国产无人区一区二区三区| 国产伦精品一区二区三区视频我| 精品视频www| 日韩影片中文字幕| 奇米影视首页 狠狠色丁香婷婷久久综合 | 国产精品久久久爽爽爽麻豆色哟哟| 成人免费一级片| 中文字幕精品久久| 青草综合视频| 糖心vlog在线免费观看| 国产激情一区二区三区桃花岛亚洲 | 在线看成人短视频| 久久综合久久色| 欧美国产综合色视频| 国产精品毛片一区二区在线看舒淇| 日韩中文有码在线视频| 成人日韩视频| 四虎4hu永久免费入口| 成人av在线看| 9i精品福利一区二区三区| 国产午夜精品一区二区三区| 国产成人久久精品麻豆二区| av动漫免费观看| 国产成人精品一区二区三区四区 | www免费在线观看| av一区二区三区在线观看| 最新日韩欧美| 亚洲av无码国产精品麻豆天美| 欧美日韩精品欧美日韩精品一| 看黄网站在线观看| 国产亚洲欧美一区二区三区| 久久久蜜桃一区二区人| 女教师淫辱の教室蜜臀av软件| 欧美一级日韩一级| 极品美鲍一区| 久久国产精品亚洲va麻豆| 日韩高清不卡在线| 日韩在线观看视频一区二区| 亚洲精品久久久久久下一站| 高清电影一区| 特级西西444| 久久新电视剧免费观看| 91久久精品无码一区二区| 韩剧1988在线观看免费完整版| 欧美三级午夜理伦三级在线观看 | 国产主播自拍av| 国产丝袜欧美中文另类| 国产ts变态重口人妖hd| 欧美最猛性xxxxx亚洲精品| 久久综合av| 中文字字幕码一二三区| 欧美日韩高清一区二区不卡| 91吃瓜在线观看| 在线国产精品网| 99re热视频这里只精品| 一级片aaaa| 日本久久亚洲电影| 国产精品videossex久久发布| 免费看黄色三级| 亚洲а∨天堂久久精品9966| 欧美三级电影网址|