精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福意外用AI生成超強CUDA內核,性能比人類專家優化得還要好!翻倍碾壓原生PyTorch,華人主創

人工智能 新聞
由AI優化的內核,在常見深度學習操作上,翻倍超越原生PyTorch,性能至多可以提升近400%。

好家伙,AI意外生成的內核(kernel),性能比人類專家專門優化過的還要好!

斯坦福最近披露了一組新發現,結果真的太亮眼了。

由AI優化的內核,在常見深度學習操作上,翻倍超越原生PyTorch,性能至多可以提升近400%——

  • 矩陣乘法(Matmul,FP32):性能達到PyTorch torch.matmul的101.3%。
  • 二維卷積(Conv2D):性能達到 torch.nn.Conv2D的179.9%。
  • Softmax:性能達到 torch.softmax的111.8%。
  • 層歸一化(LayerNorm):性能達到torch.nn.LayerNorm的484.4%。
  • Conv2D+ReLU+MaxPool組合操作:性能達到PyTorch參考實現的290.1%,以及torch.compile()參考實現的189.0%。

(在NVIDIA L40S GPU上進行基準測試,性能百分比定義為參考時間除以生成的kernel_size時間)

圖片

更驚人的是,這一切都是意外實現的。

研究團隊本來的目標是生成合成數據以訓練內核生成模型。

結果發現,僅在測試階段生成的合成數據本身,竟然可以生成性能非常優秀的內核。

圖片

圍觀網友:沒想到AI也要取代內核工程師了。

圖片

還有人發現,除了性能大幅提升外,研究團隊采用的方法也非常有趣:

他們沒有簡單的在操作上逐步優化(類似于爬坡算法),而是在每次迭代之間加入了一個語言推理的步驟,通過這種方式鼓勵搜索過程更加多樣化。

也就是說,他們是讓系統在每次改進時通過類似“思考”的方式產生更多想法,從而找到更好的解決方案。

圖片

具體如何實現,一起來看。

改代碼前先生成自然語言優化思想

按照斯坦福團隊博客的描述,這種內核生成的思路非常簡單——給定torch代碼,然后告訴都能寫編寫自定義內核來替換torch算子。

這些內核是用純CUDA-C編寫,無需使用CUTLASS和Triton等庫和DSL(Domain-Specific Language,領域專用語言)。

不同于傳統方法的是,模型并不是一上來就直接改代碼,而是先用自然語言生成優化思想,然后再將這些思想轉化為新的代碼變體。

團隊這樣做的理由是,“按順序修改”式的優化思路缺乏多樣性,導致陷入局部極小值,重復訪問同一類轉換或無休止地優化沒有前景的軌跡。

為了進一步增強思路多樣性,斯坦福團隊還使用了多分支的探索模式。

具體來說,他們的方法并非每一步都只優化一個候選方案,而是將每個想法分散開來,使其衍生出多個實現,并使用性能最高的內核作為下一輪的種子。

圖片

團隊使用OpenAI o3和Gemini 2.5 Pro挑戰KernelBench 1級中的10個問題,運行多輪后,最佳內核開始出現。

其中大多數最佳結果出現在后續輪次(總共5輪),并且主要是第4輪或第5輪。

KernelBench是斯坦福團隊自己提出的一套AI生成內核測試基準,基準中的任務分為3個級別,其中1級是指單一原始操作(Single primitive operation),包括AI的基礎構建塊(例如卷積、矩陣-向量與矩陣-矩陣乘法、損失函數、激活函數以及層歸一化)。

圖片

這一發現再加上之前DeepMind的AplhaEvolve,以及o3發現Linux的0day漏洞等一系列事件,讓網友們認為Gemini 2.5Pro和o3的能力水平已經達到了新的層級。

圖片

回到斯坦福的項目,在生成過程當中,可以看到模型的生成思路開始顯現出與人類的經驗相似之處——

  • 內存訪問優化: 提高不同內存層次結構(全局內存、共享內存、寄存器)之間數據移動的效率,并確保以最大化帶寬和最小化沖突的方式訪問數據;
  • 異步操作和延遲隱藏: 通過將慢速操作(如全局內存訪問)與計算或其他內存傳輸重疊,“隱藏”慢速操作的延遲;
  • 數據類型和精度優化: 盡可能使用低精度數據類型(如 FP16 或 BF16)以減少內存帶寬要求、提高緩存效率;
  • 計算和指令優化:提高算術計算本身的效率,減少指令數量,或利用專門的硬件指令;
  • 并行性和占用率增強:最大化流多處理器(SM)上的活動線程數量,以更好地隱藏延遲并提高整體吞吐量;
  • 控制流和循環優化:減少與循環、分支和索引計算相關的開銷。

并且斯坦福團隊還展示了一組具體的優化軌跡,從中可以看出,并不是每一步優化都一定能讓速度更快,但經過多個步驟的組合,內核的速度能夠得到大幅提升,并最終超越PyTorch。

圖片

在具體實現上,有人詢問AI生成CUDA內核時的優化建議,是否可以被轉化為對應代碼實現、還是說只是觸發了隨機探索?

作者回應說,盡管還沒有進行更嚴謹的系統驗證,但是手動檢查的案例中,生成的CUDA視線與提出的優化建議是大致匹配的。

即AI并不是在完全隨機做優化,而是確實在嘗試實現它自己提出的策略。

圖片

華人主創團隊意外發現

這項研究共有三位作者:Anne Ouyang、Azalia Mirhoseini和Percy Liang。

Ouyang目前是斯坦福大學擴展智能實驗室的博士生,她本碩畢業于麻省理工,曾在英偉達cuDNN團隊工作。

圖片

Percy Liang是斯坦福大學計算機科學副教授兼統計學助理教授,目前擔任斯坦福基礎模型研究中心主任。

曾和李飛飛一起發布、推進了多項研究工作。

圖片

Azalia Mirhoseini是斯坦福大學計算機科學助理教授、斯坦福擴展實驗室創始人。她曾在DeepMind、Google Brain以及Anthropic工作過。

她此前參與的研究包括MoE、芯片設計算法AlphaChip等。

圖片

本次研究,本來是希望生成數據來訓練內核生成模型。

但是在過程中卻出現了意想不到的結果,僅在測試階段生成的合成數據本身,竟然可以生成性能非常優秀的內核。

因為這些內核利用了此前被認為很難實現的高級優化和硬件特性,所以團隊決定以博客形式分享此次成果。

不過具體是如何生成數據的,研究團隊暫時不對外發布,只是提到了這種設計理念也很簡單

最關鍵的還是,它已經展示出了巨大潛力。

此外,研究團隊也認為此次發現也與最近的一些趨勢相呼應——大規模再訓練已不是必需。

有時,聰明的搜索和分支策略,可以解鎖科學創新并解決復雜問題,通過verifier進行廣泛搜索還能有更多收獲。

將強大推理能力與同時探索多個假設結合起來,能帶來更好結果。就像AlphaEvolve、AlphaEvolution、 Gemini 2.5 Pro深度思考一樣。

最后,團隊表示這項研究還有很多可優化的空間。比如他們手頭上就還在優化兩個維度:

  • FP16 Matmul:52% performance of torch.matmul
  • FP16 Flash Attention::9% performance of torch.nn.functional.scaled_dot_product_attention

與FP16或BF16相比,FP32在新推出硬件上的優化程度通常比較低,這也是為何使用FP32內核比PyTorch更容易實現性能提升。

他們表示,雖然現在還有不少限制,但是對于未來前景還是很樂觀的。

畢竟最開始,他們連能正常運行的內核都生成不了,但是通過不斷優化搜索方法,已經能讓flash attention的性能提升到了一個不錯的水平。

值得一提的是,搜索使用的資源也很少,大概只用了300萬token輸入和400萬token輸出。

One More Thing

實際上,不只是一個團隊在嘗試開發內核大模型。

就在5月,開發了Devin的Cognition開源了首個通過強化學習即可編寫CUDA內核的大模型Kevin-32B。

它基于QwQ-32B在KernelBench數據集上使用GRPO,實現了多輪強化學習,性能優于o3、o4-mini。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-12-16 14:33:01

AI人工智能斯坦福

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2025-09-01 02:00:00

AI署名論文推理

2022-07-20 16:39:37

AI數據

2025-09-08 09:10:00

2025-07-14 02:15:00

2025-01-17 10:26:19

模型開發ChatGPT

2025-03-12 10:38:05

2025-02-28 09:22:00

2017-11-28 14:18:29

2023-02-14 09:45:11

模型測試

2023-12-26 14:56:59

模型訓練

2023-02-12 14:00:52

ChatGPTAI人類

2023-03-06 10:26:37

AI研究

2022-02-18 09:53:17

AI芯片設計

2019-03-24 12:11:47

AI 數據人工智能

2018-01-23 16:48:47

AI

2025-08-27 09:06:00

AI工具通訊

2024-01-02 14:07:00

2025-07-14 08:57:00

點贊
收藏

51CTO技術棧公眾號

久久久久久久国产| 666欧美在线视频| 视频一区国产精品| 国产精品久久久久久无人区| 久久久9色精品国产一区二区三区| 欧美高清www午色夜在线视频| 免费人成在线观看视频播放| 国产三级在线免费| 日本午夜精品一区二区三区| 成人淫片在线看| 亚洲国产美女视频| 美女呻吟一区| 欧美日韩一区二区三区在线看 | 欧美少妇性生活视频| 8888四色奇米在线观看| 成人性视频网站| 国产精品欧美一区二区三区奶水| 欧美卡一卡二卡三| 国产va免费精品观看精品视频| 7777精品伊人久久久大香线蕉完整版| 日日碰狠狠添天天爽超碰97| 免费a级人成a大片在线观看| 2023国产精品自拍| 99久久无色码| 91tv国产成人福利| 国产精品久久久久9999高清| 大胆人体色综合| 国产精成人品免费观看| 亚洲一区二区三区中文字幕在线观看 | 成人福利av| 亚洲一区二区在线观看视频| 亚洲成人精品电影在线观看| 香蕉视频网站在线| 国产99久久久国产精品潘金 | 欧美激情一区在线观看| 国产伦精品一区二区三区视频免费| 中国一区二区视频| 久久av最新网址| 国模私拍视频一区| 久久久久久久久久99| 久久五月天小说| 亚洲天堂av综合网| 37p粉嫩大胆色噜噜噜| 国产福利拍拍拍| 99热这里只有精品在线观看| 国产偷自视频区视频一区二区| 欧美裸身视频免费观看| 欧美爱爱免费视频| 国产精品久久久久久麻豆一区软件| 亚洲视频在线免费观看| 精品人妻无码一区二区三区| 任你躁在线精品免费| 亚洲第一页中文字幕| 中文字幕精品视频在线| 丁香婷婷成人| 亚洲第一网中文字幕| 人妖粗暴刺激videos呻吟| 久久久久观看| 日韩精品极品视频| 久久久久国产精品区片区无码| 国产欧美一区二区三区米奇| 亚洲国产精品电影在线观看| 欧美国产日韩一区二区在线观看 | 成人久久网站| 日本道精品一区二区三区 | 久久电影网电视剧免费观看| 国产精品久久久久久久久久东京 | 欧美一区二区在线不卡| 樱花草www在线| 日韩高清二区| 亚洲国产精彩中文乱码av| 加勒比精品视频| 国产精品一区二区av交换| 一本色道久久综合狠狠躁篇的优点 | 视频二区欧美| 亚洲激情视频网站| 久久久久久亚洲中文字幕无码| 欧美日韩色图| yw.139尤物在线精品视频| 可以直接看的黄色网址| 在线播放亚洲| 国产精品老女人视频| 国产女人高潮的av毛片| zzijzzij亚洲日本少妇熟睡| 日本不卡二区| 国产在线一区二区视频| 亚洲高清免费视频| 日韩av资源在线| 欧美一区二区三区婷婷| 精品奇米国产一区二区三区| 欧美特黄一区二区三区| 中文字幕一区二区三区在线视频| 午夜精品免费视频| 中文字幕在线观看免费| 粉嫩aⅴ一区二区三区四区| 欧美日本韩国在线| 18av在线视频| 色94色欧美sute亚洲线路一久 | 自拍偷拍亚洲一区| 国产女人被狂躁到高潮小说| 亚洲尤物影院| 亚洲free性xxxx护士hd| 日韩一区av| 亚洲男人的天堂在线aⅴ视频| 久久久亚洲精品无码| 国产第一亚洲| 亚洲黄色www| www.超碰在线观看| 亚洲免费影视| 99精彩视频| 亚洲成人三级| 色哟哟日韩精品| 无码人妻aⅴ一区二区三区玉蒲团| 亚洲人亚洲人色久| 欧美激情视频网站| 国产又大又长又粗| 久久久美女毛片| 国产制服91一区二区三区制服| 色豆豆成人网| 日韩精品免费在线播放| 免费在线一级片| 麻豆高清免费国产一区| 蜜桃999成人看片在线观看| 在线免费观看a视频| 欧美性受极品xxxx喷水| 免费的av网站| 极品少妇一区二区三区| 91影视免费在线观看| 91在线免费看| 91国产成人在线| av无码av天天av天天爽| 亚洲乱码视频| 国产精选一区二区| 影音先锋在线播放| 欧美高清dvd| 中国1级黄色片| 日韩综合小视频| 欧美一区观看| 亚洲精品一区| 精品亚洲一区二区三区在线播放| 欧美精品乱码视频一二专区| 国产另类ts人妖一区二区| 一区二区三区在线视频111| 精品免费av一区二区三区| 国产午夜精品一区二区三区 | 日韩精品一区二区在线| 亚洲波多野结衣| 韩国女主播成人在线| 亚洲欧洲精品在线 | 91网在线看| 欧美一区二区三区成人| 久久久久亚洲av片无码| 国产精品乡下勾搭老头1| 最新av在线免费观看| 国产精久久久| 欧美另类精品xxxx孕妇| 亚洲国产精彩视频| 亚洲亚洲精品在线观看| 成人区人妻精品一区二| 亚洲看片免费| 久久精品国产综合精品| 欧美大胆性生话| 尤物yw午夜国产精品视频| 中文在线a天堂| 亚洲欧美日本在线| 日韩大尺度视频| 在线视频日韩| 日韩女优中文字幕| 伊人久久大香伊蕉在人线观看热v| 日韩视频在线观看免费| 午夜精品在线播放| 黑人巨大精品欧美一区二区三区| 少妇饥渴放荡91麻豆| 日日噜噜夜夜狠狠视频欧美人 | 成人午夜在线影视| 日韩女同互慰一区二区| 黄色一级片免费看| 国产免费久久精品| 久久久九九九热| 99热精品在线| 亚洲美女搞黄| 日韩欧美一级| 国产盗摄xxxx视频xxx69| 老司机在线视频二区| 日韩精品中文字幕一区二区三区 | 欧美一区二区三区的| 日本一级淫片色费放| 国产日产欧美一区| 国产精品igao网网址不卡| 在线午夜精品| 一区二区三区欧美成人| 国产厕拍一区| 国产精品视频区1| 白白色在线观看| 中文字幕日韩av| 偷拍精品一区二区三区| 欧美三级欧美一级| 国产在线视频卡一卡二| 国产日韩欧美不卡在线| 少妇愉情理伦片bd| 石原莉奈一区二区三区在线观看| 一区二区精品免费视频| 国产主播性色av福利精品一区| 国产精品欧美激情在线播放| 91探花在线观看| 久久精品视频在线| 黄上黄在线观看| 亚洲精品一区二区三区福利| 中文字幕一区二区久久人妻| 午夜精品久久久久久久久久| 永久免费看片视频教学| 久久理论电影网| 欧洲成人午夜精品无码区久久| 青草国产精品久久久久久| 男人插女人视频在线观看| 国产韩国精品一区二区三区| 欧美二区三区在线| 99re热精品视频| 亚洲一区二区三区四区在线播放| av高清一区| 欧美一级淫片videoshd| 黄色成人在线网| 久久久av一区| 色老头视频在线观看| 亚洲人成电影网站色| 五月婷婷免费视频| 精品国产乱子伦一区| 99热这里只有精品9| 在线观看91av| 在线观看毛片av| 日本韩国精品在线| 你懂的国产在线| 婷婷国产在线综合| 国产性生活网站| 亚洲另类色综合网站| 欧洲美女女同性互添| 国产精品水嫩水嫩| wwwww黄色| 日本一区二区免费在线观看视频| 中文字幕免费看| 久久精品亚洲精品国产欧美| 极品白嫩丰满美女无套| 久久综合色综合88| 一区二区三区免费在线观看视频| 播五月开心婷婷综合| 丰满少妇xbxb毛片日本| 成人性生交大片免费看视频在线| 一区二区三区四区影院| 丁香婷婷综合网| 加勒比精品视频| 久久免费视频色| 91精品久久久久久久久久久久| 久久精品水蜜桃av综合天堂| 波多野结衣av在线观看| 中文字幕免费一区| 欧美性猛交xxxx乱大交少妇| 国产精品久久久久久久久免费相片| 刘亦菲国产毛片bd| 亚洲视频小说图片| 久久免费黄色网址| 性久久久久久久久久久久| 亚洲黄色小说图片| 欧美中文字幕一区二区三区| 依依成人在线视频| 91精品在线麻豆| 日批免费在线观看| 亚洲欧美国内爽妇网| 成人综合影院| 久久精品国产96久久久香蕉| 日本在线观看高清完整版| 午夜精品福利在线观看| 偷拍精品精品一区二区三区| 国产美女精彩久久| 视频一区日韩| 久久久久久久久一区二区| 成人一级毛片| 国产精品自拍合集| 久久不射2019中文字幕| 久久久久xxxx| 99免费精品视频| 亚洲精品视频网址| 一区二区成人在线| 国产剧情在线视频| 91精品国产综合久久久蜜臀图片| 成人午夜免费福利| 在线亚洲午夜片av大片| a毛片在线播放| 日本一欧美一欧美一亚洲视频| 91麻豆精品国产综合久久久| 国产视频精品网| 日韩理论片av| 日韩精品 欧美| 久久99精品国产.久久久久| 免费黄色三级网站| 中文字幕一区二区三区不卡 | 欧美一区二区三区粗大| 亚洲综合激情另类小说区| 久久久久久亚洲av无码专区| 日韩限制级电影在线观看| 国产在线观看黄| 97免费视频在线| 国产色99精品9i| 日本高清不卡三区| 欧美午夜国产| 亚洲免费av一区| 久久综合久色欧美综合狠狠| 国产av无码专区亚洲av毛网站| 日本精品视频一区二区三区| 亚洲精品久久久蜜桃动漫| 最近2019中文字幕mv免费看| 色网在线免费观看| 99re在线国产| 成人短片线上看| 成年人观看网站| 国产91精品欧美| 日本青青草视频| 欧美色图12p| 黄色片在线免费观看| 97精品在线视频| 91久久偷偷做嫩草影院电| 亚洲欧美精品| 日本中文字幕一区| 精品人妻少妇嫩草av无码| 亚洲成人tv网| 亚洲精品久久久久avwww潮水| 色噜噜狠狠狠综合曰曰曰| 桃色一区二区| 欧美在线视频二区| 国产精品日韩欧美一区| 日本精品一二三区| 一区二区三区欧美视频| 国产喷水吹潮视频www| 中文字幕日韩av综合精品| 亚州一区二区三区| 欧美精品一区三区在线观看| 亚洲欧洲日本一区二区三区| 911亚洲精选| 亚洲网友自拍偷拍| 欧美在线精品一区二区三区| 欧美日韩不卡合集视频| 日韩08精品| 国产乱淫av片杨贵妃| 高清视频一区二区| 久久丫精品久久丫| 亚洲第一黄色网| 国产福利电影在线播放| 精品国产日本| 久久激情综合| www.99热| 欧美日韩电影在线| 国产黄色小视频在线| 3d动漫精品啪啪一区二区三区免费| 日韩av二区| 免费黄频在线观看| 亚洲一区日韩精品中文字幕| 高潮一区二区三区乱码| 国内免费久久久久久久久久久| 高清日韩中文字幕| 国产91在线视频观看| 久久亚洲免费视频| 国产亚洲欧美日韩高清| 丝袜亚洲欧美日韩综合| 日韩在线成人| www在线观看免费| 久久精品亚洲一区二区三区浴池| 久久久久久久亚洲| www.欧美精品一二三区| 欧美大片91| 成人一对一视频| 久久精品综合网| 一区二区日韩在线观看| 九九精品视频在线| 欧美aaaaa级| 韩国日本美国免费毛片| 中文字幕一区二区三区四区| 亚洲国产精品成人久久蜜臀| 日本视频久久久| 亚洲不卡av不卡一区二区| 亚洲一二三四五| 日本丶国产丶欧美色综合| 成人黄色网址| 欧美日本韩国一区二区三区| 激情综合色综合久久综合| 日本免费一二三区| 一区二区三区视频在线| 91成人噜噜噜在线播放| 男人搞女人网站| 亚洲综合一区二区三区| 免费在线国产| 亚洲一区二区三区香蕉| 久久男女视频| 欧美成人精品欧美一级| 亚洲日本aⅴ片在线观看香蕉| 爱情电影网av一区二区| 亚洲自偷自拍熟女另类| 亚洲视频精选在线| 欧美性孕妇孕交| 国产精品青青草| 久久国产欧美日韩精品| 欧美一级特黄视频|