精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

創造歷史!DeepSeek超越ChatGPT登頂中美AppStore

人工智能 新聞
DeepSeek 發布的 iOS 應用甚至超越了 ChatGPT 的官方應用,直接登頂 AppStore。

DeepSeek 20 日發布以來獲得的熱度至今依然沒有任何消退的跡象。一覺醒來,DeepSeek 發布的 iOS 應用甚至超越了 ChatGPT 的官方應用,直接登頂 AppStore。

圖片


不少網友都認為這是他們當之無愧。

圖片

畢竟,正如 a16z 合伙人、Mistral 董事會成員 Anjney Midha 說的那樣:從斯坦福到麻省理工,DeepSeek-R1 幾乎一夜之間就成了美國頂尖大學研究人員的首選模型。

圖片

甚至有網友認為 DeepSeek 是 OpenAI 與英偉達都未曾預見的黑天鵝。

圖片

與此同時,圍繞 DeepSeek-R1 的各路消息也正層出不窮 ——Hugging Face 等組織正在嘗試復現 R1、DeepSeek 之前接受的采訪被翻譯成了英文版并正在 AI 社區引發熱議、開發了 Llama 系列模型的 Meta 似乎陷入了焦慮之中…… 下面我們就來簡單盤點一下最近兩天圍繞 DeepSeek 的幾個熱點議題。

圖片

DeepSeek 創始人梁文鋒之前接受的采訪被翻譯成了英文版,正在 AI 社區引發熱議

AI 社區開啟 R1 復現熱潮

DeepSeek-R1 是開源的,但也沒有完全開源 —— 相關的訓練數據、訓練腳本等并未被公布出來。不過,因為有技術報告,也就有了復現 R1 的指導方針,也因此,最近有不少人都在強調復現 R1 的重要性與可行性。

圖片

圖片

?? 博主 @Charbax 總結了 DeepSeek 文檔中沒有介紹的地方以及復現 R1 的一些難點。

  • 訓練流程的細節。雖然其技術報告中介紹了強化學習階段和蒸餾,但省略了關鍵的實現細節,包括超參數(例如,學習率、批量大小、獎勵縮放因子)、用于生成合成訓練數據的數據管道(例如,如何編排 800K 蒸餾樣本)、需要人類偏好對齊的任務的獎勵模型架構(多語言輸出的「語言一致性獎勵」)。
  • 冷啟動數據生成。報告中雖然提到了創建「高質量冷啟動數據」(例如,人工標準、少樣本提示)的過程,但缺乏具體的示例或數據集。
  • 硬件和基礎設施。沒有關于計算資源(例如,GPU 集群、訓練時間)或軟件堆棧優化(例如,DeepSeek-V3 的 AMD ROCM 集成)的詳細信息。
  • 復現難題。缺少多階段強化學習的腳本等組件。

當然,也確實有些團隊已經開始行動了。

Open R1:復現一個真?開源版 R1

在復現 R1 的各式項目中,最受人關注的當屬 Hugging Face 的 Open R1 項目。

  • 項目地址:https://github.com/huggingface/open-r1

Open R1 宣稱是 DeepSeek-R1 的「完全開放復現(A fully open reproduction)」,可以補齊 DeepSeek 沒有公開的技術細節。該項目目前還在進行中,已經完成的部分包括:

  • GRPO 實現
  • 訓練與評估代碼
  • 用于合成數據的生成器

圖片

Hugging Face CEO Clem Delangue 的推文

據其項目介紹,Open R1 項目計劃分三步實施:

圖片

第一步:復現 R1-Distill 模型,具體做法是蒸餾一個來自 DeepSeek-R1 的高質量語料庫。

第二步:復現 DeepSeek 用于創建 R1-Zero 的純強化學習管線。這一步涉及到編排一個新的大規模數據集,其中包含數學、推理和代碼數據。

第三步:通過多階段訓練從基礎模型得到強化學習微調版模型。

7B 模型 8K 樣本復現 R1-Zero 和 R1

另一個復現 R1 的團隊是來自香港科技大學的何俊賢(Junxian He)團隊,并且他們采用的基礎模型和樣本量都非常小:基于 7B 模型,僅使用 8K 樣本示例,但得到的結果卻「驚人地強勁」。

  • 項目地址:https://github.com/hkust-nlp/simpleRL-reason

圖片

需要注意,該團隊的這個實現的實驗大都是在 R1 發布之前完成的。他們發現,僅使用 8K MATH 示例,7B 模型就能涌現出長思維鏈 (CoT)和自我反思能力,而且在復雜的數學推理上的表現也非常不錯。

具體來說,他們從基礎模型 Qwen2.5-Math-7B 開始,僅使用來自 MATH 數據集的 8K 樣本直接對其進行強化學習。最終得到了 Qwen2.5-SimpleRL-Zero 與  Qwen2.5-SimpleRL。

或者按其博客的說法:「沒有獎勵模型,沒有 SFT,只有 8K 用于驗證的 Math 樣本,得到的模型在 AIME 上成績為(pass@1 準確率)33.3%、在 AMC 上實現了 62.5%、在 MATH 上實現 77.2%,優于 Qwen2.5-math-7B-instruct,可與使用多 50 倍數據和更復雜組件的 PRIME 和 rStar-MATH 相媲美。」

圖片

Qwen2.5-SimpleRL-Zero 的訓練動態

圖片

所得模型與基線模型的 pass@1 準確度

基于 3B 模型用 30 美元復現 R1

TinyZero 則是一個嘗試復現 DeepSeek-R1-Zero 的項目,據其作者、伯克利 AI 研究所在讀博士潘家怡(Jiayi Pan)介紹,該項目是基于 CountDown 游戲實現的,完整配方有一句話就能說完:「遵照 DeepSeek R1-Zero 的算法 —— 一個基礎語言模型、提示詞和 ground-truth 獎勵,然后運行強化學習。」

圖片

實驗過程中,模型一開始的輸出很蠢笨,但逐漸發展出修改和搜索等策略。下面展示了一個示例,可以看到模型提出解決方案,自我驗證,并反復修改,直到成功。

圖片

實驗中,該團隊也得到了一些有意思的發現:

基礎模型的質量很重要。0.5B 的小模型在猜測一個解答之后就會停止,而從 1.5B 規模開始,模型會開始學習搜索、自我驗證、修正解答,從而可以得到遠遠更高的分數。

基礎模型和指令模型都可行。實驗發現,指令模型的學習速度更快,但性能會收斂到與基礎模型同等的程度;同時指令模型的輸出更加結構化、更可讀。

具體采用什么強化學習算法并不重要。該團隊嘗試了 PPO、GRPO 和 PRIME,但它們的差異并不大。

模型的推理行為嚴重取決于具體任務。對于 CountDown 游戲,模型會學習執行搜索和自我驗證;對于數值乘法,模型會學習使用分配律分解問題并逐步解決。

圖片

模型學會乘法分配律

而最驚人的是,整個項目的計算成本不到 30 美元。

Meta 的焦慮:下一代 Llama 可能趕不上 R1

數天前,機器之心報道文章《Meta 陷入恐慌?內部爆料:在瘋狂分析復制 DeepSeek,高預算難以解釋》引起廣泛關注與討論。

文章中, Meta 員工在美國匿名職場社區 teamblind 上面發布了一個帖子提到,國內 AI 創業公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌。

今日,The Information 最新的文章爆料出更多內容。

圖片

在文章中,The Information 爆料稱包括 Meta 人工智能基礎設施總監 Mathew Oldham 在內的領導表示,他們擔心 Meta Llama 的下一個版本性能不會像 DeepSeek 的那樣好。

Meta 也暗示 Llama 的下一個版本將于本季度發布。

此外,文章也爆料,Meta 生成式 AI 小組和基礎設施團隊組織了四個作戰室來學習 DeepSeek 的工作原理。

其中兩個作戰室,正在試圖了解幻方是如何降低訓練和運行 DeepSeek 模型的成本。其中一名員工表示:Meta 希望將這些技術應用于 Llama。

其中一些開發人員透露,盡管 Meta 的模型是免費的,但它們的運行成本通常比 OpenAI 的模型更高,部分原因是 OpenAI 可以通過批量處理其模型客戶的數百萬條查詢來降低價格。但是,使用 Llama 的小型開發人員卻沒有足夠的查詢來降低成本。

據一位直接了解情況的員工透露,第三個作戰室正在試圖弄清楚幻方可能使用哪些數據來訓練其模型。

第四作戰室正在考慮基于 DeepSeek 模型的新技術,重構 Meta 模型。Meta 考慮推出一個與 DeepSeek 相似的 Llama 版本,它將包含多個 AI 模型,每個模型處理不同的任務。這樣,當客戶要求 Llama 處理某項任務時,只需要模型的某些部分進行處理。這樣做可以使整個模型運行得更快,并且以更少的算力來運行。

不知道,在這樣的壓力下,2025 年 Meta 會拿出什么樣的開源模型?說不定,Meta 也會加入到復現 R1 的浪潮中。

圖片

不過可以預料的是,在 DeepSeek 這條鯰魚的攪動下,新一年的大模型格局正在發生轉變。

對新一年的 AI 技術發展與應用,你有什么樣的期待?歡迎留言討論。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-01 07:00:00

DeepSeekAI人工智能

2025-01-27 12:28:55

2025-09-16 09:00:00

2024-01-15 00:40:43

C#Java編譯器

2025-02-08 08:30:00

2025-05-30 07:40:56

2013-03-29 10:39:04

2011-06-28 10:11:41

Top Girl應用

2009-05-30 08:39:20

2021-01-07 14:56:55

AI 數據人工智能

2025-02-10 08:37:04

2025-05-06 15:39:53

DeepSeek-R英偉達開源

2020-12-30 13:58:36

比特幣金融加密貨幣

2025-02-08 09:15:00

2025-02-03 10:00:00

DeepSeekChatGPT人工智能

2023-05-15 12:11:24

2023-10-11 13:21:12

模型數據

2025-02-05 12:53:21

2025-03-14 13:12:53

點贊
收藏

51CTO技術棧公眾號

欧美日韩精品电影| 亚洲国产精品av| 97久久久免费福利网址| www..com.cn蕾丝视频在线观看免费版| 全球最大av网站久久| 亚洲免费在线看| 免费av在线一区二区| 国产精品久久影视| 国产日韩一区二区三区在线| 色噜噜国产精品视频一区二区| 精品人妻伦一二三区久| 欧美激情福利| 欧美日韩性生活视频| 一区二区三区四区免费观看| 日韩av视屏| 国产成人免费高清| 国产精品色视频| 国产手机在线视频| 一本一道久久综合狠狠老| 亚洲美女动态图120秒| 午夜免费一级片| 亚洲成人激情社区| 午夜欧美2019年伦理 | 99欧美视频| 亚洲精品中文字幕女同| 国产sm在线观看| 亚洲爽爆av| 日韩欧美亚洲综合| 色欲色香天天天综合网www| 黄色的网站在线观看| 国产视频一区二区在线| 国产三区二区一区久久| 国产高清免费观看| 精彩视频一区二区| 国产精品com| 日韩一区二区视频在线| 亚洲精品裸体| 欧美激情小视频| 性色av无码久久一区二区三区| 不卡一区综合视频| 亚洲天堂精品在线| 久久国产精品影院| 亚洲+变态+欧美+另类+精品| 亚洲第一视频网| 成人在线短视频| 亚洲欧美一级| 51精品久久久久久久蜜臀| 亚洲综合色在线观看| 久久天堂av| 在线精品视频免费观看| 中文字幕欧美人妻精品一区| 黄色综合网址| 一本色道久久综合亚洲91| 欧美日韩不卡在线视频| 成人免费一区二区三区牛牛| 亚洲综合色噜噜狠狠| 成人短视频在线观看免费| 日本伦理一区二区| 亚洲国产精品久久久久婷婷884 | 看一级黄色录像| 国产黄色小视频在线| 亚洲欧美日韩在线| 路边理发店露脸熟妇泻火| 在线观看电影av| 亚洲成人免费视| 亚洲自偷自拍熟女另类| 日韩av福利| 欧美日韩免费观看一区二区三区| 日韩一区二区三区久久| 97久久中文字幕| 日韩精品一区在线| 91视频在线免费| 少妇一区二区视频| 最近2019中文字幕在线高清| 成人涩涩小片视频日本| 亚洲视频观看| 欧洲亚洲妇女av| 亚洲一区二区影视| 国产成人午夜视频| 蜜桃网站成人| 国产成人在线视频免费观看| 亚洲国产综合视频在线观看| 国产精品97在线| 精品九九久久| 亚洲成人在线网| 卡一卡二卡三在线观看| 中文字幕免费一区二区| 国产69久久精品成人看| 中文字幕永久免费视频| 国产成人99久久亚洲综合精品| 久久久精彩视频| 欧美性天天影视| 亚洲一区电影777| 99视频免费播放| 欧美午夜网站| 一本久久综合亚洲鲁鲁| 欧美成人精品欧美一级私黄| 免费视频一区| 97人人澡人人爽| 蜜桃视频在线免费| 一区二区三区丝袜| 9久久婷婷国产综合精品性色| 国模大尺度视频一区二区| 亚洲精品少妇网址| 在线视频这里只有精品| 国产精品日本欧美一区二区三区| 91久久久久久久一区二区| 亚洲三区在线播放| 一区二区视频在线| 三级在线视频观看| 高潮久久久久久久久久久久久久| 中文字幕精品久久| 国产黄色片免费看| 国产a视频精品免费观看| 亚洲在线欧美| 户外露出一区二区三区| 欧美精品一区二区三区高清aⅴ| 中文字幕资源站| 日韩高清中文字幕一区| 欧美高清视频一区| 女人黄色免费在线观看| 777午夜精品免费视频| 成人在线一级片| 99精品欧美| 99精品国产高清在线观看| 日本中文字幕电影在线免费观看| 欧美视频免费在线| 手机在线成人av| 欧美日韩在线大尺度| 国产一区二区色| 成人在线高清视频| 色丁香久综合在线久综合在线观看| 手机在线成人av| 亚洲高清激情| 国产视频不卡| 国产直播在线| 亚洲国产免费av| 久久精品久久精品久久| 国产白丝网站精品污在线入口 | 亚洲国产综合在线看不卡| 亚洲自拍偷拍色片视频| 国内精品不卡| 欧美一级在线视频| 国产性xxxx| 国产成人在线视频网站| 国产精品国产三级国产专区51| 日本一区二区三区电影免费观看 | 欧美在线播放一区二区| 日韩电影网站| 中文字幕免费精品一区高清| 91porny九色| 欧美激情一区二区三区不卡| 好男人www社区| 99久久视频| 91免费看片网站| 51xtv成人影院| 日韩欧美色综合网站| 久久久久成人精品无码| 国产999精品久久| 一女被多男玩喷潮视频| 色棕色天天综合网| 国产色综合天天综合网| 最新黄网在线观看| 亚洲国产精品久久| aaaaaa毛片| 中文字幕色av一区二区三区| www.51色.com| 99亚洲伊人久久精品影院红桃| 久久影院理伦片| 国产福利一区二区三区在线播放| 日韩在线观看视频免费| 不卡的日韩av| 欧美日韩国产一区在线| 国产精品www爽爽爽| 国内外成人在线| 免费av手机在线观看| 国产日韩欧美一区二区三区| 国产一区二区在线播放| 丁香花在线高清完整版视频| 亚洲天堂一区二区三区| 97人妻精品一区二区三区| 亚洲国产成人va在线观看天堂| 免费看黄色aaaaaa 片| 免费在线观看视频一区| 久久久久久久久久久综合| 亚洲欧洲美洲国产香蕉| 成人信息集中地欧美| 密臀av在线播放| 日韩中文字幕免费看| 少妇av一区二区| 欧美日韩精品一区二区在线播放| 久艹视频在线观看| 国产日产欧美一区二区视频| 真实乱偷全部视频| 久久人人精品| 韩国无码av片在线观看网站| 亚洲小说图片视频| 99r国产精品视频| 日韩制服一区| 97热在线精品视频在线观看| 香蕉视频免费在线播放| 亚洲国模精品一区| 国产激情久久久久久熟女老人av| 色先锋久久av资源部| 黄色一级片在线免费观看| 国产精品天美传媒沈樵| 国产精品扒开腿做爽爽爽a片唱戏| 精品一区二区在线看| 青青视频在线播放| 国内久久视频| 伊人久久大香线蕉精品| 亚洲精品蜜桃乱晃| 国产伦精品一区二区三区四区免费| 久久女人天堂| 欧美做受高潮1| 国产精品蜜臀| 久久69精品久久久久久久电影好| fc2在线中文字幕| 日韩风俗一区 二区| 亚洲xxx在线| 欧美丰满美乳xxx高潮www| 波多野结衣一区二区三区在线 | 欧美成人高潮一二区在线看| 婷婷丁香综合| 亚洲区一区二区三区| 色综合综合色| 欧美午夜欧美| 中文字幕中文字幕精品| 国产亚洲一区在线播放| 日韩免费成人| 91|九色|视频| 清纯唯美激情亚洲| 亚洲一区二区三区乱码aⅴ| 偷拍自拍亚洲| 国产欧美日韩丝袜精品一区| 在线看欧美视频| 国产精品18久久久久久麻辣| 香蕉视频亚洲一级| 国产精品久久激情| 日本高清不卡一区二区三区视频| 日本一欧美一欧美一亚洲视频| 精品人人视频| 欧美性受xxxx白人性爽| 午夜不卡影院| 日本国产一区二区三区| 色在线中文字幕| 日韩av手机在线观看| 欧美成人资源| 国产精品免费一区| 成人在线高清| 91久久精品国产| 精品国产鲁一鲁****| 91在线观看免费网站| 精品一区二区三区视频在线播放| 亚洲qvod图片区电影| 亚洲五码在线| 国产欧美日韩一区二区三区| 黄色成人美女网站| 蜜桃av噜噜一区二区三| 国产亚洲一区| 中文字幕成人一区| 伊人青青综合网| 国产精品久久久久久久久电影网| 精品动漫一区| www.国产区| 久久99九九99精品| 亚洲av综合色区无码另类小说| 成人va在线观看| av小说在线观看| 亚洲欧洲成人自拍| 麻豆国产尤物av尤物在线观看 | 中文字幕日本最新乱码视频| 久久欧美肥婆一二区| 成人综合久久网| 成人avav影音| 国产无遮挡在线观看| 亚洲一区二区三区国产| 日本在线播放视频| 欧美精选一区二区| 日本xxxxxwwwww| 日韩中文字幕国产| 九色porny丨首页入口在线| 国产精品久久久久久久久久久久| 电影91久久久| 欧美精品一区二区三区四区五区| 色婷婷色综合| 欧美 日本 亚洲| 久久国产日韩欧美精品| 天堂www中文在线资源| 国产精品无码永久免费888| 久久久久97国产| 欧美日韩精品电影| 天堂av中文字幕| 久久精品国产久精国产一老狼| free性欧美16hd| 成人免费xxxxx在线观看| 欧美三级电影在线| 超级碰在线观看| 日韩中文字幕麻豆| 亚洲一区二区在线免费| 国产精品久久久久一区二区三区共| 亚洲精品午夜久久久久久久| 欧美日韩激情一区二区| 三级黄视频在线观看| 欧美成人高清视频| 成人在线视频免费| 国产中文一区二区| 欧美一区影院| 三级a在线观看| 91免费在线看| 久久久久亚洲天堂| 欧美欧美欧美欧美| 国产美女性感在线观看懂色av| 欧美日韩福利在线观看| 玖玖精品在线| 天堂精品一区二区三区| 亚洲一区欧美激情| 国产精品入口麻豆| 手机看片一区二区| 亚洲蜜臀av乱码久久精品蜜桃| 欧产日产国产69| 亚洲第一页自拍| 性xxxfreexxxx性欧美| 国产精品欧美日韩| 久操精品在线| 欧美极品欧美精品欧美| 高清在线成人网| 欧美精品乱码视频一二专区| 欧美精品tushy高清| 999国产在线视频| 国产成人精品电影久久久| 麻豆一区一区三区四区| www.亚洲视频.com| 国产ts人妖一区二区| 性欧美videos| 3d动漫精品啪啪1区2区免费 | 91丨九色porny丨蝌蚪| 久久久精品国产sm调教| 日韩一区二区免费在线观看| 成人av黄色| aa成人免费视频| 欧美日韩免费| 免费日本黄色网址| 香蕉成人啪国产精品视频综合网| 理论片中文字幕| 午夜精品一区二区三区在线| 波多野结衣在线一区二区| 日韩一级片免费视频| 成人午夜av在线| 久久午夜免费视频| 日韩久久免费电影| 韩国精品主播一区二区在线观看| 日韩精品久久一区| 麻豆91小视频| 亚洲精品久久久久久国| 91精品国产色综合久久不卡蜜臀 | 香蕉综合视频| 麻豆传媒在线看| 午夜精品一区二区三区免费视频| 五月天婷婷在线观看| 欧美在线视频免费播放| 欧美日韩伦理在线免费| 日本在线播放一区二区| 一区二区三区中文字幕| 免费av网站观看| 日本国产高清不卡| 97视频热人人精品免费| 中文字幕 欧美 日韩| 亚洲一二三专区| 青青操视频在线| 国产精品久久久久久av下载红粉| 久久密一区二区三区| 精品无码av一区二区三区不卡| 午夜精品福利一区二区蜜股av| 日韩精品系列| 成人有码视频在线播放| 亚洲美女少妇无套啪啪呻吟| 中文字幕网站在线观看| 日韩欧美在线观看一区二区三区| 3344国产永久在线观看视频| 日本高清一区| 福利91精品一区二区三区| 天堂中文在线网| 久久精品99久久久香蕉| 欧美wwwsss9999| www.亚洲高清| 午夜不卡在线视频| av基地在线| 国内精品**久久毛片app| 日韩av在线播放中文字幕| 久久免费播放视频| 国产一区二区日韩精品欧美精品| 久久99成人| 一区二区在线播放视频| 亚洲一区二区三区四区在线| 国产在线小视频| 国产日韩精品一区观看| 久久福利资源站| 国产剧情在线视频| 久久久久久久久久av|