精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek爆火后的新Scaling Law究竟是什么? 原創

發布于 2025-3-14 11:17
瀏覽
0收藏

出品 | 51CTO技術棧(微信號:blog51cto)

嘉賓 | 周博洋、魏新宇

采訪 | 薛彥澤

撰稿 | 李美涵

DeepSeek R1的發布在全球人工智能領域引發了巨大反響。這款由中國初創企業DeepSeek推出的低成本、高性能AI模型,打破了人們對AI研發“高投入、長周期”的固有認知,被西方媒體譽為“人工智能的斯普特尼克時刻”。

DeepSeek的“奇跡”有目共睹。其應用上線僅20天,日活躍用戶數就突破了2000萬,而ChatGPT達到同樣的日活量則耗時150天之余。不僅如此,DeepSeek的開源路線也廣受好評,R1成功登頂開源平臺“抱抱臉”最受歡迎模型,還以一己之力開啟了一波開源熱潮,影響不僅波及國內模型廠商,還促使OpenAI的Altman也放出了開源計劃。

另一個近期AI圈的熱點,則是千呼萬喚始出來的GPT-4.5。在“大模型撞墻論”甚囂塵上之際,OpenAI官方承認,GPT-4.5的優勢在于規模龐大,盡管模型參數量級擴張,但性能并未達到前沿水平。這迫使我們正視:在AI領域,新的時代已經開始。

為此,AIGC實戰派特別邀請了微軟(中國)有限公司高級架構師周博洋和AI技術專家魏新宇,就DeepSeek出現后值得關注的熱門話題進行了深入討論和解讀。有趣的是,兩位專家達成了一個共識:預訓練時代并未終結,然而,新的Scaling Law已經誕生。

周博洋認為,新的Scaling Law其實是“思考時間”,即模型思考的時間越久,給出的回答質量就越佳。

魏新宇則提出,新Scaling Law的重點在于后訓練的數據質量和獎勵模型的設計。誰能在這些問題上有所突破,誰就找到了模型性能提升的第二曲線。

以下是訪談要點:

?預訓練時代的持續:兩位專家一致認為,預訓練和微調仍然是模型學習知識的標準范式。盡管Scaling曲線不再陡峭,但方法本身仍然有效。

?新的Scaling Law:魏新宇認為,新的Scaling Law將出現在訓練數據和獎勵模型的設計方面。他從獎勵模型最常見的三種設計講起,揭秘了DeepSeek R1的獎勵算法如何為模型打分。

?強化學習與推理能力:周博洋指出,強化學習之所以在出現很久后,才由R1走通了強推理的路徑,是因為此前基礎模型能力的局限性。“沒有CoT的能力,強化就沒有意義,因為強化學習不是直接賦予模型推理能力,而是激發它潛在的推理能力。”

?小模型的強推理能力:魏新宇認為,小模型擁有強推理能力的關鍵在于數據強化和訓練方法的選擇。他以微軟的小模型明星Phi-4為例,給小模型的蒸餾和微調提出了一些建議。

?接入DeepSeek的建議:周博洋提供了清晰可行的建議:如果是為了業務,就選最穩的API;如果是日常使用,就選方便易用的。

?AI應用新場景:魏新宇提到,R1的推理能力為AI應用解鎖了新的場景,在教育、科研領域的潛力更大。推理意味著模型不僅能勝任現有知識的問答,還能對未來趨勢做預測,例如預測票房、股市等。

1.預訓練時代終結了嗎?

薛彥澤: 第一個問題,預訓練時代終結了嗎?

魏新宇: 我的觀點是預訓練并沒有結束,它依然是大模型的基礎。比如最近很火的DeepSeek R1,也是基于V3進行強化學習的。預訓練仍然是通用知識庫的來源,所以仍然是必要的。不過,預訓練會與后續的強化學習結合起來,優化以前大規模消耗算力的預訓練模式。因此不能說預訓練終結,我認為是一種范式的提升。

周博洋: 補充兩句,我覺得預訓練和微調依然是模型學習知識的標準范式。

首先,預訓練和監督微調是模型理解知識本源的關鍵步驟。我們會給模型各種數據,比如互聯網數據、特定領域的數據比如MATH-500等等,目的是讓模型理解語義,繼而懂得Token之間的關聯性。傳統上,預訓練主要是讓模型學會續寫和理解語言的邏輯,而微調則是讓模型生成符合人類習慣和規范的文本。

從GPT-3開始,強化學習被引入,最初是為了讓模型對齊人類價值觀,比如避免偏見、暴力等不良內容。但在訓練的過程中,逐漸發現了強化學習在推理領域的潛力。

至于預訓練是否終結,我覺得現在討論還為時尚早。雖然Scaling的曲線沒有那么陡峭了,大家也從強化學習等其他方向,探索提升能力的路徑。但是預訓練本身仍然有效。

薛彥澤: 那目前Scaling Law的瓶頸怎么突破呢?

周博洋: 還是從兩個維度來看。

第一個維度是算力和模型參數的關系。在固定的算力體系下,模型參數和token數量的關系是關鍵。比如,現在有些模型已經接近Scaling Law的極限,但如果能突破這個限制,比如把70B參數的模型和1.4T的數據放大十倍,就會變成700B參數和14T的數據,這其實已經接近一些現有大模型的規模了。不過,像DeepMind這樣的研究機構可能覺得已經達到算力上限了,但OpenAI的模型成長速度其實還能更快。因為現在更受限于多卡互聯訓練時的通信損耗,比如馬斯克提到的十萬卡訓練,效率低主要是因為通信損耗。所以,未來可能需要在算力優化和通信效率上做更多工作。

第二個維度是數據的獲取和利用。現在很多人認為數據挖掘已經到底了。但我們忽略了99%的數據其實不在集中數據里,而是分散在端側設備上,這些數據可能因為安全問題無法聯網,價值也沒被挖掘,這可能是突破Scaling Law瓶頸的一個方向。

2.后訓練、推理語境下的新Scaling Law究竟是什么?

薛彥澤: 后訓練、推理語境下的新Scaling Law究竟是什么?

周博洋:我覺得后訓練和推理語境下的新Scaling Law其實跟“思考時間”有關。思維鏈的產生和我的偶像Donald Norman有關,他在大學癡迷玩德國撲克,這個游戲就是思考的事件越長,獲勝概率才會更高。這跟Alpha Go有點像,它們會花很長時間思考,最終戰勝人類。人類大腦也有快思考和慢思考,簡單的事情比如約喝咖啡,很快就能決定;但復雜的事情比如討論算法,就需要很多中間步驟和時間。

魏新宇: 我覺得后訓練和推理語境下的新Scaling Law,重點在于后訓練的數據質量和獎勵模型的設計。以前是靠增加模型參數和數據量來提升性能,但現在更多是看怎么優化后訓練階段。

現在強化學習領域,獎勵模型的設計也很重要。相當于給模型的答案打分,判斷是否符合人類標準。獎勵方式大概有三種:1. 直接打分:只看答案是否正確來打分;2. 多步驟打分:結合推理步驟和結果一起打分;3. 全步驟打分:每一步都打分,理論上效果最好,但很復雜,實際很難完全實現。

像DeepSeek的話,獎勵模型還會基于一些規則進行打分,比如推理問題和非推理的問題打分規則各有側重。比如訓練醫學問題時,獎勵模型會根據答案是否正確、正確答案出現的次序位置等因素打分,正確答案越靠前,分數越高。

薛彥澤: OpenAI宣布從GPT-5開始就做基礎模型和推理模型的混合模型了,那么,后訓練會推動模型的架構進行變革嗎?

周博洋: 首先,任何架構的模型都可以做推理。我覺得后訓練可能會推動模型架構的變革,但目前的核心還是提升效率,而不是徹底改變模型的本質。

從模型架構的改進來看,比如DeepSeek V3模型使用的MoE技術,MoE把模型的FFN層或MLP層變大,理論上能讓模型更好地學習語義,從而提升性能。但問題在于,如果模型太大,推理時會面臨顯存占用過高的問題。因為推理時模型的參數是固定的,傳統模型會激活所有神經元,即使有些神經元在推理時并不需要,這就會浪費顯存。

為了解決這個問題,MoE技術在訓練時只激活部分“專家”(即MLP子模塊),而不是全部。這樣可以提高效率,但訓練難度也增加了。比如,Llama 3.1模型被認為是MoE模型,但它的訓練者也承認MoE模型很難訓練充分,因為很難確定哪些專家在推理時真正起作用。

DeepSeek V3模型通過一些函數強制實現負載均衡,確保所有專家都能被訓練到,這樣MoE技術才能真正發揮作用。但目前來看,這些改進的核心還是為了提高效率,而不是徹底改變模型的推理方式。模型的變革可能還在路上,目前的重點是讓現有架構更好地支持推理和后訓練。

3.OpenAl o1、o3模型都免費了DeepSeek R1還有優勢嗎?

薛彥澤: OpenAl o1、o3模型都免費了DeepSeek R1還有優勢嗎?沿著這個思路,我們還想了解兩個開源或者說免費的模型,究竟應該如何比較?DeepSeek的核心優勢在哪里?

魏新宇: 我覺得DeepSeek R1還是有優勢的,即使OpenAI的o1、o3模型免費了。首先,免費模型雖然開源,但不一定能滿足所有定制化需求。比如DeepSeek R1雖然模型較大,有600多B,部署需要近1T顯存,但它的推理能力很強,而且在特定領域,比如金融行業,可以通過蒸餾或微調來優化,讓模型更小、推理速度更快。因為從使用體驗看,R1、o3模型有時候推理一個問題需要長達十幾秒甚至更久,這在生產環境中可能難以接受。

其次,企業對數據安全和合規性有很高要求。DeepSeek R1可以通過特定手段確保模型的回答符合人類價值觀和當地法規,比如在中東國家避免涉及某些敏感話題。而開源模型在這方面可能需要額外的定制和優化。

再者,推理效率和高可用性也是關鍵。DeepSeek R1在推理過程中采用了諸如MLA技術等優化手段,通過低秩聯合壓縮等方式節省顯存,提升推理速度。尤其是蒸餾以后,去做垂域模型,比全量模型更適合大規模商業化部署。

所以,開源或免費模型的優勢在于成本低、易獲取,但DeepSeek R1的核心優勢在于推理效率、定制化能力、數據安全性和高可用性。

薛彥澤:DS的橫空出現,會不會改變國內互聯網的競爭格局?

魏新宇:從技術人員的角度來看,我覺得DeepSeek的出現肯定會對國內模型的競爭格局產生影響,但最終的競爭還是會落到整體生態上。現在國內AI市場競爭很激烈,大家都在推各種模型,但模型之間的能力差距其實并沒有那么大。比如,R1可能比其他模型強一些,但并不是說它比其他模型高出一大截,大家的能力其實都差不多。

關鍵在于,企業有沒有自己固有的客戶流量或生態。比如微信接入DS后,可以基于自己的生態推動應用;百度也可以通過地圖等業務,基于模型做附加值的東西。谷歌和微軟也是一樣,谷歌的Gemini有YouTube和其他工具,微軟有自己的辦公軟件生態,這些都是它們的優勢。

本文轉載自??51CTO技術棧??,作者:伊風


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-3-14 14:10:25修改
收藏
回復
舉報
回復
相關推薦
亚洲av无码久久精品色欲| 强开小嫩苞一区二区三区网站 | 一本色道久久综合狠狠躁的推荐| 欧美精品欧美精品系列c| 在线观看免费黄色小视频| 亚洲欧美在线专区| 亚洲免费一在线| 亚洲热在线视频| 亚洲欧洲美洲av| 欧美国产日韩a欧美在线观看| 98国产高清一区| 成人h动漫精品一区二区下载| 牛夜精品久久久久久久99黑人| 日韩电影免费观看中文字幕| 亚洲av无码久久精品色欲| 欧美free嫩15| 亚洲第一精品在线| 色yeye香蕉凹凸一区二区av| 久久久久久无码精品人妻一区二区| 亚洲黄色免费av| 一区二区三区在线播放| 日韩欧美一区二区三区久久婷婷| 免费av网站在线播放| 蜜臀av一区二区三区| 91成人国产在线观看| 翔田千里88av中文字幕| 国产亚洲电影| 亚洲黄色有码视频| 手机看片国产精品| 日本在线一区二区| 色婷婷久久一区二区三区麻豆| 国产精品无码免费专区午夜| 免费在线观看av| 久久久久久久久久久久久久久99 | 国产片在线播放| 日韩国产高清影视| 欧洲一区二区视频| 亚洲一区欧美在线| 亚洲第一精品影视| 欧美日韩国产成人在线观看| 中日韩一级黄色片| 日韩欧美视频专区| 中文字幕最新精品| 亚洲激情图片网| 日韩免费视频| 色小说视频一区| 日韩福利在线视频| 欧美一级淫片| 日韩在线观看高清| 秋霞欧美一区二区三区视频免费 | 99久久精品久久久久久清纯| 成人在线视频电影| 亚洲国产www| 风间由美性色一区二区三区 | 仙踪林久久久久久久999| 在线午夜精品自拍| 免费一级suv好看的国产网站| 狠狠色丁香婷婷综合影院| 亚洲区在线播放| 国产一区二区三区四区五区六区| 国模精品一区| 这里只有精品视频在线| 91视频免费看片| 欧美3p在线观看| 久色乳综合思思在线视频| 大地资源高清在线视频观看| 牛牛国产精品| 97在线观看免费| 中文字幕一区在线播放| 日本网站在线观看一区二区三区| 91精品国产综合久久香蕉| 99riav国产| av中文字幕不卡| 欧美专区一二三| 日韩黄色影院| 亚洲另类在线制服丝袜| 青青草视频在线免费播放| 中文字幕这里只有精品| 欧美色国产精品| 欧美日韩一区二区区| 九九热hot精品视频在线播放 | 1024手机在线观看你懂的| 欧美电影《睫毛膏》| 九九精品在线观看| 你懂的国产在线| 老司机免费视频一区二区三区| 亚洲永久免费观看| 午夜福利视频一区二区| 中文字幕欧美区| 久久www视频| 亚洲小少妇裸体bbw| 欧美日韩在线直播| 国产原创剧情av| jvid福利在线一区二区| 欧美黑人性猛交| 香蕉影院在线观看| 国产一区二区三区四| 精品在线一区| 国产网站在线免费观看| 欧美日韩国产一区二区三区| 一女二男3p波多野结衣| 久久中文资源| 日韩在线观看精品| 无码人妻一区二区三区线| 国产精品一区二区久久精品爱涩| 欧美精品中文字幕一区二区| 影音先锋中文在线视频| 在线欧美小视频| 国产+高潮+白浆+无码| 欧美一区二区三区高清视频| 97香蕉久久夜色精品国产| 国产农村老头老太视频| 国产午夜精品一区二区三区视频| av片在线免费| 91麻豆精品国产综合久久久| 亚洲欧美成人一区二区在线电影| 欧美日韩免费做爰视频| 免费成人小视频| 久久国产一区| 第一中文字幕在线| 欧美一区二区在线看| 黄色av免费播放| 国产精品日本| 国产精品制服诱惑| 深夜国产在线播放| 4hu四虎永久在线影院成人| 无码 人妻 在线 视频| 国产欧美激情| 国产伦精品一区二区三区免| 污污的视频在线观看| 777久久久精品| 日本人亚洲人jjzzjjz| 国产精品婷婷| 久久99九九| av中文在线资源库| 亚洲第一精品夜夜躁人人躁| 毛片a片免费观看| 国产一区视频在线看| 综合一区中文字幕| 日韩免费大片| 最近更新的2019中文字幕| 久久精品国产亚洲av麻豆蜜芽| 91首页免费视频| 欧美日韩性生活片| 日本欧美韩国国产| 欧美在线激情网| 艳母动漫在线看| 欧美日韩性视频在线| 国产精品久久不卡| 噜噜噜91成人网| 日韩av高清在线播放| **在线精品| 国产亚洲综合久久| 亚洲视频在线观看一区二区| 国产精品白丝在线| aaa一级黄色片| 亚洲综合自拍| 国产精品一区二区三区四区五区| segui88久久综合9999| 日韩精品欧美国产精品忘忧草| 日本午夜视频在线观看| 久久久久国产精品麻豆ai换脸| 男人操女人免费| 人人狠狠综合久久亚洲婷| 国产精品亚洲第一区| 黄视频网站在线| 精品日韩欧美在线| 91video| 中文字幕av一区 二区| 国产欧美精品一二三| 91精品啪在线观看国产18| 91久久极品少妇xxxxⅹ软件| 91高清视频在线观看| 亚洲美女精品成人在线视频| 亚洲一级av毛片| 亚洲一区二区三区不卡国产欧美 | 国产精品看片你懂得| 久久婷婷中文字幕| 亚洲毛片播放| 天堂√在线观看一区二区| 欧美国产亚洲精品| 日韩美女写真福利在线观看| 麻豆视频在线观看免费网站| 精品成人佐山爱一区二区| 午夜影院免费在线观看| 自拍偷拍国产亚洲| 一级国产黄色片| 精品一区二区三区免费| 久艹视频在线免费观看| 日本黄色精品| 国产精品综合久久久久久| 国产精品天堂蜜av在线播放| 欧美激情乱人伦一区| 成人在线视频成人| 精品国产一区二区在线观看| 波多野结衣不卡| 亚洲永久免费av| 91视频免费在观看| 国产v综合v亚洲欧| 国产三级国产精品国产专区50| 亚洲乱码久久| 国产日产欧美一区二区| 欧美精品系列| 久久精品国产精品青草色艺| 精品中文字幕一区二区三区四区| 日韩av理论片| av手机免费在线观看| 日韩最新av在线| 日韩午夜影院| 日韩一级片在线观看| 又污又黄的网站| 欧美性猛交xxxx乱大交| 五月天丁香激情| 国产精品视频看| 成人性生交大免费看| 成人午夜激情影院| 午夜免费一级片| 日本成人在线电影网| 男女高潮又爽又黄又无遮挡| 国内精品久久久久久久影视麻豆| 中文字幕一区二区三区最新| 国内成人自拍| 久中文字幕一区| 国产成人在线中文字幕| 亚洲最大成人在线| 成人动漫视频在线观看| 国产精品青青在线观看爽香蕉 | 亚洲经典三级| 日本福利视频在线观看| 欧美oldwomenvideos| 日韩中文字幕一区| 国产一区二区三区探花| 鲁片一区二区三区| 欧美三级午夜理伦三级小说| 懂色av一区二区三区在线播放| 国产一区二区三区| 成人免费淫片视频软件| 日本午夜精品久久久久| 国产日韩在线精品av| 久久亚洲国产精品尤物| 国产日韩综合一区二区性色av| 日本成人伦理电影| 国产成人啪精品视频免费网| 欧美91看片特黄aaaa| 青青在线视频一区二区三区| 中老年在线免费视频| 日韩美女在线播放| av免费在线一区| 国产精品视频地址| 亚洲91在线| 91成人在线看| av日韩精品| 精品国产乱码一区二区三区四区| 老牛精品亚洲成av人片| 六十路精品视频| 国产亚洲一区二区三区啪| 日韩一本精品| 国产精品久久久乱弄| 99久re热视频精品98| 一区在线视频| 夫妻免费无码v看片| 久久亚洲国产精品一区二区| 少妇黄色一级片| 久久国产成人午夜av影院| 五月天丁香花婷婷| 成人手机电影网| 波多野结衣办公室33分钟| 国产无人区一区二区三区| 国内毛片毛片毛片毛片毛片| 一区二区三区美女视频| 国产精品一区二区6| 欧美主播一区二区三区| 国产老妇伦国产熟女老妇视频| 日韩精品一区二区三区在线| 天堂av中文在线资源库| 最近日韩中文字幕中文| 精品精品导航| 国产精品久久久久久久久免费| 亚洲青青久久| 好吊妞www.84com只有这里才有精品| 国产成人黄色| 狠狠精品干练久久久无码中文字幕| 尹人成人综合网| 亚洲综合色在线观看| 国产iv一区二区三区| 妺妺窝人体色WWW精品| 亚洲乱码中文字幕| 日批视频免费在线观看| 日韩一区二区三区免费观看| 九色蝌蚪在线| 欧美成人午夜视频| av在线不卡精品| 国产伦精品一区二区三区四区免费 | 视频一区中文字幕国产| 可以看的av网址| 国产精品午夜在线| 日韩激情在线播放| 色网站在线免费观看| 亚洲国产精品va| 欧美日韩xx| 国外成人性视频| 91精品福利观看| 欧美日韩精品免费观看| 欧美成人久久| 污片在线免费看| 久久久99久久| 日韩免费一二三区| 欧美嫩在线观看| 日韩av地址| 欧美激情xxxx| 国产精品久久久久久久久久辛辛 | eeuss影院www在线播放| 欧美激情亚洲视频| 欧美久久久网站| 欧洲av一区| 国产欧美日韩一级| aaaaa黄色片| 亚洲色大成网站www久久九九| 国产精品传媒在线观看| 亚洲精品久久久久久久久久久久久| caopo在线| 成人网中文字幕| 日韩理论电影院| 久草福利视频在线| 国产丝袜欧美中文另类| 国产99久久久| 精品中文视频在线| 182在线视频观看| caoporen国产精品| 欧美精品导航| 韩国三级在线播放| 一区二区三区丝袜| 精品国产黄色片| 久久国产精品久久久久久| 天天综合91| 中文字幕在线亚洲三区| 美女国产一区二区| 手机看片国产日韩| 欧美人与禽zozo性伦| 男人天堂久久久| 国产日产亚洲精品| 91精品国产91久久久久久密臀| 五月天激情播播| 日韩毛片视频在线看| 国产免费不卡av| 欧美久久久精品| 6080成人| 国产女大学生av| www激情久久| 日韩电影在线观看一区二区| 国产一区二区三区在线视频 | 久久在线精品| 日本精品在线观看视频| 欧美三级日韩在线| 久久综合之合合综合久久| 亚洲精品日韩激情在线电影| 欧美日韩影院| 久久午夜夜伦鲁鲁片| 日本韩国欧美一区| 1区2区3区在线观看| 亚洲aⅴ日韩av电影在线观看| 国内成人在线| 无码人妻aⅴ一区二区三区| 91福利精品视频| 欧美jizz18性欧美| 国产精品v欧美精品v日韩| 亚洲尤物在线| 欧美自拍偷拍网| 日韩免费福利电影在线观看| 日本不卡网站| 亚洲精品久久久久久一区二区| 国产在线精品国自产拍免费| 国产在线观看成人| 亚洲欧洲美洲在线综合| 亚洲视频自拍| 性欧美大战久久久久久久| 国产欧美日韩精品一区| 99国产精品久久久久99打野战| 国内外成人免费激情在线视频网站 | 日产精品久久久久| 永久免费精品影视网站| 视频精品一区二区三区| 免费黄色特级片| 亚洲你懂的在线视频| 日本韩国一区| 亚洲在线一区二区| 日韩国产成人精品| 久久综合综合久久| 色yeye香蕉凹凸一区二区av| 国产福利一区二区精品秒拍| 国产高清视频网站| 婷婷一区二区三区| jizzjizz亚洲| 日本在线成人一区二区| 国产91富婆露脸刺激对白| 成人黄色三级视频| 性欧美在线看片a免费观看 | 久在线观看视频| 国产精品福利一区| 黄色视屏网站在线免费观看|