精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek爆火后的新Scaling Law究竟是什么?

原創 精選
人工智能
DeepSeek R1的發布在全球人工智能領域引發了巨大反響。這款由中國初創企業DeepSeek推出的低成本、高性能AI模型,打破了人們對AI研發“高投入、長周期”的固有認知,被西方媒體譽為“人工智能的斯普特尼克時刻”。

出品 | 51CTO技術棧(微信號:blog51cto)

嘉賓 | 周博洋、魏新宇

采訪 | 薛彥澤

撰稿 | 李美涵

DeepSeek R1的發布在全球人工智能領域引發了巨大反響。這款由中國初創企業DeepSeek推出的低成本、高性能AI模型,打破了人們對AI研發“高投入、長周期”的固有認知,被西方媒體譽為“人工智能的斯普特尼克時刻”。

DeepSeek的“奇跡”有目共睹。其應用上線僅20天,日活躍用戶數就突破了2000萬,而ChatGPT達到同樣的日活量則耗時150天之余。不僅如此,DeepSeek的開源路線也廣受好評,R1成功登頂開源平臺“抱抱臉”最受歡迎模型,還以一己之力開啟了一波開源熱潮,影響不僅波及國內模型廠商,還促使OpenAI的Altman也放出了開源計劃。

另一個近期AI圈的熱點,則是千呼萬喚始出來的GPT-4.5。在“大模型撞墻論”甚囂塵上之際,OpenAI官方承認,GPT-4.5的優勢在于規模龐大,盡管模型參數量級擴張,但性能并未達到前沿水平。這迫使我們正視:在AI領域,新的時代已經開始。

為此,AIGC實戰派特別邀請了微軟(中國)有限公司高級架構師周博洋和AI技術專家魏新宇,就DeepSeek出現后值得關注的熱門話題進行了深入討論和解讀。有趣的是,兩位專家達成了一個共識:預訓練時代并未終結,然而,新的Scaling Law已經誕生。

周博洋認為,新的Scaling Law其實是“思考時間”,即模型思考的時間越久,給出的回答質量就越佳。

魏新宇則提出,新Scaling Law的重點在于后訓練的數據質量和獎勵模型的設計。誰能在這些問題上有所突破,誰就找到了模型性能提升的第二曲線。

以下是訪談要點:

?預訓練時代的持續:兩位專家一致認為,預訓練和微調仍然是模型學習知識的標準范式。盡管Scaling曲線不再陡峭,但方法本身仍然有效。

?新的Scaling Law:魏新宇認為,新的Scaling Law將出現在訓練數據和獎勵模型的設計方面。他從獎勵模型最常見的三種設計講起,揭秘了DeepSeek R1的獎勵算法如何為模型打分。

?強化學習與推理能力:周博洋指出,強化學習之所以在出現很久后,才由R1走通了強推理的路徑,是因為此前基礎模型能力的局限性。“沒有CoT的能力,強化就沒有意義,因為強化學習不是直接賦予模型推理能力,而是激發它潛在的推理能力。”

?小模型的強推理能力:魏新宇認為,小模型擁有強推理能力的關鍵在于數據強化和訓練方法的選擇。他以微軟的小模型明星Phi-4為例,給小模型的蒸餾和微調提出了一些建議。

?接入DeepSeek的建議:周博洋提供了清晰可行的建議:如果是為了業務,就選最穩的API;如果是日常使用,就選方便易用的。

?AI應用新場景:魏新宇提到,R1的推理能力為AI應用解鎖了新的場景,在教育、科研領域的潛力更大。推理意味著模型不僅能勝任現有知識的問答,還能對未來趨勢做預測,例如預測票房、股市等。

1.預訓練時代終結了嗎?

薛彥澤: 第一個問題,預訓練時代終結了嗎?

魏新宇: 我的觀點是預訓練并沒有結束,它依然是大模型的基礎。比如最近很火的DeepSeek R1,也是基于V3進行強化學習的。預訓練仍然是通用知識庫的來源,所以仍然是必要的。不過,預訓練會與后續的強化學習結合起來,優化以前大規模消耗算力的預訓練模式。因此不能說預訓練終結,我認為是一種范式的提升。

周博洋: 補充兩句,我覺得預訓練和微調依然是模型學習知識的標準范式。

首先,預訓練和監督微調是模型理解知識本源的關鍵步驟。我們會給模型各種數據,比如互聯網數據、特定領域的數據比如MATH-500等等,目的是讓模型理解語義,繼而懂得Token之間的關聯性。傳統上,預訓練主要是讓模型學會續寫和理解語言的邏輯,而微調則是讓模型生成符合人類習慣和規范的文本。

從GPT-3開始,強化學習被引入,最初是為了讓模型對齊人類價值觀,比如避免偏見、暴力等不良內容。但在訓練的過程中,逐漸發現了強化學習在推理領域的潛力。

至于預訓練是否終結,我覺得現在討論還為時尚早。雖然Scaling的曲線沒有那么陡峭了,大家也從強化學習等其他方向,探索提升能力的路徑。但是預訓練本身仍然有效。

薛彥澤: 那目前Scaling Law的瓶頸怎么突破呢?

周博洋: 還是從兩個維度來看。

第一個維度是算力和模型參數的關系。在固定的算力體系下,模型參數和token數量的關系是關鍵。比如,現在有些模型已經接近Scaling Law的極限,但如果能突破這個限制,比如把70B參數的模型和1.4T的數據放大十倍,就會變成700B參數和14T的數據,這其實已經接近一些現有大模型的規模了。不過,像DeepMind這樣的研究機構可能覺得已經達到算力上限了,但OpenAI的模型成長速度其實還能更快。因為現在更受限于多卡互聯訓練時的通信損耗,比如馬斯克提到的十萬卡訓練,效率低主要是因為通信損耗。所以,未來可能需要在算力優化和通信效率上做更多工作。

第二個維度是數據的獲取和利用。現在很多人認為數據挖掘已經到底了。但我們忽略了99%的數據其實不在集中數據里,而是分散在端側設備上,這些數據可能因為安全問題無法聯網,價值也沒被挖掘,這可能是突破Scaling Law瓶頸的一個方向。

2.后訓練、推理語境下的新Scaling Law究竟是什么?

薛彥澤: 后訓練、推理語境下的新Scaling Law究竟是什么?

周博洋:我覺得后訓練和推理語境下的新Scaling Law其實跟“思考時間”有關。思維鏈的產生和我的偶像Donald Norman有關,他在大學癡迷玩德國撲克,這個游戲就是思考的事件越長,獲勝概率才會更高。這跟Alpha Go有點像,它們會花很長時間思考,最終戰勝人類。人類大腦也有快思考和慢思考,簡單的事情比如約喝咖啡,很快就能決定;但復雜的事情比如討論算法,就需要很多中間步驟和時間。

魏新宇: 我覺得后訓練和推理語境下的新Scaling Law,重點在于后訓練的數據質量和獎勵模型的設計。以前是靠增加模型參數和數據量來提升性能,但現在更多是看怎么優化后訓練階段。

現在強化學習領域,獎勵模型的設計也很重要。相當于給模型的答案打分,判斷是否符合人類標準。獎勵方式大概有三種:1. 直接打分:只看答案是否正確來打分;2. 多步驟打分:結合推理步驟和結果一起打分;3. 全步驟打分:每一步都打分,理論上效果最好,但很復雜,實際很難完全實現。

像DeepSeek的話,獎勵模型還會基于一些規則進行打分,比如推理問題和非推理的問題打分規則各有側重。比如訓練醫學問題時,獎勵模型會根據答案是否正確、正確答案出現的次序位置等因素打分,正確答案越靠前,分數越高。

薛彥澤: OpenAI宣布從GPT-5開始就做基礎模型和推理模型的混合模型了,那么,后訓練會推動模型的架構進行變革嗎?

周博洋: 首先,任何架構的模型都可以做推理。我覺得后訓練可能會推動模型架構的變革,但目前的核心還是提升效率,而不是徹底改變模型的本質。

從模型架構的改進來看,比如DeepSeek V3模型使用的MoE技術,MoE把模型的FFN層或MLP層變大,理論上能讓模型更好地學習語義,從而提升性能。但問題在于,如果模型太大,推理時會面臨顯存占用過高的問題。因為推理時模型的參數是固定的,傳統模型會激活所有神經元,即使有些神經元在推理時并不需要,這就會浪費顯存。

為了解決這個問題,MoE技術在訓練時只激活部分“專家”(即MLP子模塊),而不是全部。這樣可以提高效率,但訓練難度也增加了。比如,Llama 3.1模型被認為是MoE模型,但它的訓練者也承認MoE模型很難訓練充分,因為很難確定哪些專家在推理時真正起作用。

DeepSeek V3模型通過一些函數強制實現負載均衡,確保所有專家都能被訓練到,這樣MoE技術才能真正發揮作用。但目前來看,這些改進的核心還是為了提高效率,而不是徹底改變模型的推理方式。模型的變革可能還在路上,目前的重點是讓現有架構更好地支持推理和后訓練。

3.OpenAl o1、o3模型都免費了DeepSeek R1還有優勢嗎?

薛彥澤: OpenAl o1、o3模型都免費了DeepSeek R1還有優勢嗎?沿著這個思路,我們還想了解兩個開源或者說免費的模型,究竟應該如何比較?DeepSeek的核心優勢在哪里?

魏新宇: 我覺得DeepSeek R1還是有優勢的,即使OpenAI的o1、o3模型免費了。首先,免費模型雖然開源,但不一定能滿足所有定制化需求。比如DeepSeek R1雖然模型較大,有600多B,部署需要近1T顯存,但它的推理能力很強,而且在特定領域,比如金融行業,可以通過蒸餾或微調來優化,讓模型更小、推理速度更快。因為從使用體驗看,R1、o3模型有時候推理一個問題需要長達十幾秒甚至更久,這在生產環境中可能難以接受。

其次,企業對數據安全和合規性有很高要求。DeepSeek R1可以通過特定手段確保模型的回答符合人類價值觀和當地法規,比如在中東國家避免涉及某些敏感話題。而開源模型在這方面可能需要額外的定制和優化。

再者,推理效率和高可用性也是關鍵。DeepSeek R1在推理過程中采用了諸如MLA技術等優化手段,通過低秩聯合壓縮等方式節省顯存,提升推理速度。尤其是蒸餾以后,去做垂域模型,比全量模型更適合大規模商業化部署。

所以,開源或免費模型的優勢在于成本低、易獲取,但DeepSeek R1的核心優勢在于推理效率、定制化能力、數據安全性和高可用性。

薛彥澤:DS的橫空出現,會不會改變國內互聯網的競爭格局?

魏新宇:從技術人員的角度來看,我覺得DeepSeek的出現肯定會對國內模型的競爭格局產生影響,但最終的競爭還是會落到整體生態上。現在國內AI市場競爭很激烈,大家都在推各種模型,但模型之間的能力差距其實并沒有那么大。比如,R1可能比其他模型強一些,但并不是說它比其他模型高出一大截,大家的能力其實都差不多。

關鍵在于,企業有沒有自己固有的客戶流量或生態。比如微信接入DS后,可以基于自己的生態推動應用;百度也可以通過地圖等業務,基于模型做附加值的東西。谷歌和微軟也是一樣,谷歌的Gemini有YouTube和其他工具,微軟有自己的辦公軟件生態,這些都是它們的優勢。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.jxzklqfsx.com/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2018-03-29 10:19:45

2011-02-16 16:13:40

Debian

2020-12-17 17:33:47

MLOps大數據數據

2015-08-26 09:54:19

物聯網

2018-09-10 13:47:21

數據科學統計學決策

2019-05-27 15:30:44

Node.jsJavaScript前端

2015-09-29 09:47:14

2022-06-13 09:51:35

UWB超寬帶無線載波通信技術

2012-05-28 22:49:50

PureView

2011-08-04 13:24:28

IT運維

2025-06-25 14:18:36

LAMLAMsGUI

2020-07-08 08:09:08

邊緣計算邊緣云云平臺

2014-07-28 08:28:38

Windows

2009-07-30 14:43:30

認識BSM

2014-08-07 10:32:02

Windows微軟

2021-08-09 05:19:08

Provider 前端前端代碼

2012-09-17 09:52:20

云計算云存儲公有云

2010-03-19 17:30:18

云計算

2022-10-19 12:23:50

緩存CDN外部緩存

2015-06-04 10:26:50

點贊
收藏

51CTO技術棧公眾號

动漫一区二区| 日本高清视频在线| 欧美激情综合色综合啪啪| 日韩精品一区二区三区视频 | 91丨九色丨蝌蚪| 欧美精品videossex少妇| 久久综合狠狠综合久久综合88| 国产精品看片资源| 欧美成人精品欧美一级| 国产精品欧美三级在线观看| 欧美一区二区三区视频在线| 欧美在线观看www| 成人免费视屏| 久久久久高清精品| 国产精品一区二区三区四区五区| 日日夜夜狠狠操| 欧美成人有码| 中文字幕日韩欧美在线视频| 亚洲色偷偷色噜噜狠狠99网| 日韩伦理一区二区| 欧美性猛交xxxx富婆弯腰| 超级碰在线观看| 国产在线视频你懂得| 成人的网站免费观看| 成人免费观看a| 无码人妻av一区二区三区波多野 | 美国成人xxx| 欧美一级电影网站| 亚洲精品20p| 丝袜美腿一区| 欧美日韩精品国产| 9色porny| 婷婷色在线资源| 亚洲男同1069视频| 在线免费观看成人| 95在线视频| 久久精品无码一区二区三区| 久久波多野结衣| 黄色美女一级片| 国产伦精品一区二区三区免费 | 国产福利视频在线播放| 97天天综合网| 午夜国产精品影院在线观看| 国产精品三级一区二区| 成人欧美在线| 一区二区三区不卡视频| 欧美a级黄色大片| 黄色免费在线网站| 亚洲免费毛片网站| 最新av网址在线观看| 大片免费在线看视频| 最近中文字幕一区二区三区| 咪咪色在线视频| 蜜桃视频在线观看www社区| 国产精品乱码妇女bbbb| 一区二区国产日产| 成人片在线看| 亚洲一二三区不卡| 欧美一级欧美一级| 日本不卡网站| 一本色道久久综合精品竹菊| 国产淫片av片久久久久久| 美女100%一区| 欧美三级欧美一级| 欧美大片久久久| 欧美国产中文高清| 亚洲精品一区在线观看| 天天插天天射天天干| 神马电影久久| 日韩中文字幕第一页| www欧美com| 亚洲一级黄色| 日本91av在线播放| 在线观看免费视频a| 激情久久五月天| 99国产在线观看| 五月天婷婷激情网| 国产拍欧美日韩视频二区| 亚洲色图自拍| 欧美寡妇性猛交xxx免费| 激情av一区二区| 污污的网站18| 成人h动漫免费观看网站| 亚洲精品一区二区久| 国产真人真事毛片视频| 欧美日韩综合| 国产成人短视频| 999久久久久| 97久久久精品综合88久久| 视频一区二区三区在线观看| 亚洲小说区图片| 欧美性xxxxhd| 97超碰免费在线观看| 清纯唯美亚洲经典中文字幕| 这里只有精品视频在线| 精品午夜福利视频| 免费看欧美女人艹b| 91中文精品字幕在线视频| 人妻少妇精品无码专区| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 日韩一级大片在线| 国产麻豆天美果冻无码视频| 婷婷精品进入| 情事1991在线| www.看毛片| 中文字幕不卡三区| 国产九九九九九| 国产精品视频一区视频二区 | 51精品国自产在线| 欧美一区二区三区成人精品| 91精品综合久久久久久久久久久| 69视频在线免费观看| 国产激情久久久久久熟女老人av| 国产亚洲欧美在线| 欧美又粗又长又爽做受| 欧美在线一级| 国产午夜精品视频| 可以免费在线观看的av| 国产成人综合在线播放| 亚洲一卡二卡区| 欧美电影免费观看高清完整| 精品久久人人做人人爰| 亚洲av无一区二区三区| 日本不卡中文字幕| 欧美一区二区三区精美影视| 91av久久| 欧美成人欧美edvon| www日韩在线| 久久精品99国产国产精| 日韩精品一区二区三区色偷偷| 国产一二在线播放| 精品国产区一区| 久久国产精品波多野结衣av| 国产一区二区三区不卡在线观看| 午夜久久资源| 成人免费网站www网站高清| 亚洲男人的天堂网站| 91午夜视频在线观看| av午夜精品一区二区三区| 亚洲色成人www永久在线观看| 久久久久久久久久久久电影| 久久亚洲精品中文字幕冲田杏梨| 伊人免费在线观看高清版| 国产日产精品1区| 另类小说第一页| 成人在线国产| 成人久久久久爱| 秋霞成人影院| 日韩亚洲电影在线| 一区二区三区免费高清视频| 丁香婷婷综合色啪| 人妻无码久久一区二区三区免费 | 亚洲大胆人体视频| 日韩av黄色片| 久久综合99re88久久爱| 久草精品在线播放| av一区二区在线播放| 国产在线观看精品一区二区三区| 麻豆影院在线| 日韩无一区二区| 国产成人精品亚洲男人的天堂| av爱爱亚洲一区| 高清在线观看免费| 不卡在线一区二区| 91免费国产网站| 精品精品导航| 日韩成人在线播放| 国产成人无码专区| 亚洲视频一二三区| youjizz.com日本| 午夜亚洲影视| 在线观看成人av| 中文字幕日韩高清在线| 欧洲美女7788成人免费视频| 成人在线观看免费| 日韩一级片在线观看| 色婷婷av国产精品| 国产精品国产三级国产aⅴ无密码| aaa一级黄色片| 亚洲激情一区| 伊人久久大香线蕉av一区| 亚洲网一区二区三区| 国产999精品视频| 快射av在线播放一区| 日韩成人在线网站| 91麻豆国产视频| 精品欧美一区二区三区| 日韩精品电影一区二区三区| 成人性生交大片免费| www.超碰com| 欧美精品九九| 日韩电影在线播放| 在这里有精品| 国产精品自产拍高潮在线观看| 青青在线视频| 一区二区亚洲精品国产| 国产成人手机在线| 欧美日韩国产乱码电影| 国产五月天婷婷| 国产精品久久久久影院亚瑟 | 亚洲第一福利专区| 91亚洲国产成人精品性色| 日韩大片免费观看| 日韩视频亚洲视频| 免费在线高清av| 日韩免费高清视频| 中文字幕 自拍偷拍| 午夜精品福利视频网站| 国产av无码专区亚洲av毛网站| 久久久蜜臀国产一区二区| 无码人妻精品一区二区三| 看片的网站亚洲| 日本xxxxxxx免费视频| 亚洲精品影视| 337p亚洲精品色噜噜狠狠p| 日韩精品诱惑一区?区三区| 久久久精品动漫| 亚洲一区二区三区免费| 国产日韩精品在线播放| 毛片免费看不卡网站| 97超级碰碰碰久久久| 女人天堂av在线播放| 日韩中文字幕国产| 色综合久久影院| 国产小视频国产精品| 日韩大片b站免费观看直播| 欧美一区午夜视频在线观看| 最近中文字幕免费观看| 在线观看欧美黄色| 亚洲精品男人的天堂| 婷婷综合久久一区二区三区| 毛片aaaaa| 一区二区三区av电影| 国产1区2区3区4区| 亚洲三级视频在线观看| 天天做夜夜爱爱爱| 亚洲色图丝袜美腿| 国产精品白丝喷水在线观看| 中文字幕亚洲在| 看黄色录像一级片| 一区二区中文字幕在线| 日本午夜在线观看| 亚洲精品乱码久久久久久| 精品国产欧美日韩不卡在线观看| 国产精品久久久久7777按摩| 午夜影院黄色片| 国产精品久久免费看| 日本中文在线视频| 夜色激情一区二区| 日韩伦人妻无码| 精品人伦一区二区三区蜜桃网站| 国产香蕉视频在线| 日本道在线观看一区二区| 国产免费www| 欧美日韩不卡一区| av男人天堂网| 精品成人一区二区三区| 色综合视频在线| 亚洲美女动态图120秒| 毛片在线播放网址| 色播久久人人爽人人爽人人片视av| 生活片a∨在线观看| 精品视频9999| 999福利在线视频| 日本三级韩国三级久久| 国产一区二区三区四区五区3d | 秋霞在线一区| 日本不卡二区| 久久综合av| 激情成人开心网| 久久三级福利| 在线观看免费av网址| 国产精品99久久久| 国产乱了高清露脸对白| 国产色91在线| 日韩在线中文字幕视频| 激情亚洲一区二区三区四区| 在线视频精品免费| 欧美一区日本一区韩国一区| 免费看黄色一级视频| 亚洲欧美制服丝袜| 日本免费在线视频| 久久99精品久久久久久琪琪| 在线观看福利电影| 成人国产精品久久久久久亚洲| 影音先锋欧美激情| 日韩av大全| 国产精品大片| 亚洲视频在线a| 国产剧情av麻豆香蕉精品| 久久久久久久无码| 综合av第一页| 欧美激情亚洲综合| 欧美一级精品大片| 韩国中文免费在线视频| 久久99青青精品免费观看| 日韩a**中文字幕| 99久久免费国| 色97色成人| 欧美牲交a欧美牲交aⅴ免费真| 狠狠色狠狠色综合系列| 久久丫精品国产亚洲av不卡| 亚洲欧美视频在线观看视频| www.色国产| 日韩精品最新网址| www黄在线观看| 5252色成人免费视频| 亚洲精品福利| 一区二区三区av| 亚洲欧美日韩国产一区| 黑人无套内谢中国美女| 国产精品二三区| 久操视频在线免费观看| 亚洲成人在线网| 午夜av在线播放| 国产精品视频永久免费播放| 一区二区三区韩国免费中文网站| 国产精品视频网站在线观看| 久久精品国产免费| 成人无码av片在线观看| 精品日本美女福利在线观看| 亚洲男人天堂久久| 久久成年人免费电影| 日韩一区二区三免费高清在线观看| 麻豆一区区三区四区产品精品蜜桃| 欧美福利视频| 老司机av网站| 亚洲免费在线视频一区 二区| 中文字幕在线观看精品| 亚洲乱码一区av黑人高潮| 蜜桃视频动漫在线播放| 国产精品福利视频| 国产主播精品| 中文字幕在线播放一区二区| 1024成人网| 国产偷拍一区二区| 欧美成aaa人片在线观看蜜臀| 999色成人| 少妇熟女一区二区| 国产一区二区电影| 在线看的片片片免费| 欧美精品1区2区3区| 精品孕妇一区二区三区| 成人欧美一区二区三区黑人| 婷婷综合久久| 国产三级精品三级在线| 亚洲蜜臀av乱码久久精品蜜桃| 国产乱码精品一区二区| 成年无码av片在线| 69精品国产久热在线观看| 男女激情免费视频| 99re视频精品| 无码人妻精品一区二区三区不卡| 亚洲欧美中文日韩在线| 日韩av一级| 这里只有精品66| 国产精品影视在线| 国产精品成人av久久| 日韩av在线免费观看一区| 亚洲天堂av影院| 特级西西444www大精品视频| 久久精品国产99| 国产在线观看99| 国产婷婷色综合av蜜臀av| 久久野战av| 咪咪色在线视频| 国产91色综合久久免费分享| 亚洲视频免费播放| 国产一区二区黑人欧美xxxx| japansex久久高清精品| 日韩黄色短视频| 国产亚洲精品7777| 一级aaaa毛片| 久久免费观看视频| 国产日产精品_国产精品毛片| 中文av一区二区三区| 亚洲综合成人在线| 黄色软件在线观看| 成人免费视频网址| 影音先锋日韩资源| 一级二级黄色片| 欧美xxxx在线观看| 新片速递亚洲合集欧美合集| eeuss中文| 久久亚洲综合色| 国产人妻精品一区二区三| 97精品一区二区视频在线观看| 欧洲杯什么时候开赛| 蜜桃视频无码区在线观看| 色老综合老女人久久久| 在线你懂的视频| 日本在线成人一区二区| 国产精品自在在线| aaa在线视频| 九九久久精品一区| 欧美日一区二区| 五月天丁香社区| 69av一区二区三区| 成人片免费看| 真人抽搐一进一出视频|