精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI發布新模型:o1系列模型,更像理科生的模型 精華

發布于 2024-9-14 13:34
瀏覽
0收藏

本來今天準備發一篇金融相關的Agent論文

結果一大早上,各大群就都開始流傳著各種聊天記錄

原來是凌晨OpenAI發布了新的 o1 系列模型(以下簡稱 o1模型或o1),所以迫不及待的找了些資料趕緊學習下。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

看上去,這個 o1 系列模型在數學、編碼、科學等一系列理科生擅長的事情上,表現比GPT4還好。

目前,各大微信群的討論大致分為兩種觀點:

? o1 太牛逼了,GPT5來了,AGI立馬到來!

? o1 這不就是個 Workflow + Agent嗎?

收集了各方的【小道消息】,其實就是是【X】上各種OpenAI發布的消息 + 微信群聊天記錄 + OpenAI官方文檔。

可以總結一下:

? o1模型最大的特點:輸出最終答案前,會進行深入思考,這種思考不是簡單的通過提示工程來注入的,而是通過強化學習實現的

? o1模型的尺寸不會很大,是個小尺寸大模型(證據來自OpenAI研究院 Jason Wei的X,如下圖),但是到底多小?不知道。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

緊接著英偉達科學家 Jim Fan 也發了消息,對 o1 模型做了一些解讀,我們匯總一下要點:

? 模型的大多數參數只是用來記憶事實,而推理核心不需要太多參數。可以從知識中分離出一個小的“推理核心”,這樣可以減少大量的預訓練計算。

? 大量計算由原來的訓練階段,轉移到了服務推理階段。

? o1在實際應用落地的難度遠比學術基準測評要更難,這一塊還有待后續大家進一步探索。

? o1模型也會像之前ChatGPT一樣,形成數據飛輪,催生更多訓練數據和模型的出現。

o1是不是GPT5?

目前,根據各方消息看來,o1并不是部分自媒體吹噓的GPT5。

至少從OpenAI官方文檔中,看不到任何描述能將GPT5和o1模型聯系在一起的。

o1算是strawberry / Q* 項目的一個產出。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

雖然沒有被宣稱為GPT5,但是o1是一個不同于傳統的GPT3.5和GPT4的新范式。在OpenAI的開發者文檔中,我們可以發現,o1模型被單獨列為推理模型(Reasonging Models),這是否意味著之前 Altman 宣稱的將數據與推理引擎分離的構想已經實現,或者已經邁出實質性的一步?

這也與前面英偉達科學家 Jim Fan 提到的觀點相呼應:模型的大多數參數只是用來記憶事實,而推理核心不需要太多參數,可以從知識中分離出一個小的“推理核心”。

o1模型是不是一個Agentic Workflow?

這是今天很多群里充斥的觀點之一,在大家非常興奮的體驗了o1模型后,部分同學,包括一些自媒體也紛紛得出這樣的結論,甚至開始唱衰OpenAI。

比如,有的自媒體開始【大膽】的猜測:這次的草莓o1有可能是 gpt-4o 在進行一些微調/對齊后的 agent。

包括說:

這有沒有可能就是封裝了workflow而已?

在仔細閱讀了各種資料后,我的猜測, o1模型肯定不是 agent,原因如下:

1、o1是經過強化學習的推理模型

在官方文檔中,o1模型被定義為推理模型,而且是經過強化學習訓練的模型,使用了思維鏈進行推理。o1模型的一個顯著區別就是o1模型引入了一個成為推理token的概念,對用戶提出的問題,探索多種生成回答的方法,最后模型以一種被稱為可見token的方式輸出答案。

這種token的設計,也導致了一些與之前的模型的區別,比如:

  • ?實際生成的token數與系統返回的token數存在差異:甚至一個很簡單的問題,也會消耗大量token。比如,當回答一個簡單的提示詞“你好”的時候(雖然個人認為,這樣的提示詞并不是推理模型所擅長的),模型消耗了 400 多個token。PS:在OpenAI的官方文檔中,明確提出大家在使用o1模型的時候要預留窗口空間給推理token。比如下圖,當輸出長度超出了限制時,可見輸出就看不到了。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

?模型耗時增加:因為中間多了一個推理過程(多方式推理,可能通過一種類似MCTS的方法來進行最佳路徑搜索),所以模型輸出會比其他模型消耗更多的時間(如下圖)。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

2、沒有多模態、沒有系統提示詞、沒有工具調用、沒有stream輸出等等

如果o1只是一個Agent應用,那么為什么不把這些系統提示詞、工具調用、stream輸出加上?這些對OpenAI的工程師來說是個難題?咱們國內的組合式創新團隊都能做的事情,OpenAI居然做不了?

3、完全不同的提示詞策略

在OpenAI的官方文檔中,我們可以發現,OpenAI給出了針對推理模型的提示詞建議:

? 由于模型內部已經進行推理,過去的few shot或者zero shot cot(要求模型逐步思考)的提示詞技巧,可能并不會提升性能,反而可能會降低性能。

? 保持提示簡潔明了:模型擅長理解并回應簡短而清晰的指令,無需過多指導。

? 利用分隔符提高清晰度:使用三重引號、XML標簽或小節標題等分隔符,明確區分輸入的不同部分,幫助模型更準確地解讀。

? 在檢索增強生成(RAG)中限制額外上下文:提供額外上下文或文檔時,只包含最相關的信息,以免模型的回應過于復雜。

綜上,o1模型應該并不是一個Agentic Workflow應用,而是一個確確實實的新的模型范式。而且這應該只是OpenAI在這個事情上踏出的第一步(也許我們從代號1就可以看出,重新命名,而不是繼承),而不是最后一步,目前的o1模型也不打算取代GPT4\GPT4-o等模型的地位。

o1模型到底強還是弱?

答案是,o1肯定強,但是也沒有強到無與倫比。

目前流傳的各種體驗,測試結果來看,o1肯定是強的,特別是在需要推理的STEM領域(STEM是Science、Technology、Engineering、Mathematics 四個英文單詞首字母的縮寫)。

各種數據我就不羅列了,應該鋪天蓋地都是。

但是o1仍然是不強的,比如,o1還是無法完全正確回答一些問題,比如大家都在嘗試問他9.11和9.8到底誰大的問題。

這側面說明,即使o1是一個推理引擎,但他始終還是利用語言來模擬自然世界,與規則的方法不一樣。

所以,對于o1模型,我們需要客觀的看待,即使o1模型很強,但是也仍然是有幻覺的。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

當然,有人我們未來可能遇到號稱比 o1 強69倍的GPT-5模型,但是如果范式不變,我想仍然是無法從根本上解決 9.11和9.8 誰大這類問題的。

為什么說o1是一個更像理科生的模型?

不知道大家有沒有關注到,OpenAI的文檔里,花了很大篇幅描述o1模型在STEM和安全方面的評估。

以及,在 Greg Brockman 發的消息里可以看到,OpenAI是認可 o1 模型實際上是使模型從 System1 向 System 2 靠近的動作(之所以說靠近,是因為個人認為System1和System2邊界并不明顯)。

OpenAI發布新模型:o1系列模型,更像理科生的模型-AI.x社區圖片

在之前的論文里我們也討論過,System1和System2的區別在于:

System1:快速,不加思考、不做計算、僅憑直覺就做出判斷。比如,當我們回答1+1這個問題的時候,我們的大腦可以不加思考的回答出等于2。所以系統一的特點是:快思考、熱啟動、直覺判斷。

System2:速度,需要做復雜的計算、推理,但回答準確度高。比如,當我們回答123乘以879的時候,我們無法通過我們的快思考來回答,我們需要調用大腦的計算模塊,對這個問題進行復雜的計算后才能回答。所以系統二的特點是:慢思考、啟動慢、耗費能量高、判斷準確。

而o1則是試圖使用內置的CoT來引導模型生成更加準確的答案,而需要這些嚴格推理邏輯的則是STEM里的這幾門學科。所以我們可以認為,相比過去的大語言模型(真快,這才2年不到,就可以說過去了),o1更加像一個理科生思考。這并不是說o1是理科生,而是說,大語言模型過去更像一個文科生,特別是zero shot的時候,而現在的o1則是在彌補理科生這個短板。

是否要馬上把o1模型用起來?

對于這塊,我的答案是謹慎!

1、模型仍不完善

o1模型并非一個成熟的產品,這點從官方文檔、X上的討論都可以看得出。目前還處于beta狀態,而且各種功能的缺失,比如System Prompt、tool調用、參數設置等等。以及 o1-mini 所涉及的知識、領域仍然比較有限。

2、推理速度限制

雖然o1模型是個新模型,是新一代模型范式,是大家眼中的未來。但是o1模型因為自身設計的原因,會導致比其他模型消耗更長的時間。所以在很多應用中,特別是對時間敏感的應用,需要謹慎考慮:我們的產品、應用能否接受這樣的響應時間?

3、也許更高的成本

因為o1模型在推理過程中,會消耗大量的推理token,很多人稱之為OpenAI的扣費陷阱。當然,o1模型也帶來一個新的優勢,就是我們可以不用傳few shot案例,也許可以減少一些token的輸入,但是這一增一減,到底是增加了成本還是降低了成本,目前還不是特別明朗,推薦大家多多測試后,再做定論。

4、新的提示詞結構

o1模型因為設計的原因,帶來了一些新的提示詞范式,過去的提示詞在 o1模型上不一定適用了。

比如過去的 few shot 或者 COT 提示詞,根據官方建議,這些技巧不僅不能帶來收益,還會降低效果。


所以,綜上,是否要使用o1模型來替換我們現有應用的模型,我們需要謹慎對待,需要做充分的測試評估。這與過去的模型參數增加不一樣,這次是一個范式的變化。

雖然有這么多不利因素,但是有利因素也是顯而易見:推理能力增強了,過去做不到、或者無法實現的應用,也許會成為可能

會有新的一輪大模型風潮嗎?

過去,ChatGPT的出現,隨之而來的是合成數據帶來了一大批新的模型出現。那么這次,還會是這樣嗎?

不敢做非常確定性的答復,但是我想這次可能有點不一樣。

這次帶來的合成數據不會那么容易,按照OpenAI官方文檔,推理token是不可見的,所以至少推理token大家應該是拿不到的。那么,后續的合成數據訓練新模型這條路看上去被堵死了。

但是,事情也不是絕對的。一件事情最難的部分往往是“證明這件事可行”,所以OpenAI證明了這個路徑是可行的,也讓大家關注到了這個新的路徑,即使沒有合成數據的幫助,但是也會有其他辦法來貢獻這些數據。期待開源社區進一步的表現。

本文轉載自??大語言模型論文跟蹤??,作者: HuggingAGI ????

收藏
回復
舉報
回復
相關推薦
日欧美一区二区| 国产主播性色av福利精品一区| 久久午夜色播影院免费高清| 国产精品aaaa| www日韩在线| 美女av一区| 精品视频在线免费看| 欧美另类videosbestsex日本| 午夜一区在线观看| 捆绑调教美女网站视频一区| 欧美成人午夜视频| 88久久精品无码一区二区毛片| 国产69精品久久久久按摩| 一区二区高清免费观看影视大全| 欧美日本韩国在线| 99久久精品免费看国产交换| 先锋影音久久久| 欧美久久精品午夜青青大伊人| 亚洲色图14p| 欧美日本三级| 欧美午夜理伦三级在线观看| 韩日视频在线观看| 国产区在线看| 久久精品视频网| 国产精品久久精品视| 97精品人妻一区二区三区香蕉| 亚洲精品激情| 欧美日本亚洲视频| 少妇高潮一区二区三区喷水| 中文字幕精品影院| 欧美精品一区二区三区高清aⅴ| 8x8x最新地址| 色成人免费网站| 精品国产老师黑色丝袜高跟鞋| 国产精品夜夜夜爽张柏芝| 国产综合在线观看| 91在线免费视频观看| 国产精品9999久久久久仙踪林| 一级淫片免费看| 免费观看在线色综合| 欧美野外猛男的大粗鳮| 日韩av一区二区在线播放| 综合久久久久| 大胆欧美人体视频| 成人自拍小视频| 国产精品毛片久久| 久久精品色欧美aⅴ一区二区| 日本一二三不卡视频| 精品国产一区二区三区av片| 精品亚洲永久免费精品| 国产精品一区二区入口九绯色| 国产精品成人自拍| 亚洲国产三级网| 日韩aaaaa| 亚洲欧洲色图| 亚洲网站视频福利| 免费国产黄色片| 精品国产一区二区三区四区| 日韩精品福利网站| 在线观看日韩精品视频| 欧美久久精品| 精品亚洲va在线va天堂资源站| 国产女人18毛片水真多18| aaa国产精品| 亚洲国产成人爱av在线播放| 国产免费一区二区三区最新6| 国产主播性色av福利精品一区| 精品久久久久久综合日本欧美| 91porn在线| 加勒比视频一区| 日韩精品www| 快灬快灬一下爽蜜桃在线观看| 日韩成人影院| 欧美成人精品一区二区三区| 美女毛片在线观看| 免费视频久久| 国产久一一精品| 国产又粗又猛视频| 国产激情一区二区三区桃花岛亚洲| 古典武侠综合av第一页| 性生交大片免费看女人按摩| 成人动漫中文字幕| 日韩福利一区二区三区| 黄色网页在线看| 午夜一区二区三区视频| 成人在线免费播放视频| 久久人体av| 精品噜噜噜噜久久久久久久久试看| 99久久免费看精品国产一区| 国产精品一国产精品| 久久精品久久久久| av中文在线播放| 麻豆成人av在线| 国产精品久久久久久久免费大片 | 美女视频久久| 丝袜美腿美女被狂躁在线观看| 日韩毛片一二三区| 欧美精品久久久久久久免费| 69堂精品视频在线播放| 欧美一级生活片| 黄色aaa视频| 综合久久婷婷| 国产精品入口免费视频一| 性网爆门事件集合av| 久久精品网站免费观看| 人妻激情另类乱人伦人妻| 日韩av免费| 亚洲成人精品久久久| 刘亦菲国产毛片bd| 国产日韩欧美高清免费| 国产免费一区视频观看免费| 欧美 日韩 中文字幕| 中文字幕亚洲欧美在线不卡| 国产精品久久久久7777| 亚洲人成网站在线在线观看| 日韩激情第一页| 久久精品国产亚洲av高清色欲 | wwwxxxx在线观看| 精品精品99| 97欧美精品一区二区三区| 国产精品欧美久久久久天天影视| 97久久久精品综合88久久| 成人性做爰片免费视频| 欧美日韩女优| 亚洲免费视频观看| 国产成人啪精品午夜在线观看| 精品一区二区三区免费| 日韩高清三级| 性欧美超级视频| 日韩成人黄色av| 久久久久国产精品夜夜夜夜夜| 免费看欧美美女黄的网站| 欧美黑人3p| 男人av在线播放| 亚洲第一区中文字幕| 久草资源在线视频| 国产麻豆午夜三级精品| 综合久久国产| 免费在线成人激情电影| 国产午夜精品全部视频在线播放| 国产日产精品一区二区三区| 成人av网址在线观看| 国产小视频免费| 亚洲一区网址| 国内成人精品一区| 免费看黄色一级视频| 一区二区三区在线视频播放| 日本中文字幕在线不卡| 亚洲女同一区| 91精品国产一区二区三区动漫| 久热国产在线| 欧美xfplay| 不卡的免费av| 91在线观看免费视频| www.中文字幕在线| 欧美日韩播放| 国产精品午夜视频| 日本美女高清在线观看免费| 欧美人体做爰大胆视频| 老熟妻内射精品一区| 国产真实乱偷精品视频免| 亚洲小视频在线播放| 日韩成人久久| 97免费视频在线| 福利片在线看| 91精品国产色综合久久| 久久久久久国产精品视频| 成人妖精视频yjsp地址| 欧美精品一区免费| 欧美**vk| 成人黄色大片在线免费观看| www.久久ai| 亚洲国产精品电影| 日韩三级一区二区| 中文字幕一区二区三区在线播放| 性色av浪潮av| 在线综合欧美| 亚洲开发第一视频在线播放| 国产精久久一区二区| 97视频在线观看播放| 国产在线资源| 91精品国产福利在线观看 | 亚洲国产高清一区| 日本一区二区三区视频免费看| 日本h片久久| 欧美华人在线视频| 国产尤物视频在线| 欧美一区二区三区思思人| 日韩女优在线观看| 国产精品美女久久久久aⅴ| 潘金莲一级淫片aaaaaaa| 国产亚洲欧洲| 欧美另类videos| 色综合综合网| 成人在线看片| 免费高清视频在线一区| 欧美夫妻性视频| 九色国产在线观看| 精品日韩99亚洲| 国产精品xxxxxx| 亚洲第一搞黄网站| 天天爽天天爽天天爽| www.亚洲色图| 日本中文字幕在线不卡| 美女黄网久久| 欧美在线观看黄| 成人影院天天5g天天爽无毒影院| www.成人av| 久久久久黄色| 国产成人免费av| 国产乱码在线| 久久精品男人天堂| www.久久热.com| 日韩成人在线播放| av小说天堂网| 欧美日韩成人激情| 久久久黄色大片| 亚洲成人av电影| 欧美成人精品一区二区免费看片| 久久久久国色av免费看影院| 日韩综合第一页| 国产最新精品免费| www.涩涩涩| 天堂一区二区在线| 777777av| 欧美久久综合| 在线观看18视频网站| 北条麻妃国产九九九精品小说| 精品欧美一区二区久久久伦| 日韩欧美久久| 不卡一卡2卡3卡4卡精品在| 亚洲91在线| 国产精品视频yy9099| 日韩免费福利视频| 欧美综合国产精品久久丁香| av蜜臀在线| 欧美精品激情视频| 牛牛电影国产一区二区| 色综合男人天堂| 日本片在线看| 欧美黑人巨大精品一区二区| 成年人黄视频在线观看| 久久五月天色综合| av电影免费在线观看| 久久亚洲国产精品| 黄色网址在线免费播放| 久久国产加勒比精品无码| 国产成人在线视频免费观看| 成年无码av片在线| 在线视频观看国产| 欧美激情精品久久久久久| 欧美亚洲系列| 久久久久久网址| 精精国产xxxx视频在线野外| 97香蕉超级碰碰久久免费的优势| www555久久| 欧美在线观看一区二区三区| 免费h在线看| 日韩av电影在线网| 秋霞国产精品| 成人免费在线视频网站| 国产精品麻豆| 国新精品乱码一区二区三区18| 国偷自产av一区二区三区| 精品一卡二卡三卡四卡日本乱码 | 成人黄色在线网站| 亚洲调教欧美在线| 欧美激情在线看| 永久免费看片视频教学| 一区二区欧美国产| 久久午夜免费视频| 欧美亚洲自拍偷拍| 国产精品人人爽| 精品国产乱码久久久久久蜜臀| 五月婷婷丁香网| 一区二区成人av| www.久久ai| 日韩美女在线播放| 91麻豆精品国产综合久久久| 51精品国产人成在线观看| 六月丁香久久丫| 日韩欧美一区二区视频在线播放| 久久久精品久久久久久96| 国产精品国产对白熟妇| 欧美a一区二区| 国产调教打屁股xxxx网站| 91蝌蚪porny| 青青操在线视频观看| 午夜精品视频一区| 国产精品一区二区av白丝下载 | 国产精品久久久一区二区三区| 欧美性生活一级片| 亚洲一区在线免费| 亚洲精选一区| 91丨九色丨蝌蚪| 97se狠狠狠综合亚洲狠狠| 国产精品免费在线视频| 午夜电影久久久| 国产精品特级毛片一区二区三区| 亚洲成人av中文字幕| a中文在线播放| 国内外成人免费激情在线视频网站 | 日批视频在线看| 91美女片黄在线观看| 国产成人自拍网站| 在线观看日韩av先锋影音电影院| 99热在线只有精品| 一区二区三区视频免费在线观看 | 日本一本a高清免费不卡| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 欧美一区二区在线视频| 嫩草研究院在线观看| 九九热这里只有在线精品视| 99只有精品| 免费看成人片| 在线 亚洲欧美在线综合一区| 天堂一区在线观看| 久久一夜天堂av一区二区三区| 91嫩草丨国产丨精品| 欧洲av在线精品| 天天摸天天干天天操| 欧美日韩成人在线播放| 巨大黑人极品videos精品| 欧美最大成人综合网| 亚洲麻豆一区| 黄页网站在线看| 亚洲欧洲国产专区| 中文字幕资源网| 国产亚洲成av人片在线观看桃| 1024在线看片你懂得| 999视频在线免费观看| 亚洲v在线看| 欧美激情第一区| 亚洲丝袜自拍清纯另类| 在线观看免费黄色小视频| 亚洲欧美在线x视频| 日本黄色免费在线| 久久国产手机看片| 日韩亚洲在线| 538国产视频| 激情成人在线视频| 神马电影在线观看| 欧美亚洲成人网| 综合综合综合综合综合网| 天堂…中文在线最新版在线| 成人精品免费看| 国产精品99精品| 亚洲精品456在线播放狼人| 第四色日韩影片| 国产综合18久久久久久| 国产精品日本| 我和岳m愉情xxxⅹ视频| 色综合天天综合| 国产www.大片在线| 国产精品亚洲第一区| 99久久精品费精品国产| 欧美成人乱码一二三四区免费| 国产精品短视频| 国内精品偷拍视频| 午夜精品理论片| 性欧美lx╳lx╳| 丁香婷婷激情网| 亚洲视频1区2区| 高潮毛片7777777毛片| 97国产在线观看| 精品av一区二区| 一区二区在线免费看| 亚洲九九爱视频| 天堂av手机版| 国产精品第一视频| 久久中文字幕二区| 亚洲三级在线视频| 精品久久中文字幕久久av| 国产高清在线| 亚洲专区在线视频| 国产亚洲欧洲| 欧美福利在线视频| 日韩视频在线一区二区| 中文不卡1区2区3区| 午夜视频久久久| 国产精品一级黄| 一级成人黄色片| 久久久99免费视频| 欧洲亚洲成人| 五月天开心婷婷| 午夜精品久久一牛影视| av在线电影播放| 国产精品裸体一区二区三区| 久久国产精品久久久久久电车| 久久噜噜色综合一区二区| 亚洲精品98久久久久久中文字幕| 日韩av一级| 黄色国产一级视频| 国产精品狼人久久影院观看方式| 精品国自产拍在线观看| 欧美在线视频一二三| 亚洲精品中文字幕乱码| 欧美丰满少妇人妻精品| 678五月天丁香亚洲综合网| 免费成人在线电影|