精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI o1要跟,怎么跟?這個GitHub項目把解讀、博客、相關論文一網打盡

人工智能 新聞
優秀的 GitHub 項目啊!有關 OpenAI ο1 的一切都在這里

在 AI 領域,OpenAI 已經成了指路明燈一般的存在。隨著 o1 模型的發布,全世界的 AI 工程師都開始了新一輪的學習。

為了幫助大家盡快抓住重點,機器之心一直在跟進報道相關的解讀,包括:

  • 北大對齊團隊獨家解讀:OpenAI o1 開啟「后訓練」時代強化學習新范式
  • 張俊林:OpenAI o1 的價值意義及強化學習的 Scaling Law

同時,我們也發現了其他一些有用的資源,比如在一個 Github 項目中,有人匯總了最近的高質量技術解讀博客以及「可能」與 o1 技術路線相關的論文。相關資源列表會一直更新,

圖片


  • 項目鏈接:https://github.com/hijkzzz/Awesome-LLM-Strawberry

這些博客、論文有些是大家都讀過的,還有些可能被淹沒在平時的眾多資源中。或許從中大家可以找到復現 OpenAI o1 的有效方法。

博客

  • 博客 1:Learning to Reason with LLMs
  • 作者:OpenAI
  • 鏈接:https://openai.com/index/learning-to-reason-with-llms/

博客概述:這篇博客簡單介紹了 OpenAI o1 模型的訓練方法,比如思維鏈的采用、模型安全性的提升等。

  • 博客 2:OpenAI o1-mini
  • 作者:OpenAI
  • 鏈接:https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

博客概述:這篇博客介紹了 OpenAI o1-mini 模型的概況。

  • 博客 3:Finding GPT-4’s mistakes with GPT-4
  • 作者:OpenAI
  • 鏈接:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

博客概述:這篇博客介紹了 CriticGPT——OpenAI 基于 GPT-4 訓練的一個專門給 ChatGPT 挑毛病的新模型。它通過精準地分析 ChatGPT 的回答并提出建設性的批評,幫助人類訓練師更準確地評估模型生成的代碼,并識別其中的錯誤或潛在問題。據介紹,在 CriticGPT 的輔助下,人們審查 ChatGPT 代碼的準確率提高了 60%。研究人員還發現,CriticGPT 在很多情況下比人類專家更擅長發現錯誤,它們甚至能在一些被認為是「完美無缺」的任務中找出問題,盡管這些任務大多數并不是代碼任務,對 CriticGPT 來說有點超綱。

由于該研究發表時,Jan Leike 等 OpenAI 超級對齊團隊成員已經離職,因此也被稱為對齊團隊「遺作」。

  • 博客 4:Summary of what we have learned during AMA hour with the OpenAI o1 team
  • 作者:Tibor Blaho
  • 鏈接:https://twitter-thread.com/t/1834686946846597281
  • 推文鏈接:https://x.com/btibor91/status/1834686946846597281

博客概述:最近,OpenAI o1 團隊開展了一次答疑活動,這個帖子總結了答疑的概要,包括模型命名和推理范式,o1 模型的尺寸和性能,輸入 token 上下文和模型能力,工具、功能和即將推出的特性,CoT 推理,API 和使用限制,定價、微調與擴展,模型開發和研究見解,提示技術和最佳實踐等幾個模塊。每個模塊的總結都比較簡短,感興趣的讀者可以參見原文。

圖片

  • 博客 5:OpenAI’s Strawberry, LM self-talk, inference scaling laws, and spending more on inference
  • 作者:Nathan Lambert(Allen AI 研究科學家)
  • 鏈接:https://www.interconnects.ai/p/openai-strawberry-and-inference-scaling-laws

博客概述:在文章中,作者討論了 OpenAI 的新方法「Strawberry」及推理 scaling law,強調了推理計算的投入對 AI 能力提升的重要性。作者指出,擴大推理計算比單純擴大模型規模更有效,類似 AlphaGo 的推理技術能夠顯著提升模型表現。文章呼吁未來 AI 開發要更多關注推理技術。 

這篇博客發布于 9 月初,當時 OpenAI 還沒有發布 o1 模型,因此現在看起來非常有前瞻性。

  • 博客 6:Reverse engineering OpenAI’s o1
  • 作者:Nathan Lambert(Allen AI 研究科學家)
  • 鏈接:https://www.interconnects.ai/p/reverse-engineering-openai-o1

博客概述:這篇博客系統討論了 OpenAI o1。o1 通過訓練新模型處理長推理鏈,并使用大量強化學習來實現。與自回歸語言模型不同,o1 在線為用戶搜索答案,展示了新的 scaling law—— 推理 scaling law。博客還討論了 o1 的一些技術細節,包括其如何使用強化學習進行訓練,以及它在推理時的高成本。此外,博客還探討了 o1 對未來 AI 領域的影響,包括它如何改變 AI 產品的部署堆棧和期望,以及它如何作為一個模型,通過不同的生成策略來實現復雜的任務。最后,博客提出了一些關于 o1 結構和功能的問題,并討論了在開源領域復制這種系統所面臨的挑戰。作者還對 AI 未來的發展方向表示了期待,認為 AI 的進步將繼續獎勵那些敢于想象不可能很快變為可能的人。

圖片

論文

OpenAI o1 貢獻者參與撰寫的論文

  • 論文 1:Training Verifiers to Solve Math Word Problems
  • 機構:OpenAI
  • 作者:Karl Cobbe, Vineet Kosaraju, Mohammad Bavarian, Mark Chen, Heewoo Jun, Lukasz Kaiser, Matthias Plappert, Jerry Tworek, Jacob Hilton, Reiichiro Nakano, Christopher Hesse, John Schulman
  • 鏈接:https://arxiv.org/abs/2110.14168

論文概述:這篇論文發布于 2021 年 10 月。論文指出,盡管最先進的語言模型在很多任務上表現優異,但在處理多步驟數學推理時仍有困難。為了解決這個問題,作者創建了 GSM8K 數據集,包含 8500 個多樣化的小學數學問題。研究發現,即使是大型 Transformer 模型也難以在這些任務上取得好成績。為了提高性能,作者建議訓練驗證器來評估模型答案的正確性。通過在測試時生成多個答案并選擇驗證器評分最高的答案,這種方法顯著提升了模型在 GSM8K 上的表現,并證明了這種方法比傳統的微調方法更有效。

  • 論文 2:Generative Language Modeling for Automated Theorem Proving
  • 機構:OpenAI
  • 作者:Stanislas Polu, Ilya Sutskever
  • 鏈接:https://arxiv.org/abs/2009.03393

論文概述:這篇論文發布于 2020 年 9 月,Ilya Sutskever 是作者之一。論文探討了基于 Transformer 的語言模型在自動定理證明中的應用。研究的動機是,自動定理證明器與人類相比的一個主要限制 —— 生成原創的數學術語 —— 可能可以通過語言模型的生成來解決。作者介紹了一個名為 GPT-f 的自動證明器和證明助手,用于 Metamath 形式化語言,并分析了其性能。GPT-f 發現了被 Metamath 主要庫接受的新短證明,據作者所知,這是基于深度學習系統首次為形式數學社區貢獻并被采納的證明。

  • 論文 3:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
  • 機構:谷歌大腦
  • 作者:Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed Chi, Quoc Le, Denny Zhou
  • 鏈接:https://arxiv.org/abs/2201.11903

論文概述:這篇論文發布于 2022 年 1 月。論文探討了如何通過生成一系列中間推理步驟(即「思維鏈」)來顯著提高大型語言模型進行復雜推理的能力。具體來說,作者提出了思維鏈提示的方法,即在提示中提供幾個思維鏈的示例,以此來引導模型進行更深入的推理。實驗表明,這種方法在三個大型語言模型上提高了算術、常識和符號推理任務的性能。

  • 論文 4:Let's Verify Step by Step
  • 機構:OpenAI
  • 作者:Hunter Lightman, Vineet Kosaraju, Yura Burda, Harri Edwards, Bowen Baker, Teddy Lee, Jan Leike, John Schulman, Ilya Sutskever, Karl Cobbe
  • 鏈接:https://arxiv.org/abs/2305.20050

論文概述:這篇論文發布于 2023 年 5 月。論文探討了大型語言模型在復雜多步推理任務中的表現及其可靠性問題。作者比較了兩種訓練方法:結果監督(outcome supervision)和過程監督(process supervision),前者僅對最終結果提供反饋,后者則對每個推理步驟提供反饋。研究發現,過程監督在訓練模型解決 MATH 數據集中的問題時,顯著優于結果監督。具體來說,采用過程監督的模型在 MATH 測試集的一個代表性子集中解決問題的成功率為 78%。此外,論文還展示了主動學習(active learning)在提高過程監督效率方面的重要性。為了支持相關研究,作者還發布了 PRM800K 數據集,這是一個包含 800,000 個步驟級人類反饋標簽的完整數據集,用于訓練他們的最佳獎勵模型。

由于包括 Ilya 在內的多位 o1 核心貢獻者都參與了這篇論文,有人猜測這是 o1 模型訓練的方法論。

圖片

  • 論文 5:LLM Critics Help Catch LLM Bugs
  • 機構:OpenAI
  • 作者:Nat McAleese, Rai Michael Pokorny, Juan Felipe Ceron Uribe, Evgenia Nitishinskaya, Maja Trebacz, Jan Leike
  • 鏈接:https://arxiv.org/abs/2407.00215

論文概述:這篇論文發布于 2024 年 6 月。論文介紹了一種通過訓練「批評者」模型(即前面提到的 CriticGPT )來提高人類評估機器學習模型輸出的方法。這些批評者模型是大型語言模型,它們被訓練來提供自然語言反饋,指出代碼中的問題。研究表明,這些模型在識別代碼錯誤方面比人類更有效,甚至能夠發現人類審查者未發現的錯誤。盡管存在局限性,如可能產生誤導的幻覺錯誤,但結合人類和機器的團隊可以減少這種誤導,同時保持錯誤檢測的效率。

  • 論文 6:Self-critiquing models for assisting human evaluators
  • 機構:OpenAI
  • 作者:William Saunders, Catherine Yeh, Jeff Wu, Steven Bills, Long Ouyang, Jonathan Ward, Jan Leike
  • 鏈接:https://arxiv.org/pdf/2206.05802

論文概述:這篇論文發布于 2022 年 6 月。論文研究了如何通過微調大型語言模型,使用行為克隆來生成自然語言的批評性評論,以幫助人類發現摘要中的缺陷。實驗表明,這些模型生成的評論能夠揭示人類和機器生成摘要中的問題,包括故意誤導的錯誤。研究發現,更大的模型在撰寫有幫助的評論和自我批評方面表現更好,并且能夠利用自我批評來改進自己的摘要。論文還提出了一個比較批評能力、生成能力和辨別能力的框架,并指出即使是大型模型也可能有未表達的知識。這項研究為使用人工智能輔助的人類反饋來監督機器學習系統提供了概念驗證,并公開了訓練數據集和實驗樣本。

其他論文

除了以上論文,作者還按照年份列出了一些可能與 OpenAI o1 相關的論文,列表如下:

2024 年:

圖片

圖片

2023 年:

圖片

2022 年:

圖片

2021 年:

圖片

2017 年:

圖片

更多信息請參見原 GitHub 庫。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-26 00:25:52

Rust語法生命周期

2023-04-06 09:08:41

BPM流程引擎

2021-08-05 06:54:05

流程控制default

2024-02-27 10:11:36

前端CSS@規則

2019-12-11 13:42:19

開源技術 軟件

2021-10-11 07:55:42

瀏覽器語法Webpack

2011-12-02 09:22:23

網絡管理NetQos

2010-08-25 01:59:00

2013-08-02 10:52:10

Android UI控件

2024-08-26 10:01:50

2024-04-07 08:41:34

2024-06-12 00:00:05

2013-10-16 14:18:02

工具圖像處理

2020-05-27 14:58:04

Python Java編程語言

2023-09-26 00:29:40

CSS布局標簽

2020-10-19 06:43:53

Redis腳本原子

2009-04-02 10:17:00

交換機產品選購

2023-04-03 08:30:54

項目源碼操作流程

2024-02-23 08:14:01

項目開發Spring

2021-05-20 11:17:49

加密貨幣區塊鏈印度
點贊
收藏

51CTO技術棧公眾號

9i看片成人免费看片| 喷水视频在线观看| 中文字幕中文字幕在线十八区| 国产一二精品视频| 97人洗澡人人免费公开视频碰碰碰| 黄色在线观看av| 一区二区三区无毛| 亚洲成人tv网| 色综合视频二区偷拍在线| 国产一区二区在线视频聊天 | 亚洲成人久久网| 北条麻妃在线观看| a视频在线观看免费| 久久只精品国产| 成人在线观看视频网站| 欧美特黄aaaaaa| 91精品久久久久久久久久不卡| 亚洲精品国产电影| 超碰中文字幕在线观看| 成人福利av| 亚洲在线视频免费观看| 视频一区二区三区免费观看| 黄色片一区二区三区| 欧美aaaaa成人免费观看视频| 久久久久久久网站| 国产又色又爽又高潮免费| 日韩免费电影在线观看| 日韩精品一区二区三区视频在线观看 | 欧美亚洲三级| 欧美激情免费视频| 国产又色又爽又高潮免费| 啄木系列成人av电影| 欧美精品一区二区久久久| 小明看看成人免费视频| 欧洲一区二区三区精品| 午夜精品久久久久久久蜜桃app| 正在播放精油久久| 国产爆初菊在线观看免费视频网站 | 在线看片欧美| 久久91精品国产91久久久| 亚洲一区电影在线观看| 成人在线视频免费观看| 亚洲欧洲黄色网| 亚洲第一黄色网址| 国产福利一区二区精品秒拍| 欧美一区二区三区的| 17c国产在线| 欧美视频第一| 欧美日本国产视频| 亚洲老女人av| 欧美系列精品| 欧美精品tushy高清| 邪恶网站在线观看| 成人全视频免费观看在线看| 欧美又粗又大又爽| 国产 porn| 国产精品天堂蜜av在线播放| 欧美性色aⅴ视频一区日韩精品| 国产偷人视频免费| 日韩不卡免费高清视频| 色爱区综合激月婷婷| 麻豆传传媒久久久爱| 日本成人片在线| 欧美日韩在线免费视频| 三上悠亚在线一区| crdy在线观看欧美| 欧美一区二区在线播放| 欧美熟妇精品一区二区| 成人激情自拍| 日韩精品极品在线观看播放免费视频| 一区二区视频观看| 国产欧美日韩| 色吧影院999| 91视频综合网| 99精品国产福利在线观看免费| 97婷婷涩涩精品一区| 天堂а√在线中文在线新版 | 国产精品入口夜色视频大尺度| 中文字幕777| 国产美女精品在线| 国产精品一码二码三码在线| 天堂影院在线| 国产精品久久看| 日韩在线视频在线| 热色播在线视频| 欧美日韩精品一区二区天天拍小说| 亚洲精品国产一区二区三区| av成人综合| 国产一区二区激情| 波多野结衣在线网址| 亚洲精品美女91| 国产精品国内视频| www.污视频| 国产日韩欧美一区二区三区综合| 最新精品视频| 在线观看特色大片免费视频| 欧美精品色综合| 国产二级一片内射视频播放| 日韩欧美精品综合| 久久人91精品久久久久久不卡 | 日韩一区二区免费电影| 久久午夜夜伦鲁鲁片| 国产韩日影视精品| 51精品在线观看| 国产精品视频a| 91色porny蝌蚪| 7777在线视频| 久久人体大尺度| 日韩欧美国产1| 久久精品三级视频| 亚洲精选在线| 91国产在线播放| lutube成人福利在线观看| 亚洲午夜视频在线观看| www.精品在线| 亚洲欧洲美洲国产香蕉| 欧美成人在线网站| 中文字幕在线播放av| 99re在线精品| 欧洲精品在线播放| 爱情电影网av一区二区| 一区二区亚洲欧洲国产日韩| 久热这里只有精品6| 国产高清不卡二三区| 亚洲精品中字| 欧美大电影免费观看| 亚洲缚视频在线观看| 久久成人国产精品入口| 久久国产乱子精品免费女| 久久久久久99| heyzo中文字幕在线| 欧美一卡在线观看| 成年人网站在线观看视频| 日韩精品亚洲一区二区三区免费| 精品视频第一区| www在线看| 欧美成人一区二区三区| 国产尤物在线播放| 蜜臀av国产精品久久久久 | 亚洲va在线| 国产精品综合网站| 国产视频精选在线| 色综合天天综合网天天看片| 久久午夜夜伦鲁鲁片| 亚洲深爱激情| 久久久www免费人成黑人精品| brazzers在线观看| 精品久久久久一区二区国产| 久久婷婷国产麻豆91| 国产一区二区在线观看免费| 一区二区三区欧美在线| 日韩免费大片| 久久影院资源网| 国产视频在线免费观看| 亚洲精品v日韩精品| 日本成人xxx| 国产一区久久| 国产一区二区三区无遮挡| 黄色小说在线播放| 亚洲黄页网在线观看| 国产91精品一区| 久久综合色婷婷| 日本精品久久久久中文字幕| 不卡日本视频| 91久久久久久久久久久久久| 五月花成人网| 日韩电影中文字幕| 在线观看国产区| 亚洲天天做日日做天天谢日日欢| 三级黄色片免费看| 极品av少妇一区二区| 精品一区在线播放| 日韩网站中文字幕| 久久精品人人爽| 蜜桃av中文字幕| 一本大道av伊人久久综合| 亚洲最大成人综合网| 精品一区二区三区不卡| 国产情侣第一页| 亚洲美女15p| 成人精品网站在线观看| 538视频在线| 亚洲性xxxx| 精品国产区一区二| 色悠悠亚洲一区二区| 三级黄色在线观看| 成人精品在线视频观看| jizz欧美激情18| 91成人精品| 免费99视频| 超碰国产精品一区二页| 97香蕉久久超级碰碰高清版| 99免在线观看免费视频高清| 日韩欧美国产电影| 亚洲婷婷久久综合| 亚洲一二三四区| 欧美三级视频网站| 成人免费观看男女羞羞视频| 日本在线一二三区| 最新日韩在线| 致1999电视剧免费观看策驰影院| 久久久久97| 91色中文字幕| 免费成人动漫| 欧美激情网站在线观看| av播放在线| 亚洲精品国产电影| 精品国产九九九| 欧美视频一区二区| 五月婷婷中文字幕| 一区二区在线观看免费| 99久久99久久精品免费看小说.| 成人国产精品视频| theporn国产精品| 日韩在线播放一区二区| 日韩中文字幕在线视频观看 | 国内性生活视频| 国产精品大片| 18视频在线观看娇喘| 欧美日韩水蜜桃| 久久国产精品 国产精品| 日本免费精品| 91久久精品在线| 欧美成人三级| 国产精品久久在线观看| 欧美黄色网页| 26uuu国产精品视频| 国产乱码在线| 欧美夫妻性视频| 自由的xxxx在线视频| 久久视频这里只有精品| 在线视频自拍| 少妇高潮久久久久久潘金莲| 久蕉依人在线视频| 亚洲欧美中文字幕在线一区| 日本亚洲欧美| 精品视频久久久久久久| 无码精品在线观看| 亚洲成人黄色在线| 蜜桃在线一区二区| 亚洲国产精品视频在线观看 | 在线成人中文字幕| 久蕉在线视频| 伊人av综合网| 98在线视频| 有码中文亚洲精品| 浮生影视网在线观看免费| 亚洲精品一区在线观看香蕉| 在线观看xxx| 精品夜色国产国偷在线| 天堂在线中文字幕| 亚洲视频视频在线| eeuss影院www在线播放| 在线视频欧美日韩| 欧美被日视频| 欧美噜噜久久久xxx| 久久免费电影| 欧美一级bbbbb性bbbb喷潮片| 伊人网在线播放| 国产成人综合久久| 欧美黄页免费| 国产成人女人毛片视频在线| 亚洲一区 二区| 国产综合动作在线观看| 一区二区美女| 性欧美.com| 中文字幕一区二区av | 欧美一二三区精品| 精品国产av一区二区三区| 亚洲精品一区在线观看| 日本护士...精品国| 国产亚洲福利一区| 毛片在线播放a| 欧美精品成人91久久久久久久| av中文资源在线资源免费观看| 青青久久aⅴ北条麻妃| 国产精品99久久久久久董美香 | 国产精品视频大全| 亚洲一区二区av| 国产日韩欧美一区二区| 精品产国自在拍| 国内自拍中文字幕| 国产精品嫩草99av在线| wwwwwxxxx日本| av中文字幕在线不卡| 久久国产柳州莫菁门| 亚洲另类在线制服丝袜| 在线观看亚洲欧美| 欧美一区午夜视频在线观看| 日本韩国免费观看| 伊人青青综合网站| 神马午夜伦理不卡| 国产精品久久久91| 在线日韩成人| 日韩欧美国产二区| 激情亚洲成人| 午夜国产福利在线观看| 91在线视频播放地址| 免费高清在线观看电视| 欧美性猛交xxxx久久久| 国产老女人乱淫免费| 亚洲精品自产拍| 亚洲综合伊人久久大杳蕉| 国产成人精品在线| 动漫视频在线一区| 一区中文字幕在线观看| 久久久久国产精品午夜一区| 美女被艹视频网站| 欧美激情在线一区二区| 日本一级淫片免费放| 在线成人av影院| 国产视频在线看| 久久人人97超碰精品888| 亚洲欧美综合久久久久久v动漫| 农村寡妇一区二区三区| 国产一区观看| 亚洲第一成肉网| 欧美经典三级视频一区二区三区| 香蕉免费毛片视频| 日韩免费观看高清完整版 | 亚洲国产精品天堂| 一级黄色免费看| 亚洲视频网站在线观看| 日韩伦理在线一区| 国产精品一区在线播放| 91九色精品国产一区二区| 天天操天天摸天天爽| 久久人人爽人人爽| 日本五十熟hd丰满| 日韩精品资源二区在线| 免费黄网在线观看| 国产精品免费在线免费 | 特级西西444www大胆免费看| 精品无人国产偷自产在线| 91视频欧美| 国产日韩在线一区二区三区| 欧美区国产区| 中文字幕 欧美 日韩| 亚洲精品视频观看| 国产美女免费看| 久久视频精品在线| 国产电影一区二区| 五月天男人天堂| 国产在线不卡一区| 日韩视频中文字幕在线观看| 欧美三区在线观看| 日本高清视频在线观看| 国产视频观看一区| 欧美激情电影| 日韩高清在线一区二区| 亚洲精品美腿丝袜| 亚洲第一页视频| 韩国国内大量揄拍精品视频| 韩国女主播一区二区三区| av一区二区三区免费观看| 高清视频一区二区| 日韩免费不卡视频| 亚洲乱亚洲乱妇无码| 欧美专区福利免费| 亚洲精品电影在线一区| 久久精品99久久久| 久久高清无码视频| 亚洲美女免费精品视频在线观看| 88xx成人永久免费观看| 台湾成人av| 国产中文一区二区三区| 国产极品美女高潮无套嗷嗷叫酒店 | 亚洲免费黄色网| 一区二区三区精密机械公司| 少妇精品高潮欲妇又嫩中文字幕| 91极品女神在线| 国产日产精品一区二区三区四区的观看方式 | 日韩一级黄色大片| 888av在线视频| 视频一区三区| 国产成人免费高清| www.国产com| 精品国内亚洲在观看18黄| 91精品啪在线观看国产爱臀| 2022亚洲天堂| 国产精品久久久久久久久免费相片| av在线免费在线观看| 777777777亚洲妇女| 色999日韩| 日本xxxx裸体xxxx| 欧美美女激情18p| 国产污视频在线播放| 亚洲欧洲一区二区| 成人午夜电影小说| 亚洲高清视频免费观看| 欧美男插女视频| 国产精品一区二区三区av麻| 天天干天天曰天天操| 色婷婷久久久久swag精品 | 欧美一区二区三区……| 999国产精品永久免费视频app| 日本道中文字幕| 欧美日韩国产天堂| 校园春色亚洲| 欧美视频在线第一页|