精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1不是聊天模型?24小時(shí)熱度暴漲,奧特曼、Brockman在線圍觀

人工智能
在剛剛過去的一天,一篇名為《o1 isn’t a chat model(and that’s the point)》的文章引發(fā)了包括 OpenAI CEO Sam Altman、總裁 Greg Brockman 的關(guān)注。

不要再將 o1 當(dāng)做聊天模型了。

如何定位 o1 模型?你是否常常將其當(dāng)做一個(gè)聊天模型來使用。

在剛剛過去的一天,一篇名為《o1 isn’t a chat model(and that’s the point)》的文章引發(fā)了包括 OpenAI CEO Sam Altman、總裁 Greg Brockman 的關(guān)注。

這篇文章表示 o1 不是一個(gè)聊天模型,我們可以將它想象成一個(gè)報(bào)告生成器。

圖片


原文鏈接:https://www.latent.space/p/o1-skill-issue

2014 年,OpenAI 接連放出了 o1、o1 pro、o3 模型,隨著模型推理能力的提升,隨著而來的是高昂的訂閱費(fèi)。但很多人在訂閱使用后發(fā)現(xiàn) o1 的表現(xiàn)并不如宣傳的那樣好,當(dāng)然也包括本文的作者——曾任SpaceX軟件工程師、蘋果VisionOS人機(jī)交互設(shè)計(jì)師的Ben Hylak。

Hylak 表示每次他問 o1 一個(gè)問題時(shí),都要等上 5 分鐘的時(shí)間,結(jié)果看到的只是一大堆自相矛盾的胡言亂語,還有未經(jīng)請求的架構(gòu)圖 + 優(yōu)缺點(diǎn)列表。這讓 Hylak 很是惱火,因此直言 o1 就是垃圾。

圖片

o1 回答問題,多次自相矛盾。

為了表達(dá)心中的憤怒,Hylak 還在社交媒體上分享了這種觀點(diǎn),「我今天一整天都在使用 o1 pro—— 我再怎么強(qiáng)調(diào)也不為過 —— 它真的很糟糕。」

圖片

「輸出內(nèi)容幾乎接近胡言亂語,在同一個(gè)答案中多次自相矛盾。例如:我向它征求關(guān)于重構(gòu)的建議。它建議合并文件,但輸出的代碼塊中文件并未合并,然后又出現(xiàn)了完全不相關(guān)的結(jié)論。」

圖片

圖源:https://x.com/benhylak/status/1864835651725910023

對于 Hylak 的觀點(diǎn),有人表示贊同,但也有人強(qiáng)烈反對,他們認(rèn)為 o1 表現(xiàn)非常好。

隨著 Hylak 與那些持反對意見的人交流越來越多,他逐漸意識(shí)到自己完全錯(cuò)了:他把 o1 當(dāng)作聊天模型來使用,但實(shí)際上 o1 并不是聊天模型。

對于作者態(tài)度的轉(zhuǎn)變,奧特曼很是欣慰,表示道:「隨著人們學(xué)會(huì)如何使用 o1(包括 pro 版),觀察人們對它態(tài)度的轉(zhuǎn)變真是很有趣。」

圖片

奧特曼關(guān)于這條博客的推文瀏覽量達(dá)到 1.5M 。

Greg Brockman 表示:「o1 是一個(gè)不同類型的模型。要獲得出色的性能,需要以一種與標(biāo)準(zhǔn)聊天模型不同的新方式來使用它。」

圖片


如果 o1 不是聊天模型,那它是什么?

我們可以把它想象成一個(gè)報(bào)告生成器(report generator)。如果你給定足夠的上下文,然后告訴它你想要的輸出,o1 通常會(huì)一下子確定解決方案。

接下來的問題是,如何使用 o1。

不要寫提示,要寫 Brief

給它大量的上下文,上下文的數(shù)量作者用 ton 來形容,我們可以把它想象成提示的 10 倍。

圖片

這張圖解釋了如何構(gòu)建一個(gè)針對 o1 模型的提示(prompt),并將其分為幾個(gè)部分。

通常情況下,當(dāng)你使用像 Claude 3.5 Sonnet 或 4o 這樣的聊天模型時(shí),會(huì)先提出一個(gè)簡單的問題并附帶一些上下文。如果模型需要更多的上下文,它通常會(huì)向你詢問。

你會(huì)與模型來回迭代,糾正它并擴(kuò)展需求,直到達(dá)到期望的輸出。聊天模型本質(zhì)上是通過這種來回交互的方式從你這里獲取上下文。在與模型交互過程中,我們可能會(huì)變得越來越懶,只要還能得到好的輸出,輸入的提示越來越敷衍。

但是,o1 會(huì)直接接受那些敷衍的問題,并不會(huì)試圖從我們這里獲取上下文。相反,你需要盡可能多地向 o1 提供上下文。

即使你只是詢問一個(gè)簡單的工程問題,你也需要:

  • 詳細(xì)說明所有你嘗試過但沒有奏效的方法;
  • 添加所有數(shù)據(jù)庫架構(gòu)的完整 dump;
  • 解釋你公司的業(yè)務(wù)、規(guī)模(并定義公司特有的術(shù)語)。

簡而言之,我們要把 o1 當(dāng)作一個(gè)新入職的員工來對待。

圖片

把更多的時(shí)間用在開頭提示上。圖源:https://x.com/swyx/status/1839213190816870425

專注于目標(biāo):準(zhǔn)確地描述你想要什么

一旦你向模型提供了盡可能多的上下文,就需要專注于解釋你希望輸出是什么。

在大多數(shù)模型中,我們會(huì)告訴模型我們希望它如何回答我們。例如:你是一位專家級軟件工程師。你需要模型進(jìn)行慢思考且思考的很仔細(xì)。

這與使用 o1 取得成功的方法完全相反。不要告訴它如何做 —— 只告訴它做什么。然后讓 o1 接管,自行規(guī)劃和解決問題的步驟。這就是自主推理的作用所在,實(shí)際上這比你作為人工環(huán)節(jié)手動(dòng)審查和聊天要快得多。

圖片

知道 o1 擅長什么、不擅長什么

o1 擅長什么:

  • 完美地一次性處理整個(gè) / 多個(gè)文件:到目前為止,這是 o1 最令人印象深刻的能力。例如,復(fù)制 / 粘貼大量代碼,大量關(guān)于正在構(gòu)建內(nèi)容的上下文,o1 會(huì)完全一次性地完成整個(gè)文件(或多個(gè)文件),通常沒有錯(cuò)誤,遵循現(xiàn)有模式代碼庫。
  • 減少幻覺:例如,o1 確實(shí)擅長定制查詢語言(如 ClickHouse 和 New Relic),而 Claude 經(jīng)常混淆 Postgres 的語法。
  • 醫(yī)療診斷:Hylak 的女朋友是一名皮膚科醫(yī)生,當(dāng)朋友或家人有皮膚問題時(shí),他們通常會(huì)給 Hylak 的女朋友發(fā)一張照片。當(dāng) Hylak 拿照片詢問 o1 時(shí),o1 的回答通常與正確答案驚人地接近(約 60%)。對于醫(yī)療專業(yè)人員來說更有用 ——o1 幾乎總能提供極其準(zhǔn)確的鑒別診斷。
  • 解釋概念:Hylak 發(fā)現(xiàn) o1 非常擅長通過示例解釋非常困難的工程概念。
  • 在制定困難的架構(gòu)決策時(shí),Hylak 經(jīng)常會(huì)讓 o1 生成多個(gè)計(jì)劃,甚至比較這些計(jì)劃,每個(gè)計(jì)劃都有優(yōu)缺點(diǎn)。
  • 評估:Hylak 一直對使用 LLM 作為評估的判別器持非常懷疑的態(tài)度,但 o1 表現(xiàn)出巨大的希望 —— 它通常能夠在很少的上下文下確定生成結(jié)果是否正確。

o1 做得還不夠好的地方:

  • 用特定的聲音 / 風(fēng)格寫作:Hylak 發(fā)現(xiàn) o1 不擅長寫任何東西,尤其是在特定的聲音或風(fēng)格中。它遵循一種非常學(xué)術(shù) / 企業(yè)的報(bào)告風(fēng)格。

圖片

Hylak 嘗試讓 o1 寫這篇博客的一個(gè)例子 — — 經(jīng)過多次反復(fù),它只會(huì)寫一份平淡的報(bào)告。

  • 構(gòu)建整個(gè)應(yīng)用程序:o1 非常擅長一次性構(gòu)建整個(gè)文件,但 o1 不會(huì)構(gòu)建整個(gè) SaaS,至少不會(huì)進(jìn)行大量迭代。不過,它幾乎可以一次性完成整個(gè)功能,特別是前端功能或簡單的后端功能。

延遲從根本上改變了我們對產(chǎn)品的體驗(yàn)。考慮一下電子郵件和短信之間的區(qū)別 —— 主要是延遲,語音消息與電話通話 —— 延遲,等等。

Hylak 將 o1 稱為「報(bào)告生成器」,因?yàn)?o1 顯然不是聊天模型 —— 它感覺更像電子郵件。

Hylak 認(rèn)為 o1 將首次使某些產(chǎn)品成為可能 —— 例如,可以從高延遲、長時(shí)間運(yùn)行的后臺(tái)智能中受益的產(chǎn)品。

用戶愿意等待 5 分鐘來完成什么樣的任務(wù)?一個(gè)小時(shí)?一天?3-5 個(gè)工作日?如果設(shè)計(jì)正確的話,有很多。

需要注意的是,o1-preview 和 o1-mini 支持流式傳輸,但不支持結(jié)構(gòu)化生成或系統(tǒng)提示。o1 支持結(jié)構(gòu)化生成和系統(tǒng)提示,但尚不支持流式傳輸。

當(dāng)開發(fā)人員在 2025 年設(shè)計(jì)產(chǎn)品時(shí),實(shí)際使用該模型做什么將會(huì)非常重要。

責(zé)任編輯:姜華 來源: 機(jī)器之心
相關(guān)推薦

2025-01-20 09:28:00

AI工具模型

2025-01-13 11:48:10

人工智能o1聊天模型

2024-12-09 07:00:00

o1-mini模型強(qiáng)化微調(diào)OpenAI

2024-09-24 11:01:03

2024-09-14 12:51:04

2025-01-08 13:08:55

2024-09-18 08:40:00

智能模型AI

2024-10-05 00:00:00

2024-09-19 13:32:24

2024-11-07 15:40:00

2024-11-04 09:00:00

2024-11-25 17:23:10

2024-12-05 10:16:14

2021-12-21 10:26:39

交付項(xiàng)目Jira開發(fā)

2024-11-12 12:53:46

2025-02-03 14:17:27

2024-09-13 10:06:21

2024-12-09 11:06:31

2025-07-22 10:22:02

2012-05-16 09:53:56

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

999国产精品| av日韩久久| 中文字幕色一区二区| 国产精品99久久久久久久女警| 国产suv一区二区| 欧美天堂一区二区三区| 日本美女一级片| 欧美高清videos高潮hd| 欧美激情另类| 日韩精品―中文字幕| 日本v片在线高清不卡在线观看| 久久精品女同亚洲女同13| 91丨porny丨户外露出| 亚洲在线精品视频| 久久亚洲国产成人| 欧美综合在线视频观看| 久久久久亚洲AV成人无在 | 欧美激情欧美狂野欧美精品| 国产精品日韩| 丰满熟女一区二区三区| 无码毛片aaa在线| 在线一区二区观看| re久久精品视频| 欧美h在线观看| 欧美一区观看| 精品国产乱码久久久久久天美| 最新国产在线拍揄自揄视频| 一本大道东京热无码aⅴ| 亚洲午夜激情网站| 妖精视频一区二区三区免费观看 | 国产一区毛片| 亚洲成熟少妇视频在线观看| 国产在线资源一区| 中文字幕免费不卡| 99久久er| 少妇精品无码一区二区免费视频| 性欧美亚洲xxxx乳在线观看| 国产成人av一区二区| 国产免费a∨片在线观看不卡| 国产v亚洲v天堂无码久久久| 亚洲精品福利免费在线观看| 你微笑时很美电视剧整集高清不卡| 91av在线免费| 国产精品久久久久久久久久新婚 | 日韩porn| 精品无码一区二区三区爱欲| 欧美大片顶级少妇| 亚洲激情网址| av午夜在线| 日本成人xxx| 2019中文字幕在线免费观看| 91小视频免费观看| 国产成人久久精品麻豆二区| 大吊一区二区三区| 国产成人精品在线播放| 亚洲欧美一区二区在线观看| 亚洲精品小区久久久久久| 毛片aaaaa| 午夜精品久久久99热福利| 免费黄网站欧美| 国产精品午夜福利| 3d动漫啪啪精品一区二区免费| 曰韩精品一区二区| 电影91久久久| 少妇高潮惨叫久久久久| 欧美俄罗斯性视频| 日本v片在线高清不卡在线观看| 国产精品高潮呻吟久久久| www久久99| 亚洲v日本v欧美v久久精品| 伊人成综合网yiren22| 又黄又爽的网站| 欧美男插女视频| 久久综合精品国产一区二区三区| 黄色视屏网站在线免费观看| 不卡的一区二区| 欧美激情在线视频二区| 免费人成黄页网站在线一区二区 | 婷婷久久综合九色综合伊人色| 亚洲日本三级| 青青操视频在线| 亚洲爆乳无码专区| 久久亚洲影音av资源网| 成人av在线播放网址| а√天堂在线官网| 久久久久久天堂| 亚洲一区二区免费视频软件合集| 亚洲男人天堂一区| 午夜天堂精品久久久久| 日本大片在线观看| 日本a视频在线观看| 亚洲视频日韩精品| 高清成人免费视频| www.综合网.com| 国产老熟女伦老熟妇露脸| 国产精品久久久久久久久久新婚 | 国产黄在线免费观看| 国内精品美女av在线播放| 中文字幕久久午夜不卡| 精品av导航| 成人精品在线看| 欧美日韩国产精品一卡| 欧美日韩国产片| 亚欧美中日韩视频| 国模私拍视频在线| 欧美丰满美乳xxⅹ高潮www| 91久久在线观看| 大荫蒂性生交片| 日韩精品黄色网| 日韩精品久久久久久| 伊人福利在线| 亚洲色图27p| 视频一区视频二区视频三区视频四区国产 | 日韩在线精品强乱中文字幕| 99在线精品视频免费观看20| 无尽裸体动漫2d在线观看| 欧美一级淫片videoshd| 一本色道久久综合亚洲aⅴ蜜桃 | 红杏aⅴ成人免费视频| 五月婷婷六月丁香| 亚洲av成人片色在线观看高潮| 国产麻豆日韩| 精品少妇一区二区三区日产乱码| 国产一区二区中文字幕| av在线成人| 精品久久久久久亚洲综合网站| 激情综合在线观看| 91精品国产91久久久久久一区二区| 粉嫩13p一区二区三区| 色小子综合网| 99热这里只有精品5| 亚洲成人av免费看| 国产中文一区二区| 欧美激情精品久久久久久大尺度| 色综合久久久久综合体桃花网| 99精品美女| 天堂av中文在线| 日本免费精品视频| 九热视频在线观看| 蜜桃欧美视频| 欧美男人的天堂一二区| 精品1区2区3区4区| 黑人巨大精品| 波多野结衣视频在线观看| 日本www.色| 国产一区免费观看| 欧美大胆a视频| 在线观看成人小视频| 国产高清久久久久| 日韩激情网站| 91超碰碰碰碰久久久久久综合| 亚洲国产精彩视频| 国产欧美一区二区三区在线看蜜臂| 国产伦精品一区二区三区精品| 三级视频中文字幕| 欧美精品一区在线发布| 国产精品美女久久久久久免费| 亚洲天堂av电影| 91精品在线麻豆| 精品成人乱色一区二区| 亚洲精品国产一区二区精华液| 成人v精品蜜桃久久一区| 国产精品婷婷| 日韩免费视频| 91综合久久爱com| 欧美成人a交片免费看| 亚洲最新色图| 精品在线视频免费观看| 亚洲码无人客一区二区三区| 久久这里只精品| 日韩极品视频在线观看| 久久av综合网| 亚洲精品日韩成人| 国产精品区一区| 2020国产精品久久精品不卡| 91中文字幕在线| 国产区精品视频| 国内精品久久影院| 欧美疯狂做受xxxx高潮| 欧美肥老妇视频| 欧美黑人国产人伦爽爽爽| 一本色道久久综合狠狠躁篇怎么玩| 欧美日韩一区二区三区在线 | 国产超碰精品| 美女网站视频在线| 欧美a级在线观看| 久久www人成免费看片中文| 久久国产精品黑丝| 欧美裸体视频| 久久久久久久| av资源亚洲| 一二三四视频在线中文| 欧美激情20| 丁香高清在线观看完整电影视频| 爱久久·www| 国产毛片在线| 黄色一级a毛片| 亚洲国产一二三区| 91久久精品国产91性色69| 久久一区二区三区视频| 蜜桃av.com| www.超碰com| 法国空姐在线观看免费| 免费极品av一视觉盛宴| 日本a级片久久久| 新呦u视频一区二区| 加勒比在线一区二区三区观看| 国产精品一区二区三区久久久| 热久久这里只有精品| 久久福利视频网| 亚洲精品小视频| 亚洲激情视频在线| 在线观看欧美日韩| 中文字幕在线亚洲| 亚洲国产黄色片| 欧美v日韩v国产v| 这里只有精品视频在线观看| 一本大道综合伊人精品热热| 欧美日韩一区国产| 欧美精品一二三四| 日韩欧美黄色影院| 欧美mv日韩mv国产网站app| 欧美精品一区二区三区很污很色的| 欧美在线免费观看亚洲| 一本色道**综合亚洲精品蜜桃冫| 亚洲午夜在线视频| 疯狂做受xxxx高潮欧美日本| 欧美色综合天天久久综合精品| 日韩久久久久久| 亚洲深夜福利网站| 亚洲精品大尺度| 色哟哟入口国产精品| 亚洲性xxxx| 欧美亚洲一区在线| 久久99热只有频精品91密拍| 香蕉视频免费版| 91亚洲精品国产| 欧美v在线观看| www..com日韩| 中文字幕18页| 久久久精品国产sm调教| 无码aⅴ精品一区二区三区| 国产黄色高清视频| 欧美黄色小说| 国产精品扒开做爽爽爽的视频| 成人福利网站| 欧美伊人亚洲伊人色综合动图| 精品国产一区二区三区成人影院 | 日韩精品一级| 欧州一区二区| 99国产精品久久一区二区三区| 自拍偷拍欧美专区| 国产麻豆9l精品三级站| 国产日韩欧美激情| 亚洲欧美日韩国产另类专区| 4438x成人网最大色成网站| 日韩精品在线播放| 欧美日本中文字幕| 91网站免费看| 成人免费看片视频在线观看| 五月婷婷狠狠操| 中文字幕狠狠干| 国产女人被狂躁到高潮小说| www.爱爱.com| 2019年精品视频自拍| 亚洲涩涩av| caoporen国产精品视频| 欧美午夜精品在线| 久久国产精品久久久久久久久久| 成人自拍网站| 91免费国产精品| 国产一线二线三线在线观看| 国产精品三区在线观看| 五十路在线观看| 免费毛片在线看片免费丝瓜视频 | 麻豆mv在线观看| 窝窝社区一区二区| 国产清纯在线一区二区www| 欧美三级视频在线| 亚洲欧美日韩精品久久奇米色影视 | 在线一区欧美| 1024精品合集| 久久综合久久八八| 亚洲一卡二卡三卡| 精品国产午夜福利在线观看| 精品一区二区6| 国产老女人乱淫免费| 伊人免费在线| 新片速递亚洲合集欧美合集| 杨幂一区二区三区免费看视频| 国产一区二区调教| 亚洲电影一区二区三区| 亚洲黄色在线看| 久久99蜜桃综合影院免费观看| 99久久人妻无码精品系列| 天堂网视频在线| 在线观看视频一区二区三区 | 91在线国产观看| 欧美亚男人的天堂| 国产精品入口日韩视频大尺度| 亚洲av首页在线| 五月天婷婷色综合| 欧美sm一区| 蜜桃视频一区二区| 亚洲国产成人精品久久| 国产精品成人一区二区三区| 无码av免费精品一区二区三区| 亚洲av无码片一区二区三区 | 亚洲视频中文| 一区二区三区日韩| 亚洲日韩第一页| 日本aa在线观看| 成人在线免费看视频| 天然素人一区二区视频| 精品一区二区三区久久久| 欧美一区午夜视频在线观看| 免费影院在线观看一区| √天堂中文官网8在线| 日本精品在线中文字幕| 久久香蕉国产线看观看99| 欧美激情一级二级| 天堂av2020| 国产一级片在线播放| 激情亚洲网站| 亚洲欧洲xxxx| 国产一级不卡毛片| 好吊色一区二区| 亚洲无线一线二线三线区别av| 欧美三区在线视频| 日韩视频在线播放| 亚洲第一精品在线观看 | 久久久精品国产sm调教网站| **在线精品| 国产欧美一区二区三区在线看蜜臀 | 欧美日韩一区二区三区| 国产女人水真多18毛片18精品 | 羞羞视频在线免费国产| 国产高清久久久| 97超视频免费观看| 亚洲v在线观看| 中文字幕色婷婷在线视频| 99久久亚洲一区二区三区青草| 免费av一区二区| 亚洲妇女无套内射精| 不卡视频观看| 国产精品99久久久久久久女警 | 你懂的在线观看一区二区| 一区二区三区在线视频观看| 成人免费福利视频| 亚洲国产精品一区二区久久hs| 在线日本欧美| 国产精品无遮挡| 国产精品视频yy9099| 国产亚洲小视频| 久久97视频| 欧美一区二区三区在线观看| 国产一区二区网| 国产三级在线免费| 国产成人综合视频| 国产日韩在线精品av| 国产91精品看黄网站在线观看| 日本久久精品| 亚洲视频在线观看| 手机在线观看日韩av| 天天综合网站| 日韩欧美999| 丝袜足脚交91精品| 亚洲精品久久久久久久久久 | 国产精品一区二区在线看| 自拍偷在线精品自拍偷无码专区| 亚洲自拍偷拍视频| 国产成人无码精品久久久久| 欧美黄色大片在线观看| 日韩av一区在线观看| 久久精品国产99久久99久久久| 99在线视频影院| 欧美国产激情一区二区三区蜜月| av噜噜色噜噜久久| 中文字字幕在线观看| 99精品国产一区二区青青牛奶 | 国产一区二区三区影视| 欧美性生活影院| 国产一二三在线视频| 三级资源在线| 欧美日韩午夜激情| 六月婷婷在线视频| 最新国产在线拍揄自揄视频| 国产日韩一级二级三级| 伊人久久大香线蕉av一区| 精品51国产黑色丝袜高跟鞋| 中文字幕一区二区视频| 亚洲高潮无码久久| 91视频欧美| 色综合欧美在线视频区| 国产一区二区在线视频播放| 欧美舌奴丨vk视频| 日韩一区二区三区视频在线 | 在线观看av免费观看| 91精品视频一区二区| 欧美人xxxx|