精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微調(diào)已死,強(qiáng)化微調(diào)萬(wàn)歲 原創(chuàng)

發(fā)布于 2024-12-10 09:06
瀏覽
0收藏

編輯 | 言征 

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

OpenAI第二天的直播,奧特曼沒(méi)有出鏡,幾位OpenAI的研究員帶了一場(chǎng)AI模型的定制魔法秀!

“這不是標(biāo)準(zhǔn)的微調(diào)......它利用強(qiáng)化學(xué)習(xí)算法,將我們從高級(jí)高中水平帶到專家級(jí)博士水平。”

1.12個(gè)樣本,就能讓定制o1超過(guò)滿血o1

標(biāo)準(zhǔn)的微調(diào)已經(jīng)過(guò)時(shí)了,這次 OpenAI 打破了 AI 定制的界限。在其“OpenAI 12 天”直播系列的第二天首次為其 o1 模型提供強(qiáng)化微調(diào) (RFT)。這一新的突破標(biāo)志著我們所知道的傳統(tǒng)微調(diào)的終結(jié)。使用 RFT,模型不僅可以復(fù)制,還可以進(jìn)行推理。

通過(guò)采用強(qiáng)化學(xué)習(xí),OpenAI 希望使組織能夠?yàn)榉伞⑨t(yī)療保健、金融等領(lǐng)域的復(fù)雜任務(wù)構(gòu)建專家級(jí) AI。這種新方法使組織能夠使用強(qiáng)化學(xué)習(xí)來(lái)訓(xùn)練模型,以最少的數(shù)據(jù)(有時(shí)只有 12 個(gè)示例)處理特定于領(lǐng)域的任務(wù)。

通過(guò)使用參考答案來(lái)評(píng)估和優(yōu)化模型輸出,RFT 可以提高專家級(jí)任務(wù)的推理和準(zhǔn)確性。OpenAI 通過(guò)微調(diào) o1-mini 模型來(lái)演示這項(xiàng)技術(shù),使其能夠比以前的版本更準(zhǔn)確地預(yù)測(cè)遺傳疾病。

2.重新定義模型微調(diào)

與傳統(tǒng)的微調(diào)不同,RFT 側(cè)重于教模型思考和推理問(wèn)題,正如 OpenAI 的研究主管 Mark Chen 所解釋的那樣:“這不是標(biāo)準(zhǔn)的微調(diào)......它利用強(qiáng)化學(xué)習(xí)算法,將我們從高級(jí)高中水平提升到專家級(jí)博士水平。

局限性:該方法并非沒(méi)有局限性。OpenAI 工程師 John Allard 解釋說(shuō),RFT 在結(jié)果“客觀正確且廣泛同意”的任務(wù)中表現(xiàn)出色,但在更難定義共識(shí)的主觀領(lǐng)域或創(chuàng)造性應(yīng)用程序中可能會(huì)遇到困難。

然而,與傳統(tǒng)的完全微調(diào)相比,鋼筋微調(diào) (RFT) 通常被認(rèn)為在計(jì)算效率更高。批評(píng)者還指出,RFT 的性能在很大程度上取決于任務(wù)設(shè)計(jì)和訓(xùn)練數(shù)據(jù)的質(zhì)量。

有趣的是,使用 RFT,您只需幾十個(gè)示例即可實(shí)現(xiàn)顯著的性能改進(jìn),因?yàn)樵撃P蛷姆答佒袑W(xué)習(xí),而不需要查看所有可能的場(chǎng)景。

包括伯克利實(shí)驗(yàn)室研究人員在內(nèi)的早期采用者已經(jīng)取得了顯著的成果。例如,微調(diào)的 o1-mini 模型在識(shí)別導(dǎo)致罕見(jiàn)疾病的基因突變方面優(yōu)于其基礎(chǔ)版本。

微調(diào)已死,強(qiáng)化微調(diào)萬(wàn)歲-AI.x社區(qū)圖片

OpenAI 已向選定的組織開(kāi)放其 RFT alpha 計(jì)劃。參賽團(tuán)隊(duì)將獲得 OpenAI 基礎(chǔ)設(shè)施的訪問(wèn)權(quán)限,以訓(xùn)練針對(duì)其獨(dú)特需求優(yōu)化的模型。“開(kāi)發(fā)人員現(xiàn)在可以利用我們?cè)趦?nèi)部使用的相同工具來(lái)構(gòu)建特定于領(lǐng)域的專家模型,”Allard 說(shuō)。

計(jì)算生物學(xué)家 Justin Reese 強(qiáng)調(diào)了 RFT 在醫(yī)療保健領(lǐng)域的變革潛力,特別是對(duì)于影響數(shù)百萬(wàn)人的罕見(jiàn)疾病——“將領(lǐng)域?qū)I(yè)知識(shí)與生物醫(yī)學(xué)數(shù)據(jù)的系統(tǒng)推理相結(jié)合的能力正在改變游戲規(guī)則”。

同樣,OpenAI 與湯森路透的合作已經(jīng)證明在微調(diào)法律模型方面取得了成功,為在法律和保險(xiǎn)等高風(fēng)險(xiǎn)領(lǐng)域增強(qiáng) AI 應(yīng)用鋪平了道路。

3.AI 定制新時(shí)代

OpenAI 計(jì)劃于 2025 年公開(kāi)發(fā)布,旨在根據(jù)早期參與者的反饋改進(jìn) RFT。除了最初的應(yīng)用之外,OpenAI 還設(shè)想了 RFT 模型推動(dòng)數(shù)學(xué)、研究和基于代理的決策等領(lǐng)域的發(fā)展。“這是關(guān)于為人類最復(fù)雜的挑戰(zhàn)創(chuàng)建高度專業(yè)化的工具,”Chen 說(shuō)。

簡(jiǎn)而言之,這項(xiàng)技術(shù)將 OpenAI 的 o1 系列模型轉(zhuǎn)變?yōu)樘囟I(lǐng)域的專家,使它們能夠以無(wú)與倫比的準(zhǔn)確性進(jìn)行推理,并在復(fù)雜、高風(fēng)險(xiǎn)的任務(wù)中超越其基本版本。

定期微調(diào)通常涉及使用監(jiān)督學(xué)習(xí)在新數(shù)據(jù)集上訓(xùn)練預(yù)訓(xùn)練模型,其中模型根據(jù)數(shù)據(jù)集中提供的確切輸出或標(biāo)簽調(diào)整其參數(shù)。

另一方面,RFT 使用強(qiáng)化學(xué)習(xí),模型從對(duì)其性能的反饋中學(xué)習(xí),而不僅僅是從直接示例中學(xué)習(xí)。

該模型不是從固定標(biāo)簽中學(xué)習(xí),而是根據(jù)預(yù)定義的評(píng)分量規(guī)或評(píng)分器根據(jù)它在任務(wù)中的表現(xiàn)進(jìn)行評(píng)分。這使模型能夠探索不同的解決方案并從結(jié)果中學(xué)習(xí),專注于提高推理能力。

4.用戶實(shí)測(cè):ChatGPT o1 Pro 感覺(jué)就像買了一輛蘭博

在 OpenAI 12 Days 的第一天,該公司發(fā)布了完整版的 o1 和一款售價(jià) 200 美元的全新 ChatGPT Pro 機(jī)型。ChatGPT Pro 計(jì)劃包括 Plus 計(jì)劃的所有功能以及對(duì)附加 o1 Pro 模式的訪問(wèn),據(jù)說(shuō)該模式使用“更多計(jì)算來(lái)最好地回答最難的問(wèn)題”。此外,該計(jì)劃將提供對(duì) o1、o1-mini 和 GPT-4o 的無(wú)限制訪問(wèn)以及高級(jí)語(yǔ)音模式。

OpenAI 還宣布了該模型的以開(kāi)發(fā)人員為中心的新功能。其中包括結(jié)構(gòu)化輸出、函數(shù)調(diào)用、開(kāi)發(fā)人員消息和 API 圖像理解。OpenAI 還表示,他們正在努力為 o1 模型提供 API 支持。

“為了更加明確:O1 在我們的 Plus 級(jí)別可用,每月 20 美元。使用新的 Pro Tier(每月 200 美元),它可以更努力地思考最困難的問(wèn)題。大多數(shù)用戶會(huì)對(duì) Plus Tier 中的 O1 感到非常滿意!“OpenAI 首席執(zhí)行官 Sam Altman 在 X 上發(fā)帖。

社區(qū)中的許多人認(rèn)為 200 美元對(duì)于 ChatGPT Pro 訂閱來(lái)說(shuō)太貴了。“不要以為我需要每月 200 美元的 o1 Pro。o1 對(duì)我來(lái)說(shuō)就足夠了。哎呀,對(duì)我來(lái)說(shuō)就足夠了,“X 上的一位用戶發(fā)帖說(shuō)。

“ChatGPT o1 Pro 感覺(jué)就像買了一輛蘭博基尼。”

沃頓商學(xué)院的副教授 Ethan Mollick 可以提前接觸 o1,他分享了他的經(jīng)驗(yàn),并將其與 Claude Sonnet 3.5 和 Gemini 進(jìn)行了比較。“它可以解決一些博士級(jí)別的問(wèn)題,在科學(xué)、金融等高價(jià)值領(lǐng)域有明顯的應(yīng)用。發(fā)現(xiàn)用途需要真正的研發(fā)努力“。

他解釋說(shuō),雖然 o1 在解決 Sonnet 難以解決的特定難題方面優(yōu)于 Sonnet,但它并沒(méi)有在每個(gè)領(lǐng)域都超過(guò) Sonnet。Sonnet 在其他領(lǐng)域仍然更強(qiáng)大。“作為作家而言,o1 表現(xiàn)得并沒(méi)有想象中地更好,不過(guò)它通常能夠比 Sonnet 更好地發(fā)展復(fù)雜的情節(jié),因?yàn)樗梢愿玫靥崆坝?jì)劃。”

一位 Reddit 用戶在花了 8 小時(shí)在實(shí)際應(yīng)用程序中測(cè)試 OpenAI 的 o1 Pro(200 美元)與 Claude Sonnet 3.5(20 美元)后分享了他們的經(jīng)驗(yàn)。

對(duì)于復(fù)雜的推理,o1 Pro 是贏家,它提供的結(jié)果略好,但每個(gè)響應(yīng)的時(shí)間多了 20-30 秒。Claude Sonnet 3.5 雖然更快,但在這些任務(wù)上達(dá)到了 90% 的準(zhǔn)確率。在代碼生成方面,Claude Sonnet 3.5 的性能優(yōu)于 o1 Pro,它生成的代碼更簡(jiǎn)潔、更易于維護(hù),文檔更好,而 o1 Pro 傾向于過(guò)度設(shè)計(jì)解決方案。

同樣,Abacus AI 首席執(zhí)行官 Bindu Reddy 表示,Sonnet 3.5 在編碼方面仍然優(yōu)于 o1,這是根據(jù)她進(jìn)行的手動(dòng)測(cè)試,因?yàn)?OpenAI 尚未發(fā)布 API。

“早期跡象表明,Sonnet 3.5 在編碼方面仍然占據(jù)主導(dǎo)地位。每當(dāng) OpenAI 選擇提供 API 時(shí),我們都將能夠確認(rèn)這一結(jié)果,“她說(shuō)。

參考鏈接:https://analyticsindiamag.com/ai-origins-evolution/fine-tuning-is-dead-long-live-reinforcement-fine-tuning/

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
社區(qū)精華內(nèi)容

目錄

    国产大尺度在线观看| 色综合咪咪久久网| 国产视频一区在线观看| 国产精品视频一区二区高潮| 成人涩涩小片视频日本| 中文字幕区一区二区三| 懂色av中文一区二区三区天美| 日本一区精品| 亚洲国产成人一区二区| 欧美一级二区| 色综合久久88色综合天天看泰| 波多野结衣一本| av国产精品| 色综合久久久久综合体| av磁力番号网| 国产爆初菊在线观看免费视频网站| 国产在线观看免费一区| 热re91久久精品国99热蜜臀| 国产suv一区二区三区| 中文字幕有码视频| 高清美女视频一区| 成人午夜碰碰视频| 国产免费观看久久黄| 国产精品1000| 羞羞答答成人影院www| 亚洲精品乱码久久久久久金桔影视| 久久久久xxxx| 亚洲成人一区在线观看| 亚洲成人av电影| 97超碰人人爱| 亚洲精品承认| 国产日产亚洲精品系列| 国产一区精品在线| 精品黑人一区二区三区国语馆| 日韩在线一区二区三区| 欧美最近摘花xxxx摘花| 国产第100页| 中文字幕乱码亚洲无线精品一区| 宅男66日本亚洲欧美视频| 亚洲va欧美va人人爽| 激情视频一区二区| 国产 欧美 精品| 国产综合色在线| 国产噜噜噜噜噜久久久久久久久| 免费看日批视频| 国产欧美精品久久| 97久久精品人搡人人玩| 国产精彩视频在线| 亚洲美女一区| 性欧美xxxx交| 永久免费看片在线播放| 亚洲网站啪啪| 97国产在线视频| 久草综合在线视频| 亚洲精品国产首次亮相| 久久亚洲综合国产精品99麻豆精品福利| 国产欧美一区二区三区在线观看视频| 亚洲瘦老头同性70tv| 亚洲国产精品v| 在线观看91视频| 日本在线xxx| 久草在线资源福利站| 午夜精品久久久久久久99水蜜桃| 成人国产在线看| 国产第一页在线| 亚洲国产日产av| 免费观看国产精品视频| 日韩影院在线| 一本色道**综合亚洲精品蜜桃冫| 激情婷婷综合网| 成人国产综合| 欧美一区二区三区四区五区| 在线观看免费视频污| 欧美a在线观看| 精品不卡在线视频| 国产中年熟女高潮大集合| 欧美亚洲精品在线| 久久久国产91| 久久免费播放视频| 中文字幕免费观看视频| 青青草国产成人a∨下载安卓| 亚洲亚洲免费| 69亚洲精品久久久蜜桃小说| 国产黄色特级片| 国产精品丝袜高跟| 日韩免费视频一区| 国产精品久久久久久久久免费桃花 | 久久夜色精品国产欧美乱| 永久免费毛片在线观看| 亚洲天堂美女视频| 欧美14一18处毛片| 五月激情综合网| 一区二区成人网| 午夜久久av| 日韩精品在线免费观看视频| 欧美88888| 亚洲韩日在线| 国产精品一区专区欧美日韩| 男人天堂一区二区| 国产欧美精品区一区二区三区| 日韩最新中文字幕| 在线视频超级| 日韩天堂在线观看| 国产免费一区二区三区网站免费| 一区二区三区四区日韩| 欧美在线免费观看| 99热这里只有精品3| 久久久久久久久蜜桃| 青青在线视频免费观看| 日本肉肉一区 | 欧美精品偷拍| 日本精品免费观看| 亚洲奶汁xxxx哺乳期| 国产精品女上位| av观看免费在线| 亚洲一区二区三区日本久久九| 在线电影av不卡网址| 五月天婷婷丁香| 国产又粗又猛又爽又黄91精品| 欧美激情专区| jizzjizz中国精品麻豆| 91麻豆精品国产综合久久久久久| 久久国产柳州莫菁门| 99亚洲伊人久久精品影院红桃| 2022国产精品| 超碰在线caoporen| 欧美日韩精品高清| 最近中文字幕免费| 校园激情久久| 久久久久久高清| 大黄网站在线观看| 午夜激情久久| 国产亚洲综合久久| 欧美一区二区激情视频| 成人丝袜18视频在线观看| 四虎免费在线观看视频| 成人全视频免费观看在线看| 亚洲欧洲免费视频| 懂色av蜜臀av粉嫩av分享吧最新章节| av男人天堂一区| www.射射射| 国产欧美三级电影| 欧美激情视频在线观看| va视频在线观看| 亚洲男人的天堂在线aⅴ视频| 91插插插插插插插插| 成人久久电影| 日韩美女免费观看| 高清在线观看av| 欧美三级乱人伦电影| 一级在线观看视频| 麻豆精品在线播放| 一区一区视频| 久久久91麻豆精品国产一区| 91综合久久| 最近日韩中文字幕中文| 自拍偷拍色综合| 国产嫩草影院久久久久| 天堂社区在线视频| 三级电影一区| 亚洲xxxxx性| 一区二区三区伦理| 亚洲国产精久久久久久久| 日韩精品国产一区二区| 99国产一区二区三精品乱码| 免费av网址在线| 欧美少妇性xxxx| 91久久久在线| 丁香花在线电影| 精品视频—区二区三区免费| 国产熟妇一区二区三区四区| 中文字幕电影一区| 黑人巨大猛交丰满少妇| 亚洲三级影院| 日本一区不卡| 成人日韩视频| 韩国福利视频一区| 成人三级黄色免费网站| 丰乳肥臀在线| 欧美视频一区在线观看| 一起操在线播放| 国产成人av影院| 浮妇高潮喷白浆视频| 在线免费观看一区二区| 一级片在线观看免费| 色在线免费观看| 亚洲摸下面视频| 精品国产www| av在线不卡顿| 91国产在线精品| 成人午夜在线观看视频| 欧美一区二区女人| 男人午夜免费视频| 国产精品黄色在线观看| 亚洲精品成人无码毛片| 丝袜亚洲精品中文字幕一区| 99热这里只有精品7| 网友自拍一区| 成人妇女免费播放久久久| h片在线观看| www.久久撸.com| 无码精品在线观看| 欧美人与禽zozo性伦| 日韩手机在线观看| 国产精品久久久久久福利一牛影视| 亚洲成人精品在线播放| 日本在线观看不卡视频| 东北少妇不带套对白| 久久国产亚洲| 精品欧美国产一区二区三区不卡| 玖玖精品在线| 欧美最顶级丰满的aⅴ艳星| 91小视频xxxx网站在线| 亚洲天堂影视av| 亚洲福利在线观看视频| 欧美日韩国产高清一区二区| 久久久久久少妇| 一二三区精品福利视频| 亚洲欧美另类日本| 久久久影视传媒| 精品人妻伦一二三区久| 国内精品国产成人| 手机在线成人免费视频| 久久精品麻豆| 亚洲熟妇国产熟妇肥婆| 欧美日韩国产探花| 一区二区精品视频| 亚洲最好看的视频| 久久av一区二区三区亚洲| 视频在线观看免费影院欧美meiju| 国产精品福利无圣光在线一区| 男女羞羞在线观看| 久久久久久久久久久av| 在线观看av免费| 欧美精品生活片| 国产一二区在线| 日韩中文在线不卡| 在线激情网站| 中文字幕亚洲一区二区三区五十路| 免费黄色片在线观看| 亚洲精品视频播放| 天堂资源最新在线| 日韩精品免费一区二区三区竹菊 | 欧美大片aaa| 亚洲激情中文字幕| 天天射天天操天天干| 亚洲国产天堂久久国产91| 亚洲精品一区二区三区区别| 日韩欧美一区电影| www.亚洲欧美| 欧美一级日韩免费不卡| 国产又爽又黄免费软件| 在线成人小视频| 99久久久无码国产精品免费| 国产盗摄视频一区二区三区| 国产在线观看不卡| 国产精品99久久免费| 成人有码视频在线播放| 不卡的国产精品| 亚洲精品欧美日韩专区| 中文字幕日韩在线| 国产麻豆一区二区三区在线观看| 久久久久久毛片免费看| 亚洲精品久久久久久下一站| 国产精品入口尤物| 国产性生活视频| 在线免费观看一区| 99re热视频| 在线电影院国产精品| 久久精品网站视频| 日本女优一区| 中文字幕乱码一区二区三区| 香港欧美日韩三级黄色一级电影网站| 在线不卡视频一区二区| 欧美在线高清| 精品久久一二三| 日韩综合小视频| 性久久久久久久久久久久久久| 国产盗摄一区二区三区| 人妻少妇精品视频一区二区三区| 国产视频一区在线观看| 做爰高潮hd色即是空| 四虎国产成人精品免费一女五男| 国产又大又粗又爽的毛片| 羞羞的网站在线观看| 毛片精品免费在线观看| 又色又爽的视频| 久久亚洲一区二区三区四区| 精品国产aaa| 伊人色综合久久天天人手人婷| 日韩网红少妇无码视频香港| 在线观看欧美精品| 精品国产18久久久久久| 亚洲精品之草原avav久久| 午夜激情在线观看| 97在线观看免费| 四虎影视成人精品国库在线观看| 国产成人免费观看| 日韩久久综合| 日韩少妇内射免费播放| 国产综合久久久久久鬼色| 久久人人爽人人爽人人片| 亚洲人吸女人奶水| 波多野结衣啪啪| 精品国产91乱码一区二区三区| 国产一级在线观看| 97国产精品视频人人做人人爱| 日本一区二区中文字幕| 久久爱av电影| 伊人久久大香线| 五月婷婷狠狠操| www国产成人免费观看视频 深夜成人网| 欧美优质美女网站| 男人天堂av在线播放| 欧美成人免费网站| 嫩草香蕉在线91一二三区| 欧美最猛黑人xxxx黑人猛叫黄| 欧美一级片网址| 亚洲一区bb| 视频一区二区欧美| 久久性爱视频网站| 亚洲狠狠丁香婷婷综合久久久| 中文字幕二区三区| 亚洲人永久免费| 日韩伦理福利| 国产美女精品久久久| 欧美黄色一区二区| 黄色aaaaaa| 1000精品久久久久久久久| 精品国产www| 国产亚洲福利一区| 美女100%一区| 欧美日韩综合网| 国产精品久久久久毛片大屁完整版 | 国产精品成人v| 国产99久久精品一区二区300| 国产精品成人久久电影| 国产激情一区二区三区| 九九精品视频免费| 7777精品伊人久久久大香线蕉完整版| 国产午夜福利100集发布| 成人在线视频你懂的| 国产天堂视频在线观看| 国产福利不卡视频| 久久久久亚洲AV| 精品欧美一区二区久久| heyzo高清国产精品| 国产精品一区二区三区精品| 欧美视频亚洲视频| 女同性αv亚洲女同志| 亚洲一区在线播放| 黑人乱码一区二区三区av| 久久久久久久久国产| 日本福利一区| 国产又大又黄又粗的视频| 欧美国产综合一区二区| 在线观看毛片视频| 久久国产精品免费视频| 成人午夜网址| 欧美亚洲一二三区| 国产日韩欧美精品一区| 亚洲天天综合网| 欧美成人三级视频网站| 大奶一区二区三区| 可以免费观看av毛片| 欧美激情一区二区三区在线| 国产精品久久久久久免费播放| 欧美成人免费网| 五月天亚洲色图| 精品999在线| 亚洲乱码日产精品bd| 天天操天天干天天| 国产精品久久不能| 在线观看欧美日韩电影| 91精品国产综合久久久久久| а天堂8中文最新版在线官网| 国产精品久久在线观看| 自拍偷拍18p| 国产91精品欧美| 26uuu成人网| 亚洲激情自拍图| 欧美影视资讯| 国产又粗又长又爽视频| 久久在线观看免费| 中文字幕一区二区免费| 色综合91久久精品中文字幕| 伊人久久大香线蕉无限次| 57pao国产成永久免费视频| 亚洲永久精品大片| 欧美色综合一区二区三区| 国产在线视频欧美| 国产亚洲高清视频| 国产美女福利视频| 日韩精品在线观看网站| 国产精品免费精品自在线观看| 欧美成人三级在线视频| 国产精品久久久久婷婷| 亚洲欧美一区二区三| 91久久久久久| 视频一区二区国产|