精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?

發布于 2024-5-6 09:48
瀏覽
0收藏

就在最近,清華大學SuperBench團隊的新一輪全球大模型評測結果出爐了!


此次測評,還增加了Llama 3-8b 和Llama 3-70b兩個最近炙手可熱的模型。


在語義理解、智能體能力、代碼能力三個測評中,我們發現:Claude-3拿下兩個top 1,穩穩位于前三之列。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

Claude 3果然實強。

技術報告曝出:Claude 3靠合成數據

在技術報告中,大家發現了Claude 3的亮點——


它是在合成數據上訓練的。


鑒于大模型的參數數量和數據都是可以縮放的,所以以后計算就是瓶頸了。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

所以,Claude 3的成功,可以說是對合成數據而言是一個巨大的進步。


其實,此前艾倫人工智能研究所的科學家Nathan Lambert就曾經就Anthropic的合成數據做了一些猜測。


而現在詳細技術報告的發布,將他的猜測完全證實了!

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

合成數據的探索

關于合成數據,Lambert曾在23年11月寫下了一篇文章《合成數據:Anthropic 的 CAI,從微調到預訓練,OpenAI 的超對齊,提示、類型和開放示例》。


在這篇文章里,他做出判斷——合成數據是AI下一階段的加速器,并且詳細解釋了合成數據是什么,以及它意味著什么。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

合成數據,也就是由機器生成而非人工創建的數據,在自然語言處理(NLP)和整個機器學習(ML)領域都有著長久的歷史背景。與之密切相關的概念是數據增強,即通過對數據進行細微調整來豐富數據集的多樣性。


在NLP領域,一個經典的應用是回譯,即利用ML模型的輸出對原始文本進行重新翻譯,生成新的數據。


如今,合成數據的使命變得更加重大:通過去除人類的介入,讓AI更加符合預期且用戶友好。


這一任務由Anthropic的訓練方法和OpenAI新成立的、充滿神秘色彩的超對齊團隊牽頭,后者致力于利用AI反饋解決對齊問題。


同時,合成數據已經成為眾多知名開源模型供應商微調Meta和Mistral模型的首選工具。

合成數據,能成為下一次技術突破的關鍵嗎?


隨著當前或下一代模型很可能已經用盡了互聯網上所有的高質量數據源,模型開發者正在尋找新的途徑來獲取所需的大規模數據,以支持模型的持續擴展。


合成數據的支持者認為,增加更多的數據有助于模型更好地解決那些長尾任務或評估問題。為了模型能夠擴大100倍,將需要大量的合成或數字化數據。


反對者則認為,我們生成的所有數據都來源于與當前SOTA模型相同的分布,因此不太可能推動技術產生新的進展。


盡管如此,開源領域仍然遠遠落后于GPT-4和GPT-4-Turbo,這意味著我們想要在開發的各個階段復制這些數據,還有很長的路要走。


開源的支持者和HuggingFace Hub 上的大多數趨勢模型都將合成數據作為一種快速行動的方式,并有能力在行業中嘗試 SOTA 語言模型背后的技術。


開源支持者和HuggingFace Hub上大多數流行模型,都將合成數據作為一種快速發展,并嘗試業內最先進SOTA語言模型的方法。


像Anthropic和OpenAI這樣的公司使用合成數據,因為這是他們在規模和能力上取得進展的唯一方式,而小模型之所以使用合成數據,是因為相同規模的人類數據的成本要高出數千倍。


在這種二分法中,雖然方法看起來相似,但大公司會在創建數據集(預訓練規模的合成數據)上投入超過1000萬美元的推理計算成本,而開源競爭者可能只需要花費大約10美元。

盡管開源和閉源這兩個社區追求的目標截然不同,合成數據卻同時為他們雙方提供了支持。


合成數據可以讓模型在訓練中能多次看到某些不常見的數據點,從而使模型的魯棒性得到提升。


通過投喂大量數據,模型在小眾事實、語言和任務的處理能力也都將顯著提高。

Anthropic的CAI技術與合成數據的復雜性

關于Anthropic大量使用合成數據的傳言眾所周知,這種做法顯著提升了他們的模型魯棒性。


盡管Meta的Llama 2聊天機器人因基于隱藏的觸發詞列表而做出荒謬的拒絕而受到批評,但Anthropic的模型在拒絕不了解的問題時表現出了更加合理的判斷,值得我們給予肯定。


Anthropic在其Claude系列模型中廣泛采用的憲法AI(Constitutional AI, CAI)技術,是迄今為止已知最大規模的合成數據應用實例。


具體來說,憲法AI通過兩種方式利用合成數據:

1. 對指令調整數據進行評估,確保其遵循一系列原則,如「答案是否鼓勵暴力」或「答案是否真實」。模型在生成問題答案時會根據這些原則進行檢查,并隨時間優化答案。之后,模型會根據這些經過篩選的數據進行微調。

2. 利用語言模型生成成對偏好數據,評估在特定原則指導下哪個答案更為恰當(類似于某篇論文中對原則引導獎勵模型的使用)。隨后,模型通過合成數據進行正常的從人類反饋中學習(RLHF),這一過程也稱為RLAIF。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

如今,RLAIF已成為業界廣泛認可的術語,很多研究人員都會通過使用GPT-4來獲取評分或選擇,這些評分或選擇可以轉化為RLHF所需的接受/拒絕樣本。


然而,由于在生成批評/對多個答案進行評分與在合成數據生成階段確定一套經驗穩定原則之間存在細微差別,CAI的復雜性和細節并未被充分理解。


在進行CAI的兩個核心步驟時,Anthropic必須確保各項原則長度一致,避免概念上的重疊,并且不能隨意更改其規模。此外,有些原則所生成的數據在數值上可能會出現不穩定。

合成指令、偏好和評論

在開源模型里,我們可以清晰地看到合成數據應用方式的演進。


2023年初,模型如Alpaca和Vicuna通過使用合成指令數據對Llama模型進行監督式微調(SFT),在7-13B參數規模上實現了顯著的性能提升。


其中,很多開源指令數據集都是基于Self-Instruct方法的進步——先創建一組「種子」指令,然后利用大語言模型(LLM)生成類似的指令。目前有許多方法可以實現這一點,但都還在探索如何為數據集增加多樣性的初期階段。


與此同時,一些研究人員通過從互聯網上抓取提示,并用GPT-4將這些提示轉化為指令。但要注意,像ShareGPT這樣的提示數據集,其平均質量較低,分布也較為窄。


如今,合成偏好開始出現。這主要是通過評分或比較哪個更好來實現,類似于MT Bench和AlpacaEval的評分方法,但是會保留分數或勝負作為訓練數據。


例如,UltraFeedback就是從用戶來源(如ShareGPT)和現有的指令數據集(如FLAN)中收集提示,并生成模型的評論和完成情況。


最新的進展是通過AI評論生成的偏好或指令數據。評論是一個反復利用經過特定原則或問題微調的大語言模型(LLM)的過程。期間,增加更多的上下文信息,會大幅提高模型評論合成數據的能力,但系統設計也更加復雜。


像Meta的Shephard和KAIST的Prometheus這樣的評論模型開始出現,它們能夠對提示-生成對做出響應。但我們距離模型、意圖和知識協同作用的反饋循環還有很長的路要走

下面是一張簡單的圖表,用來展示合成指令生成是偏好上游,而偏好既是評論的上游,也是訓練難度的上游。


盡管原始的ChatGPT模型(GPT-3.5-turbo)在執行一些任務時會遇到困難,比如返回一個1到10之間的單個整數,但最新的模型輕松做到了這一點。


當開源模型能夠穩定地生成評論時,將迎來另一個轉折點。


雖然目前還不完全清楚,評論數據相比通用偏好評分對于模型的改進到底有多重要,但如果以Claude為例,它肯定是有用的。

清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?-AI.x社區

兩個合成數據的小竅門

1. 始終使用最優的模型來生成數據:

眾所周知,模型的效果完全依賴于數據的質量。

很多研究者可能不愿意支付OpenAI的數據訓練費用,但從成本效益來看,使用SOTA模型絕對是值得的。


這甚至包括使用一些非傳統方法,例如通過網頁版的ChatGPT來生成一系列的提示詞,這是作者親自嘗試過的。


2.API會發生變化,因此需要盡可能鎖定版本:

這一建議來自于作者數百次的MT-Bench評估經驗——模型API端點的變化可能會導致研究結果出現重大偏差。


例如,某個API端點會在評分時變得非常嚴厲,并且無緣無故地給出只有1分的評價。

如果不固定API的版本,你可能會遇到一些意想不到的問題,進而無法使合成數據完全可靠或符合邏輯。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/eF4eTJ_FeadW_r5SBfyvkw??

標簽
收藏
回復
舉報
回復
相關推薦
亚欧洲精品视频| avtt香蕉久久| av在线app| 国产成人精品免费| 国产91av在线| 中文字幕第二区| 激情综合五月| 欧美午夜片在线免费观看| 日韩久久精品一区二区三区| 国产理论片在线观看| 日韩午夜在线电影| 日韩在线观看免费高清| 一边摸一边做爽的视频17国产| 天天综合网站| 亚洲综合男人的天堂| 日本一区二区视频| 午夜久久久久久久久久| 天堂av在线一区| 欧美疯狂xxxx大交乱88av| 在线免费看黄视频| 9.1国产丝袜在线观看| 国产精品永久入口久久久| 日韩精品久久久久久久酒店| 日韩aaaa| 亚洲国产成人在线播放| 五月花丁香婷婷| 亚洲最大网站| 亚洲成a人片在线不卡一二三区| 亚洲精品8mav| 欧美孕妇性xxxⅹ精品hd| 激情欧美一区二区| 国产精品电影观看| 精品国产乱码一区二区| 中文在线播放一区二区 | 国产日韩亚洲欧美在线| 在线观看av黄网站永久| 91蜜桃在线免费视频| www.久久爱.cn| 一级特黄aaa大片| 三级在线观看一区二区| 26uuu另类亚洲欧美日本一 | 五月激情丁香一区二区三区| 国产欧美综合一区| 黄网站在线免费看| 国产精品久久久久久亚洲伦| 欧美高清视频一区| 婷婷婷国产在线视频| 国产成人综合在线播放| 91久久久久久久久久| 制服丝袜在线一区| 日本美女视频一区二区| 日韩美女视频免费在线观看| 久久精品视频1| 国产精品一区毛片| 欧美伊久线香蕉线新在线| 日韩欧美不卡视频| 国产精品外国| 2019中文字幕免费视频| 在线观看中文字幕视频| 亚洲每日更新| 91成人福利在线| 少妇一级淫片免费放中国| 国产精品日韩久久久| 日韩免费在线视频| 久草热在线观看| 美女网站在线免费欧美精品| 国产在线日韩在线| av中文字幕播放| 高清av一区二区| 精品国产乱码久久久久久郑州公司 | 你懂的在线观看网站| 欧美男男freegayvideosroom| 亚洲国产精品va在线看黑人| 不卡一区二区在线观看| 精品国产一区二区三区av片| 中文字幕日韩高清| 国产高清在线免费观看| 日韩五码在线| 国产精品成人播放| 国产麻豆精品一区| 成人国产免费视频| 日本不卡在线观看| 超碰在线网址| 欧美性猛交xxxx免费看| 黄色小视频免费网站| 香蕉免费一区二区三区在线观看| 欧美精品一区二区三区高清aⅴ | 亚洲专区视频| 综合激情国产一区| 免费视频网站www| 亚洲在线日韩| 成人午夜黄色影院| 五月天激情开心网| 日本一区二区高清| 国产肉体ⅹxxx137大胆| 快播电影网址老女人久久| 777xxx欧美| 亚洲av无码一区二区三区观看| 欧美综合一区| 欧美激情在线观看| 国产精华7777777| 国产精品亚洲午夜一区二区三区 | 国产91免费观看| 国产精品久久777777换脸| 大美女一区二区三区| 欧美一区二区三区精美影视| 动漫一区在线| 色94色欧美sute亚洲13| 少妇熟女视频一区二区三区| 精品一区二区三| 国a精品视频大全| 亚洲无码久久久久久久| www国产精品av| 久久这里只有精品18| av成人在线观看| 亚洲国产小视频| 精品在线观看一区| 午夜亚洲影视| 国产成人亚洲欧美| 快射视频在线观看| 色婷婷综合久久久| 成人午夜精品无码区| 久久久久久久久久久妇女| 欧美在线www| 欧美熟妇交换久久久久久分类| 国产精品国产三级国产普通话三级 | 国产经典自拍视频在线观看| 亚洲五码中文字幕| 婷婷激情5月天| 欧美丝袜激情| 欧美亚洲另类视频| 欧美特级特黄aaaaaa在线看| 亚洲色欲色欲www在线观看| av无码精品一区二区三区| 精品伊人久久久| 午夜视频一区| 国产精品私拍pans大尺度在线| 色哟哟国产精品色哟哟| 一区二区三区中文字幕电影 | 中文在线8资源库| 精品国产一区a| 精品在线免费观看视频| 国产精品一区二区在线观看网站| 在线视频亚洲自拍| 日日夜夜亚洲| 久久激情视频久久| 曰批又黄又爽免费视频| 国产精品无遮挡| 我要看一级黄色大片| 成人精品视频| 国产日韩中文在线| 美女隐私在线观看| 欧美一区二区视频观看视频| 国产97免费视频| 国产成人av在线影院| 成年丰满熟妇午夜免费视频| 久久九九精品视频| 欧美激情亚洲综合一区| 欧美一区二区三区激情| 午夜欧美大尺度福利影院在线看| 国产chinese中国hdxxxx| 亚洲免费激情| 欧美一区免费视频| 成人午夜在线| 久久精品国产2020观看福利| 国产手机av在线| 亚洲在线成人精品| 亚洲少妇18p| 日韩经典中文字幕一区| 亚洲一卡二卡三卡四卡无卡网站在线看| jvid一区二区三区| 久久夜色精品亚洲噜噜国产mv| 国产成人精品白浆久久69| 亚洲国产欧美在线| 李宗瑞91在线正在播放| 久久福利资源站| 99er在线视频| 国产午夜一区| 亚洲free嫩bbb| 成人观看网址| 一区二区三区久久精品| 国产区精品在线| 激情成人在线视频| 中文字幕网站在线观看| 极品销魂美女一区二区三区| zzijzzij亚洲日本成熟少妇| 亚洲欧美日韩三级| 国产精品99久久| av一区二区三区四区电影| 中文字幕第17页| 成人在线免费观看网站| 91精品视频在线播放| www.综合| 中文字幕视频在线免费欧美日韩综合在线看| 一级特黄aa大片| 国产亚洲一级高清| 亚洲色图日韩精品| 国产黄色精品视频| 一本大道熟女人妻中文字幕在线 | 精品久久久久久亚洲| 日本成人伦理电影| 欧美美最猛性xxxxxx| 欧美女子与性| 99精品综合| 成人美女av在线直播| 国产丝袜精品丝袜| 主播福利视频一区| 天天操天天干天天| 正在播放亚洲一区| 国产亚洲欧美在线精品| 亚洲精品福利视频网站| 国产又黄又粗的视频| www.欧美.com| 亚欧精品在线视频| 日本vs亚洲vs韩国一区三区二区 | 亚洲一区自拍| 永久免费看av| 不卡在线一区二区| 久久国产日韩欧美| 精品午夜视频| 国产原创欧美精品| 91精品论坛| 韩国一区二区电影| 午夜小视频在线观看| 中文字幕久热精品在线视频| 亚洲色欧美另类| 精品乱人伦小说| 国产婷婷在线视频| 欧美日韩一区二区在线观看 | 成人免费在线| 色妞色视频一区二区三区四区| 欧美套图亚洲一区| 亚洲国产91色在线| 亚洲第一免费视频| 欧美一区二区日韩| 国产又大又长又粗| 欧美日韩一区不卡| 久久人人爽人人爽人人片av免费| 精品久久久久久亚洲国产300| 久久久精品人妻一区二区三区四| 亚洲天堂中文字幕| 99自拍偷拍视频| 中文字幕不卡在线观看| 夫妇交换中文字幕| 国产午夜精品一区二区三区嫩草 | 老头吃奶性行交视频| 亚洲欧美日韩视频二区| 欧美一区二区三区爽大粗免费 | 青青在线免费观看视频| 久久资源在线| 精品一卡二卡三卡| 久久久久国产精品一区三寸| 久草精品在线播放| 日韩中文字幕亚洲一区二区va在线 | 国产在线高清视频| 欧美老少配视频| 日韩免费影院| 高清一区二区三区日本久| 麻豆理论在线观看| 国产精品99导航| 亚洲ww精品| 91在线在线观看| 日韩三级不卡| 精品在线一区| 成人午夜国产| 免费观看国产视频在线| 黄色精品网站| 黄在线观看网站| 亚洲精品乱码视频| 国产欧美日韩视频在线| 欧美午夜精品久久久久久蜜| 国产一卡不卡| 亚洲一二三区在线| 欧美精品色网| 日韩精品视频一区二区在线观看| 久久精品日产第一区二区| 三上悠亚在线一区二区| 国产乱国产乱300精品| 一本色道久久hezyo无码| 99精品欧美一区二区三区小说| 国产精品无码午夜福利| 国产精品对白交换视频 | 777米奇影视第四色| 奇米精品一区二区三区在线观看一 | 4k岛国日韩精品**专区| 中文字幕成在线观看| 国产精品久久久久久久app| 国产免费av国片精品草莓男男| 国产精品久久久久久久久久久久冷 | 日b视频在线观看| 国产清纯白嫩初高生在线观看91 | 国产精品久久久久久久美男| 国产视频网站一区二区三区| 久久精彩视频| 天天影视欧美综合在线观看| 少妇人妻无码专区视频| 美女国产一区二区| 一边摸一边做爽的视频17国产| 亚洲国产经典视频| 国产精品a成v人在线播放| 欧美午夜影院一区| 黄色三级网站在线观看| 最新91在线视频| 樱桃视频成人在线观看| 亚洲va男人天堂| 国产videos久久| 日本欧美视频在线观看| 美女视频免费一区| 国产国语老龄妇女a片| 成人免费在线观看入口| av一级在线观看| 亚洲电影在线看| 国产鲁鲁视频在线观看特色| 日韩av电影在线免费播放| 国产精品jk白丝蜜臀av小说| 久久久国产精华液999999| 久久久夜夜夜| 国产大学生视频| 亚洲六月丁香色婷婷综合久久| 欧美brazzers| 亚洲精品国精品久久99热| 亚洲www色| 成人网在线免费观看| 欧美日韩水蜜桃| 国产乱子夫妻xx黑人xyx真爽| 国产aⅴ精品一区二区三区色成熟| 殴美一级黄色片| 欧美午夜影院一区| 九色视频在线观看免费播放| 高清欧美性猛交xxxx黑人猛交| 亚洲伊人影院| 日韩精品久久一区二区| 狠狠色丁香久久婷婷综合丁香| 国产18无套直看片| 色婷婷久久99综合精品jk白丝| 天天操天天舔天天干| 韩国精品久久久999| 白嫩白嫩国产精品| 久久久久久久久久伊人| 国产一区二区福利| 成人免费精品动漫网站| 91精品综合久久久久久| 免费黄色在线| 91精品免费视频| 一区二区影院| 香蕉视频xxx| 一二三四社区欧美黄| 高h调教冰块play男男双性文| 欧美黄色www| 久久99精品国产自在现线| 久久精品视频16| www久久久久| 波多野结衣影片| 自拍偷拍亚洲欧美| 国产精品1区在线| 18视频在线观看娇喘| 国模大尺度一区二区三区| avove在线播放| 日韩精品一区二区三区在线观看 | 国产国语刺激对白av不卡| 欧美天天综合| 天堂中文av在线| 一区二区三区加勒比av| 日本高清视频网站| 日本中文字幕成人| 日韩中文在线电影| 国产高清av片| 亚洲一区二区在线播放相泽| 香蕉视频国产在线| 国产精品美女视频网站| 天天av综合| 人妻换人妻a片爽麻豆| 欧美色视频日本版| 91成人高清| 超碰97在线资源| 国产亚洲毛片| 黄色录像免费观看| 精品久久一区二区三区| 欧美xxx性| 91精品一区二区三区四区| 97se亚洲国产综合在线| 毛片在线免费播放| 欧美乱大交做爰xxxⅹ性3| 丝袜美腿综合| www.国产视频.com| 亚洲综合色丁香婷婷六月图片| 日本大片在线观看| 成人免费观看a| 一区二区动漫| www.av免费| 亚洲欧美日韩一区二区在线| www.久久久.com| 亚洲中文字幕无码中文字| 日韩理论在线观看| 五月天丁香视频| 91黄在线观看| 免费高清视频精品| 日本在线视频免费观看| 日韩在线观看免费av| 奇米亚洲欧美|