精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4 Turbo重回王座,ChatGPT免費升級!數(shù)學暴漲10%/上下文全面碾壓

人工智能
ChatGPT也能用上最強的GPT-4 Turbo了!今天,新版GPT-4 Turbo再次重奪大模型排行榜王座,超越了Claude 3 Opus。而且,新模型在處理64k長上下時,性能直接達到了舊版在26k時的性能。

今天起,最新版的GPT-4 Turbo,正式向ChatGPT Plus用戶開放了!

圖片圖片

有了GPT-4 Turbo加持后,ChatGPT寫作、數(shù)學、邏輯推理和編碼的能力得到提升。

小編小試,果然ChatGPT最新數(shù)據(jù)已經(jīng)更新到了4月。

圖片圖片

根據(jù)基準測試結(jié)果,GPT-4 Turbo在數(shù)學能力比上一代有了明顯改進。

圖片圖片

這也就不難理解,新版的GPT-4 Turbo今天再次登頂大模型排行榜。

圖片圖片

就連奧特曼本人表示,「GPT-4現(xiàn)在更加智能,使用起來也更舒適」。

圖片圖片

另外,據(jù)OpenAI介紹,GPT-4 Turbo在回復時,變得更直接、減少啰嗦內(nèi)容,更加口語化。

圖片圖片

一起看看,GPT-4 Turbo在基準測試中能力如何?

數(shù)學性能提升近10%

在官方公開GitHub上,OpenAI放出了gpt-4-turbo-2024-04-09最新的評估結(jié)果。

主要在以下七大基準上,對模型完成了評估:

  • MMLU(測量大規(guī)模多任務(wù)語言理解)
  • MATH(使用MATH數(shù)據(jù)集測量數(shù)學問題解決能力)
  • GPQA(研究生級別的谷歌防護問答基準)
  • DROP(需要對段落進行離散推理的閱讀理解基準)
  • MGSM(多語言小學數(shù)學基準):語言模型作為多語言思維鏈推理者
  • HumanEval(評估在代碼上訓練的大型語言模型)
  • MMMU(用于專家通用人工智能的大規(guī)模多學科多模態(tài)理解和推理基準)

在這個GitHub庫中,OpenAI主要使用零樣本、CoT設(shè)置,并采用簡單的指令,如「解決以下多項選擇題」。

這種提示方式更能真實反映模型在實際使用中的表現(xiàn)。

具體結(jié)果如下所示:

最新的gpt-4-turbo比以往的GPT-4系列,在性能上有著明顯的提升。

尤其數(shù)學方面,能力實現(xiàn)了近10%的躍階。

圖片圖片

而在整體的比較中,新模型也基本上實現(xiàn)了對Claude 3 Opus和Gemini Pro 1.5的全面超越。

圖片圖片

大海撈針比初代GPT-4提升4.3倍

同樣的,在大海撈針測試中,最新的gpt-4-turbo也是全方位地超越了此前的1106-preview。

圖片圖片

眾所周知,上下文越長,對模型的挑戰(zhàn)就越大。

而gpt-4-turbo可以在處理長達64k Token的內(nèi)容時,性能直接媲美預(yù)覽版在26k Token時的表現(xiàn)。

圖片圖片

如果我們回顧一下GPT-4剛發(fā)布時的情況,也就是大約一年之前。

最新的gpt-4-turbo在32k的配置下,性能比初代GPT-4提高了約4.3倍。

順便一提,那個時候,模型能處理的上下文最高只到32k。

圖片圖片

GPT-4 Turbo重回王座

前段時間,Anthropic手里的最強大模型Claude 3 Opus,可以說是霸榜各大榜單。

不過,就在今天,OpenAI憑借著全新的gpt-4-turbo,又把它從「榜一」的位置上拉了下來。

根據(jù)「LLM排位賽」最新的結(jié)果,GPT-4-Turbo再次超越Claude 3,奪得第一。

圖片圖片

LMSYS Org從多個領(lǐng)域收集了超過8000張人類投票,發(fā)現(xiàn)GPT-4-Turbo在編程與推理方面的表現(xiàn),超越了其他模型。

為了深入了解,研究人員在Arena引入了「類別」功能。

通過這一新功能,可以對編程、長查詢處理和多語言能力等不同領(lǐng)域進行了更詳盡的比較。

圖片圖片

研究人員還對編程領(lǐng)域中包含代碼片段的所有對話進行了標記。在這一方面,GPT-4-Turbo展現(xiàn)出更強的性能。

圖片圖片

類似的,Naman Jain也發(fā)現(xiàn),新版GPT-4-Turbo在LiveCodeBench(包含編程競賽題)上的表現(xiàn),提高了驚人的4.5分。

這類問題對目前的LLM來說挑戰(zhàn)很大,而OpenAI此次的更新,明顯是大幅提升了模型推理能力。

圖片圖片

在長查詢領(lǐng)域(Token數(shù)量超過500),Claude-3 Opus表現(xiàn)最佳。

令人有些意想不到的是,Command R/R+在這一領(lǐng)域中也有著非常高的得分。

圖片圖片

圖片圖片

有趣的是,如果只涉及英語提示,排名會與整體略有不同。

在這一類別中,三種GPT-4-Turbo依然處于領(lǐng)先地位。

而這種變化的產(chǎn)生,是因為隨著用戶基數(shù)的擴大,語言使用從英語轉(zhuǎn)向包括中文在內(nèi)的多種語言。

圖片圖片

而在應(yīng)對不同的語言時,模型的表現(xiàn)也有所差異。

例如,在中文環(huán)境中,Claude-3 Opus排名第一。

圖片圖片

以下是模型評分的置信區(qū)間 (CIs) :

圖片圖片

以及整體的勝率熱圖:

圖片圖片

參考資料:

https://twitter.com/OpenAI/status/1778574613813006610

https://twitter.com/lmsysorg/status/1778555678174663100

責任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2023-11-17 18:06:15

2024-02-20 13:31:46

模型數(shù)據(jù)

2024-04-10 14:07:00

數(shù)據(jù)AI

2024-04-25 16:56:14

GPT-4大模型人工智能

2023-12-26 08:17:23

微軟GPT-4

2025-05-30 07:40:56

2023-06-14 12:35:57

2023-11-13 08:03:33

2024-05-21 12:23:17

2023-03-02 22:46:48

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2024-06-28 12:31:22

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2023-08-29 12:45:32

2024-03-28 13:15:00

化學專業(yè)Claude 3GPT-4

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2025-04-15 07:41:18

2023-12-17 22:04:04

微軟GPT-4

2023-11-08 13:05:23

AI模型

2023-12-25 12:32:28

點贊
收藏

51CTO技術(shù)棧公眾號

成人不用播放器| 美女视频黄免费| 日本中文字幕一区二区| 国产日韩欧美激情| 91午夜理伦私人影院| 日韩乱码一区二区| 青青草综合网| 精品欧美久久久| 麻豆传传媒久久久爱| 老司机在线看片网av| 不卡av电影在线播放| 国产精品国产三级国产aⅴ9色| 神马午夜精品91| 羞羞色国产精品网站| 欧美日韩aaaaaa| 欧美爱爱视频免费看| 嫩草香蕉在线91一二三区| 99久久精品免费看| 91社区国产高清| 国产视频1区2区| 欧美日韩亚洲一区在线观看| 国产亚洲精品综合一区91| 久久精品无码专区| 色综合视频一区二区三区44| 污片在线观看一区二区| 宅男在线精品国产免费观看| 黑人与亚洲人色ⅹvideos| 国产福利一区在线观看| 国产精品日韩av| 丰满少妇乱子伦精品看片| 亚洲一本二本| 久久精品电影一区二区| 日韩人妻无码精品综合区| 成人三级av在线| 欧美一区二区在线看| 999精品视频在线| 这里有精品可以观看| 亚洲国产成人av| 日本a在线天堂| 黄色成人影院| 中文字幕一区视频| 日韩欧美精品久久| 免费观看的毛片| 高清不卡一二三区| 亚洲综合中文字幕68页| 一二三区中文字幕| 秋霞影院一区二区| 国产精品黄色av| 超碰超碰超碰超碰| 亚洲综合社区| 91成品人片a无限观看| 日韩成人免费观看| 91久久视频| 午夜精品久久久久久久白皮肤| 久久久久黄色片| 国产精品啊啊啊| 久久久久久久av| 久久久综合久久久| 激情av一区| 6080yy精品一区二区三区| 天天操夜夜操视频| 天堂成人免费av电影一区| 日韩美女中文字幕| 久久久999久久久| 久久精品国产久精国产爱| 国产精品久久久久久久久久久久久| 精品成人无码久久久久久| 日本不卡一区二区三区| 国产欧美精品一区二区三区介绍| 在线观看国产小视频| 韩国精品久久久| 97久久精品午夜一区二区| 高清乱码毛片入口| 26uuu亚洲综合色欧美| 日本10禁啪啪无遮挡免费一区二区| chinese偷拍一区二区三区| 国产精品网站导航| 可以在线看黄的网站| 日本三级在线观看网站| 欧美日韩精品在线播放| 美女网站免费观看视频| 欧美伊人亚洲伊人色综合动图| 日韩一区二区中文字幕| 国产精品入口麻豆| 国产精品免费大片| 久久精品国产一区二区电影| 久久精品国产亚洲av香蕉| 亚洲一区二区三区免费在线观看| 国产精品久久久av久久久| 国产精品人人妻人人爽| 99国产精品久久久久久久久久久| 日韩久久精品一区二区三区| av在线免费观看网址| 亚洲大片免费看| 黄色aaa级片| 91久久偷偷做嫩草影院电| 亚洲女成人图区| 日本青青草视频| 久久精品亚洲一区二区| 91在线免费看网站| 日中文字幕在线| 亚洲免费在线视频| 色欲av无码一区二区人妻| 四虎成人精品一区二区免费网站| 亚洲成人网在线| 91麻豆精品久久毛片一级| 亚洲理伦在线| 成人免费网视频| 欧美挠脚心网站| 亚洲自拍偷拍综合| 91极品视频在线观看| 女仆av观看一区| 精品中文字幕乱| 在线观看日韩一区二区| av综合在线播放| 国产日本欧美在线| 欧美123区| 日韩经典第一页| 黄页网站免费观看| 美女久久久精品| 久久精品人人做人人爽电影| 欧美另类tv| 欧美精品色综合| 午夜时刻免费入口| 亚洲综合激情| 国产欧美一区二区视频| 免费大片在线观看www| 在线观看av一区二区| 国产精品九九九九九| 在线精品观看| 99热国产免费| a级片国产精品自在拍在线播放| 欧美亚洲日本国产| 国产中年熟女高潮大集合| 亚洲精品女人| 国产精品手机在线| 日本大胆在线观看| 日韩欧美的一区| 欧美在线视频第一页| 久久99久久精品欧美| 日韩亚洲欧美精品| 户外露出一区二区三区| 国产网站欧美日韩免费精品在线观看 | 国产乱码精品一区二区三区日韩精品 | 欧美在线一级| 日韩在线视频网站| 一区二区三区日| 亚洲少妇中出一区| 欧美污在线观看| 欧美黄色一区二区| 成人免费看片网址| 91制片在线观看| 亚洲精品国精品久久99热| 日韩欧美视频在线免费观看| 成人国产精品免费观看视频| 成年人网站国产| 欧美黄色录像| 青青草原成人在线视频| 韩国中文免费在线视频| 欧美四级电影网| 懂色av粉嫩av蜜臀av一区二区三区| 久草这里只有精品视频| 天天爱天天做天天操| 毛片在线免费视频| www.五月天色| 99视频这里有精品| 日韩中文字在线| 国产农村老头老太视频| 樱花草国产18久久久久| 北京富婆泄欲对白| 母乳一区在线观看| 色一情一乱一伦一区二区三区丨| 久久精品xxxxx| 欧美精品生活片| 手机在线观看免费av| 色婷婷综合激情| 亚洲一级二级片| 成人中文字幕合集| 人妻有码中文字幕| 99精品全国免费观看视频软件| 不卡视频一区二区| 成人美女视频| 久久成人免费视频| 天堂中文在线资| 欧美视频自拍偷拍| 国产精品第108页| 日本一区二区三区久久久久久久久不 | 日韩免费高清av| 男人天堂2024| 亚洲理论在线观看| 性欧美13一14内谢| 国产一区二区伦理| 白嫩少妇丰满一区二区| 欧美国产三区| 日韩欧美在线观看强乱免费| 亚洲欧美日本国产| 国产精品∨欧美精品v日韩精品| 日韩黄色影院| 日韩精品视频在线免费观看| 国产精品视频第一页| 色偷偷久久人人79超碰人人澡| 翔田千里88av中文字幕| 91丝袜呻吟高潮美腿白嫩在线观看| 午夜精品中文字幕| 亚洲欧美日韩国产综合精品二区| 天天干天天操天天干天天操| 婷婷成人影院| 高清一区二区三区视频| 欧美韩国日本| 日韩美女主播视频| xxxcom在线观看| 不卡av日日日| 在线免费观看黄色网址| 国产视频在线观看一区二区| 东京干手机福利视频| 欧美日韩国产成人在线91| 丰满少妇xoxoxo视频| 亚洲福利视频导航| 蜜臀久久精品久久久用户群体| 国产欧美视频在线观看| 国产制服丝袜在线| 国产成人精品网址| 中文字幕第六页| 久久国产综合精品| 天堂中文视频在线| 久久在线精品| 丰满爆乳一区二区三区| 激情久久中文字幕| 老司机激情视频| 欧美xxx在线观看| 宅男一区二区三区| 欧美黄色大片在线观看| 天堂资源在线亚洲资源| 性欧美xxxx免费岛国不卡电影| 国产日韩一区欧美| 国产福利一区二区精品秒拍| 91九色对白| 亚洲**毛片| 99久热re在线精品996热视频| 疯狂欧洲av久久成人av电影| 成人黄色在线免费| 欧美一区二区三区婷婷| 国产精品一区二区久久久| 91精品影视| 国产精品男人的天堂| www.久久.com| 91精品啪aⅴ在线观看国产| 欧美韩国日本| 91视频99| 成人看片爽爽爽| 精品国产乱码久久久久久郑州公司| 成人知道污网站| 国产私拍一区| 特黄特色欧美大片| 日本精品一区二区三区高清 久久 日本精品一区二区三区不卡无字幕 | 一区二区三区不卡视频在线观看| 欧美激情精品久久| 亚洲国产日韩综合久久精品| 亚洲精品www久久久久久| 亚洲.国产.中文慕字在线| 国产情侣在线视频| 色妞www精品视频| 中文字幕永久免费视频| 91精品国产免费久久综合| 性一交一乱一乱一视频| 亚洲国产精品va在线| 国产在线视频网| 日韩在线观看av| 性爱视频在线播放| 69国产精品成人在线播放| 日韩电影av| 亚洲自拍av在线| 人人精品视频| 亚洲一区二区三区精品在线观看| 亚洲激情中文| 自拍日韩亚洲一区在线| 人人狠狠综合久久亚洲| 古装做爰无遮挡三级聊斋艳谭| 不卡视频在线观看| 日本成人午夜影院| 亚洲在线视频一区| 黄色污污网站在线观看| 欧美一卡2卡3卡4卡| 性一交一乱一色一视频麻豆| 亚洲精品丝袜日韩| 国产在线网站| 欧美激情视频在线| 中文在线资源| 5g国产欧美日韩视频| 中文有码一区| 国产人妻人伦精品| 视频在线观看91| 欧美人与性动交α欧美精品| 久久久国产一区二区三区四区小说| 亚洲精品自拍视频在线观看| 午夜精品久久久| 国产精品久久久久久久久久久久久久久久久久 | 亚洲 欧美 另类人妖| 国产成人av自拍| a级片在线观看| 亚洲1区2区3区视频| 国产精品免费无遮挡| 亚洲日本成人网| 好久没做在线观看| 91精品国产综合久久久久久蜜臀 | 日韩国产欧美一区| 黑人一区二区| 一级片黄色免费| 国产精品入口麻豆九色| 日韩精品久久久久久久酒店| 5566中文字幕一区二区电影 | 欧美美女操人视频| 写真福利精品福利在线观看| 国产欧美在线一区二区| 亚洲成人精品| 国产精品久久a| 久久免费国产精品| 日韩欧美激情视频| 日韩欧美一级在线播放| 免费**毛片在线| 国产精品欧美日韩一区二区| 日韩av午夜| 农民人伦一区二区三区| 国产麻豆午夜三级精品| 999福利视频| 欧美午夜精品一区二区三区| 三级无遮挡在线观看| 1769国内精品视频在线播放| 加勒比色综合久久久久久久久| 400部精品国偷自产在线观看 | 精品91久久久久| 四川一级毛毛片| 亚洲精品视频一区二区| 91福利在线观看视频| 色偷偷av一区二区三区乱| 日本黄色一区| 亚洲精品国产一区| 蜜乳av一区二区三区| 手机看片日韩av| 欧美亚洲免费在线一区| av女优在线| 国产欧美婷婷中文| 国产高清一区| √天堂资源在线| 亚洲色图清纯唯美| 国产成人精品无码高潮| 欧美大片免费看| eeuss鲁片一区二区三区| 精品国产av无码一区二区三区| 成人久久18免费网站麻豆| 国产一级特黄aaa大片| 亚洲国产日韩欧美在线99| 涩涩视频在线播放| 茄子视频成人在线观看| 视频一区欧美日韩| 国产一二三四区在线| 欧美日韩国产一级| 天堂8中文在线| 韩日午夜在线资源一区二区| 免播放器亚洲| 欧美人妻一区二区三区| 欧美裸体bbwbbwbbw| 欧美日韩在线视频免费观看| 精品视频在线观看| 视频精品一区二区| 欧美另类69xxxx| 欧美一级二级三级乱码| 999精品网| 天天久久人人| 风间由美性色一区二区三区 | 三级黄色免费观看| 日韩精品自拍偷拍| xx欧美xxx| 精品久久免费观看| 成人av手机在线观看| 日本免费在线观看视频| 日韩一区二区欧美| a看欧美黄色女同性恋| 99久久国产宗和精品1上映| 国产精品久久久久精k8| 亚洲av永久无码国产精品久久| 66m—66摸成人免费视频| 日本精品三区| 成人欧美精品一区二区| 一本久道中文字幕精品亚洲嫩| 日本在线观看www| 国产日韩欧美二区| 久久精品国产亚洲aⅴ| 日韩伦人妻无码| 久久精品视频导航| 人人精品亚洲| 国产又粗又猛大又黄又爽| 欧美日韩亚洲一区二区| 黄网站在线免费看| 久久涩涩网站| 国产成人免费视频精品含羞草妖精| 色老头一区二区| 午夜精品久久久久久久白皮肤| 99视频精品视频高清免费| 粉嫩av蜜桃av蜜臀av|