精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4.1全網(wǎng)實測來襲,慘遭谷歌Gemini碾壓!大佬猜測:從GPT-4.5蒸餾的

人工智能 新聞
兩個月后就號稱要淘汰GPT-4.5的GPT-4.1,實力究竟如何?在眾多實測中,它的表現(xiàn)的確可圈可點,但卻依然打不過Gemini 2.5 Pro和Claude 3.7 Sonnet。那么問題來了,OpenAI為何要發(fā)布一個遠遠落后于谷歌的模型?

不過兩月,GPT-4.5正式出局,前浪把后浪拍在了沙灘上。

圖片

GPT-4.1家族的出世,以更強編碼性能,百萬token上下文,更具性價比的價格,直接擊穿了4.5。

nano版的GPT-4.1性能足以媲美GPT-4o mini,而且速度更快,價格更便宜。

圖片

圖片

這些模型目前僅在API中提供,不過目前爆火編碼平臺Windsurf、Cursor開啟了福利大放送,七天免費體驗GPT-4.1。

圖片

這不,全網(wǎng)首波實測已經(jīng)來了。

GPT-4.1編碼驚艷,卻打不過Gemini 2.5

這款以超強編碼著稱的模型,在實際任務(wù)表現(xiàn)中又如何呢?

圖片

OpenAI科學家表示,GPT-4.1是不是推理模型,卻可以在軟件工程基準測試中拿下55%高分

網(wǎng)友Flavio Adamo用同一個提示——讓小球在旋轉(zhuǎn)的六邊形中模擬自由落體,測試了GPT-4.1三款模型和GPT-4.5的編碼表現(xiàn)。

圖片

不難看出,GPT-4.1精準模擬了小球物理運動過程,GPT-4.1-mini/GPT-4.1-nano卻差了很多意思。

GPT-4.5的實力幾乎不輸GPT-4.1。

圖片

另一個類似的測試中,讓GPT-4.1挑戰(zhàn)旋轉(zhuǎn)正方形,模擬出球體在正方形內(nèi)真實彈跳的效果。

圖片

Kaggle開發(fā)者Parul Pandey表示,用GPT-4.1創(chuàng)建用于教育物理模擬的過程非常有趣。

如下,用小球擊倒金字塔代碼生成過程中,模型讀取很少的不必要的文件,代碼結(jié)構(gòu)也非常簡潔。

圖片

另一位工程師通過Windsurf讓GPT-4.1在30秒內(nèi),便生成了一個貪吃蛇的游戲。

圖片

微軟研究員Dimitris Papailiopoulos分別用GPT-4.1、GPT-4o、GPT-4.5去畫獨角獸,推測出4.1要比4o參數(shù)量小。

圖片

有一說一,GPT-4.1生成的獨角獸是當中最丑的那個。

圖片

沃頓商學院教授Ethan Mollick用GPT-4.1去生成飛船控制面板的p5js。他表示,相較于GPT-4,4.1進步非常大,整體上表現(xiàn)出色。

圖片

而且,Ethan表示GPT-4.1是第四款可以在twigl中首次運行著色器的模型。

圖片

網(wǎng)友讓GPT-4.1和Gemini 2.5 Pro去模擬一個霓虹燈照亮的賽博朋克城市夜景,4.1模型在這個案例中還是比谷歌模型強不少。

圖片

圖片

以上demo中,不難看出GPT-4.1的編碼性能確實非常驚艷,但從宏觀來看,仍不如Gemini 2.5 Pro、Claude 3.7 Sonnet。

Aider多語言編碼最新測試中,GPT-4.1得分為52.4%,接近Grok 3和DeepSeek V3。成本相較于o3-mini也降了一半。

圖片

網(wǎng)友對此吐槽到,GPT-4.1編程不如DeepSeek V3,但價格卻貴了8倍。

圖片

同樣,在最新Livebench基準評估中,也同樣印證了GPT-4.1推理、編碼、數(shù)學實力比Gemini 2.5差。

Abacus.AI創(chuàng)始人Bindu Reddy表示,4.1性能在GPT-4o之上,但Livebench結(jié)果表明,新模型只是對4o的一個增量更新。

圖片

哈佛科學家Pierre Bongrand更是一針見血地指出,OpenAI首次在谷歌之后發(fā)布了一個遠遠落后的模型。

圖片

在GPQA Diamond知識問答基準測試中,GPT-4.1系家族未達到人類博士級水平,更別提超越Gemini 2.5 Pro了。

圖片

網(wǎng)友一張惡搞圖戲稱,在OpenAI發(fā)布GPT-4和GPT-4.1期間,谷歌便將Bard進化到最強Gemini 2.5版本。

圖片

今年的AI大戰(zhàn)中,顯然是OpenAI與谷歌硬碰硬的終極較量。

谷歌包圍圈已成,OpenAI依然不可小覷

隨著GPT-4.1的發(fā)布,Ai2后訓練負責人Nathan Lambert也在第一時間發(fā)了一篇分析文章。

他表示,雖然GPT-4.1是一個小版本的更新,但這讓人們更清楚地認識到,驅(qū)動著最佳API業(yè)務(wù)的,是非常不同的模型。

如今,OpenAI正在用GPT-4.1,將API和ChatGPT分離。

它的模型正在優(yōu)化每一美元的智能,我們以后還將繼續(xù)看到,ChatGPT的處理方式和API業(yè)務(wù)的不同。

圖片

最近,OpenAI 一直在進行各種小幅更新,而他們最終的愿景,就是將ChatGPT打造成一個獨立于其API的單體應(yīng)用。

上周,ChatGPT的記憶功能得到了改進。

今天,OpenAI又宣布了一套僅限API的模型GPT-4.1,直接跟谷歌的Gemini形成了競爭。

單獨來看,其實最近的發(fā)布都沒有什么顛覆性的前沿突破,畢竟性能相當?shù)哪P停呀?jīng)存在了。

不過,從這些更新中,卻可以看出OpenAI的戰(zhàn)略重心走向。

如今,它的周活躍用戶已經(jīng)破了19億,此時,它需要的是ChatGPT及背后模型,與市場上任何其他AI產(chǎn)品都截然不同。

其他產(chǎn)品的中心,主要都是編碼或信息處理,與它們不同,ChatGPT則格外注重個性、氛圍感和娛樂性。

體現(xiàn)這一點的一個經(jīng)典例子,就是GPT-4.5連同它的高昂定價一起,正從API中被棄用,不過仍會保留在ChatGPT中。

即將發(fā)布的o3、o4或開放模型,目前還讓人看不清OpenAI的宏觀戰(zhàn)略方向。

從下圖可以看出,OpenAI傳遞的核心信息很簡單——提供性能更好、推理速度更快的模型。

圖片

以下是新的OpenAI模型與谷歌Gemini每百萬Token的價格對比(單位為美元)。

OpenAI新模型:

  • GPT-4.1:輸入/輸出:2.00/8.00 | 緩存輸入:0.50
  • GPT-4.1 Mini:輸入/輸出:0.40/1.60 | 緩存輸入:0.10
  • GPT-4.1 Nano:輸入/輸出:0.10/0.40 | 緩存輸入:0.025

OpenAI舊模型:

  • GPT-4o:輸入/輸出:2.5/10.00 | 緩存輸入:$1.25
  • GPT-4o Mini:輸入/輸出:0.15/0.60 | 緩存輸入:$0.075

谷歌Gemini:

  • Gemini 2.5 Pro (≤200K Tokens):輸入/輸出:1.25/10.00 | 緩存:不可用
  • Gemini 2.5 Pro (>200K Tokens):輸入/輸出:2.50/15.00 | 緩存:不可用
  • Gemini 2.0 Flash:輸入/輸出:0.10/0.40 | 緩存輸入:0.025(文本/圖像/視頻),0.175 (音頻)
  • Gemini 2.0 Flash-Lite:輸入/輸出:0.075/0.30 | 緩存:不可用

雖然OpenAI的模型學術(shù)評估結(jié)果表現(xiàn)強勁,但這并未完全反映它們的實際情況。畢竟在實踐中,它們需要執(zhí)行的是重復(fù)性的小眾任務(wù)。

顯然,這些新模型是用來直接對標Gemini Flash和Flash-Lite的(在 Gemini 2.5 Pro驚艷發(fā)布之后,備受期待的Gemini 2.5 Flash也即將面世)。

相比之下,GPT-4o-mini的性能已經(jīng)落后,且不如Flash好用。

想在API業(yè)務(wù)上取得成功,OpenAI就需要在Gemini已經(jīng)占據(jù)優(yōu)勢的這個前沿領(lǐng)域?qū)崿F(xiàn)突破。

圖片

都是從GPT-4.5蒸餾來的?

很多人已經(jīng)發(fā)現(xiàn)了:在OpenAI的官方宣傳中,這些新模型的發(fā)布模式如出一轍——有廣泛改進,卻很少解釋具體原因。

所以幾乎可以肯定,這些五花八門的新模型,都是為了獲得更好的個性和推理能力,從GPT-4.5蒸餾而來的。

或者是在編碼和數(shù)學上,借鑒了像o3這樣的模型。

可以看出,新模型在代碼上已經(jīng)取得了重大進步,要知道,曾經(jīng)OpenAI早期的模型在這方面曾經(jīng)差得離譜,幾乎掛0。

圖片

不過,在編碼和數(shù)學的評估上,這些新模型仍然明顯落后于Gemini 2.5(推理模型)或 Claude 3.7(可選推理模型)這樣的頂尖模型。

如今,我們正處于模型向包含推理轉(zhuǎn)變的早期階段,但究竟什么是單一的最佳模型,這個概念已經(jīng)變得更為復(fù)雜了。

這些推理模型會通過消耗遠多于以往的Token,來實現(xiàn)性能的大幅提升。性能固然是王道,但若性能相當,則是成本更低者勝出。

但先發(fā)優(yōu)勢仍難以撼動

但說到底,對大多數(shù)普通用戶來說,上面這些技術(shù)細節(jié)其實意義不大。

對他們來說,那個被戲稱為「模型投入度」的、令人頭疼的滑塊反而更直觀——

圖片

長期以來,相對于API的價格,很多人對聊天機器人的訂閱費會更感到猶豫。

但顯然,一個日漸清晰的現(xiàn)實就是,真正個性化的、受用戶喜愛的體驗,往往只存在于這些集成的應(yīng)用程序中。

當然,開發(fā)者也可以通過API構(gòu)建競品,積累用戶交互數(shù)據(jù),但鑒于 OpenAI在產(chǎn)品層面已經(jīng)建立起了巨大的先發(fā)優(yōu)勢,想要勝過OpenAI,恐怕沒那么容易。

所有這些,都再次印證了我們的認知:產(chǎn)品化,是當前AI發(fā)展的重中之重。

記憶功能,以及將ChatGPT這條產(chǎn)品線與API服務(wù)進行更清晰的切割,都有助于OpenAI鋪平未來的發(fā)展道路。

但要完全實現(xiàn)這一愿景,OpenAI前方仍有很長的路要走。

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-05-06 08:25:00

2023-12-09 14:30:50

2025-05-15 11:54:11

GPT-4.1PlusAPI

2025-04-15 07:26:16

2025-04-15 06:41:41

2025-04-15 07:41:18

2023-08-02 00:19:46

2025-03-05 09:32:00

2025-11-19 08:10:51

2025-04-15 09:50:06

2023-12-18 15:08:00

GPTOpenAI泄露

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2025-05-15 09:34:39

2025-06-18 16:44:27

2023-08-17 13:09:41

2025-02-13 09:10:47

2023-12-20 15:32:02

模型數(shù)據(jù)

2025-03-03 07:39:23

2025-02-10 09:00:00

2025-02-18 09:21:21

點贊
收藏

51CTO技術(shù)棧公眾號

青青草在线免费视频| 国产一级片免费观看| 不卡一区视频| 亚洲图片欧美综合| 欧美日韩高清免费| 国产日韩欧美视频在线观看| 尤物精品在线| 中文字幕亚洲天堂| 亚洲精品国产成人av在线| 日韩在线短视频| 亚洲综合色自拍一区| 色噜噜一区二区| 婷婷五月综合激情| 美女视频第一区二区三区免费观看网站 | 国产免费观看久久| 高清国产在线一区| 一区二区 亚洲| 性8sex亚洲区入口| 欧美成人激情视频免费观看| 99久久久无码国产精品性| 日韩精品一区二区三区中文| 日本高清成人免费播放| 国产www免费| 国产剧情在线| 欧美激情一区二区在线| 精品一区二区三区国产| www.超碰在线.com| 精品无人区卡一卡二卡三乱码免费卡| 青草热久免费精品视频| 日本一级黄色录像| 午夜欧美视频| 欧美成人午夜免费视在线看片| 性猛交娇小69hd| 日韩在线黄色| 亚洲国产中文字幕久久网| 亚洲日本黄色片| 国产成人午夜性a一级毛片| 疯狂做受xxxx高潮欧美日本| av 日韩 人妻 黑人 综合 无码| 欧美三级黄网| 国产精品视频观看| 亚洲日本一区二区三区在线不卡| 精品久久av| 久久亚洲一区二区三区四区| 国产一区视频观看| 五月婷在线视频| 99视频一区二区三区| eeuss一区二区三区| 精品免费久久久| 国产精品亚洲人在线观看| 亚洲综合av影视| 精品久久国产视频| 国产.精品.日韩.另类.中文.在线.播放| 亚洲专区中文字幕| 国产高清免费观看| 国产高清久久久| 91免费在线观看网站| 精品国产乱码久久久久久蜜臀网站| 精品一区二区三区欧美| 成人免费福利视频| 国产成人精品av在线观| 床上的激情91.| 激情视频在线观看一区二区三区| 天天综合网天天综合| 久久久久久久久久久久久夜| 欧洲av一区| 国内精品久久久久国产| 一区二区三区四区乱视频| 97久久国产亚洲精品超碰热| 国产啊啊啊视频在线观看| 亚洲高清免费视频| 精品99在线视频| 成人午夜在线| 精品日韩一区二区三区免费视频| 日韩精品视频一区二区| 九一亚洲精品| 久久艳片www.17c.com | 日韩精品无码一区二区三区久久久 | 亚洲最大的黄色网址| 亚洲视频碰碰| 国产精品成人免费电影| 91麻豆成人精品国产免费网站| 国产高清久久久| 欧美日韩精品免费看| 中文字幕在线播放| 一区二区三区中文字幕| 国内自拍在线观看| 欧美电影在线观看网站| 精品日韩一区二区三区 | 狠狠综合久久av一区二区蜜桃| 在线性视频日韩欧美| 69av.com| 免费一区二区视频| 国产一区自拍视频| 在线观看完整版免费| 一区二区欧美国产| 亚洲免费av一区二区三区| 亚洲国产高清在线观看| 亚洲欧美综合区自拍另类| 日本中文字幕免费在线观看| 国产精品入口| 91最新在线免费观看| 青青九九免费视频在线| 伊人夜夜躁av伊人久久| 国产成人av影视| 911亚洲精品| 自拍偷拍亚洲一区| 国产免费观看av| 国产精品综合在线视频| 日韩欧美一区二区在线观看| 激情影院在线| 欧美丰满少妇xxxxx高潮对白| 色噜噜在线观看| 亚洲激情久久| 国产精品视频在线观看| 性感美女福利视频| 一区二区三区高清| 手机在线视频一区| 欧美系列电影免费观看| 91sao在线观看国产| a网站在线观看| 中文字幕亚洲综合久久菠萝蜜| av网站在线观看不卡| 成人三级av在线| 欧美精品性视频| 国产精品久久久国产盗摄| 久久久久久久精| 日日摸日日碰夜夜爽无码| 嫩呦国产一区二区三区av| 中国china体内裑精亚洲片| 国产午夜性春猛交ⅹxxx| 国产河南妇女毛片精品久久久| 亚洲一二三区精品| 在线看欧美视频| 精品亚洲国产视频| 五月婷婷开心网| 不卡视频在线看| 国产精品久久久久久久乖乖| 久久一级大片| 美女精品视频一区| 国产毛片在线视频| 亚洲精选视频在线| 国模大尺度视频| 午夜亚洲福利| 999热视频在线观看| 18在线观看的| 日韩欧美国产系列| 久草免费新视频| 成人午夜伦理影院| 亚洲人精品午夜射精日韩| 精品亚洲免a| 2019中文字幕免费视频| 秋霞av在线| 91国产成人在线| 亚洲一级理论片| 九九九久久久精品| 无码人妻aⅴ一区二区三区日本| www.久久久.com| 超碰91人人草人人干| 性欧美18一19性猛交| 亚洲成人av免费| 国产精品嫩草av| 久久精品毛片| 一区二区三区在线视频看| 久久伊人精品| 欧美在线视频观看| h视频在线播放| 欧美一区二区视频在线观看| 麻豆精品一区二区三区视频| 成人在线一区二区三区| 北条麻妃在线视频观看| 欧美一级精品| 亚洲自拍偷拍视频| 美女扒开腿让男人桶爽久久软| 亚洲美女视频网| 伊人22222| 亚洲综合图片区| 久久久久久久久久久国产精品| 日韩av中文字幕一区二区| 在线不卡视频一区二区| 91精品尤物| 国产精品夫妻激情| 欧美黄色视屏| 亚洲天天在线日亚洲洲精| 国产精品无码久久av| 婷婷综合久久一区二区三区| 中文字幕网站在线观看| 国产91综合一区在线观看| 日韩网址在线观看| 香蕉视频官网在线观看日本一区二区| 国产精品免费区二区三区观看| 欧洲av不卡| 欧美日韩xxx| 成人免费一区二区三区视频网站| 欧美一区二区视频网站| 中文字幕超碰在线| 亚洲女同ⅹxx女同tv| 欧美 日韩 成人| 国产69精品久久777的优势| 日本在线观看免费视频| 雨宫琴音一区二区在线| 亚洲在线视频一区二区| 偷拍精品福利视频导航| 91成人理论电影| 美女写真久久影院| 欧美激情久久久| 91大神xh98hx在线播放| 日韩电影中文字幕av| a天堂在线观看视频| 欧美视频你懂的| 国产香蕉视频在线| 亚洲精品第一国产综合野| 亚洲国产日韩一区无码精品久久久| 国产成人午夜精品影院观看视频| 爆乳熟妇一区二区三区霸乳| 99视频一区| 激情成人开心网| 香蕉国产精品| 亚洲日本精品国产第一区| 精品在线观看入口| 国产伦视频一区二区三区| 99精品国产九九国产精品| 国产精品扒开腿爽爽爽视频| 97人人在线视频| 欧美区在线播放| 成人黄视频在线观看| 中文字幕欧美国内| 国产在线视频福利| 亚洲欧美www| 网站黄在线观看| 亚洲成人性视频| 亚洲精品一区二区三区蜜桃 | 日本午夜在线亚洲.国产| 国产极品人妖在线观看| 久久国产精品视频| 国产高清一区二区三区视频| 一区二区三区国产在线观看| 青青草免费观看免费视频在线| 亚洲第一精品电影| 人妻一区二区三区四区| 亚洲精品一区二区三区影院| 丰满人妻一区二区三区免费视频| 欧美一区二区日韩| aaa一区二区三区| 日韩三级.com| 亚洲精品国产av| 亚洲国产精品系列| 青青操在线视频| 在线电影中文日韩| 幼a在线观看| 久久久999精品免费| 99视频免费在线观看| 欧美老女人在线视频| 成人性生交大片免费看网站| 欧美精品激情blacked18| av中文在线资源| 欧美一级免费视频| 天堂√中文最新版在线| 国产成人精品av| 亚洲视频自拍| caoporen国产精品| 最新国产一区| 天堂√在线观看一区二区| 忘忧草精品久久久久久久高清| 免费在线精品视频| 黑人一区二区| 精品www久久久久奶水| 美美哒免费高清在线观看视频一区二区| 一级做a免费视频| 成人在线视频一区| 欧美成人国产精品一区二区| 中文字幕一区二区三区在线不卡 | 久久一区二区三区av| 国产一区不卡| 日本美女爱爱视频| 99热精品在线| 成 人 黄 色 小说网站 s色| 国产传媒一区在线| 香蕉视频黄色在线观看| 国产精品久久久久久福利一牛影视| 一区二区三区四区五区| 五月天久久比比资源色| 中文字幕在线观看1| 日韩午夜精品视频| 国产黄在线观看| 欧美大成色www永久网站婷| 亚洲天堂av在线| 成人午夜高潮视频| 蜜桃一区二区三区| 国产香蕉一区二区三区| 免费欧美日韩| 蜜桃视频无码区在线观看| 久久亚洲一区二区三区明星换脸 | 91最新在线| 久久久久久久久亚洲| 精品三区视频| 国产亚洲欧美一区二区三区| 久久精品播放| 日本久久久精品视频| 风间由美一区二区三区在线观看| 蜜臀久久99精品久久久久久| 亚洲一区免费在线观看| 美女黄页在线观看| 亚洲欧美www| 超碰在线最新网址| 91久久国产综合久久蜜月精品| 成人激情电影在线| 色综合av综合无码综合网站| 国产美女视频91| 国产精品天天干| 日韩欧美在线观看| 亚洲国产欧美另类| 久久视频在线看| 91久久久久久白丝白浆欲热蜜臀| 国内视频一区二区| 精品电影一区| 中文字幕亚洲日本| 亚洲手机成人高清视频| 艳妇乳肉豪妇荡乳av无码福利 | 欧美亚洲色综久久精品国产| 午夜欧美一区二区三区在线播放| 国产男男gay体育生网站| 亚洲天堂成人在线| 日本黄色免费在线| 国产亚洲欧美一区二区三区| 国精品一区二区| 性一交一黄一片| 国产精品电影一区二区| 中文区中文字幕免费看| 亚洲视频欧美视频| 欧美成人h版| 欧美日韩国产精品一卡| 性欧美长视频| 不卡一区二区在线观看| 岛国av在线不卡| 五月天激情开心网| 欧美一级大胆视频| 日日天天久久| 国产精品69页| 中文字幕欧美日本乱码一线二线| 中文字幕在线播| 亚洲性xxxx| 亚洲精品555| 亚洲一区三区| 国产伦理精品不卡| 国产亚洲精久久久久久无码77777| 欧美成人午夜电影| 波多野结衣在线播放| 国产精品永久入口久久久| 亚洲欧洲日本mm| 三级电影在线看| 91久久精品一区二区| 成人福利在线| 成人综合国产精品| 国产一区二区三区四区三区四| 日本一级大毛片a一| 亚洲3atv精品一区二区三区| 午夜成人免费影院| 国产精品2018| 欧美电影三区| 制服.丝袜.亚洲.中文.综合懂| 亚洲第一综合色| 五月婷婷开心中文字幕| 国产精品成人播放| 久久久久久美女精品| 中文字幕三级电影| 在线影视一区二区三区| 日本激情在线观看| 超碰97网站| 美女网站久久| 日本一级二级视频| 国产视频久久网| 91精品福利观看| 亚洲熟妇国产熟妇肥婆| 国产日韩v精品一区二区| 91资源在线视频| 午夜精品福利在线观看| 国产日产一区| 久久发布国产伦子伦精品| 福利视频一区二区| 久久77777| 久久九九视频| 精品一区二区综合| 男女啊啊啊视频| x99av成人免费| 小说区图片区色综合区| 中文字幕国产高清| 疯狂做受xxxx欧美肥白少妇| 精品国产99久久久久久| 久久国产精品高清| 久久精品国产色蜜蜜麻豆| 国产无套内射又大又猛又粗又爽| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 99久久影视| 加勒比精品视频| 欧美一级在线视频| 国产综合色在线观看| 日本韩国欧美在线观看| 亚洲视频狠狠干| 国产高清视频在线|