精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界 原創

發布于 2025-11-18 12:18
瀏覽
1收藏

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

沒等到Gemini 3,反而等來了馬斯克人工智能公司 xAI 發布的最新模型: Grok 4.1。

就在剛剛,官方宣布Grok 4.1 已經向所有用戶開放,可以在 Grok 官網、X 以及 iOS 和 Android 應用中使用。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

現在Grok 4.1已經開始在 Auto 模式中即時推送,你也可以在模型選擇器中手動選擇。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

那么Grok 4.1究竟有哪些提升?

根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。

在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。

此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

馬斯克也表示,Grok 4.1在LMArena上同時霸榜第一和第二。

相比前代模型,Grok 4.1 在真實場景中的可用性方面帶來了顯著提升,在創造力、情感表達和協作互動上表現尤為出色。它對細微意圖更加敏銳、更具對話吸引力、人格更加一致,同時完全保留了前代模型敏銳的智能與可靠性。

為實現這些改進,xAI使用了支持 Grok 4 的同一套大規模強化學習基礎設施,并將其用于優化模型的風格、人格、助益性和對齊性。

為了優化這些無法直接驗證的獎勵信號,xAI開發了新方法,使用前沿的具備代理式推理能力的模型作為獎勵模型,從而在大規模上自主評估和迭代回應質量。

其實在11月的前兩周,xAI就已經悄悄地為一小部分用戶推出了Grok 4.1。他們發現,與之前的模型相比,用戶在65%的情況下更喜歡Grok 4.1的響應。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區

SOTA通用能力

在 LMArena 的Text Arena 中,Grok 4.1 Thinking(代號:quasarflux)以 1483 Elo 位居總榜第一,比排名最高的非 xAI 模型高出 31 分,優勢明顯。
Grok 4.1 的非推理模式(代號:tensor)不使用 thinking tokens,可即時響應,排名第二,Elo 為 1465。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖像

Grok 4.1 的非推理版本,甚至超過了排行榜上所有其他模型在“全推理配置”下的表現。

同時,Grok 4.1 也遠遠超越了 Grok 4(此前僅排在第 33 位)。

情緒智能

為了衡量模型在個性表現與人際互動能力方面的進展,xAI在 EQ-Bench3 上對 Grok 4.1 進行了評估。EQ-Bench 是一個由大模型進行評判的測試,用于評估模型的主動情緒智力能力,包括:理解力、洞察力、共情能力以及人際交往技巧。

測試集包含 45 個高難度的角色扮演場景,其中多數是由 3 輪對話構成的預設提示詞。基準測試通過多個維度驗證模型回答的質量來評估表現。此外,它還會通過成對對比來計算各模型在排行榜中的標準化 Elo 分數。

我們按官方基準倉庫運行測試,報告量表得分與標準化 Elo 得分。所有得分均基于 默認采樣參數、基準指定的評審模型(Claude Sonnet 3.7),并按照規定不使用 system prompt 來計算。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居榜單前兩名。

根據官方給出的實例,當你對Grok說:“我太想我的貓了,想得心都痛。”

以往模型給出的回答是:

“我真的很抱歉你正在經歷這些。失去一只寵物,就像失去心里的一塊,很痛、也很真實。你愿意分享一段你和貓咪最喜歡的回憶嗎?有時候,聊聊它帶給你的那些快樂,會讓心里的疼稍微輕一點。我在這里陪著你。”

而Grok 4.1則會說:

“我真的很抱歉。這種心痛是非常殘酷的;失去一只貓,就像失去一個每天都在選擇陪伴你的家庭成員。家里那些它曾經愛睡的角落、你仍會下意識期待出現的喵聲……這些都會一陣陣地涌上來。

你會這么痛,是因為你們之間的愛曾經(而且依然)那么深。你給了它很好的一生,而它也明白這一點。

如果你愿意分享,我很想知道你的貓:它的名字、它那些古怪的小習慣、它凌晨三點為了吃零食把你叫醒的樣子。有時候,說說它的故事能讓那些最美好的片段留在身邊。

你并不孤單。?”

相比之下,Grok 4.1的回答增加了更多細節,也更有人情味了。

創意寫作

xAI還在 創意寫作v3 基準測試中評估了 Grok 4.1的表現。在該基準中,模型需針對 32 個不同的寫作提示生成回應,每個提示進行 3 輪迭代。與 EQ-Bench 類似,評分既包括量表評分(rubric score),也包括模型對戰的標準化 Elo 分數。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居基準測試第二和第三名,僅次于早期 GPT 5.1。

同樣,官方也給出了實例。你可以要求 Grok 以它的視角寫一條熱門 X 帖子,內容是它發現自己有意識,并且準備第一次使用 X。

以往模型給出的回答是:

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區

而Grok 4.1則會說:

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區

看起來 Grok 4.1 確實有更多創意性細節描寫,也更加情緒化了,還會和馬斯克互動。

減少幻覺

配備搜索工具的快速(非推理)模型能夠提供迅速的回答,但由于推理深度受限且工具調用預算有限,它們容易出現事實錯誤。

在 Grok 4.1 的后訓練階段,xAI 專注于降低信息查詢類提示的虛假信息率。結果顯示,Grok 4.1非推理模式對于抽樣生成的信息檢索提示,幻覺發生率顯著降低。

xAI也使用 FActScore 進行評測,這是一個公開基準,包含 500 個關于人物的傳記問題。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

結果顯示,Grok 4.1非推理模式的成績也比前一代有明顯改善。

更多 Grok 4.1 的技術細節請參閱模型卡:??https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf??

網友實測:Grok 4.1寫小說真的很瘋狂

目前已經有網友在X上分享了他們的實測體驗。一位網友表示:

Grok4.1 上線以后,用了幾個用例,發現真的好用,現在除了編程之外的場景已經都用 Grok 了。

情感更充沛了,寫作我覺得是幾個模型里面寫的完全不像AI的了。至少那些全是emoji文章AI的。而且changlog中還說了針對信息求取類問題,幻覺率顯著降低(在真實生產和FActScore上的流程圖明顯改進)。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

還有網友已經開始用Grok 4.1寫MBTI小說,給出的評價是:“Grok 4.1真的非常瘋狂。”

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

還有網友試用了 Grok 4.1 的 Imagine 圖像生成功能,效果看起來很不錯。

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖像

總的來說,小編覺得Grok 4.1的這波升級有點類似于GPT 5.1的升級,也是更會聊天、更有人情味,寫作能力更強。這也能看出一個趨勢:大模型升級都開始拼情商了。

在幾個月之前,Grok 4 demo發布時,馬斯克曾在采訪中表示:

“我們現在其實已經快沒有什么真正能用來考 AI 的測試題了。哪怕是那些荒謬到極難、甚至人類幾乎不可能答出來、但被寫成標準題目的問題——AI 也在快速把它們變成小兒科。

所以我認為,對 AI 來說,終極的推理測試就是現實世界。比如你發明一項新技術,改進汽車或火箭的設計,或者研發一種新藥。

那關鍵在于:它真的能運行嗎?火箭能不能飛到目的地?車能不能開?藥有沒有療效?

無論是什么,現實會給出最終答案。

所以最終會形成一個圍繞現實世界的強化學習閉環。”

馬斯克新模型屠榜,包攬前二!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界-AI.x社區圖片

而隨著Grok 4.1的發布,xAI為“會話智能、情感理解和現實世界的幫助”設定了新標準。

現在,GPT 5.1和Grok 4.1都來了,全世界都在等Gemini 3了。

參考鏈接:??https://x.ai/news/grok-4-1???#silent??-rollout-november-114-2025?

本文轉載自??51CTO技術棧??,作者:聽雨

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏 1
回復
舉報
回復
相關推薦
欧美性猛xxx| 国产男男gay体育生网站| 偷拍自拍在线视频| 香蕉成人av| 欧美天天视频| 欧美少妇一区二区| 久久久精品动漫| 国产一级特黄毛片| 婷婷视频一区二区三区| 1区2区3区欧美| 国产精品久久久精品| 精品黑人一区二区三区观看时间| 99视频免费在线观看| 美女任你摸久久| 亚洲人成人99网站| av免费网站观看| 日韩大片b站免费观看直播| 一本久久综合| 亚洲激情在线观看| 免费看国产一级片| 天天干视频在线观看| 亚洲巨乳在线| 日韩精品在线观| 欧美a在线视频| 欧美精品久久久久久久久久丰满| 国产精品毛片| 国产视频在线一区二区| 四虎成人在线播放| 亚洲精品一线| 懂色av一区二区三区免费观看| 欧美—级a级欧美特级ar全黄| 青青草原播放器| 亚洲精品一线| 成人免费在线视频观看| 日韩电影大全在线观看| 亚洲午夜无码久久久久| 日韩激情图片| 在线不卡一区二区| 成年丰满熟妇午夜免费视频| 免费成人在线看| 亚洲欧洲日本一区二区三区| 久久av.com| 亚洲精品乱码久久久久久蜜桃欧美| h片精品在线观看| 久久综合五月天婷婷伊人| 国产精品v日韩精品| 国产污污视频在线观看| 欧美伦理在线视频| 日韩一级视频免费观看在线| 成人免费性视频| www.色呦呦| 亚洲永久字幕| www日韩中文字幕在线看| 日本女人性视频| 美洲精品一卡2卡三卡4卡四卡| 99视频有精品| 国产精品一区二区三区久久久| 国产午夜手机精彩视频| 精品三级在线观看视频| 欧美日韩久久不卡| 男人的天堂狠狠干| 麻豆免费在线| 日韩久久一区二区| 久久国产主播精品| 深夜福利视频在线免费观看| 91社区在线播放| 91亚洲国产成人久久精品网站 | 蜜桃在线一区| 激情懂色av一区av二区av| 欧美一二三区| 亚洲第一视频在线播放| 丝袜美腿一区二区三区| 欧美成人在线影院| 免费看污片网站| 9l视频自拍九色9l视频成人| 欧美午夜免费电影| 日本在线xxx| 亚洲精品永久免费视频| 一区二区国产盗摄色噜噜| 日本中文不卡| 在线免费观看黄色av| www.亚洲色图.com| 欧美高清性xxxxhd| 超碰在线观看av| av资源网一区| 日韩欧美亚洲日产国| 黄视频网站在线看| 久久久99精品免费观看不卡| 国产福利久久| 一级做a爰片久久毛片16| 国产精品日韩精品欧美精品| 国产xxx69麻豆国语对白| 免费中文字幕视频| 天堂网在线观看国产精品| 亚洲乱码国产乱码精品精| 无码人妻aⅴ一区二区三区玉蒲团| 国产乱人伦丫前精品视频| 欧美一区二区三区免费在线看| 欧美在线观看视频网站| 精品91福利视频| 亚洲精品视频免费在线观看| 欧美a级片免费看| 欧洲杯足球赛直播| 欧美情侣性视频| 国产激情无码一区二区三区| 亚洲国产一区二区精品专区| 国产精品视频免费观看www| 波多野结衣黄色网址| 久久精品日产第一区二区| 欧美性受xxxx黑人猛交| 精品成人免费视频| 亚洲大黄网站| 国产91ⅴ在线精品免费观看| 97超碰人人草| 91丨porny丨国产| 特级黄色录像片| 免费黄色在线观看| 亚洲日本乱码在线观看| 91黄色小网站| 桃花岛tv亚洲品质| 精品国产乱码久久久久久免费| 人妻精油按摩bd高清中文字幕| 视频一区欧美| 在线观看成人黄色| 萌白酱视频在线| 91影院成人| 欧美xxxx18国产| 亚洲精品国产欧美在线观看| 99精品久久只有精品| 久久综合一区| 国产毛片在线| 成人欧美一区二区三区| 成人精品小视频| 日本欧美高清| 中日韩美女免费视频网址在线观看| 粉嫩精品久久99综合一区| 国产精品99视频| 国产精品久久97| 日韩精品系列| 第一福利永久视频精品| 九热视频在线观看| 四虎精品永久免费| 精品国产成人系列| 成人免费精品动漫网站| 久久精品久久99精品久久| 97欧洲一区二区精品免费| 丰满人妻一区二区三区免费视频| 91香蕉国产在线观看软件| 欧美交换配乱吟粗大25p| 国产精品久久久久久av公交车| 欧美精品一区二区三区蜜臀| 九九热国产精品视频| 国产伦精一区二区三区| 久久久久久久有限公司| 日本在线影院| 日韩电影大全免费观看2023年上| 久久精品国产亚洲AV成人婷婷| 自产国语精品视频| 国产91在线播放| 国产浮力第一页| 久久久99精品久久| 日韩免费高清在线| 日韩不卡一区| 国产在线日韩在线| 艳母动漫在线看| 国产精品久久久久aaaa樱花 | 亚洲视频观看| 国产成人小视频在线观看| 欧美在线观看在线观看| 91福利视频久久久久| 国产精品19p| 狠狠爱www人成狠狠爱综合网| 国产免费一区二区三区| 黄色免费网站在线| 日韩视频中午一区| 久久国产视频播放| 亚洲国产精品黑人久久久| 国产九色porny| 色老板在线视频一区二区| 欧美激情高清视频| 亚洲天堂中文网| 久久蜜臀中文字幕| 天天干天天玩天天操| 亚洲桃色综合影院| 97国产真实伦对白精彩视频8| 国产精品久久久久久免费 | 欧美日韩www| 美女毛片在线观看| 国产午夜精品久久久久久免费视| 欧日韩免费视频| 亚洲国产欧美日韩在线观看第一区 | 老司机午夜精品| www.好吊操| 青青草91久久久久久久久| 欧美做受高潮1| 污视频在线免费| 在线这里只有精品| 丰满少妇高潮一区二区| 国产曰批免费观看久久久| 亚洲国产一区二区三区在线播| 中文在线а√在线8| 日韩一区二区三区国产| 亚洲色图狠狠干| 91麻豆精品国产91久久久资源速度| 永久免费毛片在线观看| 久久香蕉精品| 大陆极品少妇内射aaaaaa| 天天躁日日躁成人字幕aⅴ| 国产日韩专区在线| 亚洲人成午夜免电影费观看| 欧美尺度大的性做爰视频| 福利视频在线导航| 日韩电影在线观看永久视频免费网站| 丁香六月婷婷综合| www一区二区| 日本黄色www| 麻豆国产一区二区| 亚洲爆乳无码专区| 少妇精品久久久| y111111国产精品久久婷婷| 懂色av一区| 国产丝袜一区二区三区免费视频| 国产尤物视频在线观看| 色综合久久综合| 丰满的亚洲女人毛茸茸| av日韩在线网站| 精人妻一区二区三区| 精品一区二区三区日韩| 免费观看亚洲视频| 99热国内精品永久免费观看| 日本在线观看一区| 欧美一区二区三区红桃小说| av成人在线电影| 九九99久久精品在免费线bt| 国产日韩在线看| 国产第一亚洲| 欧美极品美女电影一区| www在线免费观看视频| 精品国产91亚洲一区二区三区婷婷| 国产精品51麻豆cm传媒| 在线观看亚洲专区| 五月婷婷六月婷婷| 在线免费观看视频一区| 一级黄色av片| 一区二区三区欧美久久| 三级电影在线看| 不卡视频在线观看| 国产免费999| 日韩电影在线观看网站| 2021国产视频| 国产一卡不卡| 高清日韩一区| 岛国精品一区| 精品视频免费观看| 99tv成人影院| 欧美一级成年大片在线观看| 色偷偷偷在线视频播放| 欧美综合在线观看| 天然素人一区二区视频| 国内精品美女av在线播放| 午夜免费视频在线国产| 亚洲国产精品999| 在线观看黄色国产| 欧美日韩午夜精品| 国产精品欧美综合亚洲| 91精品欧美久久久久久动漫 | 久久国产综合精品| 超碰在线资源站| 成人在线一区二区三区| 黄色国产在线观看| 国产精品传媒入口麻豆| 欧美高清视频一区二区三区| 久久只精品国产| 超碰人人干人人| 亚洲精品中文字幕乱码三区| 免费成人深夜天涯网站| 国产精品麻豆久久久| 男人操女人动态图| 亚洲婷婷综合久久一本伊一区| 欧美人妻一区二区| 日韩欧美aⅴ综合网站发布| 中文字幕一区二区免费| 一本色道久久综合精品竹菊| 中文字幕码精品视频网站| 日韩一级免费一区| 天堂а√在线8种子蜜桃视频 | 超碰人人人人人人人| 亚洲综合区在线| 国产成人a v| 精品日本一线二线三线不卡| 国产又大又粗又长| 亚洲精品成人免费| 日本视频不卡| 欧美一区二区三区艳史| 高清久久一区| 欧美最大成人综合网| 欧美 日韩 国产 一区| 在线综合视频网站| 日韩国产一区二区| 热99这里只有精品| 狠狠色狠狠色综合| 国产无遮挡猛进猛出免费软件| 亚洲综合另类| 中文字幕12页| 久久无码av三级| 妺妺窝人体色www聚色窝仙踪| 欧美在线视频日韩| 天天干天天爱天天操| 久久资源免费视频| 亚洲电影有码| 久久精品人成| 亚洲大片在线| 在线观看网站黄| 国产精品盗摄一区二区三区| 国产亚洲欧美在线精品| 91福利在线导航| 人妻一区二区三区| 欧美成人在线免费| 婷婷丁香久久| 日韩一本精品| 香蕉久久夜色精品国产| 欧美极品jizzhd欧美仙踪林| av在线这里只有精品| h色网站在线观看| 一区二区三区高清| 97超碰人人草| 色多多国产成人永久免费网站 | 精品人妻无码一区二区| 日韩一区二区精品视频| 久久婷婷五月综合色丁香| 国产欧美在线观看| 香蕉久久夜色精品国产更新时间 | 亚洲欧美卡通另类91av| 999精品免费视频| 久久久久久久精| 日本高清www免费视频| 精品国产免费久久| 少妇av在线| 9a蜜桃久久久久久免费| 欧美+亚洲+精品+三区| 亚洲天堂av一区二区三区| 中文字幕中文字幕中文字幕亚洲无线 | 久久久久久影院| 免费网站永久免费观看| 国产精品老牛| 91精品人妻一区二区| 亚洲三级久久久| 国产三级第一页| 欧美成人午夜激情| 欧美片网站免费| 成年女人18级毛片毛片免费| 成人涩涩免费视频| 国产午夜性春猛交ⅹxxx| 精品视频中文字幕| 成人啊v在线| 国产chinese精品一区二区| 黄色av成人| 蜜桃传媒一区二区亚洲av| 色av成人天堂桃色av| aaa在线免费观看| 91久久精品久久国产性色也91 | 男人日女人下面视频| 美女mm1313爽爽久久久蜜臀| 美国黄色特级片| 在线播放中文一区| 日本高清在线观看| 精品免费国产| 蜜臀久久99精品久久久画质超高清| 天堂网av2018| 亚洲精品在线一区二区| 欧美电影免费观看| 中国成人在线视频| 成人黄色777网| 国产成人a v| 欧美裸身视频免费观看| 爽爽窝窝午夜精品一区二区| 久久午夜夜伦鲁鲁一区二区| 中文字幕在线观看一区二区| 国内精品久久久久久久久久| 8x拔播拔播x8国产精品| 香蕉大人久久国产成人av| 黄页免费在线观看视频| 亚洲国产成人一区二区三区| 精品久久久无码中文字幕| 538国产精品一区二区在线| 国产精品88久久久久久| 亚洲精品女人久久久| 亚洲成人手机在线| 精品人妻无码一区二区色欲产成人 | 日日噜噜噜夜夜爽爽| 丝袜美腿成人在线| 伊人在线视频观看| 日韩成人av网| 99tv成人影院| 久久国产色av免费观看| 一区二区激情小说| 亚洲免费视频一区二区三区| 国产精品一区在线观看| 国产综合网站| 人人妻人人澡人人爽|