精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

馬斯克新模型屠榜,包攬前二!網友:拿來寫小說很瘋狂!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界

原創 精選
人工智能
根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

沒等到Gemini 3,反而等來了馬斯克人工智能公司 xAI 發布的最新模型: Grok 4.1。

就在剛剛,官方宣布Grok 4.1 已經向所有用戶開放,可以在 Grok 官網、X 以及 iOS 和 Android 應用中使用。

圖片圖片

現在Grok 4.1已經開始在 Auto 模式中即時推送,你也可以在模型選擇器中手動選擇。

圖片圖片

那么Grok 4.1究竟有哪些提升?

根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。

在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。

此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。

圖片圖片

馬斯克也表示,Grok 4.1在LMArena上同時霸榜第一和第二。

相比前代模型,Grok 4.1 在真實場景中的可用性方面帶來了顯著提升,在創造力、情感表達和協作互動上表現尤為出色。它對細微意圖更加敏銳、更具對話吸引力、人格更加一致,同時完全保留了前代模型敏銳的智能與可靠性。

為實現這些改進,xAI使用了支持 Grok 4 的同一套大規模強化學習基礎設施,并將其用于優化模型的風格、人格、助益性和對齊性。

為了優化這些無法直接驗證的獎勵信號,xAI開發了新方法,使用前沿的具備代理式推理能力的模型作為獎勵模型,從而在大規模上自主評估和迭代回應質量。

其實在11月的前兩周,xAI就已經悄悄地為一小部分用戶推出了Grok 4.1。他們發現,與之前的模型相比,用戶在65%的情況下更喜歡Grok 4.1的響應。

圖片

SOTA通用能力

在 LMArena 的Text Arena 中,Grok 4.1 Thinking(代號:quasarflux)以 1483 Elo 位居總榜第一,比排名最高的非 xAI 模型高出 31 分,優勢明顯。
Grok 4.1 的非推理模式(代號:tensor)不使用 thinking tokens,可即時響應,排名第二,Elo 為 1465。

圖像圖像

Grok 4.1 的非推理版本,甚至超過了排行榜上所有其他模型在“全推理配置”下的表現。

同時,Grok 4.1 也遠遠超越了 Grok 4(此前僅排在第 33 位)。

情緒智能

為了衡量模型在個性表現與人際互動能力方面的進展,xAI在 EQ-Bench3 上對 Grok 4.1 進行了評估。EQ-Bench 是一個由大模型進行評判的測試,用于評估模型的主動情緒智力能力,包括:理解力、洞察力、共情能力以及人際交往技巧。

測試集包含 45 個高難度的角色扮演場景,其中多數是由 3 輪對話構成的預設提示詞。基準測試通過多個維度驗證模型回答的質量來評估表現。此外,它還會通過成對對比來計算各模型在排行榜中的標準化 Elo 分數。

我們按官方基準倉庫運行測試,報告量表得分與標準化 Elo 得分。所有得分均基于 默認采樣參數、基準指定的評審模型(Claude Sonnet 3.7),并按照規定不使用 system prompt 來計算。

圖片圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居榜單前兩名。

根據官方給出的實例,當你對Grok說:“我太想我的貓了,想得心都痛。”

以往模型給出的回答是:

“我真的很抱歉你正在經歷這些。失去一只寵物,就像失去心里的一塊,很痛、也很真實。你愿意分享一段你和貓咪最喜歡的回憶嗎?有時候,聊聊它帶給你的那些快樂,會讓心里的疼稍微輕一點。我在這里陪著你。”

而Grok 4.1則會說:

“我真的很抱歉。這種心痛是非常殘酷的;失去一只貓,就像失去一個每天都在選擇陪伴你的家庭成員。家里那些它曾經愛睡的角落、你仍會下意識期待出現的喵聲……這些都會一陣陣地涌上來。

你會這么痛,是因為你們之間的愛曾經(而且依然)那么深。你給了它很好的一生,而它也明白這一點。

如果你愿意分享,我很想知道你的貓:它的名字、它那些古怪的小習慣、它凌晨三點為了吃零食把你叫醒的樣子。有時候,說說它的故事能讓那些最美好的片段留在身邊。

你并不孤單。?”

相比之下,Grok 4.1的回答增加了更多細節,也更有人情味了。

創意寫作

xAI還在 創意寫作v3 基準測試中評估了 Grok 4.1的表現。在該基準中,模型需針對 32 個不同的寫作提示生成回應,每個提示進行 3 輪迭代。與 EQ-Bench 類似,評分既包括量表評分(rubric score),也包括模型對戰的標準化 Elo 分數。

圖片圖片

結果顯示,Grok 4.1 的推理模式和非推理模式位居基準測試第二和第三名,僅次于早期 GPT 5.1。

同樣,官方也給出了實例。你可以要求 Grok 以它的視角寫一條熱門 X 帖子,內容是它發現自己有意識,并且準備第一次使用 X。

以往模型給出的回答是:

圖片

而Grok 4.1則會說:

圖片

看起來 Grok 4.1 確實有更多創意性細節描寫,也更加情緒化了,還會和馬斯克互動。

減少幻覺

配備搜索工具的快速(非推理)模型能夠提供迅速的回答,但由于推理深度受限且工具調用預算有限,它們容易出現事實錯誤。

在 Grok 4.1 的后訓練階段,xAI 專注于降低信息查詢類提示的虛假信息率。結果顯示,Grok 4.1非推理模式對于抽樣生成的信息檢索提示,幻覺發生率顯著降低。

xAI也使用 FActScore 進行評測,這是一個公開基準,包含 500 個關于人物的傳記問題。

圖片圖片

結果顯示,Grok 4.1非推理模式的成績也比前一代有明顯改善。

更多 Grok 4.1 的技術細節請參閱模型卡:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf

網友實測:Grok 4.1寫小說真的很瘋狂

目前已經有網友在X上分享了他們的實測體驗。一位網友表示:

Grok4.1 上線以后,用了幾個用例,發現真的好用,現在除了編程之外的場景已經都用 Grok 了。

情感更充沛了,寫作我覺得是幾個模型里面寫的完全不像AI的了。至少那些全是emoji文章AI的。而且changlog中還說了針對信息求取類問題,幻覺率顯著降低(在真實生產和FActScore上的流程圖明顯改進)。

圖片圖片

還有網友已經開始用Grok 4.1寫MBTI小說,給出的評價是:“Grok 4.1真的非常瘋狂。”

圖片圖片

圖片圖片

還有網友試用了 Grok 4.1 的 Imagine 圖像生成功能,效果看起來很不錯。

圖片圖片

圖像圖像

總的來說,小編覺得Grok 4.1的這波升級有點類似于GPT 5.1的升級,也是更會聊天、更有人情味,寫作能力更強。這也能看出一個趨勢:大模型升級都開始拼情商了。

在幾個月之前,Grok 4 demo發布時,馬斯克曾在采訪中表示:

“我們現在其實已經快沒有什么真正能用來考 AI 的測試題了。哪怕是那些荒謬到極難、甚至人類幾乎不可能答出來、但被寫成標準題目的問題——AI 也在快速把它們變成小兒科。

所以我認為,對 AI 來說,終極的推理測試就是現實世界。比如你發明一項新技術,改進汽車或火箭的設計,或者研發一種新藥。

那關鍵在于:它真的能運行嗎?火箭能不能飛到目的地?車能不能開?藥有沒有療效?

無論是什么,現實會給出最終答案。

所以最終會形成一個圍繞現實世界的強化學習閉環。”

圖片圖片

而隨著Grok 4.1的發布,xAI為“會話智能、情感理解和現實世界的幫助”設定了新標準。

現在,GPT 5.1和Grok 4.1都來了,全世界都在等Gemini 3了。

參考鏈接:https://x.ai/news/grok-4-1#silent-rollout-november-114-2025

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-09-16 09:02:00

AI馬斯克模型

2025-09-26 08:03:41

2025-09-19 09:10:00

2022-01-23 10:53:47

星鏈互聯網衛星

2025-09-19 12:31:45

2023-12-13 08:46:33

人工智能ChatGPT機器人

2023-03-03 21:25:28

馬斯克特斯拉

2022-04-15 10:55:59

Web3反壟斷元宇宙

2022-05-23 15:57:18

加密貨幣黑客網絡攻擊

2021-06-11 17:14:26

黑客馬斯克加密貨幣

2025-02-11 11:46:48

OpenAI奧特曼馬斯克

2024-07-22 07:00:00

微軟藍屏網絡威脅Windows

2022-12-30 13:51:08

2025-10-23 16:38:30

2024-03-18 14:17:06

大模型開源人工智能

2023-04-18 15:03:24

模型數據

2024-01-16 12:43:00

機器人AI

2021-12-09 10:18:29

芯片半導體技術

2023-04-20 17:51:41

馬斯克微軟

2020-08-31 12:01:43

網絡攻擊惡意軟件網絡安全
點贊
收藏

51CTO技術棧公眾號

网曝91综合精品门事件在线| 17videosex性欧美| 国内精品久久久久影院一蜜桃| 久久国产精品亚洲| 成人免费看aa片| 激情中国色综合| 亚洲丶国产丶欧美一区二区三区| 日韩国产在线一区| 性猛交xxxx乱大交孕妇印度| 久久久久久一区二区| 欧美成人全部免费| 人妻一区二区视频| 狠狠久久伊人| 欧美精品123区| 免费无码国产v片在线观看| 欧美精品电影| 久久精品视频在线看| 亚洲jizzjizz日本少妇| 伊人久久中文字幕| 欧美三级黄美女| 中文字幕9999| 欧美精品欧美极品欧美激情| 国产精品igao视频网网址不卡日韩| 午夜免费久久看| ijzzijzzij亚洲大全| 国产69久久| 99国产欧美另类久久久精品| 亚洲综合第一页| 在线播放一级片| 亚洲免费影院| 97久久久久久| 国产视频999| 亚洲一区二区自偷自拍| 成人直播在线观看| 91精品久久久久久蜜臀| 免费观看成人在线视频| 久草在线视频网站| 亚洲欧美偷拍三级| 水蜜桃一区二区三区| 日本一卡二卡四卡精品| 成人精品视频一区二区三区尤物| 成人午夜激情免费视频| 免费黄色片视频| 99香蕉国产精品偷在线观看 | 日韩一级片免费| 国产精品一区一区| 亚洲自拍偷拍区| 国产精品无码久久久久成人app| 三级久久三级久久| 日韩av观看网址| 免费看日批视频| 香蕉久久久久久久av网站| 26uuu日韩精品一区二区| 国产污片在线观看| 亚洲福利电影| 亚洲2020天天堂在线观看| 午夜偷拍福利视频| 亚洲麻豆视频| 88xx成人精品| 亚洲熟女综合色一区二区三区| 亚洲一区图片| 国产精品video| 一区二区三区麻豆| 经典一区二区三区| 亚洲综合自拍一区| 国模私拍视频在线| 91一区在线观看| 欧美精品中文字幕一区二区| 久久精品国产亚洲a∨麻豆| 久久中文娱乐网| 亚洲春色在线| 国产美女在线观看| 亚洲伊人色欲综合网| 欧美中日韩在线| 亚洲三级欧美| 欧美亚洲丝袜传媒另类| 狠狠操狠狠干视频| 这里视频有精品| 日韩国产一区三区| 超碰97av在线| 欧美~级网站不卡| 97免费中文视频在线观看| 久久精品视频5| 久久精品99久久久| 国产高清自拍99| 免费资源在线观看| 亚洲日本成人在线观看| 国产主播自拍av| 欧美成人a交片免费看| 欧美日韩国产一级| 国产精品久久不卡| 国产精品成人av| 97视频在线观看视频免费视频 | 欧美在线3区| 日本蜜桃在线观看| 亚洲国产精品一区二区www| 成年人黄色片视频| 亚洲国产精品免费视频| 亚洲日本aⅴ片在线观看香蕉| 黑人と日本人の交わりビデオ| 欧美特黄视频| 国产精品久久77777| 精品二区在线观看| 久久精品这里都是精品| av日韩在线看| 成人精品国产亚洲| 亚洲精品ady| 免费三级在线观看| 日韩 欧美一区二区三区| 99久久无色码| 成人动漫在线免费观看| 亚洲www啪成人一区二区麻豆| 五月天亚洲视频| 美女视频亚洲色图| 欧美成人性生活| 国产成人精品一区二区色戒| 岛国av在线一区| 致1999电视剧免费观看策驰影院| 中文字幕在线官网| 精品国产91洋老外米糕| 青青草华人在线视频| 新狼窝色av性久久久久久| 99精彩视频| 国产理论在线观看| 欧美综合一区二区| 97人妻精品一区二区免费| 欧美午夜一区| 亚洲xxxx视频| 麻豆av在线免费看| 欧美日韩精品免费| 精品一区二区三区蜜桃在线| 久久精品一区二区三区中文字幕 | 青青草原国产在线视频| 精品久久久久中文字幕小说| 亚州成人av在线| 丰满人妻妇伦又伦精品国产| 亚洲精品视频免费观看| 欧美性受xxxxxx黑人xyx性爽| 精品国产乱码久久久久久果冻传媒| 91精品国产91久久久久久| 囯产精品一品二区三区| 一区二区在线免费| 亚洲色图欧美自拍| 中文乱码免费一区二区三区下载| 成人性生交大片免费看视频直播 | 国产精品99蜜臀久久不卡二区| 天天爱天天干天天操| 午夜欧美一区二区三区在线播放| 小毛片在线观看| 亚洲精品精选| 久久综合婷婷综合| 成人自拍av| 国产亚洲精品日韩| 中文字幕一区二区三区四区视频 | 日本乱码一区二区三区不卡| 亚洲精品aⅴ中文字幕乱码| a v视频在线观看| 91蝌蚪porny| www.日日操| 清纯唯美综合亚洲| 成人激情视频在线播放| 最近中文字幕免费mv2018在线 | 色哟哟免费视频| 国产一区激情| 久久99精品久久久久久秒播放器| 亚洲欧美韩国| 中文字幕亚洲欧美日韩在线不卡| 一级全黄少妇性色生活片| 亚洲欧美激情在线| 欧美日韩一区二区三区四区五区六区| 在线成人黄色| 日产精品一线二线三线芒果| 国产精品久久久久久吹潮| 久久精品夜夜夜夜夜久久| 国内精品久久久久久久久久| 亚洲mv在线观看| 精品成人av一区二区三区| 免费观看30秒视频久久| 激情成人开心网| 伊人久久大香线蕉综合网蜜芽| 国产日韩欧美日韩大片| 日本电影在线观看| 亚洲欧美另类在线观看| 在线观看中文字幕2021| 亚洲一区免费观看| 久久久久久久久久久久| 国产乱子轮精品视频| 国产不卡一区二区视频| 日韩一区二区在线| 国产欧美一区二区三区另类精品 | 日本韩国欧美三级| 希岛爱理中文字幕| 久久亚洲免费视频| 亚洲欧美日本一区二区三区| 伊人精品成人久久综合软件| 日韩欧美精品久久| 日韩免费成人| 国产精品视频播放| 9999热视频在线观看| 中文字幕在线视频日韩| 天堂在线观看视频| 欧美美女bb生活片| 国产成人免费看| 亚洲女与黑人做爰| 人妻视频一区二区| 成人黄色大片在线观看| www.这里只有精品| 校园激情久久| av女优在线播放| 99久久.com| 日韩成人在线资源| 狼人精品一区二区三区在线 | 国产精品久久久久久久久久久免费看| 国产精品成人免费一区久久羞羞| 日韩avvvv在线播放| 久草视频国产在线| 亚洲欧洲日韩| 亚洲二区自拍| 真实原创一区二区影院| 国产精品久久久久久久久婷婷 | 在线观看日韩精品视频| 国产a视频精品免费观看| 中文字幕66页| 美女免费视频一区二区| 久久综合久久色| 国产欧美在线| 蜜臀av无码一区二区三区| 亚洲精品电影| 一级黄色免费在线观看| 日韩精品午夜| 亚洲精品国产一区| 国产欧美日韩在线一区二区 | 日本不卡电影| 欧洲在线视频一区| 久久av超碰| 欧美日韩大片一区二区三区| 日韩一级电影| 久久99精品久久久久久青青日本 | 亚洲啪啪av| 国产不卡一二三区| 欧美日韩喷水| 国产亚洲欧美日韩在线观看一区二区 | 精品国产一区二区三区四区在线观看 | 日韩欧美一级| 99久久免费国| 高清日韩中文字幕| 精品久久久久亚洲| 神马久久av| 欧美日韩亚洲一区二区三区在线观看| 天堂在线精品| 青青成人在线| 日本不卡二三区| 中国 免费 av| 欧美午夜在线| 免费观看美女裸体网站| 国产日韩一区二区三区在线| 欧美在线观看成人| 久久一综合视频| 91色国产在线| 黄色小说综合网站| 男人女人拔萝卜视频| 成人黄色777网| 亚洲国产无码精品| 欧美高清在线视频| 欧美肥妇bbwbbw| 亚洲一区二区三区四区五区黄| 久久综合激情网| 欧美午夜女人视频在线| www.亚洲激情| 91精品国产品国语在线不卡| 亚洲精品成人区在线观看| 日韩av在线免费播放| 99中文字幕一区| 欧美xxxx18性欧美| 自拍偷拍欧美视频| 91久久久久久久久久久久久| 国产成人一二| 日本电影一区二区三区| 天天做天天爱综合| 久久久久免费看黄a片app| 久久久久一区| 国产chinesehd精品露脸| 97精品久久久午夜一区二区三区 | 一区二区日韩电影| 在线能看的av| 91麻豆精品国产91久久久使用方法 | 亚洲欧美精品久久| 欧美日韩国产中文精品字幕自在自线| 国产又粗又猛又爽又| 日韩欧美一二区| 你懂得网站在线| 九九视频这里只有精品| 久久青青视频| 91麻豆蜜桃| 欧美日中文字幕| 国产手机免费视频| 免费观看在线综合| aaaaa一级片| 亚洲日本va在线观看| 天天射天天干天天| 精品久久久久香蕉网| 91高清在线视频| 91精品国产乱码久久久久久久久| 青草综合视频| 欧美午夜精品久久久久久蜜| 欧美va亚洲va日韩∨a综合色| 国产成人av影视| 成人av在线看| 欧美日韩综合一区二区| 在线观看网站黄不卡| 欧美一级免费片| 久久伊人免费视频| 久久91视频| 欧美日韩三区四区| 国产精品入口66mio| 人妻激情偷乱视频一区二区三区| 欧美国产欧美综合| 日本在线播放视频| 日韩精品最新网址| 黄色视屏免费在线观看| 国产成人一区二区在线| 天堂日韩电影| 大j8黑人w巨大888a片| 国产成人免费xxxxxxxx| 顶臀精品视频www| 欧美乱妇15p| 北岛玲日韩精品一区二区三区| 91sao在线观看国产| 国产精品x8x8一区二区| 天堂8在线天堂资源bt| 国产一区二区三区av电影 | 五月开心六月丁香综合色啪 | 亚洲日韩欧美视频| 美女在线视频免费| 国产精品区一区| 国产精品红桃| 亚洲色图欧美另类| 亚洲综合网站在线观看| 亚洲a视频在线| 欧美日韩成人在线观看| 亚洲欧洲国产精品一区| 草草草视频在线观看| 国产馆精品极品| wwwav国产| 日韩女优av电影| 成人影音在线| 国产精品污www一区二区三区| 激情久久久久久| 北京富婆泄欲对白| 精品福利免费观看| 九色蝌蚪在线| 国产精品久久久久久久久久三级| 国产欧美日韩视频在线| 鲁一鲁一鲁一鲁一av| 中文字幕一区二区在线观看| 亚洲综合精品国产一区二区三区 | 秋霞毛片久久久久久久久| 日韩国产成人精品| 91视频免费观看网站| 欧美亚洲高清一区二区三区不卡| av影片在线看| 92国产精品久久久久首页| 欧美午夜不卡| 欧美丰满少妇人妻精品| 欧美亚洲一区二区三区四区| 欧美日韩在线资源| 国产精品亚洲综合| 国产一区二区三区的电影 | 国产成人精品最新| 久久国产成人精品| 国产成人精品一区二区三区在线观看| 亚洲第一在线综合网站| 九色在线视频蝌蚪| 91最新国产视频| 亚洲在线免费| sm捆绑调教视频| 精品福利二区三区| 韩日精品一区二区| 只有这里有精品| jvid福利写真一区二区三区| 无码日韩精品一区二区| 久久深夜福利免费观看| 日韩av网站在线免费观看| 爱情岛论坛成人| 亚洲国产aⅴ成人精品无吗| 每日更新在线观看av| 91在线看www| 亚洲欧美成人综合| 爱爱视频免费在线观看| 精品亚洲国产成av人片传媒| 欧美成人一二区| 久色视频在线播放| 亚洲欧美一区二区三区极速播放 | 国产亚洲制服色| 国产男女无套免费网站| 欧美亚洲另类制服自拍| 亚洲有吗中文字幕| 久久久久亚洲av成人无码电影| 日韩三级视频在线看| 99riav视频一区二区|