重大新聞(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!
重大新聞——Gemini 1.5 Flash、Pro和Advanced版本的結果出來了!??
- Gemini 1.5 Pro/Advanced 排名第二,正在逼近GPT-4o
- Gemini 1.5 Flash排名第九,性能超越了Llama-3-70b,幾乎達到了GPT-4-0125
- Pro版本比4月份的版本有了顯著的提升。Flash的成本、能力和無與倫比的上下文長度使其成為市場的變革者!?

??https://x.com/lmsysorg/status/1795512202465845686??

更令人興奮的是,在中文領域,Gemini 1.5 Pro和Advanced現在是世界上最好的排名第一的模型。Flash變得更加強大!

也看到新的Gemini家族在的新“Hard Prompts”類別中保持領先,這個類別包含了更具挑戰性、需要解決問題的用戶查詢。
Hard Prompts的信息:
https://lmsys.org/blog/2024-05-17-category-hard/
模型強度的置信區間和鏈接
- 全部排行榜在:http://leaderboard.lmsys.org
- 與新的Gemini家族聊天:??https://arena.lmsys.org/??


??https://x.com/huybery/status/1795432194460340708??
本文轉載自 ??PaperAgent??,作者: PaperAgent
贊
收藏
回復
分享
微博
QQ
微信
舉報
回復
相關推薦

















