精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「中杯」Claude 3.5突然上線,竟比GPT-4o還強!全新Artifacts改寫模型交互

人工智能 新聞
Anthropic曾許下要超越OpenAI的發家愿望,沒想到竟然這么快就實現了。他們剛剛發布的Claude 3.5 Sonnet模型不僅成本更低、速度更快,而且在基準測試上的表現「彎道超車」GPT-4o。

繼今年3月發布Claude 3之后,Anthropic在半年時間里又上新了!

就在今天,Claude 3.5 Sonnet發布,作為即將推出的Claude 3.5模型家族的「排頭兵」,而且已經面向全球開啟免費試用。

圖片

具體來說, Claude 3.5 Sonnet支持200K token的上下文窗口,而在多項評測中超過了OpenAI最強的GPT-4o,以及自家的Claude 3 Opus。

與此同時,Claude 3.5 Sonnet還保持著中等規模的模型所具有的速度和成本優勢。

圖片

其中,在費用方面,Claude 3.5 Sonnet處理每百萬輸入token僅需3美元,每百萬輸出token則為15美元。(與前代相同)

圖片

用戶可以在Claude.ai和Claude iOS應用程序上免費體驗,如果訂閱了Claude Pro和團隊計劃,則可以享受更高的速率;此外,還可以通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用

生成2倍速,成本僅1/5

Claude 3.5 Sonnet雖然在零樣本MATH和MMLU評測中小幅落后GPT-4o,但在研究生級推理(GPQA)、本科級知識(MMLU)和編碼能力(HumanEval)上,毋庸置疑地刷新了SOTA——

不僅大幅領先自家的前代老大哥Claude 3 Opus,而且還完成了對谷歌Gemini 1.5 Pro和Meta 4000億參數的Llama(早期預覽版)的全面超越。

它在理解細微差別、幽默和復雜指令方面有顯著提升,并且能夠用自然、貼近生活的語調撰寫高質量內容。

在運行速度方面,Claude 3.5 Sonnet也是Claude 3 Opus的兩倍。

這種性能提升,再加上高性價比,使Claude 3.5 Sonnet非常適合處理復雜任務,如上下文敏感的客戶支持和多步驟工作流程的協調。

在內部的智能體編碼評估中,Claude 3.5 Sonnet解決了64%的問題,優于Claude 3 Opus的38%。

結果顯示,在指令和相關工具的支持下,Claude 3.5 Sonnet可以獨立編寫、編輯和執行代碼,具備復雜的推理和故障排除能力。

尤其是,它能夠輕松處理代碼翻譯,因此在更新遺留應用程序和遷移代碼庫方面效果極佳。

圖片

視覺能力超越GPT-4o

在視覺方面,Claude 3.5 Sonnet也是Anthropic迄今為止推出的最強大模型,不僅明顯優于Claude 3 Opus和Gemini 1.5 Pro,而且在大部分測試中也都超過了GPT-4o。

這些改進在需要視覺推理的任務中尤為明顯,例如解釋圖表和圖形。

不僅如此,Claude 3.5 Sonnet還可以準確地從不完美的圖像中轉錄文本——這是零售、物流和金融服務領域的核心能力。

在這些領域里,AI從圖像、圖形或插圖中獲得的信息往往要比單純的文本來得更多。

圖片

基準測試中體現的這種強大視覺能力如何落實到現實應用中呢?下面這個demo給你答案。

像GPT-4o、Gemini這些模型雖然理解圖像和視頻的能力很強,但一般只能生成文字的描述內容,在這方面我們人類顯然更擅長,能比模型做得更快更好。

但Claude不僅能準確識別、轉錄圖像中的文字內容,還結合了強大的代碼生成能力,多個模態真正集成在一起。

看一眼圖片,立刻識別信息生成JSON文件,手速絕對快過任何程序員。

圖片

還能通過編碼制造交互式圖表,代碼直接可運行,數據也絲毫不差。

圖片

不僅僅是代碼,根據圖片信息生成的網頁也是圖文并茂、界面精美。原本需要一晚上才能搞定的工作量,Claude幫你5分鐘內趕上DDL。

圖片

領域專家最為鐘愛

在附帶的報告中,Anthropic還補充了一些其他測試的結果。

圖片

報告地址:https://cdn.sanity.io/files/4zrzovbb/website/fed9cc193a14b84131812372d8d5857f8f304c52.pdf

表4展示了Claude 3.5 Sonnet在「拒絕請求」時的表現。

這里,團隊使用的而是Wildchat和XSTest數據集進行測試,從而衡量模型在面對無害提示時避免不必要的拒絕,同時在面對有害內容時保持適當的謹慎。

可以看到,Claude 3.5 Sonnet在這兩個維度上都優于Opus:它的錯誤拒絕更少,正確拒絕更多。

圖片

表5、圖1和圖2展示了Claude 3.5 Sonnet在「大海撈針」任務中的表現。

可以看到,Claude 3.5 Sonnet和Claude 3 Opus的性能幾乎不相上下,但在平均召回率方面Claude 3.5 Sonnet還是要略勝一籌。

圖片

此外,從下表中能更清晰地看到,Claude 3.5 Sonnet在所有文本長度和200K長上下文之間,召回率居然沒有出現明顯滑落,這是包括Opus在內的所有前代模型的突破。

圖片

圖片

在基于人類反饋的評估方面,團隊把從Claude 2.1開始的所有模型都拉了出來。

其中,人類評審需要與模型進行對話,并根據任務特定的指令對其進行評估。

圖3展示了與Claude 3 Opus基線相比的「勝率」(win rate)。

可以看到, Claude 3.5 Sonnet不僅在編碼、文檔、創意寫作和視覺等核心能力上有著顯著的改進,而且領域專家們也更加喜歡——在法律領域的勝率高達82%,在金融領域為73%,在哲學領域為73%。

圖片

Artifacts:讓團隊實現無縫協作

除了模型的更新之外,Anthropic還Claude.ai上推出了一項全新功能——Artifacts,擴展了用戶與Claude互動的方式。

具體來說,當用戶要求Claude生成代碼片段、文本文檔或網站設計等內容時,只需要一鍵點擊,這些Artifacts會出現在對話旁邊的專用窗口中。

這樣就創建了一個動態工作空間,用戶可以實時查看、編輯并基于Claude的創作進行構建,將AI生成的內容無縫集成到他們的項目和工作流程中。

這個功能的添加,大大增強了Claude在復雜項目中的可用性。

比如想要創建一個交互式的游戲界面,你很難在一次對話中描述清楚所有的功能與需求。即使描述清楚了,以生成模型目前的能力,未必也能一次得到滿意的結果。

于是,你可以參考軟件開發的流程,將需求分解為多個步驟,更方便Claude Sonnet進行「漸進式開發」和迭代。

比如下面這個demo中,想要創建一個游戲,可以先讓模型用SVG格式生成你想要的角色形象。

圖片

再把所有這些SVG圖像放在同一個HTML網頁中。

圖片

最后,規定好角色名稱和游戲規則,只需要告訴Claude讓這個游戲變得「可玩」,不用操心任何代碼細節,一個簡單的網頁游戲就制作完成了。

圖片

Artifacts的推出,標志著Claude從對話式AI向協作工作環境的轉變。

當然,這還只是一個開始。

不久的將來,團隊——最終是整個組織——將能夠在一個共享空間中安全地集中他們的知識、文檔和正在進行的工作,Claude將作為按需的隊友提供服務。

網友:被震撼到了!

模型剛剛發布,就有早期測試者發帖表示「被震撼到了」!

圖片

我是Claude 3.5 Sonnet模型的早期測試者,我對輸出的一致反應是「超神」,模型現在已向所有人開放。

Claude 3.5 Sonnet在關鍵評估上優于競爭模型,速度是Claude 3 Opus的兩倍,但成本只有五分之一,能勝任自主編碼和視覺處理等復雜任務,而且可以管理長文檔,確保 RAG、搜索/檢索以及比較多個長文檔等任務的準確性。

以及,我個人使用體驗的反饋:從來不需要跟它說「不,你沒明白我的提示,請執行這個操作」,它就是能理解提示并做到了;Artifact讓我更有效率;文本推理/比較的結果優秀到不可思議。

有網友表示,自己不相信基準,于是便拿了道真題來了波實測。

結果不出所料,Claude 3.5 Sonnet很快就做了出來,而GPT-4o則在一通長篇大論之后給出了錯誤的答案。

圖片

Ethan Mollick表示,Anthropic新推出的「Artifacts」用起來有點類似于簡化版的代碼解釋器。

圖片

下面,就是他用Claude創建并編輯一個游戲的實時視頻。

大局觀

那么Claude 3.5 Sonnet在Anthropic和整個AI生態系統中有什么重要意義呢?

首先是性能方面,由于當前模型架構的固化以及訓練所需的巨大計算量,在沒有重大研究突破的情況下,我們很難看到從GPT-3到GPT-4那樣的飛躍。

比如,谷歌(Gemini 1.5 Pro)和OpenAI(GPT-4o)發布的旗艦產品,在基準測試和性能方面都只有小幅的提升。

其次,隨著生成式AI廠商將注意力轉向數據策劃和許可,而不是新的可擴展架構,投資者似乎對生成式AI的投資回報周期比預期更長感到擔憂。

不過,Anthropic因為處在對抗OpenAI的關鍵位置上,因此在一定程度上不會受到這種壓力的影響。

但值得注意的是,Anthropic到2024年底的預計收入只有不到10億美元,僅僅是OpenAI的「零頭」。

圖片

第三,盡管客戶群在不斷增長,包括Bridgewater、Brave、Slack和DuckDuckGo等家喻戶曉的品牌,但它仍然缺乏一定的企業知名度。正如最近與普華永道合作向企業轉售生成式AI產品的是OpenAI,而不是Anthropic。

對此,Anthropic正在采取一種戰略性且成熟的方法來開擴市場——將更多的研發投入到像Claude 3.5 Sonnet這樣的產品上,從而在市場價格下提供稍好的性能。

可以看到,Claude 3.5 Sonnet的定價與Claude 3 Sonnet相同:每百萬個輸入模型的token收費3美元,每百萬個模型生成的token收費15美元。

最后,Claude 3.5 Sonnet雖然沒有解決大模型的「幻覺」問題,但它可能足夠有吸引力,讓開發者和企業轉向Anthropic的平臺。而這才是Anthropic關心的。

為此,Anthropic加大了對工具的投入,比如:

- 實驗性的引導AI,允許開發者「引導」模型的內部特性;

- 集成使其模型能夠在應用程序中執行操作;

- 基于模型構建的工具,比如最新的Artifacts。

此外,它還聘請了一位Instagram聯合創始人擔任產品負責人。

總體來說,Anthropic似乎已經意識到,圍繞模型構建一個生態系統,而不僅僅是孤立的模型,是保持客戶的關鍵,因為模型之間的能力差距正在縮小。

最后,讓我們拭目以待吧。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-21 09:51:17

2024-06-21 09:58:38

2024-10-06 09:00:00

AI訓練數據

2025-01-06 13:15:02

2025-01-22 16:57:32

字節跳動豆包大模型

2024-06-28 18:13:05

2024-07-16 13:24:38

2025-04-08 02:26:00

2024-07-11 16:38:15

2024-05-14 08:23:27

GPT-4oAI技術

2024-05-17 09:35:55

GPT-4o模型OpenAI

2024-06-24 12:25:22

2024-12-19 17:50:28

2024-11-04 08:40:00

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-05-20 08:20:00

OpenAI模型

2024-05-14 07:30:56

OpenAIGPT-4oGPT-4

2024-08-07 12:28:23

點贊
收藏

51CTO技術棧公眾號

欧美中文在线视频| 亚洲精品720p| 超碰97在线看| 免费观看黄色一级视频| 性欧美长视频| 日韩一区二区精品视频| 国产老头和老头xxxx×| 中文字幕21页在线看| 国产精品午夜春色av| 97久久天天综合色天天综合色hd | 日本欧美国产| 日韩一区二区电影| 国产日产欧美视频| 成人在线观看免费网站| av一区二区三区| 国产精品一区二区三区免费视频 | 国产精品久久久久999| 国产这里有精品| 国产亚洲一卡2卡3卡4卡新区 | 亚洲另类在线一区| 蜜桃精品久久久久久久免费影院| 亚洲图片在线播放| 制服诱惑一区二区| 欧美成人亚洲成人| 亚洲一级黄色录像| 国产精品天天看天天狠| 欧美日韩国产一级| 国内外成人激情视频| 人人超在线公开视频| 国产精品美女久久久久高潮| 国产有色视频色综合| 国产一区二区网站| 首页综合国产亚洲丝袜| 国内自拍欧美激情| 538精品在线视频| 欧美一二区在线观看| 亚洲精品国产欧美| 性高潮久久久久久| 亚洲影视资源| 欧美日韩激情一区二区三区| 成人性做爰aaa片免费看不忠| 国产蜜臀av在线播放| 国产精品毛片无遮挡高清| 欧美国产一二三区| 污视频在线免费观看| 高清shemale亚洲人妖| 成人激情在线观看| 一区二区视频网站| 日本va欧美va瓶| 日韩免费在线免费观看| 亚洲永久精品在线观看| 91久久夜色精品国产九色| 欧美精品免费在线| 九九精品视频免费| 亚洲精品2区| 美女久久久久久久久久久| 国产在视频线精品视频| av伊人久久| 在线性视频日韩欧美| 99久久久无码国产精品衣服| 亚洲另类春色校园小说| 精品一区二区电影| 精品久久综合| 中文字幕中文字幕一区二区| av免费观看久久| 中文字幕无码乱码人妻日韩精品| 中文精品视频| 91精品国产777在线观看| 久久久香蕉视频| 国产精品porn| 欧美精品aaa| 成年人av电影| 韩国一区二区三区在线观看| 欧美激情小视频| 日韩av一区二区在线播放| 日韩一区二区久久| 91av成人在线| 91视频在线视频| 奇米一区二区三区| 91情侣偷在线精品国产| 亚洲国产福利视频| 91美女片黄在线观看91美女| 欧洲亚洲一区二区| 色大18成网站www在线观看| 国产精品高清亚洲| 91视频 - 88av| 国产理论在线| 欧美日韩一区三区| 极品白嫩的小少妇| 猛男gaygay欧美视频| 夜夜嗨av一区二区三区免费区| 免费黄色国产视频| 欧美精选在线| 欧洲精品在线视频| 国产巨乳在线观看| 北条麻妃国产九九精品视频| 欧美中日韩一区二区三区| 日本视频在线| 黄色一区二区在线观看| 黑森林精品导航| 在线一区二区三区视频| 一个色综合导航| 精品无码人妻一区二区三| 久久午夜精品一区二区| 成人午夜黄色影院| 三级视频网站在线| 国产精品天天看| 日韩a∨精品日韩在线观看| 成人国产一区| 日韩av网站电影| www.黄色com| 亚洲免费激情| 亚洲r级在线观看| 国内精品一区视频| 亚洲一区二区欧美日韩| www.涩涩涩| 欧美a大片欧美片| 欧美成人黑人xx视频免费观看| 欧美亚洲精品天堂| 国产剧情一区在线| 日韩偷拍一区二区| 多野结衣av一区| 在线不卡中文字幕| 欧美黄色一级生活片| 在线精品一区二区| 91麻豆国产语对白在线观看| 精品乱码一区二区三四区视频| 亚洲激情图片小说视频| 密臀av一区二区三区| 国产图片一区| 欧美乱大交xxxxx| 中文字幕av网站| 91免费观看国产| 成人黄色av片| 粉嫩久久久久久久极品| 欧美成人精品在线播放| 伊人网综合在线| 国产亚洲成年网址在线观看| 女人喷潮完整视频| 欧美一区 二区| 性色av一区二区三区红粉影视| jizz中国女人| 亚洲精品免费在线| 日韩a一级欧美一级| 欧美日韩一二| 国产精品美女无圣光视频| 国产在线日本| 色婷婷亚洲一区二区三区| 熟女人妻在线视频| 国产日韩高清一区二区三区在线| 国产不卡一区二区三区在线观看| 最新国产露脸在线观看| 日韩一区二区在线观看| 国产午夜手机精彩视频| 国产一区二区三区四| 黄色www在线观看| 黄页免费欧美| 操91在线视频| 亚洲美女性生活| 亚洲超碰精品一区二区| 麻豆精品国产传媒av| 最新成人av网站| 久久精品日产第一区二区三区 | 雨宫琴音一区二区在线| 91在线精品视频| 午夜成年人在线免费视频| 日韩三级视频在线看| 久久久久黄色片| www.视频一区| 无码内射中文字幕岛国片| 日韩一区三区| 成人永久免费| 深夜成人在线| 国产一区二区三区网站| 一级黄色大片免费观看| 亚洲乱码中文字幕| 国产高清成人久久| 丝瓜av网站精品一区二区| 亚洲国产精品www| 国产一精品一av一免费爽爽| 欧美寡妇偷汉性猛交| 无码精品视频一区二区三区 | 福利一区视频| 久久综合伊人77777蜜臀| 国内老熟妇对白hdxxxx| 午夜久久久久久久久久一区二区| 成人精品在线观看视频| 日本怡春院一区二区| 水蜜桃在线免费观看| 欧美调教在线| 91麻豆国产精品| 国产精选在线| 久久久国产精品x99av| 人妻丰满熟妇av无码区hd| 91久久精品一区二区| 黄色录像二级片| 99国产精品久久久久久久久久 | 亚洲女同志freevdieo| 色偷偷噜噜噜亚洲男人| 韩国av免费在线观看| 欧美专区亚洲专区| 国产亚洲第一页| 久久久久久久综合日本| 日本网站在线看| 裸体素人女欧美日韩| 欧美少妇在线观看| 久久99视频| 国产伦精品一区二区三毛| 激情久久一区二区| 欧美做受高潮电影o| 欧美男男video| 日韩亚洲精品电影| 人成在线免费视频| 日韩久久免费av| 一级片免费网站| 欧美午夜影院在线视频| 欧美高清视频一区二区三区| 国产精品污网站| 中文字幕av网址| 成人激情综合网站| 久久久福利影院| 免费xxxx性欧美18vr| 国产无套内射久久久国产| 国产一区日韩欧美| 国产又大又长又粗又黄| 精品久久久久久久久久久下田| 国产精品12| 精品国产乱码一区二区三区| 国产精品精品久久久久久| 男人天堂视频在线观看| 欧美激情区在线播放| 91精选在线| 日韩一区二区三区国产| 黄色大片在线看| 日韩精品免费观看| 欧美一区二区三区成人片在线| 欧美一级理论片| 国产精品久久久久久免费| 欧美视频在线一区二区三区| 久久久久女人精品毛片九一| 黄色一区二区三区| 尤物视频在线观看国产| 午夜免费久久看| 亚洲黄色三级视频| 亚洲va欧美va人人爽| 国产一国产二国产三| 亚洲一区二区高清| 久热精品在线观看| 亚洲一区二区三区免费视频| 久久精品国产亚洲AV无码麻豆 | 亚洲女人被黑人巨大进入| 日韩有码第一页| 亚洲第一页中文字幕| 五月天福利视频| 日韩久久精品成人| 美州a亚洲一视本频v色道| 精品伊人久久97| 国产中文在线视频| 亚洲小视频在线| 超碰免费97在线观看| 中文字幕久久精品| 黄网站视频在线观看| 欧美日韩国产999| 国产免费拔擦拔擦8x在线播放 | 精品午夜福利在线观看| 亚洲第一搞黄网站| 在线观看 亚洲| 欧美性大战久久| 国产视频手机在线观看| 精品国一区二区三区| 无码精品在线观看| 在线观看欧美日韩国产| 91精品久久| 88国产精品欧美一区二区三区| 欧美××××黑人××性爽 | 一区二区三区四区高清视频| 国产经典一区二区三区 | 一区二区在线中文字幕电影视频 | 久久成人福利视频| 亚洲欧美日韩国产一区| 搡女人真爽免费午夜网站| 精品一区二区在线观看| 欧洲成人午夜精品无码区久久| 99r精品视频| 成人免费视频入口| 亚洲一二三四区不卡| 久久久久女人精品毛片九一| 欧美精品亚洲二区| 丰满人妻熟女aⅴ一区| 亚洲美女视频网站| 成人影院在线看| 51ⅴ精品国产91久久久久久| 日本h片久久| 国产精品免费一区二区| 狠狠色丁香婷婷综合影院| 干日本少妇视频| 午夜亚洲性色福利视频| 欧美国产日韩另类| 91在线观看地址| 免费看一级大片| 色先锋久久av资源部| 亚洲国产成人在线观看| 色哟哟网站入口亚洲精品| 另类视频在线| 国产自摸综合网| 偷拍亚洲精品| 日b视频免费观看| 美腿丝袜在线亚洲一区| 老熟妇精品一区二区三区| 国产精品电影一区二区| 国产精品男女视频| 欧美岛国在线观看| 欧美性猛交xxx乱大交3蜜桃| 欧美一级视频在线观看| 最新国产精品精品视频| 一本一道久久a久久精品综合 | 欧美高清无遮挡| 日韩国产一二三区| 日本成人黄色免费看| 亚洲高清电影| 亚洲综合中文网| 国产精品国产自产拍在线| 97久久久久久久| 亚洲精品一区二区三区福利| 国产在线高潮| 国产美女精彩久久| 大片网站久久| 亚洲国产精品久久久久爰色欲| 国产成人aaa| 一区二区三区四区五区| 欧美日韩一区二区三区在线| 你懂的视频在线| 2019中文字幕免费视频| 成人线上播放| 免费看毛片的网址| 国产91在线看| 久久久久久久久久久97| 91精品国产91久久综合桃花| 欧美69xxx| 成人激情春色网| 91精品国产91久久久久久黑人| 91高清国产视频| 国产精品国产三级国产aⅴ原创| 中文字幕欧美人妻精品| 伊人激情综合网| 欧美日韩五区| 一区二区三区视频| 麻豆免费精品视频| 欧美xxxooo| 欧美一级欧美一级在线播放| 亚洲小说区图片| 国产精品免费在线| 亚洲欧洲日本mm| 亚洲中文字幕一区| 日韩欧美成人精品| 国产福利免费在线观看| 国产精品老女人精品视频| 日韩欧美大片| 五月天婷婷在线观看视频| 亚洲欧美日韩国产综合在线| 国产黄色片免费观看| 久久久久久久久久久亚洲| 日韩在线你懂的| 欧美精品第三页| 中文字幕在线观看一区二区| 国产男女无套免费网站| 欧美激情网站在线观看| 天堂俺去俺来也www久久婷婷| wwwxxx黄色片| 国产精品人人做人人爽人人添| 国产影视一区二区| 欧美激情第6页| 亚洲成a人片77777在线播放| 欧美婷婷精品激情| 亚洲黄网站在线观看| 人妻一区二区三区四区| 日韩免费在线播放| 亚洲视频电影在线| 国产伦精品一区二区免费| 在线观看亚洲一区| 韩国中文字幕在线| 国内不卡一区二区三区| 日韩av不卡一区二区| 亚洲成人生活片| 精品中文视频在线| 国产精品免费精品自在线观看| 奇米精品一区二区三区| 亚洲国产精品99久久久久久久久| 精品国产乱码久久久久久蜜臀网站| 91av在线不卡| 小处雏高清一区二区三区| 国产xxxxxxxxx| 欧美三级韩国三级日本一级| 日韩专区av| 亚洲国产欧美日韩| 成人精品一区二区三区中文字幕| 国产美女www| 国内成人精品一区| 日韩视频在线观看| av在线播放网址|