精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

自己發(fā)基準自己第一,Anyscale行為惹社區(qū)吐槽

新聞
Anyscale 是一家專注分布式計算領域的美國初創(chuàng)公司,雖然創(chuàng)立僅三年時間,但卻收獲了不少的關注。

前一天發(fā)布 LLMPerf 排行榜,宣稱要推動大型語言模型推理領域的發(fā)展,鼓勵創(chuàng)新與超越。

第二天就收獲 AI 社區(qū)的大量吐槽,原因是排行榜的「基準甚至沒有得到很好的校準」。

這是 Anyscale 這家初創(chuàng)公司正在經歷的事情。

Anyscale 是一家專注分布式計算領域的美國初創(chuàng)公司,雖然創(chuàng)立僅三年時間,但卻收獲了不少的關注。

首先就是 Anyscale 旗下開源項目 Ray 帶來的光環(huán)。Ray 是一個開源的分布式計算框架,可以將 AI/ML 和 Python 的 workload 從單機拓展至多臺計算機上,從而提高 workload 的運行效率,目前已經在 Github 上收獲了兩萬多個 Star。帶動了最新一波大模型熱潮的 ChatGPT,也是基于 Ray 框架訓練的。

還有一部分原因是創(chuàng)始團隊的光環(huán)。這家初創(chuàng)公司的創(chuàng)始人之一、UC 伯克利教授 Ion Stoica 是市值 310 億美元的數(shù)據(jù)巨頭 Databricks 的聯(lián)合創(chuàng)始人,他在十年前帶領學生創(chuàng)立了 Databricks,收獲了商業(yè)上的巨大成功。在 2019 年,他又一次做出了創(chuàng)業(yè)的決定 ——Anyscale 誕生了。公司創(chuàng)始團隊中的 CEO Robert Nishihara 和 CTO Philipp Moritz ,也都是他在伯克利的學生。此外,伯克利教授 Michael I. Jordan 也參與了 Anyscale 的創(chuàng)業(yè)。

這些要素,都讓人們在 Anyscale 身上看到了 Databricks 的影子,一些投資者將 Anyscale 描述為充滿希望的「下一個 Databricks」

2021 年 12 月,Anyscale 完成了 1 億美元的 C 輪融資,估值達到 10 億美元,投資者包括 a16z、Addition、NEA、Intel 等。今年 8 月,Addition 和 Intel 又共同牽頭追加了新一輪 9,900 萬美元投資。

這應該是一個前景光明的技術團隊。而此次被吐槽事件的經過是這樣的:

11 月初,Anyscale 發(fā)布過一個開源大模型推理基準,叫做「LLMPerf」。這個基準是為了方便廣大研究者評估 LLM API 性能。

三天前,Anyscale 在上述工作的基礎上,推出了 LLMPerf 排行榜。

排行榜地址:https://github.com/ray-project/llmperf-leaderboard

Anyscale 稱,他們已經利用 LLMPerf 對一些 LLM 推理提供商進行了基準測試,評估大模型性能、可靠性、效率的關鍵指標包括以下三點:

  • 第一個 token 的時間(TTFT),表示 LLM 返回第一個 token 的持續(xù)時間。TTFT 對于聊天機器人等流媒體應用尤為重要。
  • token 間延遲:連續(xù) token 之間的平均時間。
  • 成功率:推理 API 在無錯誤的情況下成功響應的比例。由于服務器問題或超出速率限制,可能會出現(xiàn)失敗,這反映了 API 的可靠性和穩(wěn)定性。

但 Anyscale 曬出的這些測評結果引發(fā)了不小的爭議,比如 TTFT 這一項指標,對于不同規(guī)模的模型,Anyscale 都是第一名。

70B Models:

13B Models:

7B Models:

后兩項指標的測評結果中,Anyscale 也顯示出「遙遙領先」的水準。

面對這么多優(yōu)秀對手,Anyscale 真的能實現(xiàn)「吊打」嗎?圖中結果令人懷疑。

對此,PyTorch 創(chuàng)始人 Soumith Chintala 表示:「看到來自可靠來源的構建不佳的基準讓我感到痛苦。我希望 Anyscale 能夠解決問題,并在發(fā)布此類基準之前咨詢其他利益相關者。如果我不是很了解 Anyscale,我會認為這是惡意行為。」

問題出在哪里呢?Soumith Chintala 認為,這個基準沒有得到很好的校準,「它僅在很短的時間內展示了復雜問題的一個方面」。

至少,用戶需要了解多個附加因素:1. 服務的每個 token 成本;2. 吞吐量,而不僅僅是延遲;3. 在一段時間內測量的可靠性、延遲和吞吐量,而不僅僅是突發(fā)可靠性,突發(fā)可靠性可能會根據(jù)一天中的時間而有很大變化。

此外,Anyscale 應該明確標記該基準是有偏見的,因為 Anyscale 正在管理它,或者向其他利益相關者開放基準的設計和治理,即開放治理,而不僅僅是開源。試圖制定和控制標準并不好。

「基準游戲」并不新鮮,曾經的數(shù)據(jù)庫之戰(zhàn)、大數(shù)據(jù)之戰(zhàn)、機器學習框架之戰(zhàn)都涉及到各種投機取巧的基準測試,僅僅為了更好地展示自己。

兩位 AI 學者陳天奇和賈揚清也回憶起,那些年關于「基準游戲」的故事:

作為 LeptonAI 的創(chuàng)始人,賈揚清還分析了 Anyscale 發(fā)布的大模型推理排行榜為什么不夠合理:

作為 AI 框架領域的資深人士,請允許我分享一個故事。在圖像模式時代,每個人都想成為 「最快的框架」,為了讓自己的速度快上 2%,不惜犧牲很多其他因素。

有一個框架從來都不是最快的。猜猜它是什么?

這個框架的名字叫 PyTorch。直到今天,PyTorch 仍然不是最快的框架,這是我從同事 Soumith Chintala 身上學到的重要一課。這是一個有意識的選擇,以確保不會過度優(yōu)化單一(或少數(shù))標準。

我為 Anyscale 制作基準測試而鼓掌,恕我直言,這是一個誠實、用心良苦的基準測試,卻存在嚴重錯誤和不明確的參數(shù)。比如,在引擎蓋下運行這些服務的是什么 GPU?

但是,既然性能比較不可避免,那我就把結果公布出來吧。

在 Anyscale 在 10 月份發(fā)布的一篇帖子中,曾對比過三家 API 的推理性能。賈揚清曬出了一張 Lepton API 與這三家 API 的對比圖片:

基準數(shù)據(jù)來源:https://anyscale.com/blog/reproducible-performance-metrics-for-llm-inference

「原始數(shù)據(jù)不是由 Anyscale 發(fā)布的,因此我們不得不在帖子中的原始圖片上疊加圖表。很抱歉把這些東西拼湊在一起。」賈揚清表示:「我們并不打算用它來衡量誰是最快的,只是想證明我們是名列前茅的。」

除了賈揚清,其他「被上榜」的 API 所屬團隊也提出了質疑。

比如 FireworksAI 聯(lián)合創(chuàng)始人、CTO Dmytro Dzhulgakov:

TogetherAI 的 CEO 表示:「Anyscale 是為了清洗他們 API 糟糕性能進行的基準測試。」

多方質疑之下,Anyscale 的 CEO 親自回應了基準的缺陷問題:

我同意你的很多反饋,我們將解決它!

一些具體的事情:

我們將添加成本作為一個指標(這非常重要)。

我們將隨著時間的推移測量延遲和可靠性。正如您提到的,這些事情根據(jù)一天中的時間而變化。

關于吞吐量,此處的預期范圍是對 API 端點產品進行基準測試(而不是 LLM 推理引擎)。每個副本的吞吐量不是一個面向用戶的概念,我們可以在不訪問內部的情況下進行基準測試。吞吐量非常重要,但這是一種不同的設置。

我們的目的是使其對社區(qū)有用。僅當其成為共同努力并且社區(qū)認為這是公平時,它才會有用。我們正在與所有利益相關者聯(lián)系以就此進行合作。

與此同時,Anysacle 也在邀請各位 API 提供商共同參于排行版的「修正」:

對于此事,你怎么看?

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2014-01-21 16:44:31

作家閱餅iReader

2011-06-27 16:18:24

Qt Designer

2013-10-29 09:32:05

2013-10-29 09:08:05

2012-03-10 20:55:40

Nokia

2018-11-08 15:58:15

生產系統(tǒng)

2021-01-03 15:01:37

互聯(lián)網程序員私企

2020-11-30 19:27:34

微信文件移動應用

2013-03-14 13:49:31

Hotmail郵件服務器

2012-10-16 16:27:32

UbuntuAmazon搜索

2021-03-15 10:03:10

框架自動化開發(fā)

2023-07-14 09:49:16

2019-09-16 09:42:57

人生第一份工作跳槽那些事兒程序員

2022-01-27 09:34:29

微信iOS版朋友圈

2014-10-15 16:47:31

Android微軟

2014-07-17 09:21:57

編程編程漫畫

2012-06-05 14:35:00

Windows Pho

2025-08-08 09:22:40

2014-08-06 14:13:30

Windows Pho

2017-12-04 09:59:29

點贊
收藏

51CTO技術棧公眾號

小泽玛利亚一区二区免费| 色大师av一区二区三区| 精品视频久久久久| 白白在线精品| 欧美日韩免费看| 久久伊人资源站| 亚洲成人第一网站| 色中色综合网| 日韩精品中文字幕一区| 免费看毛片的网址| 美女做暖暖视频免费在线观看全部网址91| 久久久久久久欧美精品| 在线观看日韩欧美| 亚洲综合在线一区二区| heyzo在线| 久久精品视频一区| 热久久99这里有精品| 国产真人真事毛片视频| 欧美日韩女优| 一区二区三区精品| 日本一区不卡| 精品美女www爽爽爽视频| 在线亚洲国产精品网站| 色狠狠av一区二区三区香蕉蜜桃| 1314成人网| 国产免费拔擦拔擦8x高清在线人| 国产日韩三级在线| 91网站在线看| 美女又爽又黄免费视频| 欧美高清视频在线观看mv| 精品国产一区二区在线观看| 国产男女无遮挡| 成人黄视频在线观看| 99re这里都是精品| 国产精品专区一| 黄色大片网站在线观看| 日韩在线第七页| 亚洲黄页网在线观看| 亚洲一区精品视频在线观看| 女人让男人操自己视频在线观看| 国产精品九色蝌蚪自拍| 久久精品一二三区| 国产不卡av在线播放| 日韩高清国产一区在线| 欧美极品欧美精品欧美视频 | 欧美巨大xxxx做受沙滩| 国产欧美日韩激情| 精品国产乱码一区二区三区四区| www.五月婷婷.com| 97精品人妻一区二区三区| 黄色aa久久| 亚洲人成7777| 神马影院我不卡| 亚洲aⅴ乱码精品成人区| 国产精品一区二区果冻传媒| 国产91网红主播在线观看| www.av视频在线观看| 亚洲天天影视网| 色偷偷91综合久久噜噜| 野花社区视频在线观看| 欧美一级全黄| 日韩美女在线视频| 狠狠躁狠狠躁视频专区| 欧美无毛视频| 亚洲尤物视频在线| 天堂а√在线中文在线| 免费观看久久久久| 国产精品理论片| 日韩亚洲视频在线| 国产精品视频二区三区| 久久精品视频在线看| 欧美日韩免费观看一区| 日本1级在线| eeuss鲁片一区二区三区在线观看 eeuss影院一区二区三区 | 久久久精品高清| 怡红院成人在线| 91成人在线观看喷潮| 丝袜老师办公室里做好紧好爽 | 国产熟女一区二区三区四区| 久久精品国产秦先生| 国产精品久久久一区| 国产在线观看第一页| 视频在线观看一区二区三区| 国产成人av在线| 中文字幕手机在线视频| 日韩av网站在线观看| 国产精品黄页免费高清在线观看| 黄色av网站免费| 日韩**一区毛片| 国产精品一区久久久| 91在线公开视频| 国产精品456| 91免费视频网站| 99久久精品国产色欲| 国产999精品久久久久久绿帽| 99国产在线视频| www国产无套内射com| 国产视频一区二区三| 日韩在线卡一卡二| 国产在线视频不卡| 亚洲AV无码乱码国产精品牛牛| 国产毛片一区二区| 精品国产一区二区三区四区精华| 你懂得在线网址| 国产精品免费丝袜| 成人一对一视频| 在线视频成人| 亚洲乱亚洲乱妇无码| 欧美三级黄色大片| 视频在线观看一区| 国产一区二区三区四区hd| av在线第一页| 精品成人国产在线观看男人呻吟| 亚洲小视频网站| 一区二区三区四区在线看| 美女性感视频久久久| 成人免费一级片| 97久久精品人人做人人爽50路| 综合色婷婷一区二区亚洲欧美国产| 老色鬼在线视频| 日韩一区二区在线看片| 久久久精品成人| 亚洲一区国产| 国产日韩一区欧美| 亚洲图区一区| 欧美一区二区三区视频在线 | 国产精品麻豆久久久| 韩国v欧美v日本v亚洲| 国产又粗又猛又黄| 国产日产精品1区| 成熟丰满熟妇高潮xxxxx视频| 国产精品一区二区三区www| 在线播放日韩专区| 成人h动漫精品一区二区下载| 国产成人免费视频网站| 成年人黄色在线观看| 国内精品伊人| 色一区av在线| 国产天堂第一区| 久久久精品国产免大香伊| 亚欧无线一线二线三线区别| 成人高潮a毛片免费观看网站| 另类视频在线观看| 91精品视频免费在线观看| 国产亚洲欧美一区在线观看| 国产免费黄视频| 任你弄精品视频免费观看| 国模精品一区二区三区色天香| 精品乱子伦一区二区| 亚洲免费观看高清| 不卡的一区二区| 欧美久久一级| 国产v亚洲v天堂无码| wwww亚洲| 精品视频在线观看日韩| 欧美精品韩国精品| 久久先锋影音av| 五月天婷婷激情视频| av网站在线免费看推荐| 日韩精品亚洲一区| 日韩欧美99| 国产欧美在线观看免费| 久久久精品一区| www.四虎在线观看| 亚洲成人免费视频| 中出视频在线观看| 日韩专区在线视频| 尤物国产精品| 66精品视频在线观看| 97香蕉超级碰碰久久免费软件 | 久久天天躁狠狠躁夜夜爽蜜月| 国产乱码一区二区| 亚洲一区二区三区视频在线| 捆绑凌虐一区二区三区| 久久九九电影| 在线视频不卡国产| 福利电影一区| 国产z一区二区三区| 免费大片在线观看www| 欧美日韩黄色影视| 精品99在线观看| 久久久久久久久久久99999| 天天色天天综合网| 伊人久久亚洲影院| 日韩欧美在线电影| 日韩一区二区三区精品视频第3页| 久久免费国产视频| 超碰国产在线观看| 精品久久久久久久久久久院品网| 4438国产精品一区二区| 中文字幕视频一区二区三区久| 国产原创剧情av| 日韩中文字幕区一区有砖一区| 操bbb操bbb| 深爱激情综合| 97久久精品午夜一区二区| 亚洲最大成人| 色综合视频一区中文字幕| 成人影院免费观看| 精品sm捆绑视频| 中文字幕一区2区3区| 亚洲成av人影院| 波兰性xxxxx极品hd| 99久久精品免费观看| 手机av在线网| 成人亚洲精品| 亚洲国产人成综合网站| 亚洲精品91在线| 成人精品视频一区二区三区| 日本 片 成人 在线| 99精品福利视频| 经典三级在线视频| 欧洲视频一区| 精品欧美一区二区在线观看视频| 91视频成人| 国产精品久久久久久网站 | 久久美女视频| 欧美lavv| 久久精品福利| 懂色av一区二区三区在线播放| 婷婷综合六月| 97在线免费观看视频| 怡红院在线播放| 日韩视频中文字幕| 国产有码在线| 日韩精品在线观看一区| 欧美视频xxx| 91精品国产免费| 91亚洲精品国偷拍自产在线观看 | 亚洲精品国产精品乱码不99| 久久久久久国产免费a片| 久久综合九色综合97婷婷| 国产69视频在线观看| 国产成人亚洲综合色影视| xxxx在线免费观看| 蜜臀av一区二区在线免费观看| 日本在线观看a| 久久高清国产| 国产偷人视频免费| 翔田千里一区二区| 国产精品50p| 免费精品视频| 国产第一页视频| 日韩福利视频导航| 嫩草影院国产精品| 日本少妇一区二区| 三上悠亚在线一区二区| 美女精品自拍一二三四| 天堂中文视频在线| 久久99精品久久久久久国产越南 | 久久色.com| 精品人妻一区二区三区视频| 久久免费美女视频| 精品人伦一区二区三电影| 欧美—级在线免费片| 貂蝉被到爽流白浆在线观看| 中文在线资源观看网站视频免费不卡| 一级二级黄色片| 中文字幕亚洲一区二区av在线 | 无码国产精品高潮久久99| 成人黄色大片在线观看| 婷婷五月精品中文字幕| 不卡视频一二三四| 国产精品毛片一区二区| 中文字幕av不卡| 欧美日韩成人免费观看| 婷婷国产v国产偷v亚洲高清| 亚洲国产精品无码久久久| 欧美日韩中文精品| 国产成人精品a视频| 亚洲国产精品资源| 风间由美一区| 美女扒开尿口让男人操亚洲视频网站| 女人黄色免费在线观看| 5252色成人免费视频| jizz欧美| 国产精品yjizz| 欧美美女在线| 日韩视频一二三| 欧美亚洲自偷自偷| 欧美视频亚洲图片| 99久久99精品久久久久久 | 红桃视频在线观看一区二区| 亚洲人一区二区| 亚洲精品社区| www.日本一区| 91在线一区二区| 蜜桃av.com| 精品国产精品自拍| 91av久久久| 日韩精品中文字| 成人黄色网址| 国产精品第10页| 国产精品主播在线观看| 亚洲春色在线| 国产欧美综合一区二区三区| 向日葵污视频在线观看| 不卡一区二区三区四区| 中文字幕电影av| 欧美日韩在线一区| 性生交生活影碟片| 中文字幕视频一区二区在线有码 | 中文字幕乱妇无码av在线| 久久久久国产精品免费免费搜索| 黑人巨大精品一区二区在线| 91黄色激情网站| 午夜视频在线免费播放| 久久中文字幕国产| 99re66热这里只有精品4| 国产精品三区在线| 婷婷精品进入| 国产又大又黄又粗又爽| 91色.com| 91香蕉在线视频| 日韩你懂的电影在线观看| 亚洲精品传媒| 国产精品第1页| 五月国产精品| 欧美成人高潮一二区在线看| 国产不卡一区视频| 夫妻性生活毛片| 欧美日韩精品二区第二页| 国产在线观看网站| 国产女人18毛片水真多成人如厕 | 91网站免费入口| 亚洲成人777| www.日日夜夜| 欧美精品在线观看| 国产精品一区三区在线观看| 台湾成人av| 日本亚洲最大的色成网站www| 无码人妻aⅴ一区二区三区 | 丰满熟女人妻一区二区三| 亚洲欧美国产一本综合首页| 成人免费图片免费观看| 粉嫩av免费一区二区三区| 欧美日本一区| 亚洲成人精品在线播放| 亚洲黄一区二区三区| 国产露脸国语对白在线| 久热99视频在线观看| 国产不卡精品| 亚洲小说欧美另类激情| 韩国一区二区三区| 国产a免费视频| 日韩欧美一区中文| 蜜桃成人365av| 国产精品国模大尺度私拍| 影音先锋亚洲电影| 精品夜夜澡人妻无码av| 欧美小视频在线| 精品电影在线| 国产精品久久久久久久久久久久久久久 | 国产传媒在线| 久久久久久草| 久久美女性网| 纪美影视在线观看电视版使用方法| 色婷婷av久久久久久久| 福利在线观看| 91九色蝌蚪国产| 极品中文字幕一区| 日本黄色片在线播放| 色播五月激情综合网| 亚洲成a人v欧美综合天堂麻豆| 91香蕉电影院| 9色国产精品| 高潮毛片无遮挡| 欧美日韩午夜影院| 四虎影院观看视频在线观看| 国产女人水真多18毛片18精品| 午夜一级在线看亚洲| 污污视频网站在线免费观看| 欧美一区二区三区不卡| 国产三级国产精品| 免费在线观看一区二区三区| 国产精品一区二区亚洲| 日韩精品一区二区三区在线播放| а√天堂8资源在线| 日韩欧美一区二区视频在线播放| 国产一区在线精品| 免费在线不卡视频| 中文国产成人精品久久一| 一区二区三区在线资源| 成年人在线看片| 亚洲精品菠萝久久久久久久| 日韩精品视频在线观看一区二区三区| 国产精品影片在线观看| 欧美日韩国产在线一区| 熟女俱乐部一区二区| 日韩一区二区视频| 欧美xxx性| 黄色一级片国产| 国产精品色哟哟| 人妻丰满熟妇av无码区hd| 国产精品亚洲精品| 99精品视频免费观看视频| 熟女少妇内射日韩亚洲| 亚洲成人动漫在线播放| 高清在线一区| 欧美一级黄色片视频|