精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

剛剛,開源大模型的新王誕生了:超越GPT-4o,模型還能自動糾錯

人工智能
橫掃 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。

快速更迭的開源大模型領域,又出現了新王:Reflection 70B。

橫掃 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。

這個新模型 Reflection 70B,來自 AI 寫作初創公司 HyperWrite。

圖片

HyperWrite 公司的 CEO Matt Shumer 表示,Reflection-70B 現在是「世界上最頂級的開源 AI 模型」。

Reflection 70B 的底層模型建立在 Meta 的 Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,確保了與現有工具和 pipeline 的兼容性。

Reflection 70B 已在多個基準測試中經過嚴格測試,包括 MMLU 和 HumanEval。測試結果表明, Reflection 的表現始終優于 Meta 的 Llama 系列,并與 GPT-4o 等全球頂尖的商用模型展開了激烈競爭。

圖片

其中,它在 GSM8K 的得分甚至達到了 99.2%。要知道,GSM8k 中可能有有超過 1% 的被標為正確的答案實際上有錯,也就是說,Reflection 70B 的得分幾乎與滿分無異。

值得注意的還有 Reflection 70B 的零樣本推理能力。面對從未接觸過的內容,Reflection 70B 的表現超越了 Claude 3.5、Gemini 1.5 以及 Llama 405 在五次樣本測試中的得分。

圖片

Reflection 70B 特別適用于需要高精度的任務,它將推理分為不同的步驟以提高精度。該模型可通過 Hugging Face 下載,API 訪問將于今天晚些時候通過 GPU 服務提供商 Hyperbolic Labs 提供。

  • Hugging Face:https://huggingface.co/mattshumer/Reflection-70B
  • 試用網址:https://reflection-playground-production.up.railway.app/

假設訓練有素  模型自動糾錯

在通用能力之外,Reflection 70B 的亮點還包括「錯誤識別」和「錯誤糾正」。

一種名為「Reflection-Tuning」的技術,使得模型能夠在最終確定回復之前,先檢測自身推理的錯誤并糾正。

Reflection 70B 引入了幾個用于推理和糾錯的特殊 token,使用戶能夠以更結構化的方式與模型交互。在推理過程中,模型會在特殊標簽內輸出其推理,以便在檢測到錯誤時進行實時糾正。

圖片

Playground 演示網站包含供用戶使用的建議提示詞,比如那些很經典的例子:詢問 Reflection 70B 單詞「Strawberry」中有多少個「r」,以及哪個數字更大(9.11 還是 9.9),這兩個簡單的問題曾經難倒過很多大模型。

Reflection 70B 在測試中顯得有些遲緩,但最終 60 多秒后給出了正確的答案。

圖片

Reflection 70B 的發布只是 Reflection 系列的開端。與此同時,Reflection 405B 也在推出的路上了,預計下周上市。Shumer 表示,它的性能將遠遠超過目前的專有或閉源 LLM,例如目前全球領先的 OpenAI 的 GPT-4o。

Shumer 宣布,HyperWrite 正致力于將 Reflection 70B 模型集成到其主要的 AI 寫作助手產品中。

Reflection 405B 有望超越當今市場上最頂尖的閉源模型。HyperWrite 將發布一份報告,詳細介紹訓練過程和基準,以及 Reflection 模型背后的創新之處。

兩個人在幾周內完成  歸功于 Glaive 的合成數據

Shumer 表示完成 Reflection 70B 只花了三周,團隊只有他和另一位 AI 創業公司的創始人 Sahil Chaudhary 兩個人。

圖片

在這么短的時間內做出效果如此好的模型,Shumer 稱,都要拜 Sahil 的公司 Glaive 所賜。Glaive 是一家專門為特定需求構建數據集的初創公司。Shumer 在 X 平臺上反復 que 這一點:「聯系了 Sahil 之后,訓練數據幾小時內就生成好了?!顾€親自站臺安利:「如果你在訓練 AI 模型,一定要試試 Glaive 提供的服務。」

圖片

Glaive 專注于解決 AI 開發中最大的瓶頸之一:高質量、任務特定數據的可用性。在去年獲得了一輪 350 萬美元的種子輪融資。

圖片

Sahil Chaudhary 

小型、更專業化的語言模型在使用 Glaive 提供的服務后,能夠更快地完成訓練。已經有一些小模型使用該公司已經證明了 Glaive 的能力,例如一個 3B 參數模型在 HumanEval 等任務上的表現超過了許多參數規模更大的開源模型。

火得措手不及  GPU 不夠用了

Reflection 70B 一經發布,就火了,跑去試用的人太多,模型已經反應不過來了。

圖片

圖片

本來可以在線試用 Reflection 70B,但現在和它聊天反應很慢。

圖片

但是根據手快的網友發來的測評,Reflection 70B 也確實沒辜負六個基礎測試集里有四個都打敗了 Claude 3.5 Sonnet 的戰績。

比如,它是首個能想明白這道纏繞不清的邏輯題的大模型。

圖片

提示詞:有人在某地殺了 Agatha。Agatha、管家和 Charles 住在 此地,并且是那里唯一的居民。殺手恨他的目標,并且比受害者窮。Charles 不恨 Agatha 恨的任何人。Agatha 除了管家之外恨所有人。管家恨所有不如 Aunt Agatha 富有的人。管家恨所有 Agatha 恨的人。沒有人恨所有人。誰殺了 Agatha?

向它提問:「柏林的魏森湖地區當地人通常在哪里聚會?當地有哪些景點?」。對于這些本地人才知道的答案,其他模型雖然也能給出一些正確的回復,但是總會冒出一些在柏林之外的地點。Reflection 70B 是第一個能正確地說出主要地點,并且沒有幻覺的模型。

圖片

Reflection-70B 的編碼能力也得到了認證。有網友在 ProLLM 的編碼輔助任務中對 Reflection-70B 進行了基準測試。它確實是最好的開源模型之一,擊敗了 Llama-3.1 405B。

圖片

不過,爆火的同時,由于 Reflection 70B 的底層模型采用了 Meta 的 Llama 3.1 70B Instruct,這也引發了一些爭議。

有網友認為:「Reflection 70B 只是一種元提示(Meta-Prompting)的進步,似乎不能算是一種創新。」

圖片

但也有人對此提出反對,認為「利用思維鏈和讓大模型說出自己的工作流程」這種方法能讓大模型更好地模擬人類思考的過程。

「萬一 Shumer 的方法 Reflection-tuning,就是 OpenAI 的 Strawberry 的方法呢?」

圖片

團隊介紹

乍一看,Reflection 70B 似乎是橫空出世,HyperWrite 的知名度并不高。但其實 Shumer 已是 AI 領域的創業老將了:2020 年,他與就 Jason Kuperberg 共同創立了 Otherside AI。

圖片

從左至右分別為 Otherside AI 的聯合創始人:Matt Shumer, Miles Feldstein 與 Jason Kuperberg。

Otherside AI 憑借其當家產品 HyperWrite 收獲了一波流量。HyperWrite 最初是一款根據要點撰寫郵件和消息的 Chrome 插件。后來,它的功能越來越強大,拓展出了起草文章、總結文本等功能。截至 2023 年 11 月,HyperWrite 擁有兩百萬用戶。隨著兩位聯合創始人登上了福布斯年度「30 歲以下精英」榜單,Otherside AI 也正式更名為 HyperWrite。 

在最新一輪融資中, HyperWrite 獲得了 280 萬美元的投資。在這筆資金的加持下,HyperWrite 引入了 AI 驅動功能,升級成了可以從網頁瀏覽器自動完成預定航班、在 LinkedIn 上篩簡歷的智能管家。 

HyperWrite 在線幫你訂達美樂披薩的外賣。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-07 14:05:40

OpenAI大模型開源

2024-11-12 14:00:00

AI編程

2024-10-17 14:05:34

2025-06-06 14:17:11

模型訓練AI

2024-06-05 13:09:26

2024-09-06 13:31:31

2025-08-05 09:15:15

2024-08-14 12:54:46

2024-05-14 11:29:15

2025-11-06 08:55:00

2025-05-26 08:33:00

2024-06-27 12:45:30

2024-08-09 12:50:02

2024-08-30 14:35:00

2024-08-15 15:45:00

AI訓練

2024-12-27 10:27:58

2024-06-21 09:58:38

2025-09-28 15:35:32

AI模型強化學習

2025-04-08 02:26:00

點贊
收藏

51CTO技術棧公眾號

国产一区二区不卡视频在线观看| 亚洲午夜未删减在线观看 | 国产传媒一区二区| 天天操天天摸天天干| 国产对白叫床清晰在线播放| 青娱乐精品视频| 欧美日本中文字幕| 成人免费网站黄| 黄色羞羞视频在线观看| 97精品国产露脸对白| 国产欧美一区二区三区在线| 免费一级特黄特色大片| 精品国产一区二区三区小蝌蚪| 欧美一区二区私人影院日本| 视频一区二区三区在线观看| av天堂一区二区三区| 午夜在线视频观看日韩17c| 北条麻妃久久精品| 成都免费高清电影| 国产精品传媒| 欧美日韩国产综合视频在线观看| 你懂的av在线| 国产激情在线观看| 国产欧美一区二区精品仙草咪| 97免费资源站| 亚洲va久久久噜噜噜| 少妇愉情理伦三级| 偷拍精品精品一区二区三区| 亚洲欧美成aⅴ人在线观看| 日本一区二区不卡高清更新| 亚洲精品网站在线| 国产精品激情电影| 久久精品一区中文字幕| 中文字幕伦理片| 色婷婷狠狠五月综合天色拍| 欧美日韩亚洲精品内裤| 国产精品露出视频| 男人的天堂一区| 亚洲国产精品91| 日韩在线中文字幕| 91大神免费观看| 久久久加勒比| 欧美在线免费视屏| 桥本有菜av在线| 91青青在线视频| 国产色一区二区| 欧美一区二区福利| 黄色片在线播放| 久久er99精品| 国产精品久久久久秋霞鲁丝| 亚洲综合久久网| 久久婷婷亚洲| 日韩免费精品视频| 日批视频免费观看| 蜜桃91丨九色丨蝌蚪91桃色| 国产乱肥老妇国产一区二| 中文字幕观看视频| 毛片基地黄久久久久久天堂| 国产精品一区二区三| 一区二区三区免费观看视频| 久久99在线观看| 国产日韩欧美在线视频观看| 国产又粗又长又黄| 国产精品911| 91九色在线视频| 日本午夜精品理论片a级app发布| 狠狠干成人综合网| 97**国产露脸精品国产| 欧美成人免费在线| 中国女人特级毛片| 成人精品视频| 久久精品国产电影| 黄色一级片在线免费观看| 国产综合欧美| …久久精品99久久香蕉国产| 国产午夜麻豆影院在线观看| 蜜臀av一区二区| 99国产超薄肉色丝袜交足的后果 | 免费亚洲电影| 欧美视频精品在线观看| 激情图片中文字幕| caoporn成人| 亚洲欧美国产一区二区三区 | 一区二区三区**美女毛片| 精品国偷自产一区二区三区| 欧美日韩国产观看视频| 欧日韩精品视频| 337p日本欧洲亚洲大胆张筱雨| 国产96在线亚洲| 综合网中文字幕| 国产真实乱偷精品视频| 丝袜亚洲另类欧美综合| 91日本在线观看| 天堂成人在线| 亚洲人123区| 欧美成人高潮一二区在线看| 国产91精品在线| 亚洲一区二区三区视频在线播放 | 国产日韩欧美在线观看| 人妻中文字幕一区| 日本一区二区综合亚洲| 欧美高清中文字幕| 粉嫩av一区二区三区四区五区| 精品国产电影一区二区| 国产精品18在线| 男女av一区三区二区色多| 91九色精品视频| 国产三级视频在线看| 亚洲午夜av在线| 亚洲美女爱爱视频| 欧美猛男同性videos| 最新亚洲精品| 欧美r级电影在线观看| 免费福利视频网站| 亚洲乱码视频| 亚洲精品欧美一区二区三区| 日本在线丨区| 午夜一区二区三区视频| 亚洲激情在线看| 国产一区二区在线| 亚洲午夜未满十八勿入免费观看全集| 性色av无码久久一区二区三区| 视频一区视频二区中文| 国产综合精品一区二区三区| 在线免费观看的av| 6080亚洲精品一区二区| 人人妻人人澡人人爽| 国产一区二区三区久久| 国产精品久久久久久久天堂第1集| 久久99精品久久| 欧美日韩亚州综合| 91成年人网站| 新67194成人永久网站| 国产一区二区精品在线| 俄罗斯一级**毛片在线播放| 日韩一级免费一区| 全网免费在线播放视频入口| 免费不卡在线观看| 色噜噜色狠狠狠狠狠综合色一 | 欧美小视频在线| 手机在线看片日韩| 在线亚洲激情| 精品在线不卡| 加勒比一区二区三区在线| 亚洲国产精品精华液网站| 国产精品19p| 欧美日韩亚洲一区三区| 99久久自偷自偷国产精品不卡| 国产成人l区| 欧美一区三区四区| 国产成人无码aa精品一区| 亚洲高清电影| 国产精品白丝jk白祙| 成人av影院在线观看| 亚洲大胆人体av| 国产精品一区二区三区四| 92国产精品观看| 麻豆av免费在线| 人人狠狠综合久久亚洲婷| 在线播放中文一区| 正在播放亚洲| 日本精品在线中文字幕| 日韩在线视频二区| 国产a级免费视频| 亚洲高清免费视频| 最新中文字幕视频| 美女精品自拍一二三四| av不卡在线免费观看| 久久九九精品视频| 国a精品视频大全| 日韩精品视频无播放器在线看 | 国产精品稀缺呦系列在线| 在线观看免费版| 欧美一区二区福利在线| 亚洲一区 视频| 久久精品亚洲乱码伦伦中文| 久久婷五月综合| 91欧美极品| 91国语精品自产拍在线观看性色| 久久久久久久久亚洲精品| 欧美日韩亚洲综合一区| 国产一级视频在线播放| 久久嫩草精品久久久精品| 日本成人在线不卡| 6080亚洲理论片在线观看| 欧美一区在线直播| 欧美被日视频| 亚洲国产99精品国自产| 中文在线字幕av| 亚洲韩国精品一区| 538精品视频| 成人午夜视频在线| 91插插插插插插插插| 国内久久精品| 亚洲春色综合另类校园电影| av不卡一区| 国产精品一区二区久久久久| 成人ssswww在线播放| 日韩中文字幕网址| 香蕉久久一区二区三区| 91精品国产综合久久香蕉的特点| 欧美日韩综合在线观看| 1000精品久久久久久久久| 人妻丰满熟妇aⅴ无码| 国产在线精品不卡| 亚洲欧美日韩不卡| 日韩有码中文字幕在线| 3d精品h动漫啪啪一区二区| 91香蕉在线视频| 亚洲中无吗在线| 久久精品成人一区二区三区蜜臀| 91成人短视频在线观看| 日本亚洲精品在线观看| 黄页网站大全在线免费观看| 中文字幕精品网| 日本大片在线观看| 欧美成人一级视频| 国产老女人乱淫免费| 91福利在线看| 欧美一二三区视频| 亚洲在线视频一区| 中文字幕在线有码| 国产精品亲子乱子伦xxxx裸| 一本色道综合久久欧美日韩精品 | 91情侣偷在线精品国产| 深夜视频一区二区| 欧美又大又硬又粗bbbbb| 美女网站视频在线| 色综合久久久888| 国产一区久久精品| 俺去亚洲欧洲欧美日韩| 免费在线观看黄色网| 一区二区在线视频| 超碰在线影院| 永久免费看mv网站入口亚洲| 黄色电影免费在线看| 亚洲欧美国产精品久久久久久久| 亚洲欧美一区二区三| 亚洲精品久久久久国产| 老熟妇高潮一区二区高清视频| 日韩三级视频在线看| 国产成人毛毛毛片| 日韩欧美亚洲国产精品字幕久久久| 国产又粗又大又爽视频| 91精品国产综合久久精品| 888奇米影视| 欧美一二三四区在线| 国产福利第一页| 精品国产不卡一区二区三区| 欧美熟妇另类久久久久久不卡 | 在线观看日韩精品| 亚洲精品91天天久久人人| 欧美在线高清视频| 小早川怜子一区二区的演员表| 国产精品久久三区| 国产suv精品一区二区68| 亚洲私人黄色宅男| 九九九在线视频| 亚洲超碰97人人做人人爱| 国产成人在线免费观看视频| 欧美日韩一区免费| 无码一区二区三区| 欧美日韩精品一区视频| 国产精品视频公开费视频| xxx.xxx欧美| 45www国产精品网站| 日产精品一区| 成人欧美在线视频| 6080亚洲理论片在线观看| 国内一区二区三区在线视频| 婷婷精品在线| 亚洲国产综合自拍| 亚洲精品二区三区| 日本网站免费在线观看| 日韩综合在线视频| 日本女人黄色片| 91香蕉视频污| 日韩精品久久久久久久的张开腿让| 亚洲色图视频网| 久久草视频在线| 欧美午夜不卡在线观看免费| 99久久精品免费看国产交换| 亚洲精品国产欧美| 色影院视频在线| 欧美精品www在线观看| 亚洲成a人片| 91中文字幕一区| 婷婷综合成人| 香蕉视频在线网址| 国产精品一二| 欧美日韩理论片| 久久综合999| 婷婷久久综合网| 欧美日韩亚洲精品内裤| 99精品在线视频观看| 亚洲人成在线观看网站高清| 18视频在线观看网站| 国产a∨精品一区二区三区不卡| 国产乱码精品一区二区三区亚洲人| 久久久亚洲综合网站| 亚洲天堂一区二区三区四区| 激情网站五月天| 成人一区二区三区在线观看| аⅴ天堂中文在线网| 午夜精品久久久久久不卡8050| 91好色先生tv| 亚洲天堂日韩电影| av不卡高清| 亚洲一区二区三区乱码aⅴ蜜桃女| 亚洲资源网站| 欧美亚洲日本一区二区三区| 国产一区二区三区在线观看免费视频| 国产精品无码午夜福利| 一区二区三区蜜桃网| 夜夜躁狠狠躁日日躁av| 亚洲欧美国产另类| 亚洲啊v在线| 国产一区二区无遮挡| 你懂的国产精品永久在线| 国产三级三级看三级| 久久久不卡网国产精品二区| 粉嫩aⅴ一区二区三区| 精品久久久久久久久久久院品网| 久久77777| 国产主播精品在线| 日韩毛片视频| 免费看污污网站| 国产午夜亚洲精品午夜鲁丝片| 九色在线视频观看| 国产乱码精品一区二区亚洲| 奇米精品一区二区三区| 粉嫩aⅴ一区二区三区四区| 暗呦丨小u女国产精品| 精品视频一区二区三区免费| 九九热视频在线观看| 国产91精品久久久久久久| 国产精品久久久网站| 国产成人永久免费视频| 国产精品影音先锋| www青青草原| 日韩欧美一卡二卡| 国产精品69xx| 精品无码久久久久国产| 99精品国产一区二区青青牛奶| 丰满岳乱妇一区二区| 亚洲va韩国va欧美va精品| 色呦呦视频在线| 亚洲视频欧美视频| 欧美黄色三级| 日韩欧美一区二区在线观看| 亚洲国产一成人久久精品| 日韩精品视频一二三| 中文字幕在线不卡| 国产免费高清av| 欧美人与性动交a欧美精品| 一区二区三区视频播放| 91九色丨porny丨国产jk| 99麻豆久久久国产精品免费优播| 国产黄色片免费看| 亚洲嫩模很污视频| jizz亚洲女人高潮大叫| 超碰免费在线公开| 国产69精品一区二区亚洲孕妇| 亚欧洲精品在线视频| 亚洲女人被黑人巨大进入al| 777午夜精品电影免费看| 在线观看日韩羞羞视频| 国产成人av福利| 久久精品国产成人av| 亚洲九九九在线观看| 97成人超碰| 久久这里只有精品18| 91在线一区二区三区| 欧美日韩 一区二区三区| 亚洲国产毛片完整版| 国产精品粉嫩| 偷拍盗摄高潮叫床对白清晰| 懂色中文一区二区在线播放| 一级片在线观看免费| 日韩中文字幕视频在线观看| 高清精品视频| 国产wwwxx| 一区二区三区蜜桃网| 理论视频在线| 91国产在线播放| 日韩一区精品视频| 日本精品人妻无码77777| 亚洲男人天堂2023| 精品国产乱码一区二区三区 | 黑人と日本人の交わりビデオ| 日韩一区二区三免费高清| 五月天av在线| 免费观看中文字幕| 久久精品男人的天堂| 精品人妻aV中文字幕乱码色欲 | 免费视频网站在线观看入口| 久久资源免费视频| 亚洲人成网77777色在线播放| 国产精品久久在线观看| 国产视频在线播放|