精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

這就翻車了?Reflection 70B遭質疑基模為Llama 3,作者:重新訓練

人工智能 新聞
Reflection 70B 能不能經受住社區的考驗呢?今天 AI 模型獨立分析機構 Artificial Analysis 進行了獨立評估測試,結果有點出乎意料。

最近,開源大模型社區再次「熱鬧」了起來,主角是 AI 寫作初創公司 HyperWrite 開發的新模型 Reflection 70B。最近,開源大模型社區再次「熱鬧」了起來,主角是 AI 寫作初創公司 HyperWrite 開發的新模型 Reflection 70B。

它的底層模型建立在 Meta Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,確保了與現有工具和 pipeline 的兼容性。

這個模型橫掃了 MMLU、MATH、IFEval、GSM8K,在每項基準測試上都超過了 GPT-4o,還擊敗了 405B 的 Llama 3.1。

憑借如此驚艷的效果,Reflection 70B 被冠以開源大模型新王。該模型更是由兩位開發者(HyperWrite CEO Matt Shumer 和 Glaive AI 創始人 Sahil Chaudhary)花了 3 周完成,效率可謂驚人。

Reflection 70B 能不能經受住社區的考驗呢?今天 AI 模型獨立分析機構 Artificial Analysis 進行了獨立評估測試,結果有點出乎意料。

該機構表示,Reflection Llama 3.1 70B 的 MMLU 得分僅與 Llama 3 70B 相同,并且明顯低于 Llama 3.1 70B。

圖源:https://x.com/ArtificialAnlys/status/1832505338991395131

還有科學推理與知識(GPQA)和定量推理(MATH)基準測試的結果,同樣不如 Llama 3.1 70B。

圖源:https://x.com/ArtificialAnlys/status/1832457791010959539

此外,Reddit 上 LocalLLaMA 社區的一個帖子比較了 Reflection 70B 與Llama 3.1、Llama 3 權重的差異,結果顯示,Reflection 模型似乎是使用了經過 LoRA 調整的 Llama 3 而不是 Llama 3.1。

貼主還提供了以上模型權重比較結果的代碼來源。


from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import matplotlib.pyplot as plt
import seaborn as sns

base_model_name = "meta-llama/Meta-Llama-3-70B-Instruct"
chat_model_name = "mattshumer/Reflection-Llama-3.1-70B"
base_model = AutoModelForCausalLM.from_pretrained(base_model_name, torch_dtype=torch.bfloat16)
chat_model = AutoModelForCausalLM.from_pretrained(chat_model_name, torch_dtype=torch.bfloat16)

def calculate_weight_diff(base_weight, chat_weight):
    return torch.abs(base_weight - chat_weight).mean().item()

def calculate_layer_diffs(base_model, chat_model):
    layer_diffs = []
    for base_layer, chat_layer in zip(base_model.model.layers, chat_model.model.layers):
        layer_diff = {
            'input_layernorm': calculate_weight_diff(base_layer.input_layernorm.weight, chat_layer.input_layernorm.weight),
            # 'mlp_down_proj': calculate_weight_diff(base_layer.mlp.down_proj.weight, chat_layer.mlp.down_proj.weight),
            # 'mlp_gate_proj': calculate_weight_diff(base_layer.mlp.gate_proj.weight, chat_layer.mlp.gate_proj.weight),
            # 'mlp_up_proj': calculate_weight_diff(base_layer.mlp.up_proj.weight, chat_layer.mlp.up_proj.weight),
            'post_attention_layernorm': calculate_weight_diff(base_layer.post_attention_layernorm.weight, chat_layer.post_attention_layernorm.weight),
            'self_attn_q_proj': calculate_weight_diff(base_layer.self_attn.q_proj.weight, chat_layer.self_attn.q_proj.weight),
            'self_attn_k_proj': calculate_weight_diff(base_layer.self_attn.k_proj.weight, chat_layer.self_attn.k_proj.weight),
            'self_attn_v_proj': calculate_weight_diff(base_layer.self_attn.v_proj.weight, chat_layer.self_attn.v_proj.weight),
            'self_attn_o_proj': calculate_weight_diff(base_layer.self_attn.o_proj.weight, chat_layer.self_attn.o_proj.weight)
        }
        layer_diffs.append(layer_diff)
    return layer_diffs

def visualize_layer_diffs(layer_diffs):
    num_layers = len(layer_diffs)
    num_components = len(layer_diffs[0])

    fig, axs = plt.subplots(1, num_components, figsize=(24, 8))
    fig.suptitle(f"{base_model_name} <> {chat_model_name}", fontsize=16)

    for i, component in enumerate(layer_diffs[0].keys()):
        component_diffs = [[layer_diff[component]] for layer_diff in layer_diffs]
        sns.heatmap(component_diffs, annot=True, fmt=".6f", cmap="YlGnBu", ax=axs[i], cbar_kws={"shrink": 0.8})
        axs[i].set_title(component)
        axs[i].set_xlabel("Layer")
        axs[i].set_ylabel("Difference")
        axs[i].set_xticks([])
        axs[i].set_yticks(range(num_layers))
        axs[i].set_yticklabels(range(num_layers))
        axs[i].invert_yaxis()

    plt.tight_layout()
    plt.show()

layer_diffs = calculate_layer_diffs(base_model, chat_model)

visualize_layer_diffs(layer_diffs)

還有人貼出了 Matt Shumer 在 Hugging Face 對 Reflection 70B 配置文件名稱的更改,可以看到從 Llama 3 70B Instruct 到 Llama 3.1 70B Instruct 的變化。

圖片圖片

這樣的事實擺在眼前,似乎讓人不得不信。各路網友也開始發聲附和,有人表示自己從一開始就懷疑它是 Llama 3,當用德語問模型一些事情時,它卻用英語回答。這種行為對于 Llama 3 非常常見。

圖片圖片

還有人奇怪為什么 Reflection 70B 模型一開始就得到了如此多的炒作和關注,畢竟第一個談論它是「頂級開源模型」的人是開發者本人(Matt)。而且更確切地說,模型是微調的。

圖片圖片

更有人開始質疑開發者(Matt),認為他只是這家公司(GlaiveAI)的利益相關者,試圖通過炒作來增加價值,實際上卻對這項技術一無所知。

圖片圖片

在被質疑 Reflection 70B 的基礎模型可能是 Llama 3 而非 Llama 3.1 70B 時,Matt Shumer 坐不住了,現身進行了澄清,并表示是 Hugging Face 權重出現了問題。

圖片圖片

就在幾個小時前,Matt Shumer 稱已經重新上傳了權重,但仍然存在問題。同時他們開始重新訓練模型并上傳,從而消除任何可能出現的問題,應該很快就會完成。

圖片圖片

當被問到為何需要重新訓練時,Matt Shumer 表示本不需要這樣做,但已經嘗試了所有方法。無論做什么,Hugging Face 上 Reflection 70B 模型都會出現問題,導致離預期中的性能差得遠。

圖片圖片

當然 Matt Shumer 還面臨更多質疑,比如對 GlaiveAI 的投資情況、為什么 Hugging Face 上的基礎模型為 Llama 3 而不是 Llama 3.1 以及基準中有關 LORAing 的問題。

圖片圖片

Matt Shumer 一一進行了解釋。(以下標引用)

  1. 我是一個超級小的投資者(1000 美元),只是一次支持性的投資,因為我認為 Sahil Chaudhary 很棒。
  2. 至于為什么基礎模型是 Llama 3,我們不知道。這就是為什么我們從頭開始再訓練,應該很快完成。
  3. 那些嘗試了 Playground 并擁有早期訪問權限的用戶獲得了與托管 API 截然不同的體驗,我們需要弄清楚這一點。
  4. 不確定什么是 LORAing,但我們檢查了污染,將在下周與 405B(或更早)一起發布數據集,到時候可以查看。

至于重新訓練后的 Reflection 70B 表現如何?我們拭目以待。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-05 08:33:29

2024-12-09 07:10:00

Llama 3.3GeminiGPT-4.5

2024-07-02 09:20:59

2024-04-09 13:21:00

AI開源

2024-05-30 12:50:05

2024-08-26 10:00:00

模型數據

2024-09-09 08:50:00

2024-04-19 10:32:08

2024-09-14 09:31:00

2024-04-26 07:48:45

DockerLLama3模型

2024-12-13 14:03:44

模型訓練AI

2024-11-13 15:00:42

2024-04-30 08:28:44

開源大模型Llama

2024-11-25 08:10:00

2025-03-31 09:46:00

2024-07-23 09:20:35

2024-04-29 12:14:03

模型數據開源

2024-01-31 09:38:23

AI模型

2024-05-29 14:11:00

點贊
收藏

51CTO技術棧公眾號

欧美精品一区男女天堂| 亚洲天堂2014| 欧洲精品毛片网站| 人妻aⅴ无码一区二区三区| 日韩不卡视频在线观看| 亚洲私人影院在线观看| 国产精品区一区| 无码人妻精品一区二区50| 欧美gayvideo| 亚洲第一二三四五区| 精品视频一区二区在线| www在线免费观看视频| 成人美女视频在线看| 欧美一级电影久久| 麻豆视频在线免费看| 欧美有码在线| 在线91免费看| 久久精品xxx| 一区二区三区视频在线观看视频| 国产不卡视频在线观看| 国产成人av在线| 精品97人妻无码中文永久在线| 亚洲瘦老头同性70tv| 91精品国产色综合久久不卡电影| 人妻熟妇乱又伦精品视频| 69久久夜色| 91看片淫黄大片一级| 51成人做爰www免费看网站| caoporn国产| 激情综合自拍| 久久精品精品电影网| 91中文字幕永久在线| 亚洲一区二区三区日本久久九| 欧美亚洲图片小说| 国产资源在线视频| 调教一区二区| 亚洲天堂福利av| 亚洲精品永久www嫩草| 亚洲欧美日韩成人在线| 国产高清精品网站| 成人夜晚看av| 亚洲熟女乱色一区二区三区久久久| 99精品久久| 久久免费视频在线观看| 欧美日韩精品亚洲精品| 天天综合一区| 日韩一级裸体免费视频| 国产传媒国产传媒| 视频国产一区| 亚洲精品一区二区网址| 男人的天堂影院| 亚洲综合色婷婷在线观看| 欧美日韩国产另类一区| 色免费在线视频| 日本肉肉一区 | 劲爆欧美第一页| 国产电影一区二区在线观看| 尤物tv国产一区| 免费视频91蜜桃| 国产欧美一区| 亚洲欧美日韩高清| brazzers精品成人一区| 日韩欧美中文字幕电影| 亚洲精品97久久| 亚洲永久无码7777kkk| 欧美1区2区3区4区| 精品视频—区二区三区免费| 在线精品一区二区三区| 天堂日韩电影| 亚洲图片在线综合| 成人性生交大片免费看无遮挡aⅴ| 国产成人久久| 久久精品国产清自在天天线| 97成人资源站| 韩日精品在线| 欧美亚州一区二区三区| 亚洲av无码精品一区二区| 男女性色大片免费观看一区二区| 国产精品网站入口| 国产免费久久久| 国产99久久久精品| 麻豆av一区二区三区| 免费黄色在线视频网站| 久久视频一区二区| 日韩电影天堂视频一区二区| 在线观看免费网站黄| 亚洲日本欧美天堂| 国产天堂视频在线观看| 亚洲最新无码中文字幕久久| 精品视频在线免费| 日本中文字幕在线不卡| 台湾佬综合网| 久久好看免费视频| 免费毛片一区二区三区| 美女精品在线| 91免费高清视频| 日韩一级免费视频| 亚洲国产高清aⅴ视频| 成人在线免费观看网址| 性欧美xxx69hd高清| 欧美精品一卡二卡| 一出一进一爽一粗一大视频| 四季av一区二区三区免费观看| 欧美成人午夜激情| 天干夜夜爽爽日日日日| 国产综合成人久久大片91| 精品麻豆av| 黄色视屏免费在线观看| 精品福利在线视频| 亚洲黄色片免费| 亚洲电影一级片| 久热爱精品视频线路一| 久久亚洲精品石原莉奈| 成人永久免费视频| 亚州欧美一区三区三区在线| 1234区中文字幕在线观看| 欧美性一二三区| 国产一卡二卡三卡四卡| 99免费精品| 欧美一级免费视频| 亚洲精品久久久蜜桃动漫| 中文乱码免费一区二区| 欧美 日韩 国产一区| 日韩中文字幕| xxx欧美精品| www.久久久久久久| 成人av电影在线| 4444在线观看| 日韩电影免费观看高清完整版在线观看| 亚洲国产三级网| 欧美精品成人久久| 久久精品国产成人一区二区三区 | 日韩亚洲在线视频| 国产毛片精品| 欧美精品xxx| 97久久人国产精品婷婷| 国产免费成人在线视频| 色婷婷综合久久久久中文字幕 | 色老头在线一区二区三区| 日韩一区二区三区电影| 一区二区三区影视| 久久精品国产99国产| 色就是色欧美| xxxxx.日韩| 亚洲一级黄色av| 在线观看日本视频| 91视频在线看| 精品视频一区二区在线| 亚洲欧洲av| 欧美综合一区第一页| 香蕉视频成人在线| 狠狠色狠色综合曰曰| av无码一区二区三区| 最新日韩av| 精品在线一区| 日韩伦理在线一区| 亚洲精品小视频| 久久久久久久亚洲| 国产欧美日韩视频一区二区| 999精品视频在线| 成人婷婷网色偷偷亚洲男人的天堂| 国产成人精品av在线| 国产中文在线视频| 欧美无乱码久久久免费午夜一区 | 亚洲情趣在线观看| 国产免费中文字幕| 欧美在线高清| 精品乱色一区二区中文字幕| 偷拍视频一区二区三区| 亚洲人成在线一二| 91麻豆视频在线观看| 亚洲另类在线一区| 亚洲啪av永久无码精品放毛片| 亚洲欧洲视频| 欧日韩一区二区三区| 欧美va在线观看| 另类美女黄大片| 国模私拍视频在线| 日韩欧美精品在线观看| 色综合99久久久无码国产精品| 裸体在线国模精品偷拍| 国产91porn| 欧美日韩一区二区三区四区不卡| 国产成人精品电影久久久| 午夜看片在线免费| 日韩一级高清毛片| 久久久久99精品成人片三人毛片| 久久精品日产第一区二区三区高清版 | 极品日韩av| 日本一区视频在线观看| 国产精一区二区| 欧美伊久线香蕉线新在线| 日本中文字幕电影在线免费观看 | 热久久精品免费视频| 91精品久久久久久久蜜月 | 东京干手机福利视频| 日韩欧美视频一区二区三区| 欧美一级片在线视频| 99视频一区二区三区| 视频二区在线播放| 亚洲精品护士| 制服丝袜综合日韩欧美| 成功精品影院| 91精品久久久久久| 国产精品yjizz视频网| 日韩在线视频线视频免费网站| 亚洲精品久久久久avwww潮水| 在线中文字幕不卡| 久久免费精彩视频| 中文字幕中文在线不卡住| 欲求不满的岳中文字幕| 国产又粗又猛又爽又黄91精品| 人妻少妇被粗大爽9797pw| 欧美激情1区2区3区| 日韩影视精品| 亚洲理论电影片| 成人在线免费网站| 国产精品日韩精品在线播放| 日韩av片电影专区| 阿v视频在线| 萌白酱国产一区二区| www.在线播放| 日韩精品欧美国产精品忘忧草 | 亚洲精品一区二区久| 午夜精品久久久久久久99| 欧美日韩在线电影| 日韩三级一区二区| 欧美视频在线视频| 国产精品第一页在线观看| 综合精品久久久| 国产成人在线网址| 国产日韩精品久久久| 日本xxxx裸体xxxx| 99热在这里有精品免费| 潘金莲一级淫片aaaaaaa| 精品亚洲欧美一区| 日韩肉感妇bbwbbwbbw| 久久精品日产第一区二区| 精品少妇一区二区三区在线| 精久久久久久| 91九色丨porny丨国产jk| 欧美在线黄色| 青青草视频国产| 欧美高清一区| av中文字幕av| 中文字幕免费一区二区| 最新av网址在线观看| 欧美+日本+国产+在线a∨观看| 中文精品视频一区二区在线观看| 欧美成人精品一区二区三区在线看| 日韩黄色影视| 成人情趣视频网站| 久久久成人精品一区二区三区| 国产精品成久久久久| 在线国产99| 亚洲国产精品久久久久蝴蝶传媒| 五月天综合婷婷| 亚洲欧美日韩高清在线| av动漫在线播放| 亚洲午夜一区| 亚洲不卡中文字幕无码| 久久久久欧美精品| 可以免费在线看黄的网站| 蜜桃精品视频在线观看| www.污网站| 国产成人精品一区二| 99精品一区二区三区无码吞精| 95精品视频在线| 91成人在线免费视频| 国产精品久久久久久久第一福利| 婷婷激情四射网| 亚洲香蕉伊在人在线观| 日韩特级黄色片| 在线免费观看日韩欧美| 国产精品无码AV| 337p日本欧洲亚洲大胆精品| 五十路在线观看| 在线观看视频99| 色屁屁www国产馆在线观看| 高清欧美一区二区三区 | 成人黄色在线免费| 日韩午夜视频在线| 国产精品伊人日日| 精品精品久久| japanese在线播放| 久久www成人_看片免费不卡| 欧美激情第3页| 成人国产精品视频| 日本一卡二卡在线播放| 一区二区三区四区不卡视频| 日韩欧美成人一区二区三区 | 亚洲国产精品一| 亚洲欧美日韩区| 成人a在线视频免费观看| 55夜色66夜色国产精品视频| 美女久久久久久| 国产激情一区二区三区在线观看| 精品色999| 99久久免费观看| 另类人妖一区二区av| 精品人妻二区中文字幕| 国产女主播在线一区二区| 久草中文在线视频| 欧美中文字幕一区二区三区 | 国产亚洲精品高潮| 怡红院在线播放| 国产精品91免费在线| 视频二区欧美毛片免费观看| 色一情一乱一伦一区二区三区丨 | 国产白浆在线观看| 亚洲天堂成人在线| 国产一线二线在线观看 | 北条麻妃一区二区三区在线观看| 日韩精品一线二线三线| 伊人久久大香线蕉av超碰演员| 天天干天天干天天干天天干天天干| 成人激情午夜影院| 久久噜噜色综合一区二区| 色香色香欲天天天影视综合网| 性生交生活影碟片| 久久久久999| 欧洲精品一区二区三区| 精品视频一区在线| 国内精品福利| 亚洲自拍第三页| 国产精品入口麻豆九色| 久久久国产免费| 日韩国产精品一区| 538在线视频| 国产精品二区二区三区| 正在播放日韩欧美一页| 手机版av在线| 国产精品久久久久天堂| 在线视频精品免费| 国产午夜精品视频| 欧美亚洲大片| 亚洲 国产 日韩 综合一区| 久久人人超碰| 日本黄色特级片| 狠狠躁夜夜躁人人爽超碰91 | 日韩视频一区在线| 91另类视频| 亚洲欧美国产不卡| 久久99热这里只有精品| 欧洲美熟女乱又伦| 欧美午夜寂寞影院| 欧美69xxx| 成人天堂噜噜噜| 99国内精品久久久久久久| 午夜国产一区二区三区| 国产精品久久久久久亚洲毛片| 在线观看不卡的av| xxx欧美精品| 亚洲一区二区三区四区电影| 精品久久久久久无码中文野结衣| 成人高清伦理免费影院在线观看| 中文在线观看免费网站| 亚洲精品97久久| 亚洲精品动漫| 日韩视频精品| 精品一区二区影视| 欧美日韩人妻精品一区二区三区| 日韩精品中文字幕在线一区| 免费男女羞羞的视频网站在线观看 | 最近2019中文字幕一页二页| 日韩一级特黄| www.在线观看av| 久久青草欧美一区二区三区| 国产精品第6页| 久久精品视频99| 9999久久久久| 99色精品视频| 国产精品午夜免费| 国产黄a三级三级三级| 97免费在线视频| 欧美日韩国产在线观看网站| 国产探花在线观看视频| 午夜久久电影网| 国产理论电影在线观看| 3d精品h动漫啪啪一区二区| 一区二区精品| 中文字幕第69页| 精品国产123| 巨胸喷奶水www久久久免费动漫| 中文字幕人成一区| 成人性视频免费网站| 波多野结衣视频网址| 欧美大片大片在线播放| 婷婷综合福利| 亚洲综合伊人久久| 欧美午夜片欧美片在线观看| 2021av在线| 国产一区免费| 久久精品国产99| 色网站在线播放| 久久精品国产亚洲7777| 亚洲动漫精品| 中文字幕人妻熟女人妻a片| 色天天综合久久久久综合片| 在线观看中文|