精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟小模型擊敗大模型:27億參數,手機就能跑

人工智能 新聞
今天,微軟公布了 Phi-2 模型的更多細節以及全新的提示技術 promptbase。這個僅 27 億參數的模型在大多數常識推理、語言理解、數學和編碼任務上超越了 Llama2 7B、Llama2 13B、Mistral 7B,與 Llama2 70B 的差距也在縮小(甚至更好)。

上個月,微軟 CEO 納德拉在 Ignite 大會上宣布自研小尺寸模型 Phi-2 將完全開源,在常識推理、語言理解和邏輯推理方面的性能顯著改進。

圖片

今天,微軟公布了 Phi-2 模型的更多細節以及全新的提示技術 promptbase。這個僅 27 億參數的模型在大多數常識推理、語言理解、數學和編碼任務上超越了 Llama2 7B、Llama2 13B、Mistral 7B,與 Llama2 70B 的差距也在縮小(甚至更好)。

同時,小尺寸的 Phi-2 可以在筆記本電腦、手機等移動設備上運行。納德拉表示,微軟非常高興將一流的小語言模型(SLM)和 SOTA 提示技術向研發人員分享。

圖片

今年 6 月,微軟在一篇題為《Textbooks Are All You Need》的論文中,用規模僅為 7B token 的「教科書質量」數據訓練了一個 1.3B 參數的模型 ——phi-1。盡管在數據集和模型大小方面比競品模型小幾個數量級,但 phi-1 在 HumanEval 的 pass@1 上達到了 50.6% 的準確率,在 MBPP 上達到了 55.5%。phi-1 證明高質量的「小數據」能夠讓模型具備良好的性能。

隨后的 9 月,微軟又發表了論文《Textbooks Are All You Need II: phi-1.5 technical report》,對高質量「小數據」的潛力做了進一步研究。文中提出了 Phi-1.5,參數 13 億,適用于 QA 問答、代碼等場景。

如今 27 億參數的 Phi-2,再次用「小身板」給出了卓越的推理和語言理解能力,展示了 130 億參數以下基礎語言模型中的 SOTA 性能。得益于在模型縮放和訓練數據管理方面的創新, Phi-2 在復雜的基準測試中媲美甚至超越了 25 倍于自身尺寸的模型。

微軟表示,Phi-2 將成為研究人員的理想模型,可以進行可解釋性探索、安全性改進或各種任務的微調實驗。微軟已經在 Azure AI Studio 模型目錄中提供了 Phi-2,以促進語言模型的研發。

Phi-2 關鍵亮點

語言模型規模增加到千億參數,的確釋放了很多新能力,并重新定義了自然語言處理的格局。但仍存在一個問題:是否可以通過訓練策略選擇(比如數據選擇)在較小規模的模型上同樣實現這些新能力?

微軟給出的答案是 Phi 系列模型,通過訓練小語言模型實現與大模型類似的性能。Phi-2 主要在以下兩個方面打破了傳統語言模型的縮放規則。

首先,訓練數據的質量在模型性能中起著至關重要的作用。微軟通過重點關注「教科書質量」數據將這一認知發揮到了極致,他們的訓練數據中包含了專門創建的綜合數據集,教給模型常識性知識和推理,比如科學、日常活動、心理等。此外通過精心挑選的 web 數據進一步擴充自己的訓練語料庫,其中這些 web 數據根據教育價值和內容質量進行過濾。

其次,微軟使用創新技術進行擴展,從 13 億參數的 Phi-1.5 開始,將知識逐漸嵌入到了 27 億參數的 Phi-2 中。這種規模化知識遷移加速了訓練收斂,并顯著提升了 Phi-2 的基準測試分數。

下圖 2 為 Phi-2 與 Phi-1.5 之間的比較,除了 BBH(3-shot CoT)和 MMLU(5-shot)之外,所有其他任務都利用 0-shot 進行評估。

訓練細節

Phi-2 是一個基于 Transformer 的模型,旨在預測下一個單詞,在用于 NLP 與編碼的合成數據集和 Web 數據集上進行訓練,在 96 個 A100 GPU 上花費了 14 天。

Phi-2 是一個基礎模型,沒有通過人類反饋強化學習 (RLHF) 進行對齊,也沒有進行指令微調。盡管如此,與經過調整的現有開源模型相比,Phi-2 在毒性和偏見方面仍然表現得更好,如下圖 3 所示。

圖片

實驗評估

首先,該研究在學術基準上對 Phi-2 與常見語言模型進行了實驗比較,涵蓋多個類別,包括:

  • Big Bench Hard (BBH) (3 shot with CoT)
  • 常識推理(PIQA、WinoGrande、ARC easy and challenge、SIQA)、
  • 語言理解(HellaSwag、OpenBookQA、MMLU(5-shot)、SQuADv2(2-shot)、BoolQ)
  • 數學(GSM8k(8 shot))
  • 編碼(HumanEval、MBPP(3-shot))

Phi-2 僅有 27 億個參數,卻在各種聚合基準上性能超越了 7B 和 13B 的 Mistral 模型、Llama2 模型。值得一提的是,與大 25 倍的 Llama2-70B 模型相比,Phi-2 在多步驟推理任務(即編碼和數學)方面實現了更好的性能。

此外,盡管模型較小,但 Phi-2 的性能可與最近谷歌發布的 Gemini Nano 2 相媲美。

由于許多公共基準可能會泄漏到訓練數據中,研究團隊認為測試語言模型性能的最佳方法是在具體用例上對其進行測試。因此,該研究使用多個微軟內部專有數據集和任務對 Phi-2 進行了評估,并再次將其與 Mistral 和 Llama-2 進行比較,平均而言,Phi-2 優于 Mistral-7B,Mistral-7B 優于 Llama2 模型(7B、13B、70B)。

圖片


圖片

此外,研究團隊還針對研究社區常用的 prompt 進行了廣泛的測試。Phi-2 的表現與預期一致。例如,對于一個用于測試模型解決物理問題的能力的 prompt(最近用于評估 Gemini Ultra 模型),Phi-2 給出了以下結果:

圖片

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-13 11:16:34

微軟Phi-2大型語言模型

2025-03-13 09:12:35

2023-12-01 12:31:22

AI模型

2022-08-18 15:13:37

模型參數

2025-06-27 10:08:19

2023-12-13 09:47:38

微軟人工智能

2025-03-19 09:00:00

模型AI訓練

2024-07-04 15:32:13

2020-02-24 10:51:25

微軟開源Windows

2025-07-08 03:22:00

大模型參數AI

2022-08-20 07:52:56

語言模型參數PaLM

2025-10-17 09:17:09

2023-10-29 22:41:29

模型開源

2023-10-28 13:29:27

2025-08-05 09:13:12

人工智能AGIHRM

2025-09-08 09:06:16

2022-06-25 21:17:15

人工智能訓練

2023-06-20 13:38:22

點贊
收藏

51CTO技術棧公眾號

欧美99在线视频观看| 日本中文字幕久久| 亚洲欧美在线人成swag| 中文字幕一区二区三区不卡| 成人一区二区电影| 精品在线视频免费观看| 日韩大尺度在线观看| 91国偷自产一区二区开放时间| 日韩三级电影免费观看| 国产尤物在线观看| 影音先锋中文字幕一区| 亚洲一区二区久久久| 日本高清一区二区视频| av电影在线地址| 国产婷婷色一区二区三区四区 | 97人妻精品一区二区三区免 | 一区二区三区波多野结衣在线观看 | 日韩精品伦理第一区| 91tv国产成人福利| 亚洲激情午夜| 在线亚洲午夜片av大片| 中文字幕18页| 国产91欧美| 亚洲成人av免费| 亚洲国产欧美一区二区三区不卡| 精品人妻一区二区三区换脸明星| 校园激情久久| 欧美xxxx做受欧美.88| 无码人妻精品一区二区三区温州| 农村妇女一区二区| 偷拍一区二区三区四区| 香蕉视频在线网址| 激情小视频在线| 国产99久久精品| 国产精品视频网址| 你懂的国产在线| 欧美69视频| 最近免费中文字幕视频2019| 国产精品探花一区二区在线观看| 免费观看亚洲天堂| 欧美色视频在线观看| 加勒比成人在线| a在线免费观看| 中文字幕精品三区| 欧美日韩最好看的视频| 内射后入在线观看一区| 国产久卡久卡久卡久卡视频精品| 国产精品69久久| 色播视频在线播放| 国产综合自拍| 欧美成在线视频| 三级黄色在线观看| 日本一本不卡| 亚洲欧洲日产国产网站| 一区二区视频观看| 欧美人与动xxxxz0oz| 精品美女在线播放| 色综合久久久无码中文字幕波多| 亚洲tv在线| 欧美日韩国产高清一区二区| 超碰在线公开97| 欧美日韩激情电影| 色狠狠综合天天综合综合| 少妇高潮喷水在线观看| 黄色影院在线看| 一区二区成人在线观看| 一级性生活视频| 男女视频在线| 亚洲福中文字幕伊人影院| r级无码视频在线观看| www中文字幕在线观看| 亚洲高清久久久| 欧美精品99久久| 国产精选在线| 欧美视频国产精品| 六月丁香婷婷在线| 成人在线中文| 欧美高清视频一二三区| 一级黄色在线播放| 国产精品视频首页| 精品久久久久久久久久久久包黑料| 国产亚洲精品成人a| 精品在线网站观看| 亚洲乱码一区av黑人高潮| 日韩精品电影一区二区| 精品黄色一级片| 久久精品国产精品| 久久午夜无码鲁丝片午夜精品| 韩国在线一区| 欧美一级电影在线| 午夜一级黄色片| 久久精品国产99久久6| 91免费看蜜桃| 天堂中文在线8| 中文字幕第一区| 成人在线免费高清视频| 国产一二三在线| 一本大道久久a久久综合婷婷| 午夜久久久精品| 日本高清精品| 日韩毛片中文字幕| 国产精品成人69xxx免费视频| 欧美视频导航| 国产精品第100页| 国产成人免费看一级大黄| 97久久人人超碰| 亚洲一卡二卡三卡四卡无卡网站在线看| 91在线中文| 一本大道av一区二区在线播放| 亚洲精品手机在线观看| 卡通动漫国产精品| 中文字幕欧美在线| www.youjizz.com亚洲| 日本伊人精品一区二区三区观看方式| 97久久天天综合色天天综合色hd| 日本护士...精品国| 亚洲人一二三区| 男人操女人免费软件| 精品视频在线播放一区二区三区 | 刘玥91精选国产在线观看| 国产视频一区在线观看| 水蜜桃在线免费观看| 老司机2019福利精品视频导航| 91精品久久久久久久91蜜桃| 全黄一级裸体片| 欧美激情第二页| 国产经典一区二区| 天天干在线观看| 亚洲天堂网中文字| 欧美成人精品欧美一级乱| 久久综合偷偷噜噜噜色| 中文字幕精品在线| 一区二区三区福利视频| 成人高清视频在线| 今天免费高清在线观看国语| 韩日一区二区| 亚洲理论在线a中文字幕| 18精品爽视频在线观看| 国产一区二区免费在线| 亚洲第一在线综合在线| 欧美成人ⅴideosxxxxx| 亚洲黄色片网站| 青青操视频在线播放| 久久www免费人成看片高清| 免费电影一区| 久久久男人天堂| 欧美大片一区二区| 色在线观看视频| 激情五月婷婷综合| 一区不卡字幕| 日韩午夜电影免费看| 在线观看国产成人av片| 中文字幕免费观看| 久久先锋影音av鲁色资源网| 欧美日韩在线中文| 欧洲在线一区| 日本精品中文字幕| 欧美欧美欧美| 在线观看视频91| 日本理论中文字幕| 日韩综合小视频| 日本一区二区不卡高清更新| 欧美香蕉视频| 一本大道久久加勒比香蕉| 神马久久久久久久| 国产女人水真多18毛片18精品视频| 国产裸体舞一区二区三区| 少妇的滋味中文字幕bd| 第四色男人最爱上成人网| 亚洲欧美日韩精品久久| 精品不卡一区二区| 国产视频不卡一区| 啊啊啊国产视频| 国产精品福利在线观看播放| 92裸体在线视频网站| 波多野在线观看| 亚洲精品二三区| 五月天婷婷导航| 国产精品水嫩水嫩| 欧美成人手机在线视频| 欧美a级片一区| 国产精品视频一区二区三区经| 波多野结衣视频一区二区| 精品亚洲aⅴ在线观看| 丰满人妻一区二区三区四区| 成人欧美一区二区三区在线播放| 无码人妻一区二区三区在线视频| 伊人久久婷婷| 欧美一区二区三区四区五区六区| 韩日精品一区| 欧美日韩成人免费| 青青草在线免费观看| 欧美日韩精品一区二区三区蜜桃 | 国产成人一二片| 午夜精品久久久久久久99黑人 | 国产一区二区黄| 国产精品久久久久久免费播放| 亚洲麻豆国产自偷在线| 亚洲一区二区在线免费| 日本亚洲一区二区| 黄色a级片免费看| 欧美猛男同性videos| 国产在线播放91| 99在线视频影院| 中文字幕亚洲欧美日韩2019| 精品黑人一区二区三区国语馆| 欧美日韩国产精品| 亚洲精品一区二区三区在线播放| 成人性视频网站| 91制片厂毛片| 亚洲三级电影在线观看| 亚洲最新在线| 偷拍视屏一区| 97超碰人人看人人| 色婷婷一区二区三区在线观看| 少妇精品视频一区二区免费看| 欧美另类极品videosbestfree| 日韩a级作爱片一二三区免费观看| 欧美精品三级日韩久久| 少妇太紧太爽又黄又硬又爽| 亚洲免费成人av| 欧美另类z0zx974| 成人网在线免费视频| 中文字幕线观看| 全部av―极品视觉盛宴亚洲| 午夜免费福利小电影| 综合av在线| www.午夜色| 日韩久久视频| 欧美亚洲丝袜| 久久99精品国产自在现线| 91久久国产婷婷一区二区| 欧美暴力调教| 日本中文字幕久久看| 欧美裸体视频| 午夜精品久久久久久久99热| 欧美黑人猛交| 欧美成人激情图片网| 色多多视频在线观看| 伊人伊成久久人综合网小说| 人成免费电影一二三区在线观看| 亚洲第一页在线| 亚洲欧美强伦一区二区| 日韩久久久精品| www.黄色小说.com| 日韩午夜在线观看视频| 国产伦精品一区二区三区视频痴汉 | 亚洲一级二级片| 欧美国产激情二区三区 | 国产一区二区三区在线观看| 色综合天天做天天爱| 久久久久久久99| 亚洲蜜臀av乱码久久精品蜜桃| 国产精品欧美久久久| 黄色小视频在线观看| 亚洲天堂成人| av色综合网| 国产精选久久| 成人精品久久av网站| 精品国产第一国产综合精品| 成人性生交大片免费看视频直播| 成人国产精品一区二区免费麻豆| 91国内在线视频| av在线播放资源| 97在线日本国产| 亚洲七七久久综合桃花剧情介绍| 欧美国产中文字幕| 国产美女一区视频| 久久久久久美女| 人在线成免费视频| 57pao成人永久免费视频| 不卡专区在线| 国产成人avxxxxx在线看| 亚洲欧美se| 国产精品成人aaaaa网站| 精品久久久网| 91影视免费在线观看| 日韩一区网站| 久久久久综合一区二区三区| 免费精品国产| 亚洲bbw性色大片| 中文在线日韩| 岛国大片在线播放 | 51xx午夜影福利| 偷拍欧美精品| 免费国产成人看片在线| 天天操综合网| 人人妻人人添人人爽欧美一区| 六月婷婷一区| 看看黄色一级片| 成人精品在线视频观看| 久久偷拍免费视频| 欧美国产精品一区二区三区| 欧美极品aaaaabbbbb| 亚洲第一狼人社区| 一级成人黄色片| 制服.丝袜.亚洲.另类.中文 | 久久蜜桃资源一区二区老牛| 韩国中文字幕av| 国产精品亚洲成人| 人妻无码中文久久久久专区| 国产清纯在线一区二区www| 青青草原在线免费观看视频| 天天亚洲美女在线视频| 最新在线中文字幕| 亚洲第一色中文字幕| av在线电影网| 欧美大尺度激情区在线播放| 你懂得影院夜精品a| 91在线视频免费| 国产精品18hdxxxⅹ在线| 日韩中文字幕av在线| 99精品电影| 妞干网在线视频观看| 久久超级碰视频| www.色多多| 亚洲欧美激情小说另类| av图片在线观看| 电影网一区二区| 国产精品久久在线观看| 日韩视频在线直播| 日韩av不卡播放| 激情欧美亚洲| 五月天激情视频在线观看| 99久久er热在这里只有精品66| 欧美福利在线视频| 狠狠色狠狠色综合日日五| 精品人妻一区二区三区含羞草| 亚洲三级黄色在线观看| 污片视频在线免费观看| 成人在线国产精品| 久久av导航| 国产免费黄色一级片| 国产精品影视在线观看| 蜜桃无码一区二区三区| 亚洲图片激情小说| 亚洲综合网av| 亚洲老板91色精品久久| av影院在线免费观看| 91网免费观看| 日韩久久视频| 蜜臀一区二区三区精品免费视频| 久久精品亚洲一区二区三区浴池| 精品亚洲永久免费| 欧美va在线播放| 精品自拍一区| 日本高清视频精品| 国产精品欧美三级在线观看| 国产一区二区网| av电影天堂一区二区在线观看| 欧美成欧美va| 91精品免费观看| 自拍亚洲图区| 成人亚洲激情网| 中文字幕亚洲综合久久五月天色无吗''| 男人的天堂日韩| 久久99国产精品二区高清软件| 中文字幕在线观看亚洲| 亚洲天堂电影| 国产在线视频欧美一区二区三区| 在线精品亚洲| 人妻 丝袜美腿 中文字幕| 一区二区三区在线视频播放| 国产福利免费视频| 久久91亚洲精品中文字幕| 成人资源在线播放| 欧洲精品在线播放| av一二三不卡影片| wwwxxx亚洲| 日韩电影中文 亚洲精品乱码 | 国外色69视频在线观看| 超碰成人97| 免费看日本毛片| 26uuu欧美| 一二三区免费视频| 日韩一区视频在线| 日本免费一区二区三区视频| 欧美啪啪免费视频| 99久久婷婷国产综合精品| www.日本精品| 日韩在线视频网站| 国产精品一区二区精品视频观看| 成年人视频网站免费| 成人av动漫在线| 亚洲高清毛片一区二区| 中文字幕在线国产精品| 久久天堂久久| 成人黄色片视频| 国产精品无圣光一区二区| 少妇一级淫片日本| 久久精品99国产国产精| 亚洲熟妇无码av| 欧美日韩一级大片网址| 在线免费观看黄色网址| 91久久极品少妇xxxxⅹ软件| 日韩视频一区二区三区在线播放免费观看| 日本成人在线免费观看| 欧美视频免费在线| 日本www在线| 精品产品国产在线不卡|