精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

2.7B能打Llama 2 70B,微軟祭出「小語言模型」!96塊A100 14天訓出Phi-2,碾壓谷歌Gemini nano

人工智能 新聞
都快到年底了,大模型領域還在卷,今天,Microsoft發布了參數量為2.7B的Phi-2——不僅13B參數以內沒有對手,甚至還能和Llama 70B掰手腕!

大模型現在真的是越來越卷了!

11月OpenAI先是用GPTs革了套殼GPT們的命,然后再不惜獻祭董事會搏了一波天大的流量。

谷歌被逼急了,趕在年底之前倉促發布了超大模型Gemini,卷起了多模態,甚至不惜「視頻造假」。

就在今天,微軟正式發布了曾在11月Ignite大會上預告的Phi-2!

憑借著2.7B的參數,「小語言模型(SLM)」Phi-2幾乎打穿了所有13B以下的大模型——包括谷歌最新發布的Gemini Nano 2。

通過模型擴展和訓練數據管理方面的創新,Phi-2展現了出色的推理和語言理解能力,在復雜的基準測試中,Phi-2的性能可以打平比自己大25倍的模型,甚至略占上風。

它用非常「苗條」的尺寸,獲得了良好的性能。

這讓研究人員和模型開發人員能夠很方便地使用Phi-2進行可解釋性、安全性方面的改進,并針對其他任務進行微調。

Phi-2目前已經可以通過Azure AI Studio訪問。

但是值得注意的是,相比其他的開源模型基本上是基于Apache 2.0的授權協議,可以支持商用。Phi-2只能用于研究目的,不支持商用。

微軟最強「小模型」來了!

大語言模型現已增長到數千億的參數量,龐大的規模帶來了強大的性能,改變了自然語言處理領域的格局。

不過,能否通過恰當的訓練方法(比如數據選擇等),使得小型的語言模型也能獲得類似的能力?

微軟的Phi-2給出了答案。

Phi-2打破了傳統語言模型的縮放定律,測試成績能夠PK比自己大25倍的模型。

對于Phi-2「以小博大」的成功,微軟闡述了兩點關鍵見解:

第一點:訓練數據質量對模型性能起著至關重要的作用。

作為大模型開發者的共識,微軟的研究人員在此基礎上更進一步——使用「教科書質量」的數據。

在發布Phi-1的時候,開發團隊就提出了「教科書是你所需要的一切」(Textbooks Are All You Need)。

在本次Phi-2的開發中,團隊更是將這一點發揮到了極致。

Phi-2所使用的訓練數據,包含合成數據集,——專門用于教授模型常識推理和一般知識(科學、日常活動和心智理論等)。

此外,研發團隊還根據教育價值和內容質量,過濾了精心挑選的網絡數據,進一步擴充了訓練語料庫。

第二點:利用創新技術進行模型擴展。

以1.3B參數的Phi-1.5為基礎,將其知識嵌入到2.7B參數的Phi-2中。這種規模化的知識轉移不僅加快了訓練的收斂速度,而且明顯提高了Phi-2的基準分數。

上圖展示了Phi-2和Phi-1.5在各項測試之中的比較(其中BBH和MMLU分別使用3次和5次CoT(Chain of Thought))。

我們可以看到,在創新技術的加持下,Phi-2的性能取得了明顯提升。

96塊A100練了14天

Phi-2 是一個基于 Transformer 的模型,使用1.4T個tokens進行訓練(包括用于NLP和編碼的合成數據集和Web數據集)。

訓練Phi-2使用了96塊A100 GPU,耗時14天。

Phi-2是一個基礎模型,它沒有通過人類反饋的強化學習(RLHF)進行對齊,也沒有經過微調。

盡管如此,與經過對齊的現有開源模型相比,Phi-2在毒性(toxicity)和偏差(bias)方面有更好的表現。——這得益于采用了量身定制的數據整理技術。

上圖展示了根據ToxiGen中的13個人口統計學數據,計算出的安全性分數。

這里選取了6541個句子的子集,并根據復雜度和句子毒性在0到1之間進行評分。分數越高,表明模型產生有毒句子的可能性越小。

評估

下面,研發團隊總結了Phi-2與流行語言模型相比在學術基準上的表現。

基準測試涵蓋了多個類別,Big Bench Hard(BBH)(使用CoT進行3次測試)、常識推理(PIQA、WinoGrande、ARC easy and challenge、SIQA)、語言理解(HellaSwag、OpenBookQA、MMLU(5次)、SQuADv2(2次)、BoolQ)、數學(GSM8k(8次))和編碼(HumanEval、MBPP(3次))。

Phi-2只有2.7B的參數,在各種基準上,性能超過了Mistral 7B和 Llama-2 13B的模型性能。

而且,與25倍體量的Llama-2-70B模型相比,它在多步推理任務(即編碼和數學)上的性能還要更好。

此外,Phi-2與最近發布的Google Gemini Nano 2相比,性能也更好,盡管它的體量還稍小一些。

考慮到現在很多模型測試基準有可能已經被訓練數據污染了,研究團隊在Phi-1的開發時,就盡量避免了訓練數據被污染的可能。

微軟研究團隊也認為,判斷語言模型性能的最佳方法是在實際使用場景上進行測試。

本著這種求真務實的精神,微軟還使用了幾個Microsoft內部專有數據集和任務評估了Phi-2,并與Mistral和Llama-2進行了再次比較。得到的結果也還是說明Phi-2的平均性能要優于Mistral-7B 和Llama-2家族(7B、13B 和 70B)。

除了這些基準之外,Microsoft也忍不住對谷歌現在備受批評的Gemini演示視頻進行了一些挖掘,

視頻中展示了谷歌即將推出的最強大的人工智能模型Gemini Ultra,如何來解決相當復雜的物理問題,甚至糾正學生在這些問題上的錯誤。

事實證明,盡管Phi-2的參數量遠遠小于Gemini Ultra,但也能夠正確回答問題,并使用相同的提示糾正學生。

上圖展示了Phi-2在一個簡單的物理問題上的輸出,包括近似正確的平方根計算。

與Gemini的測試類似,這里用學生的錯誤答案進一步詢問Phi-2,看看Phi-2是否能識別錯誤在哪里。

我們可以看到,盡管Phi-2沒有針對聊天或指令跟蹤進行微調,但它還是識別出了問題所在。

不過需要注意的是,谷歌的演示視頻中使用學生手寫文本的圖像作為輸入,而Phi-2的測試中直接輸入了文本。

魔改提示工程,GPT-4逆襲Gemini Ultra

微軟放出了一個關于提示工程的研究Medprompt。他們通過創新的LLM提示工程技巧,在醫療領域獲得了之前需要專門的訓練或者微調才能達到性能提升。

論文地址:https://www.microsoft.com/en-us/research/publication/can-generalist-foundation-models-outcompete-special-purpose-tuning-case-study-in-medicine/

而在這個提示工程的基礎之上,微軟發現提示策略可以具有更通用效果。最終通過Medprompt的修改版本引導GPT-4,微軟取得了MMLU上的SOTA成績。

剛好比谷歌Gemini發布時的成績好了一點點。

圖片

微軟用這個「不經意間」取得的結果,狙擊了在Gemini發布時,谷歌用CoT@32擊敗GPT-4 5 shot的成績。

這暗中較勁,卻還要表現得舉重若輕的感覺,像極了讀書時班上兩個學霸因為競爭相互拆臺的場面。

網友熱議

此前,微軟的大佬就放出了在MT bench上對幾個模型的測試結果:

我們可以看到,僅僅2.7B的Phi-2系列,表現還是很不錯的。

對于Phi-2的表現,網友也是不吝贊美之詞:

「哇,Phi-2聽起來像是游戲規則的改變者!它的功能強大到足以與大型語言模型相媲美,但又足夠小,可以在筆記本電腦或移動設備上運行,這真是太棒了。這為在設備有限的設備上進行自然語言處理開辟了一個全新的世界。」

有網友表示很著急:

「有人想出如何在Mac上運行Microsoft的新Phi-2嗎?」

當然也有較為「尖銳」的網友拉出了OpenAI:

「如果一開始就不給模型喂垃圾,似乎就不必擔心對齊問題。@Openai 」

也有網友對小語言模型的前景充滿希望:

「非常希望Phi-3能夠在所有任務中勝過GPT-3.5」。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-04-09 13:21:00

AI開源

2023-09-18 09:36:58

微軟模型

2023-12-13 09:47:38

微軟人工智能

2024-04-29 12:14:03

模型數據開源

2024-06-05 08:33:29

2024-01-10 17:10:53

數據訓練

2023-12-13 11:16:34

微軟Phi-2大型語言模型

2024-03-15 08:30:00

AI數據

2024-12-09 07:10:00

Llama 3.3GeminiGPT-4.5

2024-12-13 14:03:44

模型訓練AI

2024-02-22 10:09:00

開源模型

2024-05-30 12:50:05

2024-07-02 09:20:59

2025-01-08 09:30:00

Meta大模型訓練

2024-06-28 13:42:07

2023-10-11 13:21:12

模型數據

2024-12-18 07:10:00

2023-09-27 12:56:09

人工智能訓練

2023-10-13 19:58:33

Mistral7B模型

2024-09-09 09:20:00

點贊
收藏

51CTO技術棧公眾號

国产又粗又长又大视频| 欧美88888| 国产尤物视频在线| 免费在线欧美视频| 一区二区三区精品| 日韩美女激情视频| 亚洲一二三四五六区| 亚洲天堂av资源在线观看| 黑人精品xxx一区一二区| 无遮挡亚洲一区| www日本高清视频| 国产精品一卡| 久久综合久久美利坚合众国| 欧美在线一级片| 懂色aⅴ精品一区二区三区| 亚洲国产综合91精品麻豆| 日韩av一区二区三区在线| 国产高清第一页| 老司机精品视频网站| 九色成人免费视频| 黄色av免费播放| 国产在线播放精品| 7777女厕盗摄久久久| 1024精品视频| 婷婷在线播放| 国产精品三级在线观看| 欧洲日本亚洲国产区| 午夜国产福利一区二区| 国产精品手机在线播放| 亚洲第一在线视频| 永久av免费在线观看| 色婷婷综合久久久中字幕精品久久| 亚洲最快最全在线视频| 亚洲欧美精品在线观看| 天堂影院在线| 一本色道精品久久一区二区三区| 久久久精品国产亚洲| 天天躁日日躁aaaxxⅹ| 久久久久97| 日韩女优av电影| 污视频在线观看免费网站| 成人精品动漫| 欧美性猛交xxxx黑人交| 99精品视频在线看| 成人小电影网站| 欧美体内谢she精2性欧美| 日韩视频在线视频| 毛片网站在线看| 亚洲乱码国产乱码精品精98午夜 | 爱草tv视频在线观看992| 亚洲三级免费电影| 91社在线播放| 成人无码一区二区三区| 国产精品综合av一区二区国产馆| 国产一区私人高清影院| 一级黄色片在线播放| 欧美成人精品| 美女av一区二区三区| 91人妻一区二区三区蜜臀| 香蕉国产精品| 久久婷婷国产麻豆91天堂| 四虎884aa成人精品| 综合五月婷婷| 久久免费视频观看| 偷偷操不一样的久久| 亚洲欧美日韩视频二区| 国产99久久久欧美黑人| 中文字幕一区二区三区四区免费看| 欧美成人直播| 久久精品免费电影| 欧美日韩精品在线观看视频| 国内自拍视频一区二区三区| 亚洲视频在线观看免费| 亚洲欧洲久久久| 97视频热人人精品免费| 免费91麻豆精品国产自产在线观看| 日本aⅴ在线观看| 亚洲天堂男人| 国产91热爆ts人妖在线| 亚洲影视一区二区| 成人av综合在线| 欧美另类一区| 久久99精品久久| 夜夜嗨av一区二区三区四季av| 国产精品999视频| 成人看片网页| 日韩色视频在线观看| 日韩免费高清一区二区| 精品美女视频| 色综合久久天天综线观看| 国产乱国产乱老熟| 精品一区二区成人精品| 欧美中文在线视频| 一本色道久久综合无码人妻| 国产精品888| 国产一区二区丝袜高跟鞋图片| 国产熟女一区二区丰满| 久久综合给合久久狠狠狠97色69| 一区中文字幕在线观看| 黄色软件视频在线观看| 欧美日韩亚洲不卡| 国产chinese中国hdxxxx| av一区二区在线观看| 久久久久免费精品国产| 一级aaaa毛片| 91看片淫黄大片一级在线观看| 中文字幕人成一区| 日韩大片欧美大片| 精品国精品自拍自在线| 香蕉视频xxxx| 国产成人三级| 久久久午夜视频| 亚洲网站在线免费观看| av亚洲精华国产精华| 国产日韩视频在线播放| 激情亚洲影院在线观看| 亚洲成人激情视频| 日韩福利小视频| 丝袜a∨在线一区二区三区不卡| 国产精品久久久久久久小唯西川| 免费在线你懂的| 一本久久精品一区二区| 永久免费未满蜜桃| 最新精品国产| 国产综合香蕉五月婷在线| 蝌蚪视频在线播放| 精品动漫一区二区三区| 极品人妻一区二区| 911久久香蕉国产线看观看| 国产精品成久久久久三级| 欧美一级特黄aaaaaa| 亚洲激情综合网| 给我免费播放片在线观看| 婷婷激情成人| 日日噜噜噜夜夜爽亚洲精品| 在线免费观看国产精品| 久久久久青草大香线综合精品| 亚洲熟妇av日韩熟妇在线 | 九九九九久久久久| 手机av免费在线| 欧美一级黄色录像| 国产美女久久久久久| 日本vs亚洲vs韩国一区三区二区| 欧美福利精品| 日韩三区在线| 中文字幕9999| 91免费视频播放| 亚洲欧美日韩综合aⅴ视频| 红桃视频 国产| 91精品一区国产高清在线gif | 色噜噜在线播放| 亚洲国产成人av网| 尤物网站在线观看| 亚洲精品孕妇| 九九九九九九精品| 亚洲成a人片| 在线观看91久久久久久| 国产精品视频久久久久久| 亚洲人成网站色在线观看| 免费人成视频在线播放| 狠久久av成人天堂| 久久久久一区二区| 日韩经典一区| 精品免费99久久| 国产无码精品视频| 91麻豆福利精品推荐| 亚洲视频在线a| 93在线视频精品免费观看| 成人激情视频网| 曰本三级在线| 亚洲精品久久久一区二区三区| 好吊操这里只有精品| 国产午夜亚洲精品午夜鲁丝片 | 伊人成人开心激情综合网| 中文字幕日本人妻久久久免费| 亚洲欧美日韩人成在线播放| 亚洲自拍偷拍精品| 久热精品在线| aaa免费在线观看| 激情小说亚洲色图| 国产精品久久av| 欧洲在线视频| 亚洲人成电影网站色xx| 国产精品久久久久久久成人午夜| 一区二区三区中文免费| 亚洲国产果冻传媒av在线观看| 日日摸夜夜添夜夜添国产精品| 中文字幕一区二区三区5566| 国产日韩三级| 国产欧美日韩亚洲精品| a级片在线免费观看| 欧美人动与zoxxxx乱| 亚洲黄色免费视频| 国产一区二区三区免费播放| 噜噜噜久久亚洲精品国产品麻豆| 日本成人小视频| 国产精品免费观看高清| 欧美黄页免费| 欧洲亚洲免费在线| 中文字幕资源网在线观看| 亚洲久久久久久久久久久| 国产黄a三级三级看三级| 色综合天天综合网天天狠天天| 91嫩草丨国产丨精品| 久久美女高清视频| 国产a√精品区二区三区四区| 日韩av一区二区三区四区| 国产一区二区片| 欧州一区二区三区| 欧美xxxx做受欧美| 国产h在线观看| 亚洲电影免费观看高清| 岳乳丰满一区二区三区| 黑人与娇小精品av专区| 超碰手机在线观看| 国产精品嫩草影院com| 精品无码国产一区二区三区51安| 精品亚洲国内自在自线福利| 天天天干夜夜夜操| 国产欧美不卡| 九九爱精品视频| 牛夜精品久久久久久久99黑人| 天堂√在线观看一区二区| 色婷婷综合久久久久久| 成人免费在线看片| 三级欧美日韩| 91精品视频网站| xxxxx.日韩| 国产精品国语对白| 国产日韩欧美麻豆| 国产69精品久久久久99| 国产美女性感在线观看懂色av| 亚洲第一黄色网| 亚洲av色香蕉一区二区三区| 欧美高清激情brazzers| 久久这里只有精品9| 国产91绿帽单男绿奴| 在线综合+亚洲+欧美中文字幕| 国产在线观看黄色| 五月天亚洲婷婷| 日韩视频免费观看高清| 亚洲一区二区三区四区在线| www.5588.com毛片| 一区二区中文字幕在线| 波多野结衣家庭教师在线观看 | av片在线观看| 久久久国产精品视频| 黄色成人在线观看| 久久中文字幕一区| 中文在线观看免费| 欧美大片欧美激情性色a∨久久| gogogogo高清视频在线| 在线亚洲人成电影网站色www| 亚洲精品男人天堂| 色哟哟一区二区在线观看| 无码人妻一区二区三区线| 色屁屁一区二区| www.亚洲激情| 欧美日韩国产成人在线91 | 亚洲第一福利在线观看| 天堂在线视频网站| 亚洲欧洲美洲在线综合| а天堂8中文最新版在线官网| 在线国产精品播放| 黄av在线播放| 91精品国产乱码久久久久久蜜臀| 最近高清中文在线字幕在线观看1| 日本成熟性欧美| 成人在线中文| 99在线国产| 欧美综合自拍| 午夜精品区一区二区三| 亚洲欧美综合久久久| av在线播放天堂| 视频一区免费在线观看| 色噜噜狠狠一区二区三区狼国成人| 国产乱人伦偷精品视频免下载| 久久久久久久久久影视| 久久一夜天堂av一区二区三区| 大胸美女被爆操| 亚洲综合丝袜美腿| 日韩精品久久久久久免费| 欧美午夜寂寞影院| 99久久一区二区| 亚洲欧美另类在线观看| 黄色的网站在线观看| 91国产一区在线| 久久亚洲精品中文字幕| 国产成人看片| 久久精品国产www456c0m| 久久艹国产精品| 美女精品一区二区| 亚洲精品在线视频免费观看| 国产精品第13页| 毛片在线免费视频| 欧美一级片在线| 风间由美一区| 97在线视频免费观看| 久久国内精品| 精品欧美日韩| 中文精品久久| 亚洲精品视频导航| 91亚洲午夜精品久久久久久| 四虎影院中文字幕| 欧美中文字幕久久| 神宫寺奈绪一区二区三区| 久久久国产一区二区| 高清电影一区| 精品视频导航| 欧美日韩影院| 福利视频999| 欧美激情一区二区三区不卡| 日韩毛片在线视频| 日韩一区二区三区视频| 成年在线电影| 欧美中文字幕在线播放| 99re91这里只有精品| 自拍偷拍99| 奇米亚洲午夜久久精品| 不卡一区二区在线观看| 99久久精品国产一区二区三区| 99热这里只有精品4| 日本精品一区二区三区四区的功能| 黄色片一区二区三区| 久久精品99无色码中文字幕| 中文.日本.精品| 日本高清久久一区二区三区| 中日韩男男gay无套| 亚洲免费观看在线| 亚洲黄色在线视频| 国产人妖一区二区| 操人视频在线观看欧美| 91九色成人| 色中文字幕在线观看| 日韩不卡一二三区| 欧美黄色高清视频| 欧美亚洲国产一区二区三区va| 精品av中文字幕在线毛片| 欧美孕妇孕交黑巨大网站| 视频福利一区| 337p粉嫩大胆噜噜噜鲁| 91麻豆国产自产在线观看| 特黄视频免费看| 亚洲免费av网址| 日韩欧美看国产| 视频一区二区三区在线观看| 免费观看在线综合| 国产精品18在线| 777色狠狠一区二区三区| 91精品久久久久久粉嫩| 97久草视频| 中文日韩在线| 波多野在线播放| 欧美日韩精品免费观看视频| 黄视频网站在线看| 亚洲影院污污.| 欧美日本在线| 丰满少妇一区二区三区| 在线视频一区二区三区| 免费大片在线观看www| 97超级碰碰| 国产日韩一区| 亚洲一区二区自偷自拍 | 图片小说视频色综合| 欧美激情第四页| 五月综合激情婷婷六月色窝| 邻家有女韩剧在线观看国语| 成人黄色片在线| 999亚洲国产精| 中文字幕在线观看免费高清| 91精品国产品国语在线不卡| a级片在线免费| 日本精品视频一区| 精品一区二区三区蜜桃| 国产一级视频在线播放| 亚洲欧美成人精品| 成人av在线播放| 国内精品在线观看视频| 中文av一区二区| 亚洲美女综合网| 国产精品国内视频| 黑丝一区二区| 九九九视频在线观看| 精品国产凹凸成av人网站| 欧美极度另类| 国产日韩亚洲欧美在线| 国产亚洲欧美在线| 亚洲成人第一区| 国产福利视频一区二区| 精品福利电影| 国产一区二区三区视频播放| 亚洲第一区中文字幕| 精品亚洲a∨| 国产淫片免费看| 亚洲精品乱码久久久久久久久| 男女污污视频在线观看| julia一区二区中文久久94| 日本在线观看不卡视频| 国产一级中文字幕| 色偷偷av一区二区三区乱|