精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

10萬美元+26天,一個低成本千億參數LLM就誕生了

人工智能 新聞
訓練一個 GPT 那樣的千億參數規模的大型語言模型需要多少錢和時間?北京智源人工智能研究院和中國科學院計算技術研究所等多所機構近日的一項研究發現可以用 10 萬美元在 26 天內訓練出一個有 1010 億參數的 LLM。

包括僅解碼器結構(如 GPT 和 LLAMA 系列模型)、僅編碼器結構(如 BERT)和編碼器 - 解碼器結構(如 T5)以及它們的變體模型在內的大型語言模型(LLM)已經取得了非凡的成功,并已被廣泛用于各種語言處理和多模態任務。

盡管如此成功,訓練 LLM 的成本還是過于高昂,以至于僅有少數公司能承受其訓練成本。此外,當前的趨勢說明未來還會使用更大規模的訓練數據,這會進一步推升大模型的研發成本。舉個例子,LLAMA-1 訓練使用了 1-1.4 TB token,而 Llama 2 更是達到了 2 TB。

研發 LLM 的另一大關鍵性挑戰是評估。主流的評估方法分為兩類:知識評估(MMLU 和 C-Eval)和 NLP 任務評估。這些評估方法可能無法真實反映模型的能力,因為也許存在數據泄漏問題,即評估數據集中某些部分可能在模型訓練過程中已被使用。此外,面向知識的評估方法可能不足以評估智能水平。一種更為公平客觀的評估方法是測 LLM 的智商(IQ),即將 LLM 泛化用于未在訓練數據中見過的條件和上下文。

增長策略。為了解決訓練成本難題,北京智源人工智能研究院和中國科學院計算技術研究所等多所機構近日做出了一番嘗試 —— 首次通過增長策略(growth strategy)訓練千億參數級的 LLM。增長意味著訓練過程中參數的數量并不固定,而是會從更小的模型擴增成大型模型。

圖片

  • 論文:https://arxiv.org/pdf/2309.03852.pdf
  • 模型:https://huggingface.co/CofeAI/FLM-101B

圖 1 展示了增長策略的三種典型場景。由于 LLM 的 FLOPs 大致與其參數數量成正比,因此模型參數的變化曲線與 X 軸之間的面積便能表示訓練的計算成本。

圖片

圖 1 (a) 展示了沒有模型增長的標準訓練策略;1 (b) 是直線型的增長策略,其能節省 50% 的成本;1 (c) 是一種適量型的增長策略,其節省的成本不到 50%;1 (d) 則是一種激進型的增長策略,能節省超過 50% 的成本。這一分析說明,為了盡可能地節省計算成本,應當采用激進型增長策略。

這項新研究的增長算子的設計靈感來自論文《2x faster language model pre-training via masked structural growth》中的 MSG,這是一個完整的運算集,涵蓋 Transformer 結構的所有四個增長維度。更重要的是,MSG 能在增長的同時嚴格地保存功能。因此,雖然小模型可以通過較小的參數搜索空間快速學習,但其知識可以被后續更大的模型繼承。這讓增長策略有可能使用相同或更少的計算成本實現更好的性能。

開源的 FLM-101B 模型。智源研究院的研究者通過逐步增長訓練了一個有 1010 億參數的 LLM 模型,他們也表示會開源發布該模型。該模型的架構是 FreeLM 的一種演進版。因此,研究者將其命名為 FLM-101B,其中 F 表示 Free。

FreeLM 框架有兩個預訓練目標,分別由語言信號和教師信號引導。在這項新研究中,這兩個目標被統一到了一個通用語言建模范式中。

IQ 評估基準。除了低成本的訓練范式,該團隊還做出了另一項貢獻,即為 LLM 的智商(IQ)評估提出了一套系統性的基準。

之前已有研究表明:盡管困惑度(PPL)指標能在一定程度上反映生成文本的質量,但卻并不可靠。另一方面,LLM 的訓練數據規模非常龐大,以至于我們難以辨別模型究竟只是在引述知識數據,還是真的實現了類似人類的推理、分析和概括能力,而這些能力正是這項研究定義 IQ 的基礎。一些常用的評估指標(用于英語的 MMLU 和用于漢語的 C-Eval)明顯是面向知識的,無法全面反映模型的智能水平。

為了進行完整性檢查,該團隊進行了一項測試:來自世界知名大學的五名計算機科學研究者使用 C-Eval 的化學試題進行了考試。結果發現他們的準確度幾乎相當于隨機亂猜,因為大多數志愿者都已忘記曾學過的化學知識。因此,強調對專業知識的了解程度的評估基準其實不足以衡量模型的 IQ。

為了全面衡量 LLM 的 IQ,該團隊開發了一個 IQ 評估基準,其中考慮了智商的四個關鍵方面:符號映射、規則理解、模式挖掘和抗干擾。

  • 語言本質上是符號的。已經有一些研究在使用符號而非類別標簽來評估 LLM 的智能水平。類似地,該團隊使用了一種符號映射方法來測試 LLM 在未曾見過的上下文上的泛化能力。 
  • 人類智能的一大重要能力是理解給定的規則并采取相應的行動。這種測試方法已被廣泛用在各種等級的測驗中。因此,規則理解成為這里的第二項測試。 
  • 模式挖掘涉及到歸納和演繹,也是智能的重要組成部分。這一方法在科學發展歷史中發揮了至關重要的作用。此外,各種競賽的測試題也往往需要這種能力才能解答。受此啟發,模式挖掘被選為第三個評估指標。 
  • 最后一個也很重要的指標是抗干擾能力,這也是智能的核心能力之一。已有研究指出,語言和圖像都很容易被噪聲干擾。考慮到這一點,該團隊把抗干擾用作了最后一個評估指標。

當然,這四個指標絕非 LLM IQ 評估的定案,但它們可作為一個起點,激勵后續的研究發展,并可望最終催生出一套全面的 LLM IQ 評估框架。 

這項研究的主要貢獻包括: 

  • 研究者表示,這是首個使用增長策略從頭開始訓練超過千億參數的 LLM 研究嘗試。同時,這還是目前成本最低的千億參數模型,成本僅 10 萬美元。 
  • 通過改進 FreeLM 訓練目標、有潛力的超參數搜索方法和功能保留型增長,這項研究解決了不穩定問題。研究者相信該方法也能為更廣大的科研社區提供助力。 
  • 研究者也通過實驗比較了新模型與之前的強大模型,其中既使用了面向知識的基準,也使用了新提出的系統性 IQ 評估基準。實驗結果表明 FLM-101B 是一個有競爭力且穩健的模型。 
  • 該團隊會發布模型檢查點、代碼、相關工具等,以推進千億參數規模的漢語和英語雙語 LLM 的研究開發。

FLM-101B 設計概況

從架構上看,FLM-101B 以 FreeLM 為骨干網絡,并集成了 xPos。在模型大小方面,得益于新的增長策略,研究者能在一次訓練中得到 16B、51B 和 101B 三種大小的模型。

至于預訓練設置,FLM-101B 繼承了 FreeLM 的訓練策略。

而在增長策略方面,不同于獨立訓練不同大小模型的常用實踐方法,該團隊可以依次訓練具有 16B、51B 和 101B 參數的三個模型,其中每個模型都會繼承其前一個較小模型的知識。

至于訓練硬件,則是使用了 24 臺 DGX-A800 GPU (8×80G) 服務器組成的集群;FLM-101B 的訓練時長不到 26 天更多并行策略和模型配置請參閱下表 1 和 2。

圖片

圖片

FLM-101B 的訓練穩定性

為了解決損失發散和梯度暴增等不穩定問題,研究者提出了一種頗具潛力的解決方案,簡述如下。

損失預測。新提出的實現訓練穩定的方法如下:

首先,在 FLM-16B 訓練開始之前先確定數據的分布。

接下來,對三個超參數進行網格搜索,包括學習率、初始化標準差和輸出層的 softmax 溫度。該網格搜索的執行是通過運行一個代理模型,其隱藏狀態維度(即模型寬度)為 256、頭數為 2,參數數量為 4000 萬。該代理模型的其它所有結構超參數和訓練數據與 FLM-16B 相同。在 6 個節點上使用數據并行時,一次運行網格搜索耗時為 24.6 小時,這大致表示:如果使用 24 節點的配置,那么運行一次需要 6 小時。

通過這種網格搜索,研究者找到了最優的超參數:學習率 = 4e-4、標準差 = 1.6e-2、softmax 溫度 = 2.0。

然后他們通過 μP 遷移這些超參數,能實現規避了不穩定問題的無縫訓練體驗。再組合使用 MSG,LM-51B 和 FLM-101B 也沒出現后續的增長發散問題。

圖 2 展示了完整的訓練損失曲線。

圖片

通過 Bfloat16 實現混合精度。使用混合精度的目的是節省運行時的內存和時間成本,這里他們選擇的是 Bfloat16。

基準評估

表 3 比較了 FLM-101B 與其它強大基準模型(LLAMA 系列模型和 GLM-130B)的性能表現。

圖片

研究者表示,這些結果說明 FLM-101B 在事實性知識方面并沒有任何優勢,而如果能使用更多訓練數據,那么其性能還會繼續提升。

表 4 展示了 eFLM-16B 與基準模型在專業知識評估方面的結果。

圖片

結果證明,在強調專業知識的數據集上的得分并不能反映 LLM 的智能水平,因為某些特定訓練數據可能具有壓倒性的貢獻。

表 5 給出了 FLM 模型每一階段的性能表現。

圖片

正如預期的那樣,FLM 的性能表現會隨模型增大而提升。FLM-101B 在幾乎所有任務上都表現最佳。這意味著該模型每一次增長后都會繼承前一階段的知識。

 IQ 實驗

實驗中,為了對 LLM 的 IQ 進行更為系統性的評估,智源研究院的這個團隊使用了現有的 IQ 相關數據集并做了一些必要的修改,他們也生成了一些新的合成數據。

具體來說,他們提出的 IQ 評估主要考慮了四個方面:符號映射、規則理解、模式挖掘和抗干擾。這些任務有一個關鍵的共同點:它們全都依賴于在新的上下文中進行推理和泛化。

下面幾張表格展示了 IQ 實驗的結果:

圖片

圖片


圖片

圖片

從這些表格來看,在這四個 IQ 評估基準上,FLM-101B 憑借低得多的計算成本取得了與 GPT-3 媲美且優于 GLM-130B 的結果。

除了訓練數據的影響外,研究者推測這種優勢可能是由于早期階段的小模型細化了較小的搜索空間,當模型變得更大更寬,泛化能力增強時,這種優勢還在持續發揮作用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-15 09:50:01

漏洞網絡安全網絡攻擊

2013-07-16 09:38:50

2020-12-26 09:12:55

白帽子黑客漏洞

2020-09-04 16:38:01

網絡攻擊勒索軟件數據泄露

2021-10-11 14:07:28

比特幣虛擬貨幣加密貨幣

2021-05-04 21:22:35

勒索軟件數據恢復網絡攻擊

2021-08-03 15:04:13

數據泄露漏洞信息安全

2021-07-07 10:40:49

勒索軟件攻擊贖金

2025-08-04 08:51:00

2025-11-03 07:39:51

2012-02-10 09:34:02

2010-08-18 09:57:44

Unix服務器IBM

2012-05-14 21:31:33

2012-05-23 10:05:49

工作效率效率程序員

2011-04-28 10:59:07

ARM

2015-02-05 10:48:37

360公司360

2025-11-18 08:54:00

2023-07-25 13:39:00

2021-01-14 09:27:05

黑客源代碼網絡攻擊

2021-09-16 09:02:59

數據泄露漏洞成本
點贊
收藏

51CTO技術棧公眾號

极品白嫩丰满美女无套| 天天好比中文综合网| 精品97人妻无码中文永久在线| 欧美成人三级| 亚洲素人一区二区| 不卡视频一区| 欧美日韩乱国产| 久久91麻豆精品一区| 欧美性一区二区| 欧美日韩一级在线| 亚洲精品911| 亚洲专区一区| 久久精品国产亚洲精品2020| 美女伦理水蜜桃4| 国产高清不卡| 亚洲欧洲av另类| 国产精品xxx在线观看www| 国产精品久久久免费视频| 成人影院天天5g天天爽无毒影院 | 少妇久久久久久被弄到高潮| 日韩一级片免费| 青椒成人免费视频| 超在线视频97| 极品白嫩少妇无套内谢| 天堂久久午夜av| 亚洲国产一二三| 色播五月综合| 黄色片网站免费在线观看| 麻豆传媒一区二区三区| 性欧美xxxx| 四虎影视一区二区| 日韩系列在线| 91精品国产高清一区二区三区 | 黑丝av在线播放| 四虎精品在线观看| 狠狠久久亚洲欧美专区| 中文字幕中文字幕一区三区| 无码国产色欲xxxx视频| 久久9热精品视频| 日本成人激情视频| 免费无遮挡无码永久在线观看视频| 国产精品免费不| 精品国产区一区| 午夜av中文字幕| 欧洲av一区二区| 欧美日韩中文字幕| www.好吊操| 超碰免费公开在线| 国产精品三级久久久久三级| 精品国产乱码久久久久久久软件| 国产情侣在线播放| 另类小说欧美激情| 国产国产精品人在线视| 日韩成人一区二区三区| 国产精品v日韩精品v欧美精品网站 | 精品国产一二三四区| 91中文在线| 亚洲欧美一区二区视频| 色婷婷精品国产一区二区三区| 日本高清视频www| 国产精品一卡二卡在线观看| 91精品啪在线观看麻豆免费| 一级黄色免费看| 美女久久久精品| 国产精品福利在线观看| 色av性av丰满av| 麻豆久久婷婷| 国产精品ⅴa在线观看h| 日韩黄色片网站| 日韩一级网站| 欧洲亚洲女同hd| 亚洲黄色免费观看| 久久久夜夜夜| 国产精品99久久久久久久久| 日日摸天天添天天添破| 国内视频精品| 国外视频精品毛片| 手机看片久久久| 亚洲自拍另类| 国产精品美乳在线观看| 中文字幕在线播放日韩| 久久国产生活片100| 国产精品永久在线| 国产农村妇女毛片精品久久| 国产精品一二三区在线| 国产精品对白刺激久久久| 欧美一区二区黄片| 久久综合久久综合久久| 午夜精品亚洲一区二区三区嫩草| 日韩免费啪啪| 亚洲男人天堂av| www.在线观看av| 欧美久久天堂| 欧美日韩一区二区三区在线| 亚洲理论中文字幕| 成人av地址| 亚洲一区二区久久| 亚洲天堂一级片| 激情久久久久| 欧美有码在线视频| 成人a v视频| 美腿丝袜在线亚洲一区 | 爱高潮www亚洲精品| 亚洲精品大尺度| 国产 欧美 在线| 99精品在线| 久久久久久国产精品美女| 青娱乐国产盛宴| 乱码第一页成人| 亚洲影院色无极综合| 亚洲欧洲成人在线| 国产精品伦理在线| 欧美国产视频一区| 456亚洲精品成人影院| 91精品国产色综合久久不卡电影| 国产视频久久久久久| av亚洲免费| 欧美黑人巨大xxx极品| 日本黄色一级视频| 国产精品一二三区在线| 欧美日韩另类综合| 好了av在线| 精品久久久久久中文字幕一区奶水| 三年中国国语在线播放免费| 大型av综合网站| 日韩性xxxx爱| 欧美brazzers| 暴力调教一区二区三区| 波多野结衣三级在线| 成人黄色动漫| 日韩午夜在线影院| 成年人视频软件| 亚洲区欧美区| 亚洲一区中文字幕| 18免费在线视频| 日韩欧美第一页| 岛国av免费观看| 久久久人成影片免费观看| 国产精品福利在线| 色猫av在线| 亚洲妇女屁股眼交7| 男人午夜视频在线观看| 精品一区二区三| 久久久久久久久久久人体| 一级做a爱片性色毛片| 久久综合九色综合97婷婷| 妞干网在线观看视频| 国产精品亚洲欧美一级在线| 伊人久久久久久久久久久| 国产成人免费高清视频| 操人在线观看| 欧美一卡2卡三卡4卡5免费| 国产精品理论在线| 久久精品系列| 久久精品magnetxturnbtih| 亚洲欧美成人影院| 色欧美乱欧美15图片| 中文字幕一二三区| 91精品国产自产在线观看永久∴ | 免费污视频在线观看| 欧美一区二区三级| 国产一区在线观看免费| 日本伊人色综合网| 久久福利电影| 9999精品成人免费毛片在线看| 日韩午夜在线影院| 欧美成人一区二区三区高清| 国产高清精品在线| 亚洲五码在线观看视频| 国产精品亚洲四区在线观看| 久久中文精品视频| www.久久精品.com| 亚洲影视在线观看| 亚洲av成人精品一区二区三区| 国语精品一区| 精品国产乱码久久久久| 亚洲妇女成熟| 在线日韩精品视频| 一道本在线视频| 亚洲女人小视频在线观看| 古装做爰无遮挡三级聊斋艳谭| 亚洲精品888| 国产超碰91| 亚洲第一av| 伊人久久久久久久久久久| 一区二区三区精| 亚洲黄色免费网站| a级一a一级在线观看| 久久精品一区| 一区二区国产日产| 综合视频一区| 日韩美女激情视频| 成年人在线观看视频| 欧美精品第1页| 久久精品99国产精| 91免费国产在线观看| 男人搞女人网站| 成人羞羞网站入口| 99国产高清| 欧美激情20| 丝袜美腿精品国产二区| 亚洲成人777777| 色综合夜色一区| 希岛爱理中文字幕| 91亚洲国产成人精品一区二三| 欧美两根一起进3p做受视频| 久久久久久久久99精品大| 国产美女99p| 久久精品黄色| 97激碰免费视频| 九色porny在线| 日韩va亚洲va欧洲va国产| 亚洲怡红院av| 天天综合网天天综合色| 成人黄色短视频| 91亚洲国产成人精品一区二三| 欧美三级理论片| 激情综合视频| 一区视频二区视频| 欧美三级自拍| 91香蕉亚洲精品| 欧美电影免费观看高清完整| 久久视频在线免费观看| 台湾av在线二三区观看| 91精品免费在线| 国产精品久久久久久人| 亚洲一区二区在线视频| 99久久精品久久亚洲精品| 26uuu亚洲| 国内自拍偷拍视频| 蜜桃视频在线观看一区| 欧美成人免费高清视频| 先锋资源久久| 日本不卡免费新一二三区| 91欧美极品| 国产裸体写真av一区二区| 性xxxxfjsxxxxx欧美| 色小说视频一区| 精品亚洲综合| 亚洲国产精品悠悠久久琪琪| 精品区在线观看| 在线成人av网站| 中文字幕乱码视频| 在线观看免费视频综合| 久久久久女人精品毛片九一| 性欧美疯狂xxxxbbbb| 亚洲欧美一区二区三区四区五区| 国产精品免费观看视频| 亚洲精品成人无码| 久久久久久一二三区| 国产又粗又长又爽| 成人av网站免费观看| 日本少妇一级片| 国产福利不卡视频| 午夜性福利视频| 成人午夜av在线| 少妇被狂c下部羞羞漫画| 国产91精品露脸国语对白| 天堂av8在线| 日韩成人午夜精品| 蜜臀久久99精品久久久酒店新书| 激情另类综合| 8x8ⅹ国产精品一区二区二区| 牛牛国产精品| 天堂а√在线中文在线| 欧美日韩亚洲国产精品| 免费拍拍拍网站| 亚洲国产高清一区二区三区| 青青草国产精品视频| 亚洲黄色在线| 国产91在线免费| 鲁大师成人一区二区三区| 日本成人在线免费视频| 日本不卡一区二区三区 | 美女网站视频色| 中文字幕一区二区5566日韩| 四虎影院中文字幕| 亚洲一区二区精品视频| 亚洲免费在线观看av| 日本久久电影网| 在线视频1卡二卡三卡| 91麻豆精品91久久久久同性| 亚洲高清视频在线播放| 亚洲国产成人精品一区二区 | 亚洲精品二区| 91不卡在线观看| 阿v天堂2018| 免费日韩av| 日本肉体xxxx裸体xxx免费| 免费的成人av| 久久精品一二三四| 成人免费黄色在线| 蜜桃精品一区二区| 国产精品国产自产拍高清av王其| 一区视频免费观看| 五月婷婷激情综合网| 日韩国产成人在线| 日韩精品最新网址| 蜜桃视频在线观看www| 国产视频精品免费播放| 色老头视频在线观看| 欧美第一淫aaasss性| 欧洲亚洲两性| 5g影院天天爽成人免费下载| 麻豆精品99| 在线一区亚洲| 在线亚洲一区| 992tv人人草| 国产亚洲一区二区三区四区| 亚洲国产精品久| 在线观看视频一区二区| 不卡视频免费在线观看| 亚洲最新av在线网站| aa级大片免费在线观看| 国产精品美女免费视频| 红杏一区二区三区| 亚洲欧洲精品在线| 亚洲久久成人| 91看片破解版| 2020日本不卡一区二区视频| 日本一二三不卡视频| 香蕉影视欧美成人| 国产精品久久久久久久久久久久久久久久久久 | 国产在线xxxx| 奇米色一区二区| 人妻丰满熟妇aⅴ无码| 亚洲自拍偷拍欧美| 看黄色一级大片| 精品视频一区在线视频| 精灵使的剑舞无删减版在线观看| 国产精品日本精品| 亚洲区小说区图片区qvod按摩| 免费高清一区二区三区| 蜜臀精品一区二区三区在线观看 | 秋霞国产精品| 精品久久久久久乱码天堂| 亚洲综合色网| 国内外成人免费在线视频| 97成人超碰视| 久久久国产精华液| 日韩一区二区免费在线观看| 在线国产91| 国产精品视频永久免费播放| 日韩在线麻豆| 黄页免费在线观看视频| 国产精品亚洲成人| 在线看的片片片免费| 欧美日本一区二区三区| 在线免费观看的av网站| 国产精品久久中文| 久久不见久久见国语| 国产美女无遮挡网站| 国产99久久久国产精品潘金 | 开心激情综合网| 欧美精品在线免费观看| 二区三区精品| 在线免费观看成人| 韩国精品一区二区| 亚洲伦理一区二区三区| 777精品伊人久久久久大香线蕉| av在线电影播放| 国产精品亚发布| 日韩伦理一区| 永久免费的av网站| 国产精品天天看| 中文字幕免费观看视频| 色青青草原桃花久久综合| 欧美天堂一区二区| 成人高清dvd| 成人爽a毛片一区二区免费| 在线观看黄网站| 日韩在线免费高清视频| 97久久综合精品久久久综合| 亚洲精品无码久久久久久| 一色桃子久久精品亚洲| 狠狠综合久久av一区二区| 日韩av观看网址| 一区二区蜜桃| 日韩精品卡通动漫网站| 在线成人午夜影院| 日韩脚交footjobhdboots| 亚洲一区二区三区免费观看| 成人午夜精品在线| 中文字幕在线播出| 韩国三级日本三级少妇99| 成人久久久久| 人妖粗暴刺激videos呻吟| 欧美色老头old∨ideo| 色操视频在线| 亚洲不卡中文字幕| 国产一区二区精品在线观看| 国产精品一区无码| 欧美成人一区二区三区电影| 自拍亚洲一区| 国产原创剧情av| 欧美日韩国产免费| 男人的天堂免费在线视频| 中文字幕の友人北条麻妃| 久久久99精品免费观看| 免费观看a视频|