精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

估值840億AI實驗室再放大招,他們要給大模型戴上「緊箍咒」

人工智能 新聞
在大模型訓練時,如何管理權重、避免數值爆炸與丟失?Thinking Machines Lab 的新研究「模塊流形」提出了一種新范式,它將傳統「救火式」的數值修正,轉變為「預防式」的約束優化,為更好地訓練大模型提供了全新思路。

剛剛,OpenAI前CTO Mira Murati創辦的Thinking Machines Lab再次發布成果!

這是他們繼《克服LLM推理中的不確定性》(Defeating Nondeterminism in LLM Inference)之后,第二篇研究文章——《模塊流形》(Modular Manifolds)。

博客地址:https://thinkingmachines.ai/blog/modular-manifolds/

訓練大型神經網絡如同「走鋼絲」,必須小心翼翼地維持其內部「健康」,防止權重、激活值或梯度這些關鍵張量變得過大或過小,以免引發數值溢出等一系列問題。

其中一個重要的思路,是為大模型提供一套統一的量級管理。

首先是穩住基本盤。

使用Layer Norm技術把每層的輸出拉回合適范圍,對激活向量進行歸一化(normalization)這也是目前一種普遍的做法。

對梯度更新進行歸一化也很常見,例如Muon優化器對更新進行譜歸一化處理,使每一步更新的幅度可控。

再進一步,是直接「管住」權重本體。

歸一化權重矩陣是一個值得嘗試的方向。

文中提出了一種重新思考優化算法提供了新視角:將權重張量約束在某個子流形(submanifold)上,以便與這些流形約束協同設計優化算法。

這好比把「救火」變「預防」:

一開始就把參數放在健康區間,讓訓練更穩、更具解釋性,從而使大模型可以更穩定、高效地訓練起來。

流形優化器的形態

我們知道,流形只是一個局部看起來很平坦的曲面。

如果放大到足夠多,它看起來就像是一個普通平面。

流形上某一點附近的局部平坦空間稱為「切空間」(tangent space)。

如圖1所示,三維球面或更高維度的超球面是一個流形,圖中以紅色部分表示其在某點的切平面。

為了讓權重能夠「待在」指定的流形里,一個簡單的方法是使用普通優化器,在每步更新后將權重投影回流形。

但問題是如果優化步驟偏離流形太多,再被強制投影回來,這會導致名義學習率不再對應參數在流形上的實際位移,從而削弱我們對「步長—效果」關系的直覺。

想在流形上認真設計訓練算法,必須先想清楚:在切空間里怎么度量「距離」?

一個解決思路是直接在切空間中進行優化。這樣,每一步都是沿著流形「表面」走,學習率能更好地對應「實際位移」。

常見的選擇是歐幾里得距離,但也可以選擇以其他方式測量距離,如圖2所示。

值得注意的是,距離度量方式的選擇會直接影響最優優化步驟的方向。

圖3中,粉色箭頭表示原始梯度——即損失函數對權重的偏導數(partial derivative)。

也就是說,我們不一定非要嚴格按照梯度方向移動。

為了用數學表達這個過程,我們可以把「在流形約束和特定距離度量下的最優更新方向」看作一個帶約束的優化問題,可以用一個搭配歐幾里得范數的超球面來舉例。

用g表示梯度, w表示超球面上的當前點, a表示更新方向, η表示學習率,我們需要解決的問題是:

再回到圖 1、2 和3所展示的可視化語言,這個公式的意思是:綠色箭頭(也就是a的最優解)必須同時滿足兩個條件:

一是它要落在紅色的切平面上,二是它必須在半徑為η的黃色圓圈上。

我們可以應用拉格朗日乘數法來求解。

其中λ和μ是拉格朗日乘子。

對這個拉格朗日函數對a求導并令其為零,然后結合兩個約束條件求解λ和μ,就可以得到最優更新方向。

簡單來說最優更新的做法是:先從梯度中減去與w同方向的徑向分量,即把梯度投影到切空間上,然后將結果歸一化,再乘以學習率。

這樣得到的更新方向就在切空間里了。

圖4中顯示這個微小的修正過程被稱為「回縮映射」(retraction map)。

完整的流形優化算法如下:

總結來說,一階流形優化器包含三個步驟:

  • 找到一個單位長度的切向量,在梯度方向上盡可能遠;
  • 用學習率乘以這個方向,然后從當前權重中減去;
  • 把更新后的權重通過回縮映射拉回流形上。

在執行這一流程時,我們需要決定選擇什么樣的流形來作為約束,此外是如何定義「長度」的度量方式。

根據這兩個選擇的不同,我們就能得到不同的優化算法,具體見下表。

流形Muon

Transformer中的典型權重矩陣W是一個「向量變換器」,即它將輸入向量x
轉換為輸出向量y=Wx。

我們希望設計一種流形約束和距離函數,使得該矩陣對輸入向量的作用合理:既不應導致輸出值過大或過小,也不應在更新權重時引起輸出向量劇烈變化或幾乎無變化。

一個思考矩陣如何作用于向量的好方法是使用奇異值分解(SVD),如圖 5 所示。

SVD以分解矩陣的方式顯示矩陣如何沿著不同的軸拉伸輸入向量。

我們希望矩陣的「拉伸效應」接近于1,因此選擇了一個所有奇異值均為1的矩陣流形。

這種矩陣流形在數學上被稱為Stiefel流形,在高矩陣( m≥n)的假設下,它可以等價地定義為以下集合:

要為Stiefel流形設計優化器,還需選擇一個合適的距離函數。

為限制權重更新對輸入向量的最大拉伸作用,譜范數(spectral norm),即矩陣最大奇異值的度量是一個合適的選項。

雖然它只約束了最大效應,但由于優化器會飽和這一上限,因此也能間接防止最小效應過小。

正是這一想法,促成了Muon優化器的提出。

這一想法與Stiefel流形約束結合后,就形成了「manifold Muon」問題

文中的一個關鍵發現是一個凸優化問題,可以通過標準方法——對偶上升法(dual ascent)來求解。

經過推導,對偶函數的梯度為:

通過一個小實驗,可以驗證算法的可行性,實驗設置與結果見圖6。

模塊流形

這里還有一個重要的問題:當我們將多個層組合起來構建完整的神經網絡時,會發生什么?

是否需要關注層與層之間的交互,并據此修改優化策略?

這需要一種可以將前文介紹的推導邏輯推廣到整個神經網絡的方法——模塊流形(modular manifolds)理論。

該理論的核心思想是:構建一種抽象機制,用來指導如何在各層之間合理分配學習率。

在本質上,在不同層之間分配學習率,或者對單個層進行縮放,都依賴于我們對網絡輸出對權重的Lipschitz敏感性的理解。

我們在搭建網絡的過程中會追蹤這種敏感性,而流形約束有助于我們更加精準地把握它。

責任編輯:張燕妮 來源: 新智元
相關推薦

2017-03-07 16:09:14

IBM量子計算互聯網

2024-12-19 09:00:00

模型數學訓練

2019-05-22 11:50:46

5G運營商網絡

2019-05-21 14:15:07

美國5G運營商

2025-07-22 10:45:55

2021-08-04 09:48:05

數字化

2009-05-07 16:20:20

谷歌實驗室Gmail

2021-07-05 09:52:05

大數據大數據“殺熟”數據監管

2025-08-04 09:17:00

馬斯克AI視頻生成

2015-02-06 09:23:52

賽可達實驗室網絡安全

2011-05-25 17:51:40

2017-10-12 15:51:14

AI人工智能

2018-07-05 17:50:14

AI

2025-11-14 11:17:07

2010-01-18 15:29:23

IT教育

2022-07-01 12:42:53

VR新模型元宇宙

2016-03-21 12:56:26

2009-09-21 11:45:36

CCIE實驗室考試

2024-12-25 12:04:34

點贊
收藏

51CTO技術棧公眾號

欧美一区二区三区不卡| 91老司机福利 在线| 欧美老少配视频| 性猛交╳xxx乱大交| 国产伦理精品| 欧美激情中文字幕一区二区| 91精品视频网站| 日本熟伦人妇xxxx| 日本a口亚洲| 精品电影一区二区三区| 成人免费视频久久| 日韩av官网| 国产精品日日摸夜夜摸av| 成人av免费电影| 中文字幕 欧美激情| 欧美视频一区| 色偷偷综合社区| 亚洲精品第二页| 日韩一区二区三区四区五区| 天涯成人国产亚洲精品一区av| 亚洲精品日韩精品| 日本激情一区二区三区| 久久99这里只有精品| 国内成人精品视频| 国产美女福利视频| 精品国产91乱码一区二区三区四区| 欧美一区二区三区的| 国产成人综合一区| 菠萝蜜视频在线观看www入口| 国产精品网站一区| 久久久精品动漫| 亚洲AV无码国产精品午夜字幕| 日本不卡在线视频| 7777kkkk成人观看| 久久免费在线观看视频| 欧美国产美女| 尤物九九久久国产精品的分类 | 91插插插插插插| 自拍视频一区| 日韩av在线网页| 无码人妻一区二区三区免费n鬼沢| 成人影院在线免费观看| 色综合久久久久综合99| 久久久久久久久久久99| 色婷婷在线播放| 亚洲激情av在线| 97超碰人人爱| 大片免费在线观看| 中文字幕亚洲区| 在线不卡日本| 免费黄色电影在线观看| 亚洲国产精品黑人久久久| 日本午夜精品一区二区| 国产一二三在线观看| 91免费国产视频网站| 精品国产日本| 污视频软件在线观看| 99综合电影在线视频| 国产精品一区二区免费| 日韩中文字幕免费观看| 成人黄色在线看| 九色91国产| 天堂av电影在线观看| 久久综合久久综合九色| 日韩精品久久久| 国产精品一区二区婷婷| 国产精品久久久久久久久图文区| 亚洲精品中文字幕在线| 老司机精品视频在线观看6| 亚洲人成在线观看一区二区| 50度灰在线观看| 国产一线二线在线观看| 午夜精品久久久久久| 国产91对白刺激露脸在线观看| 中文在线免费二区三区| 欧美午夜理伦三级在线观看| 艹b视频在线观看| 欧美日韩中出| 日韩理论片久久| 摸摸摸bbb毛毛毛片| 婷婷综合社区| 欧美黄色www| 亚洲午夜18毛片在线看| 全国精品久久少妇| 亚洲综合精品伊人久久| 日韩中文字幕免费观看| 日本一区二区三区国色天香 | 精品人妻少妇嫩草av无码| 国产精品嫩模av在线| 色偷偷噜噜噜亚洲男人的天堂| 日本老熟俱乐部h0930| 国产亚洲一级| 国产剧情日韩欧美| 亚洲精品国产精品国| 久久婷婷一区二区三区| 中文字幕欧美日韩一区二区| 国产丝袜精品丝袜| 在线一区二区视频| 欧美熟妇精品一区二区| 久操成人av| 欧美剧在线观看| 日韩免费av网站| 国产高清无密码一区二区三区| 麻豆精品传媒视频| 99热国产在线中文| 欧美无砖专区一中文字| 亚洲成a人片在线www| 俺要去色综合狠狠| 国产最新精品视频| ,一级淫片a看免费| 91麻豆视频网站| 久久最新免费视频| 欧美xnxx| 日韩第一页在线| 欧美成人片在线观看| 日本亚洲最大的色成网站www| 国产精品久久亚洲7777| 秋霞影院午夜丰满少妇在线视频| 天天综合天天综合色| 中文字幕永久有效| 免费欧美激情| 91av在线播放| 乱精品一区字幕二区| 中文字幕一区二| 天天操天天爽天天射| 亚洲人成伊人成综合图片| 欧美美最猛性xxxxxx| 一级二级三级视频| 国产午夜精品理论片a级大结局| 精品人妻大屁股白浆无码| 四虎视频在线精品免费网址| 亚洲免费av电影| 国产在线观看成人| 国产一区二区日韩精品| 亚洲精蜜桃久在线| 国产成人免费9x9x人网站视频| 日韩av网站大全| 国产精品成人网站| 国产91精品一区二区麻豆亚洲| 一卡二卡3卡四卡高清精品视频| 日韩在线免费| 国产视频精品va久久久久久| 日韩精品久久久久久久| 成人黄色小视频在线观看| 久久亚洲国产成人精品无码区| 国产视频一区二区在线播放| 伊人一区二区三区久久精品| 中文字幕日韩第一页| 国产天堂亚洲国产碰碰| 日本美女高潮视频| 久久av电影| 国产成人精品亚洲精品| 经典三级在线| 在线观看国产91| 日韩av片在线| 韩国精品免费视频| 四虎永久免费网站| 日韩精品一级| 高清在线视频日韩欧美| 四虎免费在线观看| 一本久久精品一区二区| 亚洲人成人无码网www国产| 首页亚洲欧美制服丝腿| 相泽南亚洲一区二区在线播放| 视频精品导航| xxx欧美精品| 国产三级漂亮女教师| 一区二区三区在线视频观看| 在线观看免费视频国产| 国产精品亚洲综合久久| 品久久久久久久久久96高清| 精品福利在线| 久久6免费高清热精品| 国精品人妻无码一区二区三区喝尿 | 91精品国产综合久久久蜜臀粉嫩 | 欧美日韩中文字幕日韩欧美| 91视频在线网站| 精品在线你懂的| 久久在线中文字幕| 免费观看久久av| 成人情趣片在线观看免费| 天堂成人av| 亚洲毛片在线观看.| 911美女片黄在线观看游戏| 一区二区三区蜜桃网| 国产乱了高清露脸对白| 免费成人你懂的| 成人在线视频一区二区三区| 亚洲免费福利一区| 91香蕉电影院| 小视频免费在线观看| y97精品国产97久久久久久| 亚洲国产精品久久久久久6q| 色婷婷久久久亚洲一区二区三区 | 欧美伊人久久大香线蕉综合69| 一区二区三区四区五区| 99久久精品国产一区二区三区| 在线观看的毛片| 黄色精品免费| 亚洲国产另类久久久精品极度| av日韩一区| 日韩av电影手机在线观看| www在线观看播放免费视频日本| 国产视频精品自拍| 性一交一乱一伧老太| 欧洲另类一二三四区| 久草网在线观看| 国产精品午夜在线| 91视频啊啊啊| 国产福利精品一区| 日韩av片网站| 亚洲女优在线| 久久人人爽人人爽人人av| 青青草国产成人a∨下载安卓| 国产一区二区香蕉| 玛雅亚洲电影| 亚洲97在线观看| 最新黄网在线观看| 日韩在线视频网| 极品白浆推特女神在线观看| 欧美精品一区在线观看| 国产模特av私拍大尺度| 欧美熟乱第一页| 人人草在线观看| 欧美日韩免费在线观看| 精品一区二区三区四| 亚洲欧美中日韩| 欧美a在线播放| 国产亚洲一区二区三区四区| 这里只有精品在线观看视频| 国产精品一区二区三区99| 青青青国产在线视频| 亚洲三级色网| 亚洲 欧美 综合 另类 中字| 欧美.日韩.国产.一区.二区| 成人手机视频在线| 日韩欧美一区二区三区在线视频| 日韩av影视| 国产一区不卡| 日产精品高清视频免费| 视频一区欧美| 日韩高清国产精品| 欧美系列电影免费观看| 日本一区二区三区四区在线观看| 亚洲最好看的视频| 精品伦精品一区二区三区视频| 盗摄系列偷拍视频精品tp| 痴汉一区二区三区| 网站一区二区| 国产精品9999久久久久仙踪林| 91麻豆精品激情在线观看最新| yellow视频在线观看一区二区| 日韩中文字幕视频网| 翡翠波斯猫1977年美国| 精品国产影院| 免费久久一级欧美特大黄| 精品盗摄女厕tp美女嘘嘘| 日韩电影免费观看高清完整| 日本一区二区在线看| 在线播放豆国产99亚洲| 欧美xxx在线观看| 国产www免费| 久久av在线| 色片在线免费观看| 国产制服丝袜一区| 佐佐木明希电影| 99久久99久久精品免费观看| 丰满少妇一区二区| 国产精品色眯眯| 婷婷在线精品视频| 午夜亚洲国产au精品一区二区| 手机看片久久久| 欧美日韩综合在线| 国产黄色av片| 日韩久久免费视频| 免费网站免费进入在线| 久久91亚洲精品中文字幕奶水| 成av人片在线观看www| 国产精品69精品一区二区三区| 外国成人毛片| 国产亚洲精品自在久久| 国产精品一区2区3区| 懂色av一区二区三区四区五区| 亚洲福利一区| 激情 小说 亚洲 图片: 伦| 国产在线不卡一区| 双性尿奴穿贞c带憋尿| 国产精品久久久久一区二区三区| 久久久无码一区二区三区| 色综合久久久网| 国产黄a三级三级三级| 亚洲天堂av在线免费| 91麻豆国产福利在线观看宅福利| 欧美有码在线观看视频| 成人97精品毛片免费看| 农村寡妇一区二区三区| 性欧美欧美巨大69| 2022亚洲天堂| 国产精品自拍网站| 亚洲女优在线观看| 亚洲一级在线观看| 亚洲图片小说视频| 日韩黄在线观看| 在线观看操人| 国产精品久久久久久久久粉嫩av| 99精品国产一区二区三区2021| 日韩影片在线播放| 一本色道久久综合亚洲精品高清 | 一道本在线视频| 亚洲免费av片| 波多野结衣久久| 91沈先生在线观看| 精品一区二区三区中文字幕老牛 | 久久高清内射无套| 色哟哟一区二区在线观看| 好男人在线视频www| 久久久国产精品视频| 精品网站在线| 免费精品视频一区二区三区| 日韩一区二区久久| 亚洲一区和二区| 亚洲欧美日韩人成在线播放| 中国女人真人一级毛片| 亚洲乱码av中文一区二区| 爱福利在线视频| 999在线观看免费大全电视剧| 第四色成人网| 亚洲欧美在线精品| 国产午夜精品一区二区三区嫩草 | 国产综合成人久久大片91| 丁香激情五月少妇| 色婷婷亚洲一区二区三区| 日本在线丨区| 2019中文字幕在线| 狼人天天伊人久久| 免费国产黄色网址| 成人动漫一区二区| 国产无码精品在线观看| 亚洲大胆人体在线| 高端美女服务在线视频播放| 国产精品一区而去| 国产农村妇女精品一二区| 亚洲成av人片在线观看无| 亚洲成人动漫av| 天天操天天干天天舔| 51视频国产精品一区二区| 欧美日韩一本| 国产三区在线视频| 久久精品一区二区| 久草视频在线免费| 中日韩午夜理伦电影免费 | 欧美日韩精品一区二区三区| а天堂8中文最新版在线官网| 国产成人综合一区二区三区| 精品国产aⅴ| 色播五月激情五月| 自拍偷拍亚洲综合| 精品国产无码AV| 国自在线精品视频| 香蕉国产成人午夜av影院| 日本黄色三级大片| 国产精品―色哟哟| av网站免费播放| 91精品国产一区| 一区二区三区韩国免费中文网站| 91av俱乐部| 亚洲三级电影网站| 免费看黄网站在线观看| 欧美一级淫片aaaaaaa视频| 国产亚洲欧美日韩在线观看一区二区 | 国产区在线观看成人精品| 一区二区视频免费观看| 久久高清视频免费| 欧美变态网站| 天堂网在线免费观看| 一二三区精品视频| 天堂a中文在线| 91精品久久久久久久久久另类 | 艳妇臀荡乳欲伦亚洲一区| 亚洲av成人无码久久精品老人| 国产精品r级在线| 中文字幕av亚洲精品一部二部| 亚洲天堂资源在线| 欧美日韩在线电影| 国产精品蜜臀| 四虎永久国产精品| 成人性生交大片| 中文字幕乱码无码人妻系列蜜桃| 欧美乱大交做爰xxxⅹ性3| 亚洲天堂日韩在线| 能看毛片的网站| 日本高清不卡一区| 色在线视频网| 午夜一区二区三视频在线观看| 国产成人av福利| 精品国产www| 7777kkkk成人观看| 亚洲一区 二区 三区| 国产高潮呻吟久久| 亚洲成人av在线播放|