精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體

發(fā)布于 2024-11-11 10:56

瀏覽

0收藏

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

論文鏈接：https://arxiv.org/pdf/2410.18035

低秩適應(yīng)（LoRA）及其專(zhuān)家混合（MOE）變體是非常有效的參數(shù)高效微調(diào)（PEFT）方法。然而，由于在Transformer層中添加了LoRA模塊和MOE routers，這些方法在多租戶(hù)環(huán)境中引入了顯著的延遲。為了解決這個(gè)問(wèn)題，本文提出了低秩適應(yīng)的混合（MiLoRA），一種新穎且高效的LoRA變體。MiLoRA與之前的MOE風(fēng)格LoRA方法不同之處在于將每個(gè)LoRA模塊視為一個(gè)專(zhuān)家，并采用了一種基于提示的router機(jī)制。該機(jī)制在生成第一個(gè)新標(biāo)記之前計(jì)算專(zhuān)家路由結(jié)果，并將這些結(jié)果用于后續(xù)標(biāo)記，從而減少延遲。在常識(shí)推理任務(wù)、數(shù)學(xué)推理任務(wù)和廣泛使用的LLM評(píng)估基準(zhǔn)上進(jìn)行的廣泛實(shí)驗(yàn)和分析表明，MiLoRA始終優(yōu)于具有可比可調(diào)參數(shù)預(yù)算的強(qiáng)大PEFT基線。此外，與之前基于LoRA的方法相比，MiLoRA在多租戶(hù)環(huán)境中顯著減少了延遲。

亮點(diǎn)直擊

提出了一種新穎的LoRA變體，MiLoRA，它以高效的方式將MOE機(jī)制與LoRA結(jié)合起來(lái)。
在MiLoRA中，將每個(gè)LoRA模塊視為一個(gè)專(zhuān)家。
提出了一種基于提示的路由機(jī)制，以避免 token-wise 的計(jì)算。
進(jìn)行了廣泛的實(shí)驗(yàn)和分析，結(jié)果表明MiLoRA框架在實(shí)際應(yīng)用中優(yōu)于基線模型，并在可比的參數(shù)預(yù)算下表現(xiàn)更佳；在大語(yǔ)言模型推理過(guò)程中高效。

總結(jié)速覽

解決的問(wèn)題

多租戶(hù)環(huán)境中的延遲：在Transformer層中添加LoRA模塊和MOE router導(dǎo)致顯著的延遲，影響性能。
參數(shù)高效微調(diào)（PEFT）方法的局限性：現(xiàn)有的LoRA和MOE變體在多租戶(hù)設(shè)置中效率不高。

提出的方案

MiLoRA框架：一種新穎且高效的LoRA變體，將MOE機(jī)制與LoRA結(jié)合。
基于提示的router機(jī)制：在生成第一個(gè)新標(biāo)記之前計(jì)算專(zhuān)家結(jié)果，避免逐個(gè)token的router計(jì)算。

應(yīng)用的技術(shù)

低秩適應(yīng)（LoRA）：用于有效的參數(shù)微調(diào)。
專(zhuān)家混合（MOE）：通過(guò)將每個(gè)LoRA模塊視為一個(gè)專(zhuān)家，優(yōu)化模型選擇。
提示機(jī)制：用于高效計(jì)算和。

達(dá)到的效果

性能提升：在常識(shí)推理、數(shù)學(xué)推理任務(wù)和LLM評(píng)估基準(zhǔn)上，MiLoRA優(yōu)于強(qiáng)大的PEFT基線。
顯著減少延遲：MiLoRA在多租戶(hù)環(huán)境中表現(xiàn)出更高的效率，相較于傳統(tǒng)LoRA方法降低了延遲。
可比的參數(shù)預(yù)算下的優(yōu)越表現(xiàn)：在相同的參數(shù)預(yù)算下，MiLoRA框架在實(shí)際應(yīng)用中表現(xiàn)更佳。

方法

本節(jié)首先介紹LoRA和MoE的基礎(chǔ)概念，然后詳細(xì)闡述MiLoRA的架構(gòu)設(shè)計(jì)。

初步

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

動(dòng)機(jī)

正如下表4所示，現(xiàn)有的MOE風(fēng)格LoRA研究在推理過(guò)程中顯著減慢了LLM骨干網(wǎng)絡(luò)的速度，使每秒處理的tokens（tps）減少約20%。這些研究中，每個(gè)LoRA模塊被分解為多個(gè)專(zhuān)家，并且需要調(diào)用一個(gè)routers來(lái)確定哪些專(zhuān)家被激活。在生成每個(gè)token時(shí)，每層的多個(gè)LoRA模塊和多個(gè) router的計(jì)算被執(zhí)行，導(dǎo)致的延遲不可忽視。為了提高這種MOE LoRA方法的效率，需要研究以下研究問(wèn)題：

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

RQ1. 能否將LoRA模塊視為一個(gè)專(zhuān)家，使得每個(gè)Transformer層只有一個(gè)LoRA router，并且每層只激活一個(gè)這樣的專(zhuān)家？

RQ2. LoRA router能否在輸入提示時(shí)僅調(diào)用一次？

即時(shí)感知的 LoRA router

為了調(diào)查RQ1和RQ2，現(xiàn)在嘗試提出MiLoRA方法的細(xì)節(jié)。MiLoRA的核心是提示感知路由機(jī)制。在該機(jī)制下，LoRA router將輸入提示的隱藏狀態(tài)作為輸入，并輸出當(dāng)前層的激活LoRA專(zhuān)家。與之前的工作不同，本文的工作：（a）僅在輸入提示首次通過(guò)Transformer骨干網(wǎng)絡(luò)并在生成第一個(gè)新標(biāo)記之前計(jì)算LoRA router一次。 router的激活決策將在后續(xù)生成步驟中重復(fù)使用。（b）在Transformer的層級(jí)上確定激活的LoRA專(zhuān)家，選擇哪個(gè)Transformer模塊由其對(duì)應(yīng)的LoRA模塊進(jìn)行修改。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

可學(xué)習(xí)激活函數(shù)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

實(shí)驗(yàn)

數(shù)據(jù)集和評(píng)估指標(biāo)

將本文的方法與基線進(jìn)行比較，涉及一系列具有挑戰(zhàn)性的任務(wù)：（a）五個(gè)基準(zhǔn)常識(shí)問(wèn)答任務(wù)，ARC-e 和 ARC-c，OBQA，PIQA，BoolQ。（b）兩個(gè)數(shù)學(xué)推理任務(wù)，AQuA和 GSM8k。利用 Hu et al.（2023）提供的鏈?zhǔn)剿季S（COT）推理來(lái)訓(xùn)練這些數(shù)學(xué)任務(wù)的樣本。所有推理都是通過(guò)zero-shot CoT在 GPT-3.5 上生成的，但沒(méi)有經(jīng)過(guò)任何錯(cuò)誤過(guò)濾。（c）MT-Bench，MMLU，和 BBH。由于這些任務(wù)不提供訓(xùn)練數(shù)據(jù)，利用 Alpaca數(shù)據(jù)集進(jìn)行指令調(diào)優(yōu)。詳細(xì)的統(tǒng)計(jì)數(shù)據(jù)和評(píng)估指標(biāo)可以在附錄 B 中找到。

基線

將 MiLoRA 框架與當(dāng)前的 SOTA PEFT 基線方法進(jìn)行比較。

LoRA 及其變體： 考慮以下 LoRA 變體作為基線：（a）原始 LoRA；（b）AdaLoRA，它在不同的 Transformer 模塊之間自適應(yīng)調(diào)整 LoRA 參數(shù)；（c）MOELoRA，它將每個(gè) LoRA 模塊視為單秩 LoRA 專(zhuān)家的混合；（d）DoRA，這是 LoRA 的最新變體之一，它將預(yù)訓(xùn)練權(quán)重分解為兩個(gè)組件：幅度和方向，用于微調(diào)，特別采用 LoRA 進(jìn)行方向更新。

其他 PEFT 方法： 我們還考慮了最新的 PEFT 方法：（a）He et al.（2021）提出的 Parallel-Adapter；（b）Learned-Adapter；（c）P-tuning v2；（d）IAPT；（e）BitFit；（f）(IA)3，它將可學(xué)習(xí)向量乘到 Transformer 層中不同模塊的隱藏狀態(tài)上。

(g) SSP，這是一個(gè)結(jié)合不同PEFT方法的代表性工作，包括LoRA和BitFit。基線使用他們的開(kāi)源代碼進(jìn)行實(shí)現(xiàn)。我們僅調(diào)整與可調(diào)參數(shù)數(shù)量相關(guān)的超參數(shù)，以公平比較基線方法和我們的MiLoRA方法。

實(shí)驗(yàn)設(shè)置

計(jì)算基礎(chǔ)設(shè)施 在NVIDIA A40（48GB）GPU上運(yùn)行所有實(shí)驗(yàn)。

預(yù)訓(xùn)練骨干模型 主要實(shí)驗(yàn)使用最新開(kāi)源的LLM，LlaMA-2 7B作為預(yù)訓(xùn)練骨干模型。在消融研究中，我們還將使用最近發(fā)布的LlaMA-2 13B和Gemma 2B。

預(yù)測(cè)頭 在微調(diào)LlaMA-2 7B時(shí)，我們僅考慮監(jiān)督微調(diào)（SFT）設(shè)置。在接收到提示或指令后，所有預(yù)測(cè)均使用語(yǔ)言建模頭（LM head）生成。沒(méi)有安裝額外的預(yù)測(cè)頭來(lái)進(jìn)行分類(lèi)或數(shù)值預(yù)測(cè)。在推理期間的解碼中，我們使用束搜索，束大小為3。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

可重復(fù)性 在五個(gè)不同的隨機(jī)種子下運(yùn)行每個(gè)任務(wù)，并報(bào)告每個(gè)任務(wù)在測(cè)試集上的中位性能。

主要結(jié)果

單任務(wù)設(shè)置。在這個(gè)設(shè)置中，我們通過(guò)采用這些方法對(duì)單個(gè)任務(wù)進(jìn)行微調(diào)，將MiLoRA與基線PEFT方法進(jìn)行比較。五個(gè)常識(shí)推理任務(wù)和兩個(gè)數(shù)學(xué)推理任務(wù)的實(shí)驗(yàn)結(jié)果見(jiàn)下表1。我們?cè)诘诙兄姓故玖丝烧{(diào)參數(shù)的數(shù)量，在第三列中展示了平均激活參數(shù)。表1顯示，我們的MiLoRA方法在所有七個(gè)任務(wù)中均優(yōu)于基線方法，具有可比的可調(diào)參數(shù)和更少的激活參數(shù)。特別是，MiLoRA在可比參數(shù)下超越了之前的SOTA LoRA風(fēng)格基線，如AdaLoRA、DoRA和MOELoRA。這些結(jié)果表明，我們的方法在大語(yǔ)言模型的下游任務(wù)適應(yīng)方面表現(xiàn)良好。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

多任務(wù)設(shè)置。下表2展示了在多任務(wù)學(xué)習(xí)中，使用LLaMA2-7B的LoRA、DoRA、MOELORA和MiLoRA的結(jié)果。與表1中的單任務(wù)設(shè)置相比，在多任務(wù)學(xué)習(xí)期間，我們混合了來(lái)自ARC、BoolQ、OBQA和PIQA的訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練模型，然后進(jìn)行單獨(dú)評(píng)估以調(diào)查每種方法的泛化能力。結(jié)果表明：(a) 與單任務(wù)學(xué)習(xí)相比，LoRA和DoRA在多任務(wù)學(xué)習(xí)中平均準(zhǔn)確率有所下降（LoRA：-2.0%，DoRA：-2.25%）。與此同時(shí)，MOELORA和MiLoRA幾乎保持相同的平均準(zhǔn)確率。MiLoRA在平均得分方面幾乎沒(méi)有性能損失。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

通用指令調(diào)優(yōu)的結(jié)果。在使用我們的MiLoRA方法或MOELoRA方法對(duì)LLaMA-2 7B模型進(jìn)行在Alpaca 數(shù)據(jù)集上的微調(diào)后，我們利用了具有挑戰(zhàn)性的基準(zhǔn)測(cè)試，如MT-Bench、MMLU和BBH進(jìn)行評(píng)估。我們報(bào)告了在MT-Bench上的平均GPT-4得分（gpt4-score）。下表3展示了結(jié)果。與之前的實(shí)驗(yàn)（表1和表2）一致，我們的MiLoRA方法在這三個(gè)基準(zhǔn)測(cè)試中優(yōu)于MOELoRA方法，證明了MiLoRA在提升大語(yǔ)言模型指令調(diào)優(yōu)質(zhì)量方面的優(yōu)越性。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

消融研究與進(jìn)一步分析

推理效率分析

為了展示MiLoRA方法的推理效率，現(xiàn)在比較MiLoRA、DoRA和MOELoRA在不同beam size下進(jìn)行beam search時(shí)的GPU內(nèi)存和解碼速度。在這個(gè)實(shí)驗(yàn)中，LoRA參數(shù)沒(méi)有合并到主干中，以模擬單一大語(yǔ)言模型的多租戶(hù)設(shè)置。我們提供了兩個(gè)用于衡量效率的指標(biāo)：(a) 峰值內(nèi)存成本（以MiB為單位）。(b) 每秒生成的tokens數(shù)量（tps）。結(jié)果如表4所示。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

從表4可以看出，在beam size為1和3的情況下，MiLoRA方法的內(nèi)存成本與MOELoRA和DoRA相當(dāng)。然而，其在tps方面的生成速度顯著更高。對(duì)于beam size為1，MiLoRA比MOELoRA快21.7%，比DoRA快19.7%。

在beam size為3的情況下，MiLoRA比MOELoRA快17.9%，比DoRA快13.2%。MiLoRA的速度優(yōu)勢(shì)來(lái)自以下因素：(a) 我們的方法僅在輸入提示首次經(jīng)過(guò)大語(yǔ)言模型（LLM）并在生成第一個(gè)新token之前的每個(gè)Transformer層調(diào)用LoRA router。相比之下，MOELoRA和幾乎所有現(xiàn)有的基于MOE的LoRA變體在生成每個(gè)新token時(shí)需要在每層調(diào)用多個(gè) router。(b) 我們的方法顯著減少了在每個(gè)解碼步驟中激活的LoRA模塊數(shù)量，使得生成新token更加高效。

激活的LoRA專(zhuān)家的分布

我們現(xiàn)在比較MT-Bench、BoolQ和PIQA任務(wù)中所有Transformer層上的LoRA專(zhuān)家分布，如圖2所示。我們可以觀察到：(a) 不同的Transformer層通過(guò)其對(duì)應(yīng)的 router選擇激活不同的LoRA專(zhuān)家，且單個(gè)LoRA專(zhuān)家的最大比例不到30%。結(jié)果是直觀的，因?yàn)椴煌疃鹊腡ransformer層表示不同的知識(shí)，需要不同的LoRA專(zhuān)家來(lái)表達(dá)。(b) 不同任務(wù)上的LoRA分布是不同的。例如，在MT-Bench和BoolQ任務(wù)中，少數(shù)層激活LoRA Q或LoRA K，而在PIQA任務(wù)中，這兩個(gè)LoRA專(zhuān)家被頻繁選擇。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

MiLoRA框架的消融研究

我們現(xiàn)在考慮以下MiLoRA的變體：(a) MiLoRA-1將自注意力池化替換為平均池化。(b) MiLoRA-2將自注意力池化替換為最后一個(gè)token池化。(c) MiLoRA-3為L(zhǎng)oRA router使用GeLU激活函數(shù)。(d) MiLoRA-4在前16層的LoRA router中使用ReLU，在更深的16層中使用GeLU。(e) MiLoRA-5在前16層的LoRA router中使用GeLU，在更深的16層中使用ReLU。BoolQ、PIQA和MMLU任務(wù)的實(shí)驗(yàn)結(jié)果如表5所示。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

結(jié)果顯示，MiLoRA在默認(rèn)設(shè)置下（如表1所示）優(yōu)于五個(gè)變體。此外，(a) 將MiLoRA-1和MiLoRA-2與MiLoRA進(jìn)行比較表明，自注意力池化器提供了高質(zhì)量的信息聚合，從而實(shí)現(xiàn)了正確的LoRA專(zhuān)家選擇。(b) 將MiLoRA-5與MiLoRA-3和MiLoRA-4進(jìn)行比較表明，為不同層的 router使用不同的激活函數(shù)可以提升性能。(c) 然而，MiLoRA優(yōu)于MiLoRA-3、MiLoRA-4和MiLoRA-5，表明可學(xué)習(xí)的激活函數(shù)可以為每個(gè)LoRA router適配適當(dāng)?shù)募せ詈瘮?shù)，并增強(qiáng)下游適應(yīng)能力。

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

你的LoRA需要更新了！科大訊飛等提出MiLoRA：新穎且高效的LoRA變體-AI.x社區(qū)

關(guān)于預(yù)訓(xùn)練骨干網(wǎng)絡(luò)的消融實(shí)驗(yàn)

我們的主要實(shí)驗(yàn)是在LlaMA-2 7B模型上進(jìn)行的。為了展示我們方法的廣泛適用性，現(xiàn)在在LlaMA-2 13B和Gemma 2B上進(jìn)行實(shí)驗(yàn)。結(jié)果在附錄E的表7中報(bào)告可以看到，我們的MiLoRA方法在這兩個(gè)骨干網(wǎng)絡(luò)上也能優(yōu)于基線方法。

結(jié)論

這項(xiàng)工作介紹了LoRA混合（MiLoRA）方法，一種用于大語(yǔ)言模型參數(shù)高效微調(diào)的新方法。與以前關(guān)于MOE風(fēng)格LoRA方法的文獻(xiàn)不同，MiLoRA：（a）在Transformer層級(jí)激活LoRA專(zhuān)家，決定激活哪個(gè)Transformer模塊的LoRA。（b）激活哪個(gè)LoRA專(zhuān)家的決策依賴(lài)于輸入提示。（c）對(duì)于給定的提示，LoRA router只調(diào)用一次。后續(xù)的tokens生成步驟重用 router的決策。為了提高我們框架的下游性能，建議在微調(diào)期間為不同深度的LoRA router學(xué)習(xí)不同的激活函數(shù)。我們的方法易于實(shí)現(xiàn)且現(xiàn)成可用。在各種任務(wù)上的實(shí)驗(yàn)表明，MiLoRA方法在推理效率的同時(shí)優(yōu)于基線方法。

限制本文證明了提出的方法可以提高參數(shù)高效微調(diào)在多種任務(wù)和不同預(yù)訓(xùn)練模型（如LlaMA-2 7B、LlaMA-2 13B、Gemma 2B）上的性能。然而，我們也承認(rèn)以下局限性：（a）由于計(jì)算資源有限，我們沒(méi)有對(duì)更大規(guī)模的開(kāi)源大語(yǔ)言模型（如LlaMA-2 70B）進(jìn)行實(shí)驗(yàn)。（b）自然語(yǔ)言處理中的其他任務(wù)，如信息抽取，也未被考慮。不過(guò)，我們的框架可以輕松轉(zhuǎn)移到其他主干架構(gòu)和不同類(lèi)型的任務(wù)上。研究我們的方法是否在其他大規(guī)模主干模型和其他類(lèi)型的任務(wù)上仍然具有優(yōu)越性將會(huì)很有趣。將在未來(lái)的工作中探索這一點(diǎn)。

本文轉(zhuǎn)自AI生成未來(lái) ，作者：AI生成未來(lái)

原文鏈接:??https://mp.weixin.qq.com/s/-10BeAOFUzsN9JkXfmQegQ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型推理框架RTP-LLM對(duì)LoRA的支持

wx5bbef785639a1 ? 6324瀏覽 ? 0回復(fù)
配置不同的學(xué)習(xí)率，LoRA還能再漲一點(diǎn)？

laokugonggao ? 5915瀏覽 ? 0回復(fù)
今日arXiv最熱大模型論文：超越LoRA，北京大學(xué)提出預(yù)訓(xùn)練模型非梯度優(yōu)化法

pangguiyu ? 4458瀏覽 ? 0回復(fù)
大模型微調(diào)新范式：當(dāng)LoRA遇見(jiàn)MoE

zhangyannni ? 5813瀏覽 ? 0回復(fù)
文生視頻時(shí)代已到，百度、訊飛、字節(jié)誰(shuí)能率先做出“國(guó)產(chǎn)Sora”？

liutao988 ? 3788瀏覽 ? 0回復(fù)
改變LoRA的初始化方式，北大新方法PiSSA顯著提升微調(diào)效果

輕薄滴假象 ? 3913瀏覽 ? 0回復(fù)
單GPU實(shí)現(xiàn)LLM多LoRA微調(diào)

angel ? 6798瀏覽 ? 0回復(fù)
LLM高效微調(diào)詳解-從Adpter、PrefixTuning到LoRA

angel ? 6203瀏覽 ? 0回復(fù)
LLM微調(diào)技術(shù)LoRA圖解

51CTO內(nèi)容精選 ? 4690瀏覽 ? 0回復(fù)
全面對(duì)標(biāo)GPT-4 Turbo，訊飛星火V4.0 重磅發(fā)布！

51CTO技術(shù)棧 ? 3640瀏覽 ? 0回復(fù)
如何拯救LoRA初始化？LoRA-GA：性能顯著提升+收斂速度更快！

angel ? 4380瀏覽 ? 0回復(fù)
利用多Lora節(jié)省大模型部署成本

卓勝微wjp ? 4373瀏覽 ? 0回復(fù)
數(shù)據(jù)高效和計(jì)算高效全都要！中科大&微信等提出多模態(tài)大語(yǔ)言模型EE-MLLM

angel ? 4127瀏覽 ? 0回復(fù)
中科大&科大訊飛重磅開(kāi)源OpenMusic：音樂(lè)生成更高質(zhì)量，更有樂(lè)感

angel ? 5049瀏覽 ? 0回復(fù)
大模型面經(jīng)——LoRA最全總結(jié)

shizhi02 ? 5107瀏覽 ? 0回復(fù)
優(yōu)雅談大模型：一文讀懂LoRA/DoRA/MoRA

魯班模錘1 ? 6152瀏覽 ? 0回復(fù)
參數(shù)高效微調(diào)-Prefix Tuning、Adapter Tuning、LoRA

大模型自然語(yǔ)言處理 ? 5555瀏覽 ? 0回復(fù)
破解LoRA融合密碼！無(wú)需訓(xùn)練奪得SOTA！K-LoRA巧用Top-K策略，讓風(fēng)格與主體完美融合

angel ? 4313瀏覽 ? 0回復(fù)
一文讀遍 LoRA 家族：大語(yǔ)言模型高效訓(xùn)練的"秘密武器"

鴻煊的學(xué)習(xí)筆記 ? 5158瀏覽 ? 0回復(fù)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

多領(lǐng)域SOTA誕生！Vid2World：打通視頻擴(kuò)散到世界模型的“任督二脈”｜清華、重大 2025-05-23 10:17:32發(fā)布
多模態(tài)終極大一統(tǒng)！字節(jié)開(kāi)源BAGEL爆火：圖文生成理解雙冠王，竟能預(yù)測(cè)未來(lái)畫(huà)面？ 2025-05-22 09:33:05發(fā)布

熱門(mén)推薦

用 Cognee 構(gòu)建端到端知識(shí)圖譜，實(shí)現(xiàn)當(dāng)前效果最好的AI Agent記憶層 0回復(fù)

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復(fù)

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態(tài)輕量化邊界 0回復(fù)

2025 年最強(qiáng) OCR 大比拼：從識(shí)別文本到文檔智能，誰(shuí)才是終極解法？ 0回復(fù)

馬斯克新模型屠榜，包攬前二！馬斯克：已經(jīng)沒(méi)有真正能考AI的測(cè)試題了，終極測(cè)試是現(xiàn)實(shí)世界 0回復(fù)

上一篇：谷歌&Mistral AI發(fā)布TIPS：具有空間意識(shí)的文本-圖像預(yù)訓(xùn)練（適配各種計(jì)算機(jī)視覺(jué)任務(wù)）

下一篇：首次超越擴(kuò)散模型和非自回歸Transformer模型！字節(jié)開(kāi)源RAR：自回歸生成最新SOTA！

社區(qū)精華內(nèi)容

目錄

国产免费一区二区三区四区五区| 中日韩av在线播放| 在线观看xxx| 一本色道久久综合一区| 亚洲欧美在线一区二区| 91精品无人成人www| 老司机免费在线视频| 国产.精品.日韩.另类.中文.在线.播放 | 日韩一区二区三区不卡视频| 在线黄色网页| 2021国产精品久久精品| 国产视频999| 黄色小视频在线免费看| 国产免费av一区二区三区| 91精品国产综合久久福利软件 | 久久香蕉av| 久久综合国产精品| 91中文在线视频| 每日在线观看av| 成人一级片网站| www在线免费观看| 成人丝袜视频网| 国产精品第七影院| 国产性猛交普通话对白| 欧洲杯足球赛直播| 亚洲国产成人精品久久| 日本三级黄色网址| 日本三级一区| 亚洲一区在线免费观看| 亚洲不卡1区| 性生交生活影碟片| 久久国产生活片100| 96精品视频在线| 麻豆视频在线免费看| 国内黄色精品| 日韩av在线免费观看| 天美一区二区三区| 成人国产精品一区二区免费麻豆| 欧美日韩国产色| 大地资源网在线观看免费官网| 六十路在线观看| 91亚洲资源网| 国产欧美一区二区三区另类精品| 一级做a爱片久久毛片| 可以免费看不卡的av网站| 欧美精品久久久久久久| 日韩视频中文字幕在线观看| 不卡在线一区二区| 亚洲欧美综合图区| 右手影院亚洲欧美| 日韩精品免费一区二区三区竹菊| 亚洲成人网在线| 高清中文字幕mv的电影| 亚洲综合色婷婷在线观看| 91精品黄色片免费大全| 日本高清一区二区视频| 日韩免费在线电影| 欧美福利视频导航| www.污网站| 国产精品亚洲欧美一级在线| 欧美日韩国产美女| 日本黄大片一区二区三区| av成人在线播放| 欧美天堂一区二区三区| 美女黄色片视频| 国产极品一区| 欧美精品99久久久**| 亚洲免费黄色录像| 高清精品久久| 日韩视频免费直播| yjizz视频| 日韩av资源网| 亚洲区在线播放| 欧美日韩生活片| 91精品福利| 欧美日韩国产成人在线| 国产乱码久久久久久| 一本久道久久久| 国产成人精品日本亚洲| 中文字幕激情视频| 国产在线视频精品一区| 91免费版网站在线观看| 亚洲爆乳无码一区二区三区| av亚洲产国偷v产偷v自拍| 欧美韩国日本精品一区二区三区| 国产一级二级三级在线观看| 国产精品久久久久影院亚瑟| 日本福利视频网站| 欧美裸体视频| 欧美色电影在线| 美女又黄又免费的视频| 欧美一区自拍| 中文字幕日韩在线视频| 青娱乐国产在线视频| 国产日韩欧美三级| 国产一区二区丝袜| 肥臀熟女一区二区三区| 久久久99精品久久| 国产日韩第一页| 国产精选在线| 欧美人与性动xxxx| 星空大象在线观看免费播放| av在线不卡顿| 韩国一区二区电影| 自拍偷拍精品视频| 国产精品影视在线| 日韩av影视| 麻豆av在线免费看| 欧美日韩一区二区免费在线观看 | 高清电影在线免费观看| 日本精品视频一区二区三区| 99精品视频国产| 午夜精品福利影院| 久久精品视频免费播放| 少妇一级淫片免费放中国| 久久精品99久久久| 欧美激情导航| 免费在线看污片| 精品视频在线看| 中文字幕在线免费看线人| 久久久国产精品| 国产精品igao视频| 日韩中文字幕观看| 一区二区三区四区在线| 污污的网站18| 岳的好大精品一区二区三区| 欧美高清视频在线播放| 最好看的日本字幕mv视频大全| 成人动漫一区二区三区| 亚洲欧洲免费无码| 女生影院久久| 日韩精品在线第一页| 欧美交换国产一区内射| 丝袜诱惑制服诱惑色一区在线观看| 99c视频在线| 免费av网站在线观看| 色婷婷久久99综合精品jk白丝| 黑人玩弄人妻一区二区三区| 91成人影院| 成人免费大片黄在线播放| 国产小视频在线播放| 欧美日韩综合视频网址| 色哟哟视频在线| 国语精品一区| 99国产视频在线| av在线影院| 欧美一区在线视频| 欧美风情第一页| 久久国产精品区| 亚洲一卡二卡三卡| 精品亚洲a∨| 少妇av一区二区三区| 成人免费一区二区三区| 欧美激情一区不卡| 中文字幕一区二区三区四区在线视频| 爽爽窝窝午夜精品一区二区| 97免费中文视频在线观看| 日韩在线视频观看免费| 欧美日韩国产专区| 性色av蜜臀av色欲av| 亚洲欧美日韩国产一区二区| 久久99精品国产99久久| 麻豆国产在线| 亚洲欧美激情一区| 波多野结衣电车| 国产精品毛片无遮挡高清| 亚洲免费一级视频| 久久精品青草| 成人情视频高清免费观看电影| 免费看电影在线| 日韩av一区二区在线| 日本黄色一级视频| 国产精品午夜春色av| 日本黄色福利视频| 雨宫琴音一区二区三区| 成人免费视频观看视频| 黄色污网站在线观看| 亚洲精品视频免费| 久久这里只有精品9| 中文字幕中文字幕中文字幕亚洲无线| 亚洲综合在线一区二区| 狠狠久久婷婷| 中文字幕日产av| 美女精品网站| 一本色道久久99精品综合| 精品中文字幕一区二区三区四区| 欧美激情日韩图片| 日本精品专区| 欧美日韩免费高清一区色橹橹| 超碰手机在线观看| www..com久久爱| 五月婷婷激情久久| 亚洲夜夜综合| 日韩精品每日更新| 欧美久久在线| 先锋影音一区二区| 91国产美女在线观看| av在线电影播放| 精品噜噜噜噜久久久久久久久试看| 五月天婷婷综合网| 国产精品久久影院| 中文字幕在线永久| 久久99精品国产.久久久久久| www.av91| 成人在线国产| 国产伦理久久久| 五月天色综合| 热门国产精品亚洲第一区在线| 日本在线免费网| 亚洲精品av在线播放| 在线免费观看视频网站| 午夜精品久久久久久久久久久| 美国一级黄色录像| 97se狠狠狠综合亚洲狠狠| 久久成年人网站| 免费在线播放第一区高清av| 穿情趣内衣被c到高潮视频| 久久99国内| 黑人中文字幕一区二区三区| 一区二区三区无毛| 日韩免费在线播放| 成全电影大全在线观看| 日韩中文理论片| 精品推荐蜜桃传媒| 亚洲国产精品成人一区二区| 国产又粗又猛视频免费| 欧美性猛交xxxx免费看漫画| 真实国产乱子伦对白在线| 国产精品麻豆久久久| 免费污网站在线观看| 99视频一区二区| 丰满岳乱妇一区二区 | 综合久久一区二区三区| 亚洲av熟女国产一区二区性色| 91玉足脚交白嫩脚丫在线播放| 色哟哟免费视频| 韩国成人精品a∨在线观看| 校园春色亚洲色图| 美女黄网久久| 欧在线一二三四区| 亚洲欧美日韩视频二区| 国产精品久久..4399| 国产综合网站| 青青在线视频免费观看| 欧美一区二区三区免费看| 影音欧美亚洲| 婷婷亚洲五月色综合| 亚洲欧洲精品一区二区| 91亚洲人成网污www| 天天好比中文综合网| 成人直播大秀| 中日韩在线视频| 久久久久亚洲| 懂色av粉嫩av蜜臀av| 一区二区中文字| 国产视频在线观看网站| 伊人久久亚洲热| 成人一区二区免费视频| 一区二区三区福利| www.亚洲天堂网| 久久精品五月| 性欧美极品xxxx欧美一区二区| 三级一区在线视频先锋| 国产精品美女在线播放| 在线看片不卡| 可以在线看黄的网站| 激情视频一区| 欧美国产日韩激情| 亚洲无线视频| 97av视频在线观看| 欧美综合国产| 国产性生交xxxxx免费| 精品一区二区影视| 五月天国产视频| 美女视频黄久久| 一本岛在线视频| 久久精品国产久精国产爱| 乌克兰美女av| 国产福利视频一区二区三区| 香蕉视频在线观看黄| 成人毛片老司机大片| 加勒比综合在线| 中文字幕免费不卡| 男人天堂资源网| 亚洲国产精品一区二区久久| 日韩精品一区二区在线播放| 精品女厕一区二区三区| 中文字幕有码视频| 51精品国自产在线| 性一交一乱一乱一视频| 亚洲天堂免费在线| 午夜在线观看视频| 欧美精品一区在线播放| 中文在线免费视频| 国产精品久久一区主播| 欧美一级做a| 精品日本一区二区三区在线观看| 台湾色综合娱乐中文网| 日本一区二区三区四区在线观看| 中文字幕av亚洲精品一部二部| 久久精品无码中文字幕| 国产欧美日韩一级| 青娱乐精品在线| 99久久精品国产精品久久| 熟女俱乐部一区二区| 一区二区在线免费观看| 97久久久久久久| 欧美乱熟臀69xxxxxx| 四虎影视在线观看2413| 色偷偷888欧美精品久久久| 亚洲婷婷噜噜| 国产精品日韩在线观看| 欧美日韩黄网站| 欧美精品v日韩精品v国产精品| 成人女性视频| 欧美中日韩在线| 激情综合网天天干| 免费无码一区二区三区| 中文字幕一区二区三区不卡在线| 国产三级精品三级在线观看| 欧美一级欧美三级| 欧美一区二区视频| 午夜精品www| 99精品视频在线免费播放| 久久99国产精品99久久| 好吊日精品视频| 久久久久久久久久久久91| 国产精品一二三在| 天天色天天综合| 欧美性猛交xxxx乱大交3| www.97av| 视频直播国产精品| 国产乱码午夜在线视频| 动漫一区二区在线| 久久中文视频| 色综合av综合无码综合网站| 91香蕉视频mp4| 欧美另类视频在线观看| 日韩欧美在线字幕| 五月天婷婷社区| 欧美黑人一级爽快片淫片高清| 国产一区二区三区免费在线| 先锋影音日韩| 亚洲自拍另类| 大又大又粗又硬又爽少妇毛片| 亚洲一区在线电影| 国产露脸国语对白在线| 久久精品视频中文字幕| 亚洲伦理影院| 五月天色一区| 日本vs亚洲vs韩国一区三区二区| 91av在线免费| 亚洲一区在线观看网站| www.亚洲黄色| 欧美成人免费全部观看天天性色| 日韩成人一区| 小说区图片区图片区另类灬| 日韩高清在线观看| 日本xxx在线播放| 精品国产成人av| 国模私拍视频在线| 91精品国产精品| 久久aimee| 六月丁香婷婷在线| 久久精品视频一区二区三区| 中文字幕亚洲精品在线| 亚洲欧洲日本专区| 日韩在线短视频| 超碰免费在线公开| 久久99精品久久久久久久久久久久 | 91插插插插插插| 7777精品伊人久久久大香线蕉最新版 | lutube成人福利在线观看| 国产精品va在线播放| 99久久激情| 国产精品嫩草影视| 午夜精品福利久久久| 色视频在线观看免费| 欧美亚洲伦理www| 色综合天天爱| 亚洲三级在线观看视频| 玉足女爽爽91| 蜜桃视频久久一区免费观看入口| 久久久久久97| 国产精品日韩精品中文字幕| 日韩无套无码精品| 亚洲人成在线播放网站岛国| 精品美女www爽爽爽视频| 欧美成人一区二区三区电影| 欧美日韩一区二区三区不卡视频| 成人综合视频在线| 久久久久久黄色| 中文字幕一区二区人妻| 久久精品最新地址| 日韩欧美四区| 久久婷婷综合色| 自拍av一区二区三区| 好吊视频一区二区三区| **欧美日韩vr在线| 久久久久久美女精品|