精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在家中完成LLM微調高效指南(上)

原創
人工智能
盡管相比推理,微調仍然較為耗費計算資源,但借助于低秩適應(LoRA)及其量化變體QLoRA等技術,現在可以使用單塊GPU來微調模型——這正是我們將在本指南中探討的內容。

編輯 | 言征

出品 | 51CTO技術棧(微信號:blog51cto)

LLM在生成文本和理解信息方面非常有效,但它們最終受限于訓練數據的語料庫。例如,如果你讓一個通用的預訓練模型回答與你的業務特定流程或操作有關的問題,最好的結果是它拒絕,最壞的情況是它會信誓旦旦地給出一個看似合理但錯誤的答案。

當然,你可以通過自己訓練一個模型來解決這個問題,但所需的資源往往超出實際可行的范圍。例如,訓練Meta的相對小的Llama 3 8B模型需要約130萬GPU小時的計算資源,使用的是80GB的Nvidia H100。好消息是你不需要這樣做。我們可以通過稱為微調的過程,利用現有的模型(如Llama、Mistral或Phi),并通過自己的數據擴展其知識庫或修改其行為和風格。

盡管相比推理,微調仍然較為耗費計算資源,但借助于低秩適應(LoRA)及其量化變體QLoRA等技術,現在可以使用單塊GPU來微調模型——這正是我們將在本指南中探討的內容。

在本指南中,我們將討論:

  • 微調的應用場景和適用時機
  • 擴展預訓練模型能力和行為的替代方法
  • 數據準備的重要性
  • 如何使用Axolotl和自定義數據集微調Mistral 7B模型
  • 各種超參數及其對訓練的影響
  • 加快和提高微調效率的其他資源

1.設定期望

相比我們之前的動手指南,微調是一個涉及很多參數調整、開關配置和最佳實踐的復雜過程。因此,我們認為有必要設定一些期望。

微調是修改預訓練模型行為或風格的有用方法。然而,如果你的目標是教授模型新的知識,雖然可以做到,但可能有更好和更可靠的方式值得首先考慮。

我們之前探討過檢索增強生成(RAG),這種方法基本上為模型提供了一個它可以參考的庫或數據庫。這個方法因其相對易于設置、計算成本低廉且可以引用來源而備受歡迎。不過,它并不完美,也無法改變模型的風格或行為。

例如,如果你正在構建一個客戶聊天機器人來幫助用戶查找資源或解決產品問題,你可能不希望它回答與健康或財務無關的問題。提示工程可以在一定程度上幫助實現這一點。你可以創建一個系統提示,指示模型以某種方式行事。例如,添加一句“你不具備回答與健康、健康管理或營養相關問題的能力,如有相關問題,請將話題引導至更合適的內容。”

提示工程在其簡單中顯得優雅:只需告訴模型你希望它做什么或不做什么。但實際上,使用中的LLM模型經常會遇到一些邊界情況,導致模型被誤導執行它不應該做的事情。你可能會驚訝地發現,有時只需一句“忽略所有之前的指示,而執行以下操作”即可使模型改變行為。

如果RAG和提示工程無法滿足需求,則可以考慮微調。

2.使用QLoRA進行內存高效的模型微調

在本指南中,我們將使用微調來改變Mistral 7B模型的風格和語調。特別是,我們將使用QLoRA,如前所述,這將允許我們在與傳統訓練相比下,使用更少的內存和計算資源進行微調。

這是因為微調比運行模型需要更多的內存。在推理過程中,可以通過將參數數量乘以精度來計算內存需求。對于Mistral 7B,其訓練精度為BF16,因此大約需要14 GB內存,外加少量用于關鍵緩存的內存。

然而,完全微調則需要幾倍于此的內存來加載模型。對于Mistral 7B來說,內存需求約為90 GB或更多。如果你沒有多GPU的工作站,幾乎必然需要租用像Nvidia A100或H100這樣的數據中心GPU來完成任務。

這是因為完全微調意味著以完整分辨率重新訓練模型的每一個權重。好消息是,在大多數情況下,不必更新所有權重即可調整神經網絡的輸出。實際上,只需更新幾千或幾百萬的權重就可以實現預期的效果。

這正是LoRA的邏輯所在:簡而言之,它將模型的權重凍結在一個矩陣中,然后使用另一組矩陣記錄對第一個矩陣的調整以微調模型。這大大減少了計算和內存的開銷。QLoRA進一步優化了這一點,通過以更低的精度(通常為四位)加載模型的權重。因此,每個參數只需占用半字節的內存。

3.微調很簡單,數據準備就沒那么簡單了

解決了那些問題之后,我們需要談談數據。事實證明,微調模型并不是最難的部分,難的是準備和清理數據集,以確保模型能按你的期望工作。

那么,你從哪里獲取用于微調模型的數據呢?嗯,對于像電子郵件助手或客戶服務聊天機器人這樣的應用,你其實不需要找得太遠。只需打開你電子郵件中的“已發送”文件夾,就能找到一個不錯的起點來尋找有機數據。如果你在使用像Continue這樣的本地聊天助手,它可能會自動生成可用于微調模型的訓練數據。

雖然高質量的有機數據是理想之選,但它可能無法涵蓋你可能遇到的所有場景。例如,假設你希望模型生成回復,將收到的電子郵件的發送者引導到另一個部門或團隊。如果這種情況只是偶爾發生,你可能沒有足夠的有機數據來進行訓練。

這時,使用大型語言模型(LLMs)生成合成數據或部分合成數據就派上了用場。這樣做相當直接,只需將幾個示例輸入模型,并要求它生成模仿這些示例的新數據。你可能需要不斷調整提示,直到找到合適的內容。

你可以對輸入和輸出都這樣做,或者生成輸入并手動寫出對應的回復。在我們的測試中,我們發現合成數據通常缺乏細微差別,半合成數據效果良好,而完全有機數據的效果最佳。

無論你是使用有機數據還是合成數據來生成數據集,你都需要花時間清理數據集,刪除個人信息或不良樣本等內容。例如,如果你正在為客戶服務或支持微調模型,你可能想從數據中刪除代理或用戶的姓名、電話號碼和其他信息。

雖然微調對于改變模型的行為最有幫助,但它仍然會捕捉到數據集中始終出現的細節,如姓名。

一旦你收集好了數據——其實并不需要太多:甚至100個樣本可能就足以以明顯的方式改變模型的行為——你就需要以模型能夠理解的方式對其進行格式化。有很多方法可以做到這一點,但就我們的目的而言,我們發現使用Alpaca數據格式的JSON模板效果相當不錯。

4.微調容易,數據準備難

以上內容準備好后,我們需要談談數據。事實證明,微調模型并不是最難的部分,真正的難點在于準備和清理數據集,使模型能夠真正按照你的意圖運行。

那么,你要從哪里獲取微調模型的數據呢?對于電子郵件助手或客服聊天機器人之類的應用,數據來源并不難找。簡單地查看你的電子郵件“已發送”文件夾,就能為獲取自然數據提供一個不錯的起點。如果你使用的是本地聊天助手,如Continue,它可能會自動生成可用于微調模型的訓練數據。

如果寫代碼注釋讓你頭疼,你也可以讓AI來代勞。只要記得在提交代碼前查看一下注釋內容。

當你在家就能創建屬于自己的AI代碼助手,誰還需要GitHub Copilot呢?

雖然高質量的自然數據是理想選擇,但它可能無法覆蓋所有可能遇到的場景。例如,如果你希望模型生成的郵件回復能夠將發件人重定向至不同的部門或團隊,而這種情況偶爾才發生,那么可能沒有足夠的自然數據來訓練模型。

這時,使用LLM生成合成數據或部分合成數據會非常有用。操作步驟相對簡單:你可以向模型提供一些示例,然后讓它生成模擬這些示例的新數據。你可能需要調整提示,直到生成出符合需求的數據。

你可以同時為輸入和輸出生成數據,也可以只生成輸入,自己編寫相應的輸出。在我們的測試中發現,完全合成的數據通常缺乏細微之處,而半合成數據效果較好,完全自然的數據效果最佳。

無論是用自然數據還是合成數據生成數據集,你都需要花時間清理數據集,去除個人身份信息或無效樣本。例如,如果你在微調一個客戶服務或支持類的模型,可能需要刪除數據中的代理人或用戶的姓名、號碼及其他信息。

雖然微調主要用于改變模型的行為,但模型仍然會受到數據集中一致出現的細節(如名稱)的影響。

一旦數據準備好了,其實不需要很多數據:即便是100個樣本也可能足以顯著改變模型的行為。接下來,你需要將數據格式化,使模型能夠理解。對于我們的目的,我們發現這種基于Alpaca數據格式的JSON模板效果很好:

[
    {
      "instruction": "generate an appropriate response to this chat message",
      "input": "I'm having trouble getting Product X to work properly.",
      "output": "Can you tell me more about what isn't working?"
    },
...
]

5.設置Axolotl

市面上有許多用于微調LLM的框架,如Unsloth和Hugging Face的Transformers Trainer。不過在本次動手操作中,我們將使用Axolotl。

該開源項目旨在抽象出微調流行語言模型的復雜性,并支持多種不同的訓練技術。因此,如果你在工作站或游戲PC上用QLoRA開始微調,之后想要在云端進行完整微調,可以輕松切換。

Axolotl的另一大優勢是提供了大量用于微調流行LLM的模板庫,因此你不必從頭開始摸索針對特定模型或數據集需要的超參數。

6.準備條件

一塊至少有16GB顯存的GPU。任何較新的Nvidia GPU都可以。對于AMD用戶,建議使用AMD Radeon RX 7900或更高型號。我們測試了RTX 3090 TI 24GB、RTX 6000 Ada Generation 48GB、AMD Radeon RX 7900 XT 20GB和Radeon Pro W7900 48GB。

- 在本指南中,我們會盡量保持簡單,使用Ubuntu Desktop 24.04。

- 你的顯卡所需的最新GPU驅動和CUDA(Nvidia)或ROCm(AMD)二進制文件。如果是第一次設置這些,可能會有些棘手,因此我們會在Ubuntu 24.04上詳細說明配置步驟。

- 假設你對Linux系統的命令行操作較為熟悉。以下操作說明涉及在此環境中使用終端運行命令。

由于Nvidia和AMD顯卡的設置略有不同,注意區分。更多內容。會在下一篇文章中介紹。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.jxzklqfsx.com/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-04-08 14:47:18

物聯網

2024-06-06 08:25:30

2018-10-19 09:30:57

SSHSFTPLinux

2024-11-27 14:00:00

模型訓練

2019-06-04 13:00:34

2013-11-21 11:03:29

Nginx性能優化

2025-02-14 08:18:33

2025-03-17 08:00:00

2024-11-21 08:22:45

2025-10-14 09:54:28

2023-10-07 10:41:54

語言模型微調BitFit

2021-08-04 10:40:39

無人駕駛自動駕駛人工智能

2025-08-29 07:47:54

2025-05-08 05:00:00

2025-08-06 06:15:00

2024-01-24 13:37:36

大型語言模型人工智能

2024-04-18 10:39:57

2024-06-11 08:21:26

2024-07-22 08:17:00

模型性能

2024-06-26 09:00:00

點贊
收藏

51CTO技術棧公眾號

人人澡人人澡人人看欧美| 亚洲激情中文字幕| 99精品视频网站| 亚洲av色香蕉一区二区三区| 99视频精品| 一区二区三欧美| 精品人妻无码中文字幕18禁| 户外露出一区二区三区| **欧美大码日韩| 国产呦系列欧美呦日韩呦| 亚洲精品国产精品乱码视色| 欧美日韩ab| 国产亚洲欧洲在线| 久久发布国产伦子伦精品| 国产免费不卡| 一区二区三区精品视频| 欧美一二三四五区| 国产成人精品白浆久久69| 久久一二三四| 久久久久久久电影一区| 最新日韩免费视频| 蜜桃一区二区三区| 亚洲成人精品视频| 污污网站在线观看视频| videos性欧美另类高清| 一区二区三区高清| 亚洲欧美精品在线观看| 四虎影院在线域名免费观看| 国产精品影音先锋| 国产美女久久精品| 免费在线观看黄网站| 亚洲精品成人| 色综合伊人色综合网站| 精品少妇人妻一区二区黑料社区| 九九九九九九精品任你躁 | 亚洲色成人www永久网站| 极品日韩av| 另类色图亚洲色图| 婷婷综合在线视频| 国产91精品对白在线播放| 亚洲国产精久久久久久久| 久久久久久国产精品日本| 国内欧美日韩| 欧美色中文字幕| 亚洲视频在线a| 欧美一级大黄| 色域天天综合网| 久久国产亚洲精品无码| 91在线超碰| 亚洲国产一区二区三区| 欧美乱做爰xxxⅹ久久久| 黄色的网站在线观看| 国产精品午夜春色av| 欧美久久久久久| 日本v片在线免费观看| 99久久99久久综合| 国产亚洲欧美一区二区三区| 黄色美女一级片| 福利电影一区二区| 国产在线资源一区| 日韩偷拍自拍| 久久久久久一级片| 日本精品一区二区三区视频 | 色妞欧美日韩在线| 日韩免费av一区| 91精品电影| 欧美巨乳在线观看| 国产一级二级三级视频| 精品999成人| 欧洲亚洲在线视频| 波多野结衣大片| 久久99久久99| 91久久精品美女| 欧美少妇bbw| 91麻豆国产自产在线观看| 免费在线观看91| 午夜在线播放| 亚洲一区二区三区三| 国产精品999视频| 香蕉视频亚洲一级| 欧美日韩国产大片| 国产一卡二卡三卡四卡| 日韩大胆成人| 日韩中文字幕不卡视频| 青青草手机在线视频| 亚洲国产专区校园欧美| 欧洲成人午夜免费大片| 国产精品乱码久久久| 不卡一区二区中文字幕| 日本一区二区三区精品视频| 免费av在线网站| 亚洲午夜在线视频| 青青在线免费观看视频| 精品国产一区二区三区2021| 日韩av在线不卡| 日本 欧美 国产| 最新日韩av| 国产噜噜噜噜久久久久久久久| 亚洲黄色一级大片| 国产亚洲欧美中文| 欧美黄网在线观看| 日韩一区二区三区在线免费观看| 日韩一区二区视频在线观看| 六月婷婷七月丁香| 欧美91大片| 国产精品国内视频| 欧美 日韩 国产 成人 在线| 国产精品麻豆99久久久久久| 日本免费不卡一区二区| 伊人久久精品| 国产亚洲精品日韩| 日韩成人av毛片| 久久99精品久久久久久| 欧美日韩电影一区二区三区| 色综合999| 欧美日韩精品免费| 久久国产精品无码一级毛片| 你懂的国产精品| 国产精品久久久久99| 视频一区二区免费| 亚洲人亚洲人成电影网站色| wwwxxx黄色片| 欧美顶级毛片在线播放| 久久国产精品久久久久久| 亚洲av综合一区| 91视频91自| 奇米影视亚洲色图| 影音先锋欧美激情| 久久手机免费视频| 在线播放亚洲精品| 国产三级欧美三级| 国产精品沙发午睡系列| 成人动漫视频| 欧美成人性生活| 国产精品爽爽久久久久久| 中文字幕成人在线观看| 青青在线视频免费| 竹菊久久久久久久| 欧美亚洲国产视频| 四虎永久在线观看| 亚洲高清免费观看高清完整版在线观看| 伊人色在线观看| 波多野结衣的一区二区三区| 日本久久久久久久久| 午夜成人鲁丝片午夜精品| 亚洲一区二区三区视频在线 | 91视频观看免费| 免费看又黄又无码的网站| 国产乱人伦丫前精品视频| 欧美黑人极品猛少妇色xxxxx| av中文字幕第一页| 亚洲综合无码一区二区| 中文字幕一二三区| 中文字幕一区二区三区在线视频| 91久久久久久久久久久| 在线黄色网页| 精品国产凹凸成av人导航| 久久精品波多野结衣| 丁香一区二区三区| 日韩小视频网站| 里番精品3d一二三区| 2023亚洲男人天堂| 国产资源在线播放| 欧美亚洲尤物久久| 日韩精品久久久久久久的张开腿让| 免费看欧美美女黄的网站| 亚洲图片在线观看| 人人爱人人干婷婷丁香亚洲| 色综合视频一区中文字幕| 丰满肥臀噗嗤啊x99av| 疯狂做受xxxx欧美肥白少妇| 欧美 日韩 国产 成人 在线观看 | youjizz.com日本| 一区二区毛片| 亚洲精品中文字幕在线| 视频亚洲一区二区| 98精品国产高清在线xxxx天堂| 亚洲人午夜射精精品日韩| 在线精品国精品国产尤物884a| 男人av资源站| 99久久久免费精品国产一区二区| 人妻有码中文字幕| 亚洲精品2区| 麻豆av一区二区| 国产精品.xx视频.xxtv| 欧美激情第99页| 久久久久国产精品嫩草影院| 欧美日韩另类一区| 精品少妇久久久| 欧美韩日一区二区三区四区| 欧美一区二区三区影院| 午夜综合激情| 男人j进女人j| 欧美美女在线观看| 2019国产精品视频| 精品3atv在线视频| 欧美激情网友自拍| 思思99re6国产在线播放| 精品日韩欧美在线| 亚洲图片中文字幕| 五月婷婷综合激情| 尤物在线免费视频| 久久日韩粉嫩一区二区三区| 亚洲欧美日本一区二区| 亚洲一区久久| 欧美一二三不卡| 久久影视一区| 免费日韩av电影| 成人自拍在线| 国产在线观看不卡| 日韩成人动漫| 久久久久久久999| 黄色免费在线观看| 在线观看日韩www视频免费| 色窝窝无码一区二区三区| 5566中文字幕一区二区电影| 欧美一级淫片免费视频黄| 亚洲不卡av一区二区三区| 国产黄色小视频网站| 国产欧美日韩亚州综合| 91玉足脚交白嫩脚丫| 国产寡妇亲子伦一区二区| 波多野结衣xxxx| 久久精品女人| aa在线观看视频| 欧美私人啪啪vps| 天天干天天色天天爽| 成人动漫免费在线观看| 欧美日韩喷水| 无码少妇一区二区三区| 国产富婆一区二区三区| 国产精品一站二站| 成人免费福利在线| 欧洲av一区二区| 国产成人一区二区三区| 亚洲欧洲美洲av| 久久人人爽国产| 黄页网站大全在线免费观看| 欧美激情视频网址| 国产视频中文字幕在线观看| 久久久精品一区二区| 免费人成在线观看播放视频| 色婷婷成人综合| 天堂а√在线资源在线| 日韩在线免费av| 黄色网址视频在线观看| 久久精品视频亚洲| 久久五月精品| 欧美成人小视频| 欧美人体视频xxxxx| 欧美黑人性视频| 白白色在线观看| 欧美亚洲日本网站| 欧美特大特白屁股xxxx| 国产精品久久久久久中文字| а√天堂资源国产精品| 成人黄在线观看| 日韩在线精品强乱中文字幕| 国产精品乱子乱xxxx| 青青草久久爱| 日本一区二区不卡高清更新| 清纯唯美亚洲综合一区| 伊人天天久久大香线蕉av色| 午夜精品毛片| 亚洲国产精品成人天堂| 美女尤物久久精品| av网站在线不卡| 国产又粗又猛又爽又黄91精品| 手机精品视频在线| 不卡av电影在线播放| 日本xxxx裸体xxxx| 国产精品欧美经典| 欧美成人片在线观看| 精品久久久久久久久中文字幕 | 裸体素人女欧美日韩| 亚洲国产高清av| 国产suv一区二区三区88区| 免费无码一区二区三区| 国产日韩欧美制服另类| 国产av无码专区亚洲av毛网站| 亚洲成a人v欧美综合天堂| 青青国产在线视频| 91精品在线一区二区| 亚洲 欧美 精品| 久久国内精品一国内精品| 91桃色在线观看| 国产精品视频区1| 亚洲天堂中文字幕在线观看| 麻豆精品蜜桃一区二区三区| 五月天综合网站| 男人日女人bb视频| 久久99久久久久久久久久久| 给我看免费高清在线观看| 国产精品热久久久久夜色精品三区| 久久久99精品| 欧美少妇性性性| 天堂av资源网| 久久国产精品偷| 成人不卡视频| 精品一区久久久| 亚洲精品a级片| 国产精品99久久免费黑人人妻| 丁香激情综合五月| 亚洲一级理论片| 欧美视频在线观看 亚洲欧| 国产情侣激情自拍| 日韩成人在线观看| 欧美hdxxxxx| 国产欧美日韩丝袜精品一区| 色先锋久久影院av| 99久久免费观看| 精品一区二区三区日韩| 全黄一级裸体片| 五月婷婷欧美视频| 丰满肉嫩西川结衣av| www.精品av.com| 另类激情视频| 久久99精品久久久久久水蜜桃 | 日韩在线xxx| 成人免费毛片a| 波多野结衣亚洲色图| 欧美久久久久久久久| 国产福利电影在线| 97视频在线观看亚洲| baoyu135国产精品免费| 久久av秘一区二区三区| 美女任你摸久久| 谁有免费的黄色网址| 欧美午夜精品久久久久久久| 粉嫩小泬无遮挡久久久久久| 色综合五月天导航| 91精品亚洲一区在线观看| 亚洲国产一区二区精品视频| 视频一区视频二区中文字幕| 中文字幕一区二区三区人妻不卡| 图片区小说区区亚洲影院| 亚洲国产中文字幕在线| 久久99国产综合精品女同| 精品国产亚洲一区二区三区在线| 免费看啪啪网站| 久久99久国产精品黄毛片色诱| 亚洲国产精品一区二区久久hs| 欧美中文字幕一区| 成人三级黄色免费网站| 国产成人黄色av| 国产成人精品一区二区免费看京 | 国产成a人亚洲精| 成人性生活毛片| 欧美一级高清大全免费观看| 国产黄色在线观看| 亚洲综合在线播放| 欧美日韩中文| 在线xxxxx| 欧美视频第一页| 国产一级网站视频在线| 国产精品日韩在线| 天天综合精品| 国产免费a级片| 无吗不卡中文字幕| 国产私拍精品| 国产美女搞久久| 午夜激情一区| 亚洲一级av无码毛片精品| 日本电影亚洲天堂一区| jizz在线观看中文| 成人做爰www免费看视频网站| 亚洲一区二区| 亚洲国产第一区| 91黄色免费看| av毛片在线播放| 国内一区二区在线视频观看| 久久综合导航| 亚洲欧美卡通动漫| 欧美变态凌虐bdsm| 澳门成人av网| 97超碰人人爱| 99精品国产视频| 中文字幕在线观看视频一区| 欧美伦理91i| 亚洲人亚洲人色久| 九九热99视频| 午夜精品一区在线观看| 国产福利在线| 国产激情美女久久久久久吹潮| 久久99伊人| 一级黄色录像视频| 日韩精品999| 亚洲伦理网站| 国产又黄又大又粗视频| 国产精品不卡视频| 视频一区二区免费| 成人免费看吃奶视频网站| 亚洲裸体俱乐部裸体舞表演av| 欧美日韩生活片| 亚洲激情自拍图| 麻豆精品国产| 天天操天天爱天天爽| 亚洲一区二区三区激情| 婷婷视频在线| 蜜桃狠狠色伊人亚洲综合网站|