精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MLLM QLoRA微調實戰:基于最新的袖珍Mini-InternVL模型 原創

發布于 2024-6-30 23:04
瀏覽
0收藏

譯者 | 朱先忠

審校 | 重樓

引言

大型語言模型(LLM)的世界正在不斷發展,新的進步正在迅速出現。一個令人興奮的領域是多模態LLM(MLLMs)的發展,這種模型既能夠理解文本又能夠理解圖像,并與之進行交互。因此,這種多模態模型的出現將為文檔理解、視覺問答等任務打開一個新的可能性的世界。

我最近寫了一篇關于這種模型的文章??《微軟最新的Phi-3視覺語言模型的6種現實應用》??(6 Real-World Uses of Microsoft’s Newest Phi-3 Vision-Language Model)。這篇文章探索了微軟新發布的模型Phi-3-Vision的可能使用場景,這是一種小型但功能強大的MLLM,可以在本地運行(文章中的鏈接提供了相應的代碼示例)。

但在本篇文章中,我們將探索一個強大的組合:InternVL模型和QLoRA微調技術。我們將專注于如何輕松地為任何特定使用場景定制此類模型。我們將使用這些工具創建一個收據信息理解程序,以便以高精度從中提取公司名稱、地址和購買總額等關鍵信息。

了解任務和數據集

該項目旨在開發一個系統,利用InternVL的功能,準確地從掃描的收據中提取特定信息。該任務提出了一個獨特的挑戰,不僅需要強大的自然語言處理(NLP),還需要解釋輸入圖像的視覺布局的能力。這將使我們能夠創建一個單一的、無OCR的端到端管道,從而在復雜文檔中表現出強大的通用性。

為了訓練和評估我們的模型,我們將使用??SROIE??數據集。SROIE提供了1000張掃描的收據圖像,每張圖像都標注了關鍵實體,如:

  • 公司:商店或企業的名稱?
  • 日期:購買日期?
  • 地址:商店的地址?
  • 總計:支付的總金額?

MLLM QLoRA微調實戰:基于最新的袖珍Mini-InternVL模型-AI.x社區

來源:??https://arxiv.org/pdf/2103.10213.pdf??。?

我們將使用模糊相似性得分來評估我們模型的性能,這是一種衡量預測實體和基本事實實體之間相似性的指標。這個指標的數據值范圍是從0(不相關的結果)到100(完美的預測)之間。

InternVL:一個多模式的發電站

InternVL是OpenGVLab的一個多模型LLM家族,旨在擅長圖像和文本任務。它的體系結構將視覺模型(如InternetViT)與語言模型(如InternLM2或Phi-3)相結合。這里,我們將重點介紹Mini-InterneVL-Chat-2B-V1-5變體,這是一個非常適合在消費級GPU上運行的較小版本。

InternVL的主要優勢表現在:

  • 效率:其緊湊的尺寸允許高效的訓練和推理。?
  • 準確性:盡管體積較小,但它在各種基準測試中都具有競爭力。?
  • 多模態功能:它將圖像和文本理解無縫結合。?

演示程序:您可以在鏈接https://huggingface.co/spaces/OpenGVLab/InternVL處探索一下有關InternetVL的實時演示情況。

QLoRA微調:一種內存高效的方法

為了進一步提高我們模型的性能,我們將使用QLoRA,這是一種微調技術,可以在保持性能的同時顯著減少內存消耗。以下是它的工作原理:

  1. 量化:預訓練的LLM被量化為4位精度,減少了其內存占用。?
  2. 低級別適配器(LoRA):LoRA不修改預訓練模型的所有參數,而是向網絡添加小型可訓練適配器。這些適配器能夠捕獲特定任務的信息,而無需更改主模型。?
  3. 高效訓練:量化和LoRA的結合即使在內存有限的GPU上也能實現高效的微調。?

代碼演練:基線性能

讓我們深入研究一下相關的代碼實現吧。首先,我們將在沒有任何微調的情況下評估一下Mini-InterVL-Chat-2B-V1-5的基線性能:

quant_config = BitsAndBytesConfig(
 load_in_4bit=True,
 bnb_4bit_quant_type="nf4",
 bnb_4bit_compute_dtype=torch.bfloat16,
)

model = InternVLChatModel.from_pretrained(
 args.path,
 device_map={"": 0},
 quantization_cnotallow=quant_config if args.quant else None,
 torch_dtype=torch.bfloat16,
)

tokenizer = InternLM2Tokenizer.from_pretrained(args.path)
# 在max_num參數中設置圖片小塊的最大數量

model.eval()

pixel_values = (
 load_image(image_base_path / "X51005255805.jpg", max_num=6)
 .to(torch.bfloat16)
 .cuda()
)

generation_config = dict(
 num_beams=1,
 max_new_tokens=512,
 do_sample=False,
)

# 單輪單圖像對話
question = (
 "Extract the company, date, address and total in json format."
 "Respond with a valid JSON only."
)
# print(model)
response = model.chat(tokenizer, pixel_values, question, generation_config)

print(response)
上述代碼的輸出結果是:
```json
{
 "company": "SAM SAM TRADING CO",
 "date": "Fri, 29-12-2017",
 "address": "67, JLN MENHAW 25/63 TNN SRI HUDA, 40400 SHAH ALAM",
 "total": "RM 14.10"
}
```

上面的代碼實現了:

  1. 從Hugging Face云端加載模型。?
  2. 加載樣本收據圖像并將其轉換為張量。?
  3. 提出一個問題,要求模型從圖像中提取相關信息。?
  4. 運行模型,并以JSON格式輸出提取的信息。?

這項零樣本評估顯示了令人印象深刻的結果,實現了74.24% 的平均模糊相似性得分。這證明了InternVL在無需微調的情況下理解收據和提取信息的能力。

微調:使用QLoRA增強性能

為了進一步提高準確性,我們將使用QLoRA對模型進行微調。以下展示了我們使用這種微調技術的實現代碼:

_data = load_data(args.data_path, fold="train")

# 量化配置
quant_config = BitsAndBytesConfig(
 load_in_4bit=True,
 bnb_4bit_quant_type="nf4",
 bnb_4bit_compute_dtype=torch.bfloat16,
)

model = InternVLChatModel.from_pretrained(
 path,
 device_map={"": 0},
 quantization_cnotallow=quant_config,
 torch_dtype=torch.bfloat16,
)

tokenizer = InternLM2Tokenizer.from_pretrained(path)

# 在max_num參數中設置圖片小塊的最大數量
img_context_token_id = tokenizer.convert_tokens_to_ids(IMG_CONTEXT_TOKEN)
print("img_context_token_id", img_context_token_id)
model.img_context_token_id = img_context_token_id

model.config.llm_config.use_cache = False

model = wrap_lora(model, r=128, lora_alpha=256)

training_data = SFTDataset(
 data=_data, template=model.config.template, tokenizer=tokenizer
)

collator = CustomDataCollator(pad_token=tokenizer.pad_token_id, ignore_index=-100)

img_context_token_id = tokenizer.convert_tokens_to_ids(IMG_CONTEXT_TOKEN)
print("img_context_token_id", img_context_token_id)
model.img_context_token_id = img_context_token_id
print("model.img_context_token_id", model.img_context_token_id)

train_params = TrainingArguments(
 output_dir=str(BASE_PATH / "results_modified"),
 num_train_epochs=EPOCHS,
 per_device_train_batch_size=1,
 gradient_accumulation_steps=16,
 optim="paged_adamw_32bit",
 save_steps=len(training_data) // 10,
 logging_steps=len(training_data) // 50,
 learning_rate=5e-4,
 lr_scheduler_type="cosine",
 warmup_steps=100,
 weight_decay=0.001,
 max_steps=-1,
 group_by_length=False,
 max_grad_norm=1.0,
)
# 訓練器
fine_tuning = SFTTrainer(
 model=model,
 train_dataset=training_data,
 dataset_text_field="###",
 tokenizer=tokenizer,
 args=train_params,
 data_collator=collator,
 max_seq_length=tokenizer.model_max_length,
)

print(fine_tuning.model.print_trainable_parameters())
# 開始訓練
fine_tuning.train()
# 保存模型
fine_tuning.model.save_pretrained(refined_model)

上面的代碼實現了:

  1. 加載啟用量化支持的模型。?
  2. 用LoRA微調模型,添加可訓練的適配器。?
  3. 從SROIE數據集創建數據集。?
  4. 定義訓練參數,如學習率、批量大小和訓練輪數。?
  5. 初始化訓練器以處理訓練過程。?
  6. 在SROIE數據集上訓練模型。?
  7. 保存微調后的模型。?

以下是基本模型和QLoRA微調模型之間的示例比較:

Ground Truth: 

{
 "company": "YONG TAT HARDWARE TRADING",
 "date": "13/03/2018",
 "address": "NO 4,JALAN PERJIRANAN 10, TAMAN AIR BIRU, 81700 PASIR GUDANG, JOHOR.",
 "total": "72.00"
}

Prediction Base: KO

```json
{
 "company": "YONG TAT HARDWARE TRADING",
 "date": "13/03/2016",
 "address": "JM092487-D",
 "total": "67.92"
}
```

Prediction QLoRA: OK

{
 "company": "YONG TAT HARDWARE TRADING",
 "date": "13/03/2018",
 "address": "NO 4, JALAN PERUBANAN 10, TAMAN AIR BIRU, 81700 PASIR GUDANG, JOHOR",
 "total": "72.00"
}

實驗結果

在使用QLoRA進行微調后,我們的模型獲得了95.4% 的顯著模糊相似性得分,比基線性能(74.24%)有了顯著提高。這證明了QLoRA在不需要大量計算資源的情況下提高模型精度的能力(在RTX 3080 GPU上對600個樣本進行15分鐘的訓練)。

我們使用InternVL和QLoRA成功構建了一個強大的收據數據理解程序。這種方法展示了多模式LLM在文檔分析和信息提取等現實任務中的潛力。在這個示例用例中,我們使用幾百個樣本和消費者級別的GPU上幾分鐘的計算時間,在預測質量上獲得了30分。

注意:您可以在鏈接https://github.com/CVxTz/doc-llm處找到該項目的完整代碼實現。

結語

當今,多模式LLM的發展才剛剛開始,未來充滿了令人興奮的可能性。自動化文檔處理領域在MLLM(多模態大型語言模型)時代具有巨大的潛力。這些模型可以徹底改變我們從合同、發票和其他文檔中提取信息的方式,只需要最少的訓練數據。通過整合文本和視覺,他們可以以前所未有的精度分析復雜文檔的布局,為更高效、更智能的信息管理鋪平道路。

人工智能的未來是多模式的,InternVL和QLoRA是幫助我們在小型的計算預算上釋放其潛力的強大工具。

參考鏈接

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:A Simple Recipe to Boost the Performance of MLLMs on Your Custom Use Case,作者:Youness Mansar?

鏈接:https://towardsdatascience.com/a-simple-recipe-to-boost-the-performance-of-mllms-on-your-custom-use-case-6014440f5373


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
日本精品一区二区三区四区的功能| 91尤物视频在线观看| 日韩在线观看免费高清| 麻豆传媒在线看| 久草免费在线视频| 国产精品美女一区二区三区| 国产精品久久久对白| 国产日韩在线免费观看| 欧美在线91| 亚洲天堂网在线观看| 丰满人妻一区二区三区大胸| 三级成人黄色影院| 一区二区三区四区精品在线视频| 蜜桃传媒视频第一区入口在线看| 国产一区二区网站| 亚洲一区黄色| 欧美插天视频在线播放| 最近中文字幕免费| av在线亚洲色图| 欧美军同video69gay| 国产淫片免费看| av大全在线| 欧美国产视频在线| 精品免费二区三区三区高中清不卡| 在线不卡免费视频| 久久一综合视频| 97视频网站入口| 欧美丰满熟妇bbbbbb| 久操国产精品| 精品1区2区在线观看| av在线免费看片| 三级成人黄色影院| 欧美性黄网官网| 免费看欧美黑人毛片| 黄色网页在线观看| 亚洲国产成人自拍| 欧洲精品一区色| 四虎影院在线域名免费观看| 成人午夜av电影| 亚洲自拍偷拍色片视频| 怡红院成永久免费人全部视频| 国产精品婷婷| 97av在线影院| 日韩精品在线免费视频| 亚洲国产免费| 国语自产精品视频在线看一大j8 | 久久精品国产亚洲5555| 欧美成人福利视频| 9191在线视频| 99re热精品视频| 欧美刺激午夜性久久久久久久| 亚洲在线观看网站| 视频一区日韩| 精品久久国产老人久久综合| 人妻 日韩 欧美 综合 制服| 高清精品视频| 亚洲美女性生活视频| 国产jk精品白丝av在线观看| 精品日韩毛片| 色婷婷av一区二区三区久久| 91精品国产闺蜜国产在线闺蜜| 一区二区影院| 欧美交受高潮1| 亚洲黄色一区二区| 免费中文字幕日韩欧美| 国产精品aaaa| 一级特黄aaa大片| 国产乱码精品一区二区三区忘忧草 | 国产精品一区二区黑丝| 国产精品国产精品国产专区蜜臀ah | 翔田千里88av中文字幕| 欧美日韩三区| 26uuu另类亚洲欧美日本老年| 国产精品久久久久久人| 奇米精品一区二区三区在线观看| 成人免费在线视频网址| 国产v片在线观看| 99精品桃花视频在线观看| 日本黄网免费一区二区精品| 黄色动漫在线| 富二代精品短视频| 五月婷婷丁香色| 在线播放一区二区精品视频| 亚洲欧洲中文天堂| 朝桐光av在线| 国产精品亚洲欧美| 91精品久久久久久久久久久久久| 亚洲精品国偷拍自产在线观看蜜桃 | 色呦呦国产精品| 激情文学亚洲色图| 天天久久夜夜| 欧美成人在线免费视频| 国语对白永久免费| 国产伦精品一区二区三区免费迷 | 欧美三级视频| 国产精品va在线| 成人小说亚洲一区二区三区| 欧美精彩视频一区二区三区| 欧美大黑帍在线播放| 欧美成a人片在线观看久| 日韩一区二区三区在线视频| 受虐m奴xxx在线观看| 亚洲影视一区二区三区| 日韩美女免费线视频| 午夜精品久久久久久久第一页按摩 | 亚洲一区不卡| 91在线看网站| 91精品大全| 色悠久久久久综合欧美99| 韩国三级视频在线观看| 少妇一区二区视频| 久久免费视频网站| 国产普通话bbwbbwbbw| 久久精品在线免费观看| 国产毛片久久久久久国产毛片| 精品女同一区二区三区在线观看| 日韩精品一区二区三区第95| 欧美日韩偷拍视频| 激情五月婷婷综合| 欧美一区二区影视| 爱啪视频在线观看视频免费| 日韩精品一区二区三区视频 | 亚洲成人免费| 国产美女扒开尿口久久久| 日本护士...精品国| 亚洲图片欧美一区| 亚洲AV无码久久精品国产一区| 日韩在线观看电影完整版高清免费悬疑悬疑 | 欧美va在线观看| 亚洲伦理中文字幕| 91av在线免费视频| caoporen国产精品视频| 久久综合亚洲精品| 榴莲视频成人app| 日韩一二三在线视频播| 一区二区视频在线免费观看| 国产日韩精品一区| 国产一区二区视频免费在线观看| 日韩欧美天堂| 欧美在线一区二区视频| 四虎影视在线播放| 色综合婷婷久久| 久久精品—区二区三区舞蹈| 免费日韩av片| 日本精品一区二区三区视频 | 精品无码久久久久久久动漫| 97天天综合网| 日韩精品极品在线观看播放免费视频 | av电影在线播放| 一本色道久久| 欧美日韩精品免费观看| 久久91导航| 中文字幕久久久| 国产乱淫av片免费| 亚洲一区二区欧美| a天堂视频在线观看| 久久午夜视频| 一级做a爰片久久| 欧美一级片网址| 国内外成人免费激情在线视频 | 国产亚洲婷婷免费| 性欧美1819| 欧美日韩网站| 欧美大陆一区二区| 忘忧草在线www成人影院| 国产亚洲精品91在线| 中文字幕第31页| 亚洲精品福利视频网站| 第四色在线视频| 日韩福利电影在线| 无码人妻aⅴ一区二区三区日本| 精品中文字幕一区二区三区| 777午夜精品福利在线观看| 久久电影中文字幕| 69精品人人人人| 国产无遮挡又黄又爽又色| 久久久国产综合精品女国产盗摄| av污在线观看| 国产精品欧美综合在线| 亚洲一区视频在线| 亚州av综合色区无码一区| 久久久久久久尹人综合网亚洲| 日韩欧美精品在线不卡| 最新亚洲国产| 91精品国产高清| a中文在线播放| 日韩欧美一级精品久久| 国产又黄又猛又粗又爽| 最新成人av在线| 国产精品久久久免费观看| 免费看黄色91| 可以看毛片的网址| 日本一区二区在线看| 俄罗斯精品一区二区| 中文字幕系列一区| 久久久久久97| 精品自拍一区| 国产午夜精品视频| 天天操天天射天天| 69久久夜色精品国产69蝌蚪网| 国产精品777777| 亚洲午夜免费电影| 人与动物性xxxx| 97国产一区二区| 欧美xxxx黑人| 久久99热这里只有精品| 岳毛多又紧做起爽| 亚洲图片在线| 青少年xxxxx性开放hg| 欧美在线色图| 欧美精品一区在线发布| 国产精品久av福利在线观看| 国产一区玩具在线观看| 日本欧美不卡| 国产91在线播放精品91| av2020不卡| 欧美另类高清videos| 欧美精品电影| 日韩最新中文字幕电影免费看| 久草在现在线| 亚洲天堂成人在线| 欧美扣逼视频| 国产偷亚洲偷欧美偷精品| 成人免费一级视频| 欧美sm美女调教| 亚洲av无码国产综合专区| 4438x亚洲最大成人网| 中文在线字幕av| 日本精品一级二级| 亚洲av无码不卡| 在线观看亚洲精品| 波多野结衣视频在线看| 在线日韩av片| 久久精品五月天| 91精品办公室少妇高潮对白| 久久精品视频2| 色综合视频一区二区三区高清| 丁香六月婷婷综合| 色视频一区二区| 亚洲精品91天天久久人人| 91官网在线免费观看| 三级网站在线播放| 色婷婷国产精品久久包臀| 日本道在线观看| 欧美性xxxxxxx| 日本精品入口免费视频| 欧美日韩在线不卡| 91麻豆成人精品国产| 777亚洲妇女| 亚洲黄色在线播放| 日韩精品视频在线| 精品无吗乱吗av国产爱色| 中文字幕亚洲字幕| 大地资源网3页在线观看| 欧美激情手机在线视频 | 自拍偷拍亚洲综合| 欧美成人免费看| 亚洲v中文字幕| 国产寡妇亲子伦一区二区三区四区| 日韩欧美高清视频| 一级黄色免费看| 日韩一区二区影院| 亚洲欧美日本在线观看| 一区二区三区精品99久久| 秋霞午夜理伦电影在线观看| 欧美另类交人妖| 成人小电影网站| 国产欧美中文字幕| 成人春色在线观看免费网站| 鲁丝一区二区三区免费| 日本一区二区高清不卡| 黄色一级片国产| 奶水喷射视频一区| 国内av一区二区| 99精品久久99久久久久| 欧美波霸videosex极品| 亚洲欧美日韩一区| 欧美三级一区二区三区| 欧美日韩免费一区二区三区视频 | 国产91丝袜在线18| 国产精品无码网站| 国产精品国产馆在线真实露脸 | 黄色片网站免费| 一区二区三区四区高清精品免费观看| 天天干在线播放| 日韩午夜精品电影| 国产h在线观看| 欧美大尺度激情区在线播放| 成人性生交大片免费网站| 亚洲综合中文字幕68页| 精品一区不卡| 精品视频在线观看一区| 精品一区二区三区在线观看国产| 欧美做受喷浆在线观看| 亚洲日本va在线观看| 天堂а√在线中文在线新版| 91精品国产色综合久久不卡蜜臀 | 爱情岛论坛成人| 成人一区二区三区中文字幕| 中文字幕第24页| 欧美日韩国产影院| 国产福利第一视频| 中文字幕免费国产精品| 久草在线资源福利站| 99精品在线直播| 98精品视频| 婷婷六月天在线| 99热精品国产| 久久久久久久久久综合| 欧美精品一卡两卡| 国产色在线 com| 青草热久免费精品视频| 精品中国亚洲| 日本福利视频网站| 国产中文字幕精品| 男女全黄做爰文章| 色婷婷精品久久二区二区蜜臀av | 亚洲天堂中文字幕在线观看| 亚洲一区二区三区精品在线观看 | 亚洲午夜一区二区| 国产伦精品一区二区三区四区| 怡红院精品视频| free欧美| 欧美伦理一区二区| 欧美亚洲一级| 人妻熟女aⅴ一区二区三区汇编| 亚洲一线二线三线视频| 精品毛片一区二区三区| 美女福利精品视频| 国产精品1区| 在线视频一区观看| 国内一区二区在线| 糖心vlog免费在线观看| 欧美二区三区91| 快射av在线播放一区| 91免费国产视频| 自拍偷拍欧美| 亚洲国产欧美日韩在线| 一区二区三区精品视频| 不卡视频在线播放| 欧美激情精品久久久久久大尺度 | 色之综合天天综合色天天棕色| 久久激情视频| 中文字幕免费高清| 欧美亚洲国产一区二区三区| av在线收看| 成人黄色在线播放| 欧美福利影院| 国产一级黄色录像| 欧美性jizz18性欧美| 国产福利在线观看| 成人亚洲综合色就1024| 一区二区三区午夜视频| 国产在线不卡av| 欧美色道久久88综合亚洲精品| 欧美理论在线观看| 国产免费一区二区三区在线能观看 | 丰满人妻一区二区三区四区| 日韩在线视频线视频免费网站| 96视频在线观看欧美| 成人免费性视频| 99精品欧美一区二区蜜桃免费| 无码人妻精品一区二区三区蜜桃91| 中文字幕亚洲字幕| 日韩在线观看一区二区三区| 日本在线xxx| 国产免费久久精品| 国产三级午夜理伦三级| 国内精品久久久久久久| 国产亚洲欧美日韩在线观看一区二区 | 97免费视频在线播放| 精品一区在线| 色综合五月婷婷| 舔着乳尖日韩一区| eeuss影院在线播放| 国产精品10p综合二区| 久久久久久9| 久草视频在线资源| 亚洲性视频网址| 日韩一二三区| 男人的天堂日韩| 亚洲影视在线观看| 黄网在线免费| 国产精品精品软件视频| 秋霞午夜鲁丝一区二区老狼| 久操视频免费在线观看| 国产一区二区三区在线| 欧美电影在线观看一区| 韩国一区二区av| 亚洲在线观看免费| 一级毛片视频在线| 精品国产91亚洲一区二区三区www| 七七婷婷婷婷精品国产| 久草视频免费在线| 日日狠狠久久偷偷四色综合免费| 欧美变态挠脚心| 在线免费黄色小视频| 在线看一区二区| 美女的胸无遮挡在线观看| 六月婷婷激情网|