精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型應(yīng)用落地:如何選擇合適的 Embedding 模型? 原創(chuàng)

發(fā)布于 2024-6-28 10:28
瀏覽
0收藏

0、背景落地

在生成式人工智能(GenAI)領(lǐng)域,檢索增強(qiáng)生成(RAG)作為一種策略脫穎而出,它通過(guò)集成外部數(shù)據(jù)來(lái)擴(kuò)充像 ChatGPT 這樣的大型語(yǔ)言模型(LLM)的現(xiàn)有知識(shí)庫(kù)。

RAG 系統(tǒng)核心涉及三種關(guān)鍵的人工智能模型組件:嵌入(Embedding)模型負(fù)責(zé)將信息轉(zhuǎn)化為數(shù)學(xué)向量,重排名(Reranker)模型則用于優(yōu)化搜索結(jié)果,而強(qiáng)大的基礎(chǔ)語(yǔ)言模型確保了豐富的語(yǔ)境理解和生成。

本篇文章旨在指導(dǎo)您依據(jù)數(shù)據(jù)特性及目標(biāo)領(lǐng)域,比如:金融專業(yè),來(lái)挑選最合適的嵌入模型,從而最大化 RAG 系統(tǒng)的效能與準(zhǔn)確性。

1、文本數(shù)據(jù):MTEB 排行榜

HuggingFace 推出的 MTEB leaderboard 是一個(gè)綜合性的文本嵌入模型比較平臺(tái),讓您可以一覽各模型的綜合性能表現(xiàn)。

為了滿足向量搜索的需求,建議優(yōu)先關(guān)注“Retrieval Average”這一列,并按降序排列,以識(shí)別在檢索任務(wù)中表現(xiàn)最優(yōu)的模型。在此基礎(chǔ)上,尋找那些內(nèi)存占用小、效率高的佼佼者。

  • 嵌入向量維度指的是模型輸出向量的長(zhǎng)度,即函數(shù) f 將輸入 x 轉(zhuǎn)化為向量 y 的 y 部分,體現(xiàn)了模型對(duì)文本特征的編碼深度。
  • 而最大 Token 數(shù)則是模型能夠處理的文本片段的最大長(zhǎng)度,相當(dāng)于函數(shù) f中的輸入 x,影響著單次請(qǐng)求能包含的信息量。

在篩選理想模型時(shí),您不僅可根據(jù)檢索性能排序,還能夠依據(jù)特定條件進(jìn)一步篩選:

  • 語(yǔ)言支持:涵蓋法語(yǔ)、英語(yǔ)、中文、波蘭語(yǔ)等多語(yǔ)種。(示例篩選:task=retrieval, Language=chinese)
  • 領(lǐng)域適應(yīng):針對(duì)法律文本的專業(yè)應(yīng)用。(如:task=retrieval, Domain=law)

值得注意的是,MTEB上的排名可能因新公開的訓(xùn)練數(shù)據(jù)而有所偏差,某些模型的評(píng)分可能存在虛高現(xiàn)象。因此,參考 HuggingFace 的官方博客,學(xué)習(xí)如何辨別模型排名的真實(shí)可靠性顯得尤為重要。在訪問(wèn)每個(gè)模型的“模型卡片”頁(yè)面時(shí),以下幾個(gè)步驟至關(guān)重要:

  • 深入探究訓(xùn)練詳情:查找相關(guān)博客和研究論文,這些資料會(huì)詳細(xì)介紹模型的訓(xùn)練數(shù)據(jù)、任務(wù)設(shè)定等關(guān)鍵信息。
  • 留意模型來(lái)源:知名機(jī)構(gòu)或公司的模型往往更值得信賴。比如:voyage-lite-02-instruct 模型的卡片缺少與其同系列其他模型的關(guān)聯(lián)信息,暗示其可能存在過(guò)擬合問(wèn)題,不推薦實(shí)際部署。

基于上述考量,我建議使用 Snowflake 新推出的“snowflake-arctic-embed-1”模型。該模型不僅在排名上表現(xiàn)搶眼,而且以其較小的體積適合在有限資源的設(shè)備上運(yùn)行,此外,模型卡片提供的博客和論文鏈接也增加了其透明度和可信度。

2、圖像數(shù)據(jù):ResNet50

如果您希望查找與某張圖片風(fēng)格或內(nèi)容相似的其他圖片,比如:搜尋更多關(guān)于蘇格蘭折耳貓的圖像資料,一種方法是上傳一張?jiān)撈贩N貓的照片,并利用圖像搜索引擎去發(fā)掘類似圖片。

ResNet50 作為一種廣泛采納的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,自2015年微軟基于 ImageNet 數(shù)據(jù)集的訓(xùn)練成果以來(lái),便成為了圖像識(shí)別領(lǐng)域的基石之一。

類似地,在面對(duì)視頻搜索需求時(shí),ResNet50 能夠發(fā)揮作用,通過(guò)將視頻分解成一系列靜態(tài)幀,對(duì)每一幀應(yīng)用模型以生成對(duì)應(yīng)的嵌入向量。隨后,基于這些向量進(jìn)行相似性比對(duì),系統(tǒng)能夠甄選出與查詢視頻最為接近的視頻內(nèi)容,從而為用戶提供高度匹配的搜索結(jié)果。

3、音頻數(shù)據(jù):PANNs

就如同圖像搜索一樣,您也能夠依據(jù)提供的音頻片段去探尋類似的音頻內(nèi)容。

PANNs(預(yù)訓(xùn)練音頻神經(jīng)網(wǎng)絡(luò))作為一種主流的音頻檢索 Embedding 模型,其優(yōu)勢(shì)在于它基于龐大的音頻資料庫(kù)進(jìn)行了預(yù)先訓(xùn)練,對(duì)此在音頻分類與標(biāo)簽分配等任務(wù)上展現(xiàn)出卓越的能力。

4、多模態(tài)圖像與文本數(shù)據(jù):SigLIP 或 Unum

近年來(lái),一系列旨在對(duì)文本、圖像、音頻及視頻等多種非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行綜合訓(xùn)練的 Embedding 模型應(yīng)運(yùn)而生。這些創(chuàng)新模型能夠在統(tǒng)一的向量空間框架下,有效把握并表達(dá)不同形態(tài)的非結(jié)構(gòu)數(shù)據(jù)所蘊(yùn)含的深層語(yǔ)義信息。

多模態(tài) Embedding 技術(shù)的發(fā)展,使得跨領(lǐng)域的應(yīng)用如文本導(dǎo)向的圖像檢索、圖像內(nèi)容的自動(dòng)生成描述,乃至圖像間的相似性搜索成為可能,極大地拓寬了人工智能的應(yīng)用范疇。

2021年,OpenAI 發(fā)布的 CLIP 作為 Embedding 模型的典范,開辟了新領(lǐng)域,盡管其定制化微調(diào)的需求增加了使用的復(fù)雜度。這一挑戰(zhàn)隨后在2024年迎來(lái)了轉(zhuǎn)機(jī),谷歌推出了 SigLIP(Sigmoidal-CLIP),該模型憑借在 zero-shot prompt 任務(wù)上的出色表現(xiàn),顯著降低了部署難度,提升了用戶體驗(yàn)。

與此同時(shí),輕量級(jí)的小型 LLM(語(yǔ)言模型)日益受到青睞。它們的吸引力在于能夠擺脫對(duì)高端云計(jì)算資源的依賴,輕松實(shí)現(xiàn)在個(gè)人筆記本上的運(yùn)行。這些“小而美”的模型,因內(nèi)存占用低、響應(yīng)速度快以及處理效率高的特點(diǎn),正逐步改變著 AI 應(yīng)用的格局。Unum 等平臺(tái)更是提供了集成多模態(tài)功能的小型 Embedding 模型,進(jìn)一步推動(dòng)了 AI 技術(shù)的普及與應(yīng)用便捷性。

5、多模態(tài)文本、音頻、視頻數(shù)據(jù)

多模態(tài)的文本-音頻 RAG(檢索增強(qiáng)的生成)系統(tǒng)廣泛采納了多模態(tài)生成型 LLMs。此過(guò)程啟始于音頻信息的文本化轉(zhuǎn)換,創(chuàng)造音頻-文本配對(duì),繼而將文本內(nèi)容編碼為 Embedding 形式的向量,以便利用 RAG 機(jī)制進(jìn)行常規(guī)的文本查詢。最終階段涉及將檢索到的文本逆向關(guān)聯(lián)回相應(yīng)的音頻片段。

OpenAI 的 Whisper 技術(shù)在這方面起到了橋接作用,它能夠?qū)崿F(xiàn)語(yǔ)音到文本的高效轉(zhuǎn)寫。相反地,OpenAI 還開發(fā)了 Text-to-Speech(TTS)模型,完成了從文本到語(yǔ)音的逆向轉(zhuǎn)換,豐富了多模態(tài)交互的閉環(huán)。

至于多模態(tài)文本-視頻的 RAG 應(yīng)用,則采取了類似的策略,先將復(fù)雜的視頻內(nèi)容簡(jiǎn)化為可處理的文本描述,經(jīng) Embedding 轉(zhuǎn)化后執(zhí)行文本查詢,最后輸出相關(guān)的視頻片段作為檢索成果。

OpenAI 的創(chuàng)新工具 Sora,則在文本到視頻的生成領(lǐng)域展現(xiàn)了非凡能力,與 Dall-E 在圖像生成領(lǐng)域的成就相似,Sora 僅需用戶輸入文本提示,即可借助強(qiáng)大的 LLM 生成對(duì)應(yīng)的視頻內(nèi)容。Sora 的靈活性不僅限于文本,還能基于靜態(tài)圖像或現(xiàn)有視頻進(jìn)行視頻的衍生創(chuàng)作,進(jìn)一步拓展了多模態(tài)內(nèi)容生成的邊界。

Milvus目前已經(jīng)集成了主流的Embedding模型,體驗(yàn)鏈接:???https://milvus.io/docs/embeddings.md??


本文轉(zhuǎn)載自公眾號(hào)玄姐聊AGI  作者:玄姐

原文鏈接:????https://mp.weixin.qq.com/s/IKyF7k_vswDnaCosylw2kA???

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
91精品国产黑色紧身裤美女| 久久精品综合网| 欧美精品videossex性护士| 亚洲丝袜在线观看| 黄色漫画在线免费看| 国产亚洲精品资源在线26u| 国产精品夜间视频香蕉| 久草免费在线视频观看| 小说区图片区色综合区| 欧美日韩国产bt| 日韩极品视频在线观看| 精品影院一区| 国产成人精品一区二区三区网站观看 | 国产裸体舞一区二区三区 | 欧美高清自拍一区| 成人国产精品久久久网站| 日韩不卡在线视频| 欧美色偷偷大香| 成人免费毛片在线观看| 伊人免费在线| 国产丝袜美腿一区二区三区| 999热视频| 中国女人一级一次看片| 一本久久综合| 欧美插天视频在线播放| 亚洲第一视频区| 欧美日韩一区二区三区不卡视频| 91精品国模一区二区三区| 99精品视频播放| 爱福利在线视频| 亚洲丝袜自拍清纯另类| 日韩和欧美的一区二区| 天堂а在线中文在线无限看推荐| 国产一区二区美女诱惑| 国产精品丝袜一区二区三区| 国产毛片aaa| 黄色成人av网站| 久久不射电影网| 国产一区二区三区四区在线| 在线日韩网站| 日韩精品999| 亚洲图片综合网| 98视频精品全部国产| 欧美一区二区三区在| 亚洲欧美国产中文| 日本综合视频| 欧美又粗又大又爽| 999香蕉视频| 中文字幕一区久| 欧美性xxxx在线播放| 黄色大片在线免费看| 国产www视频在线观看| 一级做a爱片久久| 草草草视频在线观看| 天堂成人av| 洋洋av久久久久久久一区| 男人天堂成人网| 丝袜美腿av在线| 夜夜亚洲天天久久| 隔壁人妻偷人bd中字| 青青在线视频| 亚洲大片一区二区三区| 国产原创中文在线观看| 色戒汤唯在线观看| 精品欧美一区二区三区| 欧洲av无码放荡人妇网站| 亚洲天堂手机| 欧美在线观看视频在线| 一区二区三区四区毛片| 99热这里有精品| 日韩欧美激情在线| 黄色免费看视频| 亚洲色图美女| www国产亚洲精品久久网站| 日日噜噜夜夜狠狠久久波多野| 欧美一区高清| 午夜剧场成人观在线视频免费观看| 日韩三级视频在线| 日韩av二区在线播放| 成人黄色av网站| 国产女人高潮时对白| 丰满岳乱妇一区二区三区| 免费一区二区三区| 网友自拍视频在线| 亚洲电影在线播放| 日韩欧美黄色大片| 久久综合给合| 亚洲乱码国产乱码精品精天堂| 日韩福利在线视频| 欧美日韩中文| 国产91久久婷婷一区二区| 国产又粗又黄又爽视频| 成人精品一区二区三区四区 | 中文字幕第三区| 精品av导航| 精品国产一区av| 日韩欧美a级片| 奇米亚洲午夜久久精品| 动漫一区二区在线| av在线免费观看网| 亚洲一区在线观看视频| 超碰av在线免费观看| 视频国产精品| 在线播放亚洲激情| 波多野结衣国产| 国产中文字幕一区| 欧美日韩精品久久| 污污视频在线看| 欧美日韩精品一区视频| 国产高清自拍视频| 欧美成人精品| 国产欧美日韩中文字幕在线| 色呦呦免费观看| 亚洲猫色日本管| 韩国中文字幕av| 西瓜成人精品人成网站| 欧美精品在线看| 在线观看免费黄色小视频| 国产69精品久久久久777| 视频一区视频二区视频三区高| 激情av在线| 欧美一区二区视频免费观看| 国产精品情侣呻吟对白视频| 国产亚洲高清视频| av一区二区三区免费| 日本三级视频在线观看| 91久久精品一区二区三| av鲁丝一区鲁丝二区鲁丝三区| 中文字幕一区二区三区久久网站| 国产精品视频男人的天堂| 日本在线视频1区| 精品久久久精品| 国产吃瓜黑料一区二区| 综合久久亚洲| 成人免费视频97| 免费大片在线观看www| 欧美在线观看视频一区二区三区| 一二三不卡视频| 国产亚洲精品自拍| 国产视频99| a级片免费在线观看| 欧美成人一级视频| 欧美高清视频一区二区三区| 国产呦萝稀缺另类资源| 最新中文字幕久久| 欧美.com| 欧美黄色三级网站| 亚洲精品一区二区口爆| 亚洲一级片在线观看| 国产艳妇疯狂做爰视频| 精品999成人| 国产精品免费一区二区三区观看 | 一区二区在线观看不卡| 中文字幕55页| 国产主播精品| 国内精品视频在线播放| 国产羞羞视频在线播放| 亚洲黄色免费三级| 五月天婷婷激情| 国产欧美日韩另类一区| 性chinese极品按摩| 久久人人99| 91在线看www| 成人免费高清观看| 日韩精品免费在线观看| 在线免费观看国产精品| 中文字幕av不卡| www激情五月| 尤物在线精品| 欧美精品一区二区三区久久| 国产精品一区二区免费福利视频 | 视频一区国产精品| 成人网av.com/| 欧美国产中文字幕| 四虎在线免费观看| 欧美日韩国产在线播放网站| 欧美黑人性猛交xxx| 成人动漫一区二区在线| 国产男女在线观看| 999国产精品| 97欧洲一区二区精品免费| av在线理伦电影| 在线播放国产一区中文字幕剧情欧美| 国产一区二区视频免费观看| 性感美女极品91精品| 免费看91的网站| 国产二区国产一区在线观看| 青青草原成人网| 国产大片一区| 久久99精品国产一区二区三区 | 国产成人免费观看| 欧洲一级精品| 欧美日本高清视频| 黄色视屏网站在线免费观看| 日韩视频免费观看高清完整版在线观看| 日本免费一二三区| 亚洲天堂久久久久久久| 国产人妻人伦精品1国产丝袜| 精品在线播放午夜| 亚洲午夜精品久久久久久人妖| 久久影院一区| 噜噜噜噜噜久久久久久91| 99er精品视频| 国产成人精品网站| 精灵使的剑舞无删减版在线观看| 亚洲午夜国产成人av电影男同| 亚洲第一成人av| 欧美日韩亚洲综合在线| 中文字幕亚洲精品在线| 亚洲色图欧美激情| av黄色在线免费观看| 国产成人av福利| 99sesese| 日韩精品一级中文字幕精品视频免费观看| 妺妺窝人体色www看人体| 青青草成人影院| 欧美日韩在线精品| 超碰97久久| 亚洲综合精品一区二区| 中文字幕系列一区| 日本中文字幕不卡免费| 福利网站在线观看| 欧美另类xxx| 免费黄色网页在线观看| 中文字幕日韩精品有码视频| 手机亚洲第一页| 欧美精品一区二| 亚洲av无码一区二区三区性色 | 日韩片欧美片| 欧美日韩一区二| 亚洲黄页在线观看| 久久精品国产精品国产精品污| 丁香婷婷成人| 成人av免费看| 99久久免费精品国产72精品九九| 成人免费自拍视频| 日本精品在线中文字幕| 日本高清+成人网在线观看| 欧美13videosex性极品| 国内精品小视频在线观看| 在线看三级电影| 欧美另类老女人| 久久av色综合| 欧美黑人巨大xxx极品| 18视频在线观看| 欧美丰满少妇xxxx| 在线xxxx| 欧美极品在线播放| av电影在线地址| 97精品伊人久久久大香线蕉| 啊啊啊久久久| 日本精品久久久久影院| 卡通欧美亚洲| 国产成人精品电影| 韩日一区二区| 成人国产精品一区二区| 高清一区二区三区av| 91亚洲国产成人久久精品网站 | 欧美日韩在线不卡一区| 欧美一区二区三| 中文字幕免费高| 韩国欧美一区| 久久久久久久激情| 日本午夜精品视频在线观看 | 无码人妻精品一区二区三区9厂| 欧美日韩在线免费观看| 亚洲精品91天天久久人人| 欧美欧美午夜aⅴ在线观看| 国产喷水福利在线视频| 精品粉嫩超白一线天av| 你懂的免费在线观看| 色一区av在线| heyzo在线| 国产精品黄色av| 日本伊人久久| 农村寡妇一区二区三区| 97久久视频| 国产午夜伦鲁鲁| 精品一区二区免费在线观看| 久久久久久久久久久久国产精品| 99在线精品观看| 国产第一页精品| 亚洲一区二区视频在线观看| 久久亚洲精品石原莉奈| 91精品一区二区三区久久久久久| 日批免费在线观看| 亚洲欧洲日产国产网站| a视频在线观看免费| 欧日韩在线观看| 日韩精品视频一区二区三区| 久久精品国产一区二区三区日韩| 欧美hd在线| 亚洲精品无码久久久久久| 久久国产精品区| 偷拍女澡堂一区二区三区| 亚洲私人影院在线观看| 黄色片中文字幕| 日韩欧美国产三级| jizz视频在线观看| 性欧美办公室18xxxxhd| 四虎影视国产精品| 欧美在线视频一区二区三区| 欧美精选在线| 天堂网在线免费观看| 91在线国产观看| 欧美三级 欧美一级| 欧美性色黄大片| 亚洲欧美日韩成人在线| 乱亲女秽乱长久久久| 日韩免费小视频| 精品免费视频123区| 一本精品一区二区三区| 8x8x最新地址| 26uuu精品一区二区在线观看| 欧美成人777| 欧美日韩一卡二卡| 深夜福利视频一区| 久久久久久久久久av| 国产成人久久精品一区二区三区| 日本三级中国三级99人妇网站| 国产综合自拍| wwwxxx色| 亚洲精品美国一| 99久久亚洲精品日本无码| 中文字幕精品久久久久| 日韩免费电影| 久久综合精品一区| 影音先锋中文字幕一区| 伊人av在线播放| 亚洲欧美一区二区三区国产精品| www.欧美色| 国产一区二区三区18| free欧美| 色涩成人影视在线播放| 久久亚洲电影| av男人的天堂av| 日本久久精品电影| 九色在线免费| 日本91av在线播放| 思热99re视热频这里只精品| 国产中文字幕在线免费观看| 成人一区在线观看| 国产一级生活片| 亚洲成人网久久久| а_天堂中文在线| 久久久综合亚洲91久久98| 国产一区二区三区成人欧美日韩在线观看| 精品伦一区二区三区| 五月婷婷久久综合| 深夜福利在线视频| 欧美中在线观看| 精品国产中文字幕第一页| www.色就是色| 国产精品久久久久久久久动漫| 中文人妻熟女乱又乱精品| 中文字幕亚洲二区| 成人在线视频www| 日本香蕉视频在线观看| www.欧美精品一二区| 国产又大又黄视频| 国产亚洲美女久久| 日韩在线激情| 97超碰国产精品| 91在线观看污| 亚洲天堂一二三| 欧美大片免费观看在线观看网站推荐| 午夜日韩影院| 777精品久无码人妻蜜桃| 久久久99免费| 国产又粗又猛又色又| 久久久久久久影院| 国产91精品对白在线播放| 日韩中文字幕a| 亚洲香肠在线观看| 国产精品一区二区婷婷| 91精品国产综合久久久久久蜜臀| 欧美日韩亚洲三区| 波多野结衣av在线免费观看| 欧美另类z0zxhd电影| 国产精品—色呦呦| 欧洲一区二区日韩在线视频观看免费| 久久99精品国产.久久久久久| 免费人成在线观看| 亚洲女同性videos| 国产精品无码久久久久| 人妻无码久久一区二区三区免费| 91麻豆福利精品推荐| 一级爱爱免费视频| 97在线免费观看视频| 999久久久免费精品国产| 波多野结衣一二三区| 欧美日韩另类一区| 欧美裸体视频| 午夜久久久久久久久久久| 久久综合久久综合九色| 国产区精品在线| 国产精品6699| 国内一区二区三区| 国产jizz18女人高潮| 亚洲电影在线看|