精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維 精華

發布于 2024-6-20 10:47
瀏覽
0收藏

一月份,OpenAI發布了兩種新的嵌入模型:text-embedding-3-small和text-embedding-3-large。這些模型采用套娃表示學習技術(MRL:Matryoshka Representation Learning)進行訓練,這使得開發者可以在嵌入中權衡性能和成本。

什么是套娃表示學習?

套娃表示學習是一種用于訓練嵌入模型的技術。它允許在犧牲少量準確性的情況下換取更小的嵌入尺寸。因此,可以以更低的成本存儲更多的信息,并更快地搜索它。

嵌入通過從序列末尾移除維度,并且只使用嵌入向量的子集維度來縮短。例如,你可以只使用原本具有1536維度向量的前8、16、32等維度(或任何其他維度的切片)。

與常見的向量嵌入不同,其中所有維度都同等重要,在套娃嵌入中,向量前面的維度存儲的信息比后面的維度更多,后者只是添加了更多細節。可以通過嘗試在多個分辨率下對圖像進行分類的類比來理解這一點:較低的分辨率提供了更多高層次的信息,而較高的分辨率則添加了更多細節

因此,檢索性能隨著表示大小的增加而提高。然而,OpenAI報告說,text-embedding-3-large嵌入可以縮短到256的大小,同時在MTEB基準測試上仍然優于未縮短的、大小為1536的text-embedding-ada-002嵌入

套娃嵌入的表示大小與檢索性能

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維-AI.x社區

MRL(Matryoshka Representation Learning,套娃表示學習)實現的魔力全部在于訓練這些模型時優化的損失函數!如果之前損失函數是L,對于MRL,將損失函數分解為各個向量維度范圍上的損失之和:Loss_Total = L(upto 8d) + L(upto 16d) + L(upto 32d) + ... + L(upto 2048d)。有了這個新的嵌套損失函數,模型就有動力在向量的每個子部分捕捉信息。

修改損失函數后,可以免費獲得這些可截斷的向量,無需任何額外成本——這幾乎適用于所有損失函數,并且可以對現有的預訓練模型進行微調以輸出MRL向量!這意味著MRL非常容易采用并應用于預訓練模型。

套娃嵌入詳細分析

下面將使用來自DBpedia的100萬個對象的數據集進行工作,這些對象已使用新的OpenAI套娃text-embedding-3-large模型和舊的ada-002模型進行了嵌入。這將理解信息是如何在套娃向量中與它們的非套娃前身不成比例地存儲的。

在下面的分析中,從上述數據集中隨機抽取了1萬個向量,并繪制了每個維度上觀察到的值的標準差。一個維度上看到的方差或標準差是衡量該維度相對于其他維度攜帶多少信息的良好指標。

顯示了使用新text-emb3-large模型和舊ada-002模型嵌入的DBpedia中的10,000個隨機樣本,每個維度的標準差平滑值。

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維-AI.x社區

可以看到,標準差是維度索引的多步函數——早期維度捕獲更多信息,而后面的維度捕獲較少。圖表還顯示,OpenAI嵌入模型在維度={512d, 1024d, 1536d, 3072d}處使用了4個聚合損失函數,按照上面詳細描述的MRL風格進行訓練。

更有趣的是,這些步驟內的信息(512d, 1024d, 1536d, 3072d)在各個維度之間或多或少地均勻擴散。這也解釋了MRL論文中的神奇發現,即你可以實際上取這些預指定塊之間的維度(例如750d),仍然可以獲得增量效益?

可視化套娃向量空間

還可以問一個有趣的問題:當你使用越來越多的套娃嵌入維度時,底層數據表示/向量空間會如何變化

下面的視頻中,每一幀都是使用僅使用一定數量的MRL向量維度的主成分分析(PCA)生成的3D向量空間。

從上面鏈接的相同數據集中取了10,000個隨機樣本,使用OpenAI text-embed-3-large模型進行嵌入,然后使用PCA將它們縮減到3D空間;從僅使用4個維度開始,一直到使用所有3072個維度。用越來越多的維度可視化套娃向量。

OpenAI最新套娃嵌入模型分析:256維的MTEB效果超過1536維-AI.x社區

可以看到,當使用512個維度時,向量空間的結構已經被很好地定義了,在這些最初的512個維度之后,其他維度主要用于在更大的結構內收緊數據表示

當到達2000+維度時,只看到數據點的小幅度抖動,可能是因為增量維度的貢獻微乎其微,無法在前3個主成分中看到。

熟悉 OpenAI 的 Matryoshka

OpenAI 發布了兩個新模型,text-embedding-3-small和,它們使用Matryoshka表示學習text-embedding-3-large技術進行訓練 。這些模型的 API 支持一個參數,可以使用該參數控制生成的嵌入的長度。dimensions

如果使用相同的模型但不同的dimensions參數嵌入相同的文本,會發現較短的嵌入不是較長嵌入的截斷版本。

# !pip install openai
from openai import OpenAI


openai = OpenAI()


def vectorize(text,
              dimensions,
              model = "text-embedding-3-small"):
   text = text.lower()


   return openai.embeddings.create(input = [text], 
                                   model = model, 
                                   dimensions = dimensions).data[0].embedding


example_text = "Learned representations are a central component in modern ML systems, serving a multitude of downstream tasks."


full = vectorize(example_text, dimensions = 1536)
short = vectorize(example_text, dimensions = 8)


print(full[:8])
print(short)

[-0.001463836757466197, -0.0241670124232769,  0.00683123804628849, -0.013936602510511875, 0.0320618636906147, 0.00872271228581667, 0.031053075566887856, 0.021820487454533577]
[-0.025210261344909668, -0.41620534658432007, 0.11764788627624512, -0.24001678824424744,  0.5521708130836487, 0.15022294223308563, 0.5347974300384521,   0.3757933974266052]

但是,如果檢查它們的余弦相似度,會發現它們非常相似(或者由于四舍五入而甚至相等)。

from sklearn.metrics.pairwise import cosine_similarity


cosine_similarity([full[:8]], [short])

array([[1.]])

如果仔細觀察,會發現嵌入實際上僅在縮放因子上有所不同(在本例中為 0.058)。

scale = full[0]/short[0]
print(scale)
print([x * scale for x in short])
print(full[:8])

0.05806511632065122
[-0.001463836757466197, -0.0241670118626955, 0.006831238201508919, -0.01393660272831134, 0.03206186249057062, 0.008722712614794586, 0.031053074983168057, 0.021820487334108546]
[-0.001463836757466197, -0.0241670124232769, 0.00683123804628849, -0.013936602510511875, 0.0320618636906147, 0.00872271228581667, 0.031053075566887856, 0.021820487454533577]

請注意 text-embedding-3-large 和 text-embedding-3-small 在默認嵌入長度的長度上有所不同:

默認尺寸text-embedding-3-small:1536

默認尺寸text-embedding-3-large:3072

此外,  當切片為相同尺寸時,它們不會產生兼容的嵌入:

large = vectorize(example_text, dimensions = 3072, model = "text-embedding-3-large")
small = vectorize(example_text, dimensions = 1536, model = "text-embedding-3-small")
print(large[:1536])
print(small)


cosine_similarity([large[:1536]], [small])

[0.011070899665355682,   0.014488349668681622, -0.021118611097335815, -0.011152755469083786, 0.011555208824574947, -0.0007622754783369601, ... ]
[-0.001463836757466197, -0.0241670124232769,    0.00683123804628849,  -0.013936602510511875, 0.0320618636906147,    0.00872271228581667,   ... ]
array([[-0.00149749]])

如果需要在生成嵌入維度后更改嵌入維度,則需要對嵌入維度進行規范化。OpenAI文檔對此進行了更全面的解釋。

本文轉載自??PaperAgent??

已于2024-6-20 15:51:37修改
收藏
回復
舉報
回復
相關推薦
欧美日韩国产欧| 日韩在线观看中文字幕| 国产精品久久久久久久久久免费看| 国产精品久久久久久久久久久久久| 亚洲区一区二区三| 高清一区二区三区| 欧美视频一区二区在线观看| 国产免费xxx| 神马久久久久| 国产综合色精品一区二区三区| 欧美激情视频免费观看| 一级黄色片大全| 亚洲热av色在线播放| 亚洲成人免费看| 亚洲视频精品一区| 天堂成人在线观看| 精品一区二区三区在线播放视频| 久久久欧美精品| 日韩av片在线免费观看| 欧美天堂影院| 欧美一区二区三区播放老司机| www黄色av| 最爽无遮挡行房视频在线| 久久先锋影音av鲁色资源| 成人高清视频观看www| 在线观看黄网站| 欧美一区成人| 少妇高潮久久77777| 蜜桃精品成人影片| 亚洲精品一区二区三区在线| 欧美三级欧美一级| 国产黄色一级网站| 6699嫩草久久久精品影院| 1000部国产精品成人观看| 欧美福利精品| 天天干天天爽天天操| 国产精品99久久久久久似苏梦涵 | 久草免费在线观看视频| 91综合在线| 在线看片第一页欧美| 李宗瑞91在线正在播放| 久久99国产精品久久99大师| 欧美mv日韩mv| 无套内谢丰满少妇中文字幕 | 国产精品人人爽| 欧美久久综合| 欧美精品生活片| 久久人妻无码aⅴ毛片a片app | 欧美h视频在线观看| av资源在线观看免费高清| 久久精品欧美一区二区三区麻豆| 精品国产乱码久久久久久郑州公司| 国产视频在线免费观看| 国产在线精品一区二区夜色| 国产在线拍偷自揄拍精品| 在线观看不卡的av| 久久99热99| 91久久精品久久国产性色也91| 一本色道久久综合熟妇| 久久成人免费日本黄色| 成人xxxxx| www.国产.com| 99国产欧美另类久久久精品| 久久精品日产第一区二区三区精品版 | 中文字幕人妻一区二| 久久久久蜜桃| 久久久亚洲福利精品午夜| 在线观看亚洲天堂| 性一交一乱一区二区洋洋av| 国产999精品视频| 在线播放一级片| 国产最新精品免费| 国产精品 日韩| 婷婷在线免费观看| 久久久久久亚洲综合| 日韩女优中文字幕| 黄页视频在线播放| 亚洲图片欧美一区| 人妻精品无码一区二区三区| 亚洲成av在线| 欧美放荡的少妇| 乱码一区二区三区| 蜜臀av免费一区二区三区| 中文字幕久久亚洲| 久久久国产精品人人片| 亚洲综合精品四区| 成人妇女免费播放久久久| 亚洲国产精品久久久久久久| aaa亚洲精品一二三区| 日韩精品不卡| 在线三级电影| 色噜噜狠狠色综合中国| 久久6免费视频| 白嫩白嫩国产精品| 一区二区三区四区精品| 性色av无码久久一区二区三区| 在线成人www免费观看视频| 日本中文字幕久久看| 国产特级黄色片| 91蝌蚪国产九色| 国产高清不卡无码视频| 欧美大片免费高清观看| 91精品久久久久久久99蜜桃| 丰满大乳奶做爰ⅹxx视频| 希岛爱理av一区二区三区| 欧美在线亚洲一区| 亚洲第一页在线观看| 国产精品你懂的在线| 黄页免费在线观看视频| 国产高清日韩| 一区二区三区视频免费在线观看| 日本a在线观看| 精品综合免费视频观看| 欧美精品123| 成人高潮aa毛片免费| 7878成人国产在线观看| 中字幕一区二区三区乱码| 亚洲精品少妇| 97人摸人人澡人人人超一碰| 中国日本在线视频中文字幕| 欧美日韩国产在线看| 91视频免费入口| 99久久99久久精品国产片桃花 | 国产亚洲人成a一在线v站| 国产真实乱人偷精品视频| 狠狠色丁香久久婷婷综合丁香| 欧洲av一区| 午夜伦理福利在线| 亚洲精品一区二区三区影院 | 一级片免费在线播放| 国产一区二区三区久久久| 亚洲不卡一卡2卡三卡4卡5卡精品| 久久五月精品中文字幕| 日韩一区二区三区免费观看| 亚洲色图欧美色| 丝袜脚交一区二区| 九九久久99| 99爱在线观看| 亚洲大尺度美女在线| 免费一级片在线观看| 国产综合色产在线精品| 成年人黄色在线观看| 91精品国产66| 夜夜嗨av色一区二区不卡| 91精品国产综合久久久蜜臀九色| 成人av免费在线播放| www污在线观看| 伊人久久大香线蕉av超碰| 久久av.com| 国产a级免费视频| 亚洲综合自拍偷拍| 黄色av电影网站| 中文字幕一区二区三三| 波多野结衣久草一区| 黄色美女视频在线观看| 日韩av有码在线| 九九热在线视频播放| 91丨九色丨国产丨porny| 成人在线免费观看av| 伊人久久大香线蕉综合网蜜芽| 日韩av片电影专区| 91精彩视频在线播放| 欧美美女黄视频| 麻豆亚洲av熟女国产一区二| 成人午夜av电影| 亚洲国产精品久久久久婷蜜芽| 一区二区小说| 成人观看高清在线观看免费| 欧美人与牲禽动交com| 欧美成人伊人久久综合网| 日本一区二区三区四区五区| 26uuu成人网一区二区三区| www.99在线| 中文字幕av亚洲精品一部二部| 国产高清在线精品一区二区三区| 美女网站在线看| 中文精品99久久国产香蕉| 91中文字幕在线播放| 亚洲国产美女搞黄色| 精品人伦一区二区三电影| 国内久久精品视频| 欧美日韩不卡在线视频| 精品色999| 懂色av一区二区三区在线播放| 澳门成人av网| 久久久国产精品亚洲一区| 免费av网站观看| 在线视频欧美区| 免费在线观看一级片| 91在线国内视频| 色婷婷激情视频| 欧美专区18| 青少年xxxxx性开放hg| 美女视频亚洲色图| 国产日韩欧美另类| 中国色在线日|韩| 久久精品国产综合| 欧美zzoo| 欧美成人一区二区三区片免费| www亚洲视频| 亚洲欧美日韩国产成人精品影院 | 亚洲精品视频91| 欧美综合在线视频| 国产一级一片免费播放| 国产精品毛片大码女人| 泷泽萝拉在线播放| 国产精品一品二品| 天天干天天av| 日韩在线卡一卡二| 日本午夜激情视频| 91精品电影| 日韩欧美在线观看强乱免费| 免费日韩一区二区三区| 亚洲jizzjizz日本少妇| 国产精品第一国产精品| 欧美一区二三区| 爱情岛亚洲播放路线| 久热在线中文字幕色999舞| 国产69久久| 亚洲欧美精品suv| 色香蕉在线视频| 日韩视频免费观看高清完整版在线观看| 久久国产乱子伦精品| 天天做天天摸天天爽国产一区| 欧美黑人性猛交xxx| 国产精品污www在线观看| 在哪里可以看毛片| 91在线国产福利| 国产精品91av| 国产99久久久国产精品| 九色91porny| 国产成人啪免费观看软件| 91pony九色| 极品美女销魂一区二区三区 | 91性感美女视频| 亚洲精品一二三四| 精品系列免费在线观看| 国产福利在线免费| 久久精品国产第一区二区三区| 91制片厂毛片| 麻豆成人免费电影| 99国产精品久久久久久| 极品美女销魂一区二区三区| 亚洲欧美日韩三级| 九九热在线视频观看这里只有精品 | 国模雨婷捆绑高清在线| 九九久久国产精品| 欧美一卡二卡| 韩国三级日本三级少妇99| www.综合| 日韩av日韩在线观看| 精品成人免费一区二区在线播放| 欧洲一区二区视频| 日本精品在线中文字幕| 国产日韩欧美在线播放| 大胆国模一区二区三区| 北条麻妃高清一区| 天天做夜夜做人人爱精品 | 三级视频网站在线观看| 99精品欧美一区二区三区小说| 欧美丰满少妇人妻精品| 国产清纯在线一区二区www| 精品一区二区三孕妇视频| 中文字幕人成不卡一区| 久久久www成人免费毛片| 欧美日韩国产区| 一区二区三区在线免费观看视频| 欧美人妇做爰xxxⅹ性高电影 | 国产精品一级片| 黑森林av导航| 国产欧美一区二区精品秋霞影院| 最新黄色av网址| 亚洲午夜久久久久久久久电影院| 51国产偷自视频区视频| 欧美色精品天天在线观看视频| 国产伦精品一区二区三区免.费| 欧美一区二区成人| 天天在线女人的天堂视频| 中文字幕久久亚洲| 国产盗摄精品一区二区酒店| 国产成人精品优优av| 国产精品毛片aⅴ一区二区三区| 高清视频一区| 日韩国产一区| 777av视频| 久久se这里有精品| 久久久久久久无码| 亚洲视频你懂的| 4438国产精品一区二区| 日韩视频一区二区三区 | 国产精品素人视频| 久久伊人成人网| 欧美亚洲高清一区| 免费观看黄色一级视频| 日韩在线中文字| 色欲狠狠躁天天躁无码中文字幕 | 先锋影音男人资源| 99热这里只有精品8| 亚洲天堂国产视频| 93久久精品日日躁夜夜躁欧美 | 天涯成人国产亚洲精品一区av| 中文字幕在线2019| 日韩成人黄色av| 色呦呦网站在线观看| 国产精品第一第二| 欧美电影免费网站| 99re6这里有精品热视频| 老司机午夜免费精品视频| 久久久国产精品久久久| 国产精品伦理一区二区| 国产精品久久久久久久久久精爆| 日韩视频一区二区三区在线播放| 2021av在线| 日本亚洲欧洲色α| 美女一区2区| 国产女主播自拍| 国产一区二区三区蝌蚪| 萌白酱视频在线| 在线看一区二区| 精品电影在线| 欧美做爰性生交视频| 国产乱人伦丫前精品视频| 久久人妻无码一区二区| 麻豆精品一区二区av白丝在线| 人妻av无码一区二区三区| 欧美日韩免费一区| 亚洲精品第五页| 九九精品在线观看| 亚洲日本视频在线| 国产香蕉一区二区三区| 精品无码三级在线观看视频| 女人裸体性做爰全过| 在线免费一区三区| bbbbbbbbbbb在线视频| 日本一区二区三区四区视频| 亚洲深夜福利在线观看| 欧美牲交a欧美牲交| 91片黄在线观看| 91久久国产视频| 日韩激情在线视频| 625成人欧美午夜电影| 久久久久久九九| 西西裸体人体做爰大胆久久久| 日韩免费高清一区二区| 午夜精品影院在线观看| 五十路在线观看| 2020久久国产精品| 加勒比色老久久爱综合网| 日韩在线综合网| 91蝌蚪porny| www.久久网| 最近2019中文字幕在线高清| 久久影视精品| 国产精品h视频| 国产精品一区在线| 久久久久久久久久久久国产| 精品国产乱码久久久久久老虎 | 国产激情999| 日韩精品一卡| 国产性生活一级片| 亚洲第一精品在线| 欧美一区二区视频| 国产精品久久中文| 一区二区在线| wwwxx日本| 色婷婷综合激情| 乱人伦中文视频在线| 国产精品xxx在线观看www| 国产日本精品| 免费黄色在线网址| 日韩欧美国产午夜精品| 亚洲十八**毛片| 亚洲综合第一| 成人精品高清在线| 99精品一区二区三区无码吞精 | 欧美一级一区| 国产三级在线观看完整版| 欧美精品丝袜中出| 伦理av在线| 天天综合狠狠精品| 国产精品综合视频| 中文字字幕在线中文| 久久精品国产成人精品| 哺乳一区二区三区中文视频| 成年人视频网站免费观看| 国产精品麻豆欧美日韩ww| 精品黑人一区二区三区在线观看 | 春日野结衣av| 国产精品亲子伦对白| 亚洲精品久久久久久动漫器材一区| 91tv亚洲精品香蕉国产一区7ujn| 日韩在线视屏| 国产激情第一页| 欧美一区午夜精品| 日韩电影免费观看高清完整版| 4444在线观看| 国产日韩三级在线| 免费观看毛片网站| 91在线观看免费观看 | 国产v综合ⅴ日韩v欧美大片|