精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM

發(fā)布于 2025-4-25 06:47
瀏覽
0收藏

  • 訓練一個好的向量模型的重點在于最大限度地利用了更多、更高質量的負樣本,來訓練模型。
  • 騰訊提出的Conan-embedding,采用了動態(tài)硬負樣本挖掘方法,以便在整個訓練過程中向模型展示更多具有挑戰(zhàn)性的負樣本。
  • 最近發(fā)布Conan-embedding-V2版本,在MTEB榜單上已經(jīng)超越了BGE等一眾傳統(tǒng)豪強。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

  • 支持中、英雙語

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

一、Conan-embedding-V2

  • V1版本主要基于通用預訓練的雙向Bert模型進行Embedding任務的訓練。
  • V2版本從頭訓練了原創(chuàng)詞表和模型結構的大模型基座——Conan-1.4B,在此基礎上進行了中、英、多語言的Embedding任務的訓練。
  • 上下文長度從v1版本的512,提升到了32k。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

訓練的4個階段

  • 第1和第2階段,大語言模型(LLM)訓練階段

加入嵌入數(shù)據(jù),以更好地使LLM與嵌入任務對齊

設計了Conan-1.4B,包含8層Attention Layers,Hidden Size為3584,最長上下文32k。

參數(shù)量是1.4B,能夠在較少的參數(shù)下提供更大的Embedding維度。

從基礎的字母、符號上,在約40萬條多語言語料上訓練了Conan的BBPE分詞器,目標詞表大小15萬,完成了詞表訓練。

  • 第3階段,弱監(jiān)督訓練階段

使用與LLM監(jiān)督微調(SFT)相同的配對數(shù)據(jù),并應用軟掩碼來彌合LLM與嵌入模型之間的差距。

使用gte-Qwen2-7B-instruct模型進行評分,并丟棄得分低于0.4的數(shù)據(jù)

訓練中采用了InfoNCE損失函數(shù),并結合In-Batch Negative采樣

  • 第4階段,監(jiān)督訓練階段

引入了跨語言檢索數(shù)據(jù)集和動態(tài)硬負例挖掘方法,以提高數(shù)據(jù)的多樣性和價值

針對不同的下游任務進行任務特定的微調。

將任務分為四類:檢索、跨語言檢索、分類和語義文本相似度(STS)。

前三類任務:包括一個查詢、一個正例文本和一些負例文本,使用經(jīng)典的InfoNCE損失函數(shù)。

STS任務涉及區(qū)分兩個文本之間的相似度,采用CoSENT損失來優(yōu)化。

為了更好的對比Conan-embedding提升了哪些內(nèi)容,下面也簡單介紹一下Conan-embeddingV1,尤其注意一下難例數(shù)據(jù)挖掘的方法,v2版本也是用同樣的方法

二、Conan-embeddingV1

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

總共分為:預訓練和微調兩個階段

2.1 預訓練階段

  • 篩選數(shù)據(jù):bge-large-zh-v1.5模型評分,丟棄所有得分低于 0.4 的數(shù)據(jù)。
  • 使用帶批內(nèi)負樣本的 InfoNCE 損失進行訓練,它利用小批量內(nèi)的其他樣本作為負樣本優(yōu)化模型。
  • 即,在每個小批量中,除了目標樣本的正樣本對之外的所有樣本都被視為負樣本。
  • 通過最大化正樣本對的相似性并最小化負樣本對的相似性,批內(nèi)負樣本 InfoNCE 損失可以有效地提高模型的判別能力和表示學習性能。
  • 此方法通過充分利用小批量內(nèi)的樣本,提高了訓練效率,減少了生成額外負樣本的需求。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

2.2 監(jiān)督微調

監(jiān)督微調時對不同的下游任務執(zhí)行特定的微調任務。將任務分為兩類:

  • 檢索任務:

包括查詢、正文本和負文本,經(jīng)典的損失函數(shù)是 InfoNCE 損失。

  • STS 任務:

涉及區(qū)分兩個文本之間的相似性,經(jīng)典的損失函數(shù)是交叉熵損失。

CoSENT 損失略優(yōu)于交叉熵損失,因此采用 CoSENT 損失來優(yōu)化 STS 任務。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

三、難例數(shù)據(jù)挖掘

一種動態(tài)難樣本挖掘方法介紹:

  • 對于每個數(shù)據(jù)點,記錄當前相對于查詢的難樣本的平均分數(shù)。
  • 每 100 次迭代,如果分數(shù)乘以 1.15 小于初始分數(shù),并且分數(shù)的絕對值小于 0.8,將認為負樣本不再困難,并進行新一輪的難樣本挖掘。
  • 在每次動態(tài)困難負例挖掘過程中,如果需要替換困難負例,使用 (i-1)\times n + 10到i\times n +10 的案例作為負例,其中 i表示第 i次替換,而 n表示每次使用的困難負例數(shù)量。

騰訊屠榜MTEB,嵌入模型告別BERT,擁抱LLM-AI.x社區(qū)

  • 上圖展示了動態(tài)困難負例挖掘與標準困難負例挖掘中正例和負例的得分-步數(shù)曲線
  • 隨著步驟的增加,標準困難負例挖掘中負例的得分停止下降并開始振蕩,表明模型已經(jīng)完成了從該批負例中學習。
  • 相反,動態(tài)困難負例挖掘一旦檢測到負例不再對模型構成挑戰(zhàn),就會替換這些困難負例。

??https://arxiv.org/pdf/2408.15710??

??https://huggingface.co/TencentBAC/Conan-embedding-v2??

??https://zhuanlan.zhihu.com/p/1897675709696149020??

本文轉載自??CourseAI??,作者:CourseAI

已于2025-4-25 10:09:37修改
收藏
回復
舉報
回復
相關推薦
亚洲免费人成在线视频观看| 91精品1区2区| 国产精品裸体一区二区三区| 亚洲另类欧美日韩| 欧美日韩中文一区二区| 91精品久久久久久久99蜜桃| 免费不卡av在线| 第一福利在线| 成人免费观看男女羞羞视频| 国产精品福利在线观看| 欧美黄色一区二区三区| 免费视频一区三区| 欧美成人a∨高清免费观看| 日本黄网站免费| 四虎亚洲成人| 国产精品丝袜黑色高跟| 国产精品青青草| 国产一区二区三区黄片| 99精品国产在热久久下载| 最新国产精品拍自在线播放| 91丨porny丨对白| 欧美激情啪啪| 一本色道久久综合狠狠躁的推荐 | 中文字幕中文字幕一区| 狠狠色噜噜狠狠狠狠色吗综合| 依依成人在线视频| 国产欧美大片| 欧美多人爱爱视频网站| 日韩在线视频免费看| 免费国产自久久久久三四区久久| 欧美www视频| 午夜免费一级片| 精品裸体bbb| 欧美日韩一区二区三区| 国产高清不卡无码视频| 日本中文在线观看| 欧美经典一区二区三区| 久久一区二区三区av| www.97超碰| 国产乱对白刺激视频不卡| 国产精品美女www| 国产精品suv一区| 国产毛片一区| 69国产精品成人在线播放| 欧美三级在线免费观看| 亚洲欧美日韩高清在线| 视频直播国产精品| 美女av免费看| 日韩激情免费| 中文字幕亚洲欧美日韩在线不卡| 国产美女免费无遮挡| 色婷婷狠狠五月综合天色拍| 亚洲福利视频二区| 妖精视频一区二区| 精品一区二区男人吃奶| 亚洲国产精品va| 双性尿奴穿贞c带憋尿| 精品少妇一区| 亚洲欧洲高清在线| 国产高潮呻吟久久| 国产尤物久久久| 这里只有精品丝袜| 潮喷失禁大喷水aⅴ无码| 久久国产电影| 久久网福利资源网站| 国语对白在线播放| 亚洲黄色大片| 日本久久久久久| 影音先锋国产在线| 久久精品国产久精国产爱| 成人激情视频网| 亚洲奶汁xxxx哺乳期| 成人激情黄色小说| 欧美不卡在线一区二区三区| av在线三区| 亚洲日本护士毛茸茸| 99国产精品白浆在线观看免费| 国产经典三级在线| 欧美午夜影院在线视频| 91精品无人成人www| 成人午夜888| 亚洲第一网中文字幕| mm131美女视频| 天天射—综合中文网| 欧美日韩成人精品| 亚洲欧美自拍视频| 精品一区二区免费在线观看| 俄罗斯精品一区二区三区| 先锋av资源站| 国产精品第一页第二页第三页| 成人在线免费观看网址| 国产蜜臀在线| 在线观看免费亚洲| 亚洲av无码久久精品色欲| 一区二区三区日本久久久| 丝袜情趣国产精品| 久久精品久久国产| 日本怡春院一区二区| av一区和二区| 成人在线观看黄色| 亚洲尤物视频在线| 网站一区二区三区| 精品日产乱码久久久久久仙踪林| 一区二区三区视频观看| 国产精品二区一区二区aⅴ| 人人精品人人爱| 国产区一区二区| 天堂аⅴ在线地址8| 欧美日韩精品二区| 91香蕉国产线在线观看| 欧美极品在线观看| 欧美激情精品久久久久久黑人 | 黄色香蕉视频在线观看| 在线看片一区| 成人妇女免费播放久久久| 天天综合永久入口| 一区二区三区在线播放| 日日噜噜夜夜狠狠| 妖精视频一区二区三区| 欧美高清videos高潮hd| 91国产免费视频| 久久久久久亚洲综合| 91黄色在线看| 久久久久久久久久久久电影| 在线观看精品国产视频| 欧美一区二区激情视频| 岛国一区二区在线观看| 日本特级黄色大片| 欧美不卡高清一区二区三区| 亚洲精品网站在线播放gif| 久久激情免费视频| 国产一区二区三区国产| 综合视频在线观看| 国内自拍亚洲| 国产亚洲精品成人av久久ww| www.国产com| 91啪九色porn原创视频在线观看| 日本福利视频一区| 一区二区三区高清在线观看| 九色成人免费视频| 99在线小视频| 亚洲精品欧美激情| 日韩高清在线一区二区| 91久久电影| 91久久在线播放| 国产原创精品视频| 这里只有精品99re| 黄色片子在线观看| 国产精品夜夜爽| 女人床在线观看| 伊人精品久久| 777国产偷窥盗摄精品视频| 天天av天天翘| 欧美丝袜一区二区三区| 人妻体内射精一区二区| 免费日韩av片| 亚洲国产欧美一区二区三区不卡| 粉嫩一区二区三区| 国产午夜精品全部视频播放 | 国产老女人精品毛片久久| 男人的天堂成人| 日韩影片在线观看| 久久久免费观看| 午夜视频在线播放| 欧美系列一区二区| 亚洲av无码一区二区三区在线| 国产精品一区在线观看乱码| 人妻互换免费中文字幕| 欧美a一欧美| 国产精品日韩av| av毛片在线免费看| 亚洲精品在线免费播放| 久久久久99精品成人片三人毛片| 国产无人区一区二区三区| 亚洲 激情 在线| 亚洲国产精品久久久天堂| 国产精品国产精品国产专区蜜臀ah| 123区在线| 永久免费精品影视网站| www.国产黄色| 色综合一个色综合| 国产又粗又猛又爽又黄的视频小说| 狠狠色综合日日| 青青草视频在线免费播放| 精品日本12videosex| 成人欧美在线观看| segui88久久综合9999| 亚洲天堂免费视频| xxxwww在线观看| 91久久香蕉国产日韩欧美9色| 精品一区二区在线观看视频| 成人小视频免费观看| 亚洲欧美另类动漫| 国产精品大片免费观看| 日本中文不卡| 999久久精品| 国产日韩欧美成人| 国产在线精彩视频| 久久久国产精品一区| 青梅竹马是消防员在线| 欧美一区二区三区婷婷月色| 天堂中文字幕在线观看| 亚洲精品国产一区二区精华液| 菠萝菠萝蜜网站| 国产剧情在线观看一区二区 | 国产a久久麻豆| 污视频免费在线观看网站| 亚洲高清毛片| 欧美 日韩 国产 在线观看| 米奇777超碰欧美日韩亚洲| 97久草视频| 外国成人毛片| 国产精品成人va在线观看| 国产色婷婷在线| 欧美成人精品激情在线观看 | 久久av资源网站| 国产在线网站| 日韩精品福利网站| 高清毛片aaaaaaaaa片| 欧美精品电影在线播放| 午夜一区二区三区四区| 精品久久久久久久久中文字幕 | 久久不射中文字幕| a级黄色一级片| 国内精品久久久久国产盗摄免费观看完整版 | 一级黄色大片免费观看| 色综合久久综合| 在线观看亚洲天堂| 婷婷久久综合九色国产成人 | 国内自拍一区| 欧洲精品视频在线| 中文无码久久精品| 五月天男人天堂| 97精品国产| 亚洲v国产v| 日本a级不卡| 无遮挡亚洲一区| 国内亚洲精品| 日本欧美色综合网站免费| 亚洲丝袜美腿一区| 牛人盗摄一区二区三区视频| 日韩激情毛片| 免费成人av网站| 精品少妇av| 亚洲精品欧洲精品| 久久美女精品| 韩国黄色一级大片| 亚洲私人影院| 日本中文字幕网址| 亚洲一区二区成人| 欧美精品第三页| 麻豆精品一二三| 国产精品igao网网址不卡| 国产麻豆精品一区二区| a级大片免费看| 成人蜜臀av电影| 老司机福利av| 国产偷v国产偷v亚洲高清| 男人的天堂av网| 国产精品国产a级| 欧美成人黄色网| 午夜国产不卡在线观看视频| 久久久久久91亚洲精品中文字幕| 日韩欧美aaa| 亚洲图片视频小说| 日韩区在线观看| 亚洲欧美另类一区| 亚洲男人第一网站| 午夜视频在线| 久久久久中文字幕| 浪潮色综合久久天堂 | 精品国产乱子伦一区二区| 欧美日本韩国国产| 国产大片一区| 日韩亚洲欧美视频| 久久婷婷av| 中文字幕剧情在线观看| av一二三不卡影片| 青青草自拍偷拍| 亚洲午夜久久久久久久久久久| 国产黄色片免费看| 欧美精品成人一区二区三区四区| 国内精品久久久久久久久久久| 日韩av在线资源| 国产在线观看免费麻豆| 6080yy精品一区二区三区| 成人在线免费av| 国产精品免费区二区三区观看| 国产一区二区在线| 999一区二区三区| 日韩av中文字幕一区二区三区| 亚洲日本黄色片| 2021国产精品久久精品| 美国黄色片视频| 欧美日韩免费在线观看| 一级特黄色大片| 日韩大陆欧美高清视频区| 日本三级视频在线观看| 97久久精品人人澡人人爽缅北| 懂色aⅴ精品一区二区三区| 成人看片视频| 日韩中文在线电影| 亚洲爆乳无码专区| 国产mv日韩mv欧美| 三级黄色在线观看| 日本韩国欧美在线| 天堂中文在线资源| 欧美人与性动交a欧美精品| 欧美aaa视频| 狠狠色综合色区| 欧美激情视频一区二区三区免费| 成人精品视频一区二区| 99久久精品情趣| 在线免费日韩av| 欧美视频一区二| 日本不卡视频一区二区| 欧美激情女人20p| 四虎国产精品免费久久5151| 欧美xxxx黑人又粗又长密月| 亚洲欧洲日本mm| 乳色吐息在线观看| 日韩毛片精品高清免费| 中日精品一色哟哟| 亚洲另类xxxx| 在线看片国产福利你懂的| 国产精品久久亚洲7777| 国产精品啊啊啊| 亚洲a级黄色片| 国产精品看片你懂得| 日韩精选在线观看| 亚洲日本成人女熟在线观看| 日本蜜桃在线观看视频| 国产精品亚洲综合| 亚洲国产mv| 人妻激情偷乱频一区二区三区| 伊人开心综合网| 性欧美一区二区三区| 欧美久久精品午夜青青大伊人| 日本午夜精品久久久久| 伊人婷婷久久| 精品一二三四区| 婷婷社区五月天| 欧美一区二区三区视频| 91网址在线观看| 99re6在线| 狠狠噜噜久久| 日韩www视频| 欧美性猛交xxxx免费看| 欧洲亚洲在线| 国产精品久久久久福利| 热久久天天拍国产| 一级黄色高清视频| 亚洲一区二区三区四区在线观看 | 美女主播精品视频一二三四| 国产 日韩 欧美在线| av日韩在线网站| 国产伦精品一区二区三区视频网站| 亚洲精品日韩欧美| 午夜激情成人网| 亚洲精品中文字幕乱码三区不卡| 蜜桃一区二区三区在线观看| 日韩精品一区二区三区在线视频| 91精品国产欧美一区二区成人| 视频在线这里都是精品| 国产亚洲欧美另类一区二区三区| 99国产一区| 国产91丝袜美女在线播放| 在线不卡a资源高清| 性欧美videos高清hd4k| 精品视频免费观看| 狂野欧美一区| 国产美女福利视频| 欧美精品一区二区在线观看| 午夜激情成人网| 永久免费网站视频在线观看| 成人av在线看| 亚洲天堂视频在线播放| 精品国产一区av| 九九热hot精品视频在线播放| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 国产精品拍天天在线| 丰满岳乱妇国产精品一区| 热久久这里只有精品| 亚洲精品一区二区妖精| 亚洲最大免费视频| 欧美另类高清zo欧美| 黄色大片在线| 日韩成人av网站| 国产不卡在线播放| 久久精品五月天| 色综合色综合网色综合| 精品国产一区二区三区久久久樱花| 国产欧美精品一二三| 欧美性20hd另类| 99视频免费在线观看| 欧美一区二区在线| 国产成都精品91一区二区三| 波多野结衣av无码| 国色天香2019中文字幕在线观看| 日韩国产一区二区|