精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

智源發(fā)布全球最大中英文向量模型訓(xùn)練數(shù)據(jù)集!規(guī)模高達(dá)3億文本對(duì)

人工智能 新聞
為推動(dòng)大模型開(kāi)源生態(tài),智源研究院發(fā)布全球最大面向中英文語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)集。

9月15日,北京人工智能產(chǎn)業(yè)峰會(huì)暨中關(guān)村科學(xué)城科創(chuàng)大賽頒獎(jiǎng)典禮現(xiàn)場(chǎng),智源研究院發(fā)布面向中英文語(yǔ)義向量模型訓(xùn)練的大規(guī)模文本對(duì)數(shù)據(jù)集MTP(massive text pairs)。

這是全球最大的中、英文文本對(duì)訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)規(guī)模達(dá)3億對(duì),具有規(guī)模巨大、主題豐富、數(shù)據(jù)質(zhì)量高三大特征,進(jìn)而可以推動(dòng)解決中文模型訓(xùn)練數(shù)據(jù)集缺乏問(wèn)題。

圖片

通用語(yǔ)義向量模型是決定大模型性能的關(guān)鍵組件,可以鏈接外模型與外部知識(shí);由「關(guān)聯(lián)文本」為基本元素的優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),是構(gòu)建通用語(yǔ)義向量模型的核心要素。

本次開(kāi)源的MTP數(shù)據(jù)集,正是智源BGE中英文語(yǔ)義向量模型訓(xùn)練所用中英文數(shù)據(jù)。

3億中英向量模型訓(xùn)練數(shù)據(jù)開(kāi)放

數(shù)據(jù)在大模型訓(xùn)練中至關(guān)重要,構(gòu)建高質(zhì)量開(kāi)源數(shù)據(jù)集,特別是用于訓(xùn)練基礎(chǔ)模型的開(kāi)源數(shù)據(jù)集對(duì)大模型發(fā)展意義重大,然而中文社區(qū)卻鮮少數(shù)據(jù)開(kāi)源貢獻(xiàn)者。

圖片

本次發(fā)布的全球最大語(yǔ)義向量模型訓(xùn)練數(shù)據(jù)MTP,具備如下特征:

- 規(guī)模巨大:

3億文本對(duì),中文1億,英文2億。

- 主題豐富:

源自海量?jī)?yōu)質(zhì)文本數(shù)據(jù),涉及搜索、社區(qū)問(wèn)答、百科常識(shí)、科技文獻(xiàn)等多種主題。

- 數(shù)據(jù)質(zhì)量高:

數(shù)據(jù)經(jīng)過(guò)必要的采樣、抽取、過(guò)濾獲得;由該數(shù)據(jù)訓(xùn)練得到的語(yǔ)義向量模型BGE (BAAI General Embedding)性能大幅領(lǐng)先同類(lèi)別模型。

圖片

MTP數(shù)據(jù)集鏈接:https://data.baai.ac.cn/details/BAAI-MTP

BGE 模型鏈接:https://huggingface.co/BAAI

BGE 代碼倉(cāng)庫(kù):https://github.com/FlagOpen/FlagEmbedding

鑒于數(shù)據(jù)的重要性,智源在2021年就推出了全球最大語(yǔ)料庫(kù)WuDaoCorpora,開(kāi)放200GB高質(zhì)量低風(fēng)險(xiǎn)中文語(yǔ)料,由400余個(gè)產(chǎn)學(xué)研單位合作,已有770多個(gè)研發(fā)團(tuán)隊(duì)申請(qǐng),為微軟、哈佛大學(xué)、斯坦福大學(xué)、華為、阿里巴巴、騰訊、鵬城實(shí)驗(yàn)室等提供數(shù)據(jù)服務(wù),有效支撐全球大模型相關(guān)研究。

今年開(kāi)放的最大規(guī)模、可商用、持續(xù)更新的中文開(kāi)源指令數(shù)據(jù)集COIG,由來(lái)自全球40余個(gè)機(jī)構(gòu)的100多名工程師共同參與,創(chuàng)造了跨越國(guó)界、緊密合作的全球數(shù)據(jù)開(kāi)源動(dòng)人故事。

下載達(dá)數(shù)十萬(wàn),廣受歡迎的BGE模型升級(jí)更新

BGE 語(yǔ)義向量模型一經(jīng)發(fā)布就備受大模型開(kāi)發(fā)者社區(qū)關(guān)注,目前Hugging Face累計(jì)下載量達(dá)到數(shù)十萬(wàn),且已被LangChain, LangChain-Chatchat, llama_index 等知名開(kāi)源項(xiàng)目集成。

中文語(yǔ)義向量模型評(píng)測(cè)(C-MTEB)  

 英文語(yǔ)義向量模型評(píng)測(cè)榜(MTEB)

 Langchain官方推文:「BGE模型在MTEB基準(zhǔn)上排名第一」

 LangChain聯(lián)合創(chuàng)始人兼首席執(zhí)行官Harrison Chase推薦

基于社區(qū)反饋,BGE進(jìn)一步優(yōu)化更新,表現(xiàn)更加穩(wěn)健、出色。具體升級(jí)如下:

- 模型更新:

BGE-*-zh-v1.5緩解了相似度分布問(wèn)題,通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行過(guò)濾,刪除低質(zhì)量數(shù)據(jù),提高訓(xùn)練時(shí)溫度系數(shù)temperature至0.02,使得相似度數(shù)值更加平穩(wěn) 。

- 新增模型:

開(kāi)源BGE-reranker 交叉編碼器模型,可更加精準(zhǔn)找到相關(guān)文本,支持中英雙語(yǔ)。不同于向量模型需要輸出向量,BGE-reranker直接文本對(duì)輸出相似度,排序準(zhǔn)確度更高,可用于對(duì)向量召回結(jié)果的重新排序,提升最終結(jié)果的相關(guān)性。

- 新增功能:

BGE1.1增加難負(fù)樣本挖掘腳本,難負(fù)樣本可有效提升微調(diào)后檢索的效果;在微調(diào)代碼中增加在微調(diào)中增加指令的功能;模型保存也將自動(dòng)轉(zhuǎn)成 sentence transformer 格式,更方便模型加載。

值得一提的是,日前智源聯(lián)合Hugging Face發(fā)布了一篇技術(shù)報(bào)告,報(bào)告提出用C-Pack增強(qiáng)中文通用語(yǔ)義向量模型。

圖片

報(bào)告地址:https://arxiv.org/abs/2309.07597

構(gòu)建大模型時(shí)代的類(lèi)Linux生態(tài)

伴隨2022年末ChatGPT 橫空出世,全球大模型研發(fā)進(jìn)入如火如荼的爆發(fā)期,而激烈的競(jìng)爭(zhēng)與高昂的成本,也同時(shí)推動(dòng)著開(kāi)源崛起成為人工智能發(fā)展的關(guān)鍵推動(dòng)力量。

標(biāo)志性的事件是今年5月在全球人工智能圈廣為流傳的一篇Google內(nèi)部文件,聲稱(chēng)「開(kāi)源AI將擊敗谷歌和OpenAI」;來(lái)自Meta的代表性開(kāi)源模型 Llama則對(duì)當(dāng)前產(chǎn)業(yè)發(fā)展起到至關(guān)重要的作用。

作為中國(guó)大模型開(kāi)源生態(tài)圈的代表機(jī)構(gòu),智源正在著力打造FlagOpen飛智大模型技術(shù)開(kāi)源體系,引領(lǐng)共建共享大模型時(shí)代的「類(lèi)Linux」開(kāi)源開(kāi)放生態(tài)。

上線于2022年11月,正式發(fā)布于2023年2月,F(xiàn)lagOpen大模型技術(shù)開(kāi)源體系先見(jiàn)性地預(yù)見(jiàn)大模型開(kāi)源建設(shè)這一大勢(shì)所趨。

現(xiàn)在,智源大模型技術(shù)開(kāi)體系 FlagOpen 新增 FlagEmbedding 版塊,聚焦于 Embedding 技術(shù)和模型,BGE 是其中首個(gè)開(kāi)源模型。

FlagEmbedding:https://github.com/FlagOpen/FlagEmbedding

在BGE項(xiàng)目之外,F(xiàn)lagOpen還有包括大模型算法、模型、數(shù)據(jù)、工具、評(píng)測(cè)等重要組成部分。

其中,F(xiàn)lagEval(天秤)大模型評(píng)測(cè)體系及開(kāi)放平臺(tái),構(gòu)建3維評(píng)測(cè)體系、覆蓋600余項(xiàng)全面能力評(píng)測(cè),旨在建立科學(xué)、公正、開(kāi)放的評(píng)測(cè)基準(zhǔn)、方法、工具集,協(xié)助研究人員全方位評(píng)估基礎(chǔ)模型及訓(xùn)練算法的性能。

每月發(fā)布的FlagEval大模型評(píng)測(cè)榜單,對(duì)主流模型進(jìn)行多維評(píng)測(cè)解讀,打造公正全面金標(biāo)準(zhǔn),正在愈來(lái)愈成為大模型能力評(píng)價(jià)的風(fēng)向標(biāo)。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2023-08-09 10:08:00

模型AI

2023-09-15 13:08:56

AI訓(xùn)練

2020-11-18 10:29:07

模型人工智能開(kāi)源

2021-06-04 10:34:19

AI

2015-08-18 15:19:51

2021-09-30 11:20:01

AI 數(shù)據(jù)人工智能

2025-09-17 14:47:51

2020-07-20 09:49:56

開(kāi)源技術(shù) 趨勢(shì)

2020-07-16 13:00:18

人工智能機(jī)器學(xué)習(xí)技術(shù)

2021-03-22 11:16:50

人工智能應(yīng)用基礎(chǔ)設(shè)施

2020-09-10 08:54:09

全球消費(fèi)電子CE智能家居

2021-06-02 00:03:02

人工智能悟道2.0

2020-06-08 11:16:06

百度

2021-10-15 15:26:10

AI 數(shù)據(jù)人工智能

2015-12-01 11:17:41

Windows 10Version 151鏡像

2024-05-15 17:30:51

開(kāi)源模型

2024-06-11 08:40:00

2025-03-10 09:30:00

2009-08-13 09:26:14

.NET正則表達(dá)式

2009-03-17 09:52:22

Unicode中英文Python
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美孕妇性xx| 日韩一区二区三区四区五区六区| 欧美精品一区二区三区在线四季| 中文字幕第一页在线播放| 国产精品久久久久久影院8一贰佰| 日韩一区二区三区视频| 日韩av在线综合| 成人看av片| 久久影视一区二区| 91人人爽人人爽人人精88v| 国产香蕉在线视频| 日本一区二区三区视频| 精品动漫一区二区三区在线观看| 密臀av一区二区三区| 免费不卡av| 中文字幕制服丝袜一区二区三区| 精品无人区一区二区三区| 国产又爽又黄免费软件| 久久裸体视频| 国模gogo一区二区大胆私拍| 懂色av粉嫩av浪潮av| 人人精品亚洲| 日韩欧美一级二级三级| 在线观看高清免费视频| 午夜激情电影在线播放| 亚洲一区二区三区在线| 日本三级福利片| 久久久资源网| 99精品国产热久久91蜜凸| 91综合免费在线| 中文字幕日韩经典| 日韩国产精品久久久| 97久久超碰福利国产精品…| 国产精品成人免费观看| 97视频热人人精品免费| 在线视频欧美性高潮| 日韩av在线看免费观看| 欧美色资源站| 亚洲国产美女精品久久久久∴| 超碰在线免费av| 韩国三级成人在线| 欧美日韩国产大片| 污片在线免费看| 亚洲精品国产嫩草在线观看| 色婷婷国产精品综合在线观看| 久久综合九色综合88i| 2020国产在线| 亚洲国产美女搞黄色| 日本一级黄视频| 污污片在线免费视频| 亚洲精品五月天| 午夜久久久久久久久久久| 国产美女福利在线| 亚洲精品一二三| 91成人综合网| 波多野结衣在线高清| 亚洲综合色丁香婷婷六月图片| 青草全福视在线| 日本乱理伦在线| 有码一区二区三区| 久久久久99精品成人片| 96av在线| 色国产综合视频| 欧美性猛交xxx乱久交| 国产福利91精品一区二区| 欧美区视频在线观看| 一起操在线视频| 视频在线观看免费影院欧美meiju| 日韩视频免费观看高清在线视频| 黑人玩弄人妻一区二区三区| 你懂的在线观看一区二区| 国产视频久久网| 特级西西人体高清大胆| 女人香蕉久久**毛片精品| 久久久久久久久91| 国产婷婷色一区二区在线观看| 日韩电影在线一区二区| 成人黄色中文字幕| 亚洲国产剧情在线观看| 91视频一区二区三区| 亚洲黄色成人久久久| 免费av毛片在线看| 亚洲一级二级在线| aⅴ在线免费观看| 亚洲一区av| 精品成a人在线观看| 人妻av无码一区二区三区| 999国产精品| 69**夜色精品国产69乱| 亚洲一级片免费看| 成人精品亚洲人成在线| 欧美中文娱乐网| 超碰在线网址| 欧美视频在线视频| 亚洲免费在线播放视频| 欧洲vs亚洲vs国产| 久久久国产精品亚洲一区| 日本三级视频在线| 久久er99精品| 精品国产一区二区三区四区精华 | 日韩av一二三区| 日韩专区在线视频| 成人av资源| 2019中文字幕在线视频| 精品二区三区线观看| 天堂在线中文在线| 免费电影一区二区三区| 欧美激情va永久在线播放| 蜜臀99久久精品久久久久小说| 狠狠狠色丁香婷婷综合激情| 欧美在线视频一区二区三区| 天堂va在线| 欧美色老头old∨ideo| 性活交片大全免费看| 日本一区二区在线看| 欧美在线免费看| 亚洲精品网站在线| 综合在线观看色| 亚洲精品一二三四五区| 欧美freesex8一10精品| 美女国内精品自产拍在线播放| 免费观看成人毛片| 成人一区二区三区中文字幕| 一区二区视频在线播放| 日韩影片中文字幕| 亚洲国内精品视频| 久久久久久久久久久97| 国产在线日韩欧美| 在线免费一区| 成人精品三级| 伊人久久久久久久久久| 亚洲GV成人无码久久精品| 成人激情免费网站| 一级性生活视频| 国产精品视频一区二区三区| 最近中文字幕2019免费| 亚洲成熟少妇视频在线观看| 波多野结衣中文一区| 18禁裸男晨勃露j毛免费观看| 国产精品一区二区三区四区在线观看| 最新91在线视频| 亚洲一卡二卡在线| 中文字幕中文字幕一区| mm131国产精品| 日韩一区亚洲二区| 国产精品尤物福利片在线观看| 国产原创av在线| 在线看国产一区二区| 日本成人午夜影院| 日本欧美久久久久免费播放网| 日韩福利二区| 亚洲黑人在线| 不卡av在线播放| 亚洲av无码乱码国产精品| 亚洲精品久久7777| 亚洲成人精品在线播放| 亚洲免费精品| 久久精品人人做人人爽电影| 自拍偷拍欧美视频| 亚洲一区二区久久| 亚洲在线免费观看视频| 日韩毛片视频在线看| 国产又粗又猛又爽又黄| 1024日韩| 色阁综合av| 北岛玲精品视频在线观看| 久青草国产97香蕉在线视频| 午夜精品久久久久久久96蜜桃 | 一道本无吗dⅴd在线播放一区| 无码人妻精品一区二区蜜桃色欲| 国产欧美日韩在线看| jizzzz日本| 欧美福利电影在线观看| 精品日本一区二区三区| 国产综合色区在线观看| 精品国内亚洲在观看18黄| 午夜精品久久久久久久96蜜桃| 亚洲1区2区3区视频| 亚洲久久久久久久| 国产综合色在线视频区| 国产欧美日韩网站| 精品高清在线| 97se在线视频| 日韩高清中文字幕一区二区| 精品国产一区久久久| 精品人妻一区二区三区含羞草| 亚洲.国产.中文慕字在线| 欧美图片第一页| 国产一区二区三区久久悠悠色av| 精品无码一区二区三区在线| 日韩精品免费一区二区三区| 成人在线资源网址| 成人性片免费| 久久久久久成人| 在线看免费av| 日韩高清免费在线| 7777久久亚洲中文字幕| 婷婷中文字幕一区三区| 我要看黄色一级片| 26uuu国产日韩综合| 中文字幕12页| 久久九九免费| 可以看毛片的网址| 亚洲国产成人精品女人| 欧美日韩精品久久| 亚洲精品在线播放| 国产美女精彩久久| 综合日韩av| 精品视频9999| 午夜精品一区| 国产亚洲精品综合一区91| 免费观看国产精品| 欧美一区二区视频在线观看 | 日韩亚洲欧美一区二区三区| 老熟妇一区二区三区| 五月婷婷欧美视频| 欧洲猛交xxxx乱大交3| 国产精品麻豆视频| 亚洲一区二区观看| 成人免费观看男女羞羞视频| 亚洲理论中文字幕| 久久99久久精品欧美| 日韩欧美在线免费观看视频| 国产毛片一区| 精品无码国产一区二区三区av| 91精品国产自产拍在线观看蜜| 欧美日韩亚洲在线| 影视先锋久久| 欧美18视频| 色愁久久久久久| 激情小说综合网| 国产精品qvod| 国产精品一区二区av| 6080成人| 国产精品播放| 大型av综合网站| 国产精品亚洲综合| 久久97精品| 精品国产乱码久久久久久蜜柚| 国产成人澳门| 国产日韩一区二区| 台湾佬综合网| 欧美在线日韩精品| 日本a口亚洲| 亚洲精品永久www嫩草| 日本精品三区| 一区二区日本伦理| 一本精品一区二区三区| gogogo免费高清日本写真| 亚洲成av人片一区二区密柚| 国产美女视频免费| 欧美精品国产| 婷婷无套内射影院| 欧美一级久久| 午夜欧美福利视频| 黄页网站大全一区二区| 日本黄色三级网站| 懂色av一区二区三区免费观看| 人妻互换一二三区激情视频| 99久久综合狠狠综合久久| aaaaa一级片| 国产婷婷精品av在线| 国产性猛交xx乱| 日韩一区有码在线| 欧美毛片在线观看| 激情成人在线视频| www.日韩一区| 91精品国产综合久久久久久久| xxxx国产精品| 亚洲免费视频一区二区| 高h视频在线| 另类天堂视频在线观看| 丁香影院在线| 国产91免费观看| 日韩国产91| 国产伦精品一区二区三区四区视频 | 色视频在线免费观看| 欧美剧在线观看| 涩涩涩在线视频| 国产日韩欧美另类| 国产精品x8x8一区二区| 日韩精品欧美在线| 欧美搞黄网站| 日韩精品视频久久| 激情综合色丁香一区二区| 青青草视频网站| 亚洲国产岛国毛片在线| 国产一级二级毛片| 在线一区二区观看| 黄色av网站免费在线观看| 一区二区三区天堂av| 婷婷丁香在线| 国产精品扒开腿做爽爽爽视频 | 亚洲成色777777女色窝| 国产日本在线| 久久久久久久久91| 日韩一级视频| 欧美日韩另类丝袜其他| 影音先锋成人在线电影| 日韩av一二三四| 国产成人aaa| 国产一级淫片久久久片a级| 亚洲五月六月丁香激情| 一级黄在线观看| 日韩理论片久久| 四虎亚洲成人| 国产精品视频网站| 蜜臀av免费一区二区三区 | 奶水喷射视频一区| 久久精品一二三四| 国产精品婷婷午夜在线观看| 日本熟妇毛耸耸xxxxxx| 日韩一区二区精品在线观看| 国产视频精选在线| 91高清视频免费观看| 99re8这里有精品热视频免费 | 狠狠干一区二区| 欧美粗暴jizz性欧美20| 天堂av8在线| 国产精品天美传媒沈樵| 日韩精品成人免费观看视频| 337p日本欧洲亚洲大胆色噜噜| gogo在线高清视频| 国产伊人精品在线| 欧美一区2区| 午夜精品久久久内射近拍高清 | 日韩一级大片在线观看| 日本最黄一级片免费在线| 日韩av手机在线观看| 日韩福利视频一区| 国产精品999视频| 成人av网站在线观看免费| 免费网站看av| 日韩免费成人网| 美足av综合网| 动漫美女被爆操久久久| 黄色av日韩| 国产av一区二区三区传媒| 一区二区三区免费网站| 国产91视频在线| 欧美国产视频一区二区| 97一区二区国产好的精华液| 欧美交换配乱吟粗大25p| 国产91富婆露脸刺激对白| 久久99久久98精品免观看软件| 日韩一区二区三区在线观看| 在线电影福利片| 99精彩视频| 伊人久久综合| 99久久国产精| 91精品办公室少妇高潮对白| 成年人视频在线免费观看| 国产精品成人一区二区三区吃奶| 精品国产乱码久久久久久蜜坠欲下 | 日韩欧美一区二区视频| 欧美卡一卡二| 国产乱码精品一区二区三区卡| aa亚洲婷婷| 1024手机在线观看你懂的| 欧美日韩一级二级三级| 国产原创视频在线观看| 国产精品久久亚洲7777| 国产一区二区三区久久久久久久久 | 高潮无码精品色欲av午夜福利| 中文国产成人精品久久一| 欧美日韩视频免费看| 污污污污污污www网站免费| av在线不卡电影| 国产美女www| 久久久精品免费| 精品一区二区男人吃奶| 五月婷婷狠狠操| 一区二区免费在线播放| 日本在线视频1区| 国产美女久久精品| 狠狠入ady亚洲精品| 男女做爰猛烈刺激| 91精品欧美综合在线观看最新 | eeuss影院www在线观看| 亚洲综合自拍一区| 亚洲伊人网站| 91嫩草|国产丨精品入口| 亚洲精品福利在线| 免费视频观看成人| 日本手机在线视频| 国产精品久久免费看| 欧美亚洲精品在线观看| 国产精品久久久久久久美男| 欧美视频在线观看| 高潮毛片无遮挡| 精品久久久网站| 国产一区二区三区影视| 精品少妇在线视频| 国产精品久久99| 亚洲欧美一区二区三| 91在线免费网站| 久久综合影视| 国产亚洲欧美久久久久| 日韩在线观看免费| 午夜精品福利影院|