精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI文本嵌入模型入門指南

譯文 精選
人工智能
這篇綜合指南介紹了如何使用OpenAI文本嵌入模型在GenAI應用程序中嵌入創建和語義搜索。

譯者 | 布加迪

審校 | 重樓

向量嵌入在AI中至關重要,它可以將復雜的非結構化數據轉換成機器可以處理的數值向量。這些嵌入捕獲數據中的語義和關系,從而實現更有效的分析和內容生成。

ChatGPT的創建者OpenAI提供了各種嵌入模型,這些模型提供高質量的向量表示,可用于包括語義搜索、聚類和異常檢測在內的各種應用。這篇指南將探討如何利用OpenAI的文本嵌入模型來構建響應迅速的智能AI系統。

什么是向量嵌入和嵌入模型?

在我們深入討論之前,不妨先闡述幾個術語。首先,什么是向量嵌入?向量嵌入是許多AI概念的基礎。它是數據的數值表示,特別是非結構化數據,比如文本、視頻、音頻、圖片及其他數字媒體。它捕獲數據中的語義和關系,并為存儲系統和AI模型提供一種高效的方式來解讀、處理、存儲和檢索復雜的高維非結構化數據。

所以,如果嵌入是數據的數值表示,那么如何將數據轉換成向量嵌入?這時候嵌入模型就有了用武之地。

嵌入模型是一種將非結構化數據轉換成向量嵌入的專用算法。它旨在學習數據中的模式和關系,然后在高維空間中表示它們。關鍵思想是,相似的數據片段具有相似的向量表示,并且在高維空間中彼此更接近,從而允許AI模型更有效地處理和分析數據。

比如在自然語言處理(NLP)背景下,嵌入模型可能在學習后明白單詞“king”和“queen”是相關的,應該在向量空間中彼此靠近,而像“banana”這樣的單詞將被放在更遠的位置。向量空間中的這種鄰近反映了單詞之間的語義關系。

嵌入模型和向量嵌入的一個常見用途在于檢索增強生成(RAG)系統。RAG系統不是僅僅依賴大語言模型(LLM)中的預訓練知識,而是在生成輸出之前為LLM提供額外的上下文信息。這些額外的數據使用嵌入模型轉換成向量嵌入,然后存儲在像Milvus這樣的向量數據庫中。對于需要詳細的、基于事實的查詢響應的組織和開發人員來說,RAG是理想的選擇,使得它在各個行業部門都很有價值。

OpenAI文本嵌入模型

ChatGPT背后的OpenAI公司提供了各種嵌入模型,它們非常適合處理語義搜索、聚類、推薦系統、異常檢測、多樣性測量和分類等任務。

鑒于OpenAI的受歡迎程度,許多開發人員可能會使用它的模型來嘗試RAG概念。雖然這些概念一般適用于嵌入模型,還是不妨關注OpenAI具體提供了什么。

在談論NLP時,一些OpenAI嵌入模型特別重要。

  • text-embedding-ada- 002
  • text-embedding-3-small
  • text-embedding-3-large

下表提供了這些模型之間的直接比較。

模型

描述

輸出維度

最大輸入

價格

text-

embedding-3-

large

功能最強大的嵌入模型,

同時適用于英文任務和

非英文任務。

3072

8.191

0.13美元/100萬

個token

text-

embedding-3-

small

比第二代ada嵌入模型

提高了性能。

1536

8.191

0.10美元/100萬

個token

text-

embedding-

ada - 002

功能最強大的第二代嵌入

模型,取代16個第一代

模型。

1536

8.191

0.02美元/100萬

個token

選擇合適的模型

與所有事情一樣,選擇模型需要權衡利弊。在全身心投入其中一個模型之前,確保你清楚地了解自己想要做什么、有哪些可用的資源以及期望從生成的輸出中獲得哪種程度的準確性。使用RAG系統,你可能會權衡計算資源與查詢響應的速度和準確性。

  • text- embeddings -3-large:當準確性和嵌入豐富度很重要時,這可能是首選的模型。它使用最多的CPU和內存資源(價格更昂貴),需要最長的時間來生成輸出,但輸出將是高質量的。典型的用例包括研究、高風險應用或處理非常復雜的文本。
  • text-embedding-3-small:如果你更關心速度和效率,而不是獲得絕對最好的結果,該模型的資源密集程度較低,從而降低了成本,并縮短了響應時間。典型的用例包括實時應用或資源有限的情形。
  • text-embedding-ada-002:雖然其他兩個模型是最新版本,但這是在OpenAI引入之前的主要模型。這種多功能模型在兩個極端之間提供了很好的中間地帶,提供了可靠的性能和合理的效率。

如何用OpenAI生成向量嵌入?

不妨逐步看看如何使用這每一種嵌入模型生成向量嵌入。無論選擇哪種模型,你都需要具備幾個要素才能入手,包括向量數據庫。

PyMilvus是用于Milvus的Python軟件開發工具包(SDK),在這種環境下很方便,因為它與所有這些OpenAI模型無縫集成。OpenAI Python庫是另一個選擇,它是OpenAI提供的SDK。

為了本教程,我將使用PyMilvus生成向量嵌入,并將它們存儲在Zilliz Cloud中,以便進行簡單的語義搜索。

Zilliz Cloud上手起來很簡單:

  • 注冊一個免費的Zilliz Cloud帳戶。
  • 設置無服務器集群,并獲取公共端點和API密鑰。
  • 創建一個向量集合,并插入你的向量嵌入。
  • 對存儲的嵌入進行語義搜索。

好了,現在我將解釋如何為上面討論的這三個模型生成向量嵌入。

text-embedding-ada-002text-embedding-ada-002

使用text-embedding-ada-002生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus.model.dense import OpenAIEmbeddingFunction
from pymilvus import MilvusClient

OPENAI_API_KEY = "your-openai-api-key"
ef = OpenAIEmbeddingFunction("text-embedding-ada-002", api_key=OPENAI_API_KEY)

docs = [
  "Artificial intelligence was founded as an academic discipline in 1956.",
  "Alan Turing was the first person to conduct substantial research in AI.",
  "Born in Maida Vale, London, Turing was raised in southern England."
]
# Generate embeddings for documents
docs_embeddings = ef(docs)

queries = ["When was artificial intelligence founded",
         "Where was Alan Turing born?"]
# Generate embeddings for queries
query_embeddings = ef(queries)

# Connect to Zilliz Cloud with Public Endpoint and API Key
client = MilvusClient(
   uri=ZILLIZ_PUBLIC_ENDPOINT,
   token=ZILLIZ_API_KEY)

COLLECTION = "documents"
if client.has_collection(collection_name=COLLECTION):
   client.drop_collection(collection_name=COLLECTION)
client.create_collection(
   collection_name=COLLECTION,
   dimension=ef.dim,
   auto_id=True)

for doc, embedding in zip(docs, docs_embeddings):
   client.insert(COLLECTION, {"text": doc, "vector": embedding})
  
results = client.search(
   collection_name=COLLECTION,
   data=query_embeddings,
   consistency_level="Strong",
   output_fields=["text"])

text-embedding-3-small

使用text-embedding-3-small生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus import model, MilvusClient
	
	OPENAI_API_KEY = "your-openai-api-key"
	ef = model.dense.OpenAIEmbeddingFunction(
	  model_name="text-embedding-3-small",
	  api_key=OPENAI_API_KEY,
	  )
	
	# Generate embeddings for documents
	docs = [
	  "Artificial intelligence was founded as an academic discipline in 1956.",
	  "Alan Turing was the first person to conduct substantial research in AI.",
	  "Born in Maida Vale, London, Turing was raised in southern England."
	]
	
	docs_embeddings = ef.encode_documents(docs)
	
	# Generate embeddings for queries
	queries = ["When was artificial intelligence founded",
	         "Where was Alan Turing born?"]
	
	query_embeddings = ef.encode_queries(queries)
	
	# Connect to Zilliz Cloud with Public Endpoint and API Key
	client = MilvusClient(
	   uri=ZILLIZ_PUBLIC_ENDPOINT,
	   token=ZILLIZ_API_KEY)
	
	COLLECTION = "documents"
	if client.has_collection(collection_name=COLLECTION):
	   client.drop_collection(collection_name=COLLECTION)
	client.create_collection(
	   collection_name=COLLECTION,
	   dimension=ef.dim,
	   auto_id=True)
	
	for doc, embedding in zip(docs, docs_embeddings):
	   client.insert(COLLECTION, {"text": doc, "vector": embedding})
	  
	results = client.search(
	   collection_name=COLLECTION,
	   data=query_embeddings,
	   consistency_level="Strong",
	   output_fields=["text"])

text-embedding-3-large

使用text-embedding-3-large生成向量嵌入,并將其存儲在Zilliz Cloud中進行語義搜索:

from pymilvus.model.dense import OpenAIEmbeddingFunction
	from pymilvus import MilvusClient
	
	OPENAI_API_KEY = "your-openai-api-key"
	ef = OpenAIEmbeddingFunction("text-embedding-3-large", api_key=OPENAI_API_KEY)
	
	docs = [
	  "Artificial intelligence was founded as an academic discipline in 1956.",
	  "Alan Turing was the first person to conduct substantial research in AI.",
	  "Born in Maida Vale, London, Turing was raised in southern England."
	]
	
	# Generate embeddings for documents
	docs_embeddings = ef(docs)
	
	queries = ["When was artificial intelligence founded",
	         "Where was Alan Turing born?"]
	
	# Generate embeddings for queries
	query_embeddings = ef(queries)
	
	# Connect to Zilliz Cloud with Public Endpoint and API Key
	client = MilvusClient(
	   uri=ZILLIZ_PUBLIC_ENDPOINT,
	   token=ZILLIZ_API_KEY)
	
	COLLECTION = "documents"
	if client.has_collection(collection_name=COLLECTION):
	   client.drop_collection(collection_name=COLLECTION)
	client.create_collection(
	   collection_name=COLLECTION,
	   dimension=ef.dim,
	   auto_id=True)
	
	for doc, embedding in zip(docs, docs_embeddings):
	   client.insert(COLLECTION, {"text": doc, "vector": embedding})
	  
	results = client.search(
	   collection_name=COLLECTION,
	   data=query_embeddings,
	   consistency_level="Strong",
	   output_fields=["text"])

結論

雖然本教程只是觸及表面,但這些腳本足以讓你開始上手向量嵌入。值得一提的是,這些絕不是唯一可用的模型。這份全面的AI模型列表都與Milvus協同工作。不管你的AI用例是什么,你可能都會找到一個可以滿足需求的模型。

如果想進一步了解Milvus、Zilliz Cloud、RAG系統和向量數據庫等方面,敬請訪問Zilliz.com。

原文標題:Beginner’s Guide to OpenAI Text Embedding Models,作者:Jason Myers

鏈接:https://thenewstack.io/beginners-guide-to-openai-text-embedding-models/。

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2023-10-27 20:52:13

OpenAIJina AI開源

2024-09-24 11:01:03

2024-05-09 08:11:04

OllamaGo訓練文本

2023-04-09 16:17:05

ChatGPT人工智能

2024-01-29 00:05:00

OpenAI嵌入機器學習

2023-11-09 09:00:00

OpenAI人工智能Whisper

2025-07-15 09:07:00

2023-11-24 14:05:00

AI訓練

2019-03-18 09:00:00

軟件測試軟件開發

2024-02-19 09:19:54

OpenAIAI模型人工智能

2024-03-04 14:15:16

OpenAI語言嵌入模型

2024-02-26 16:36:48

2011-03-08 09:22:37

2011-05-18 15:15:44

MySQL

2010-08-03 15:19:08

FlexBuilder

2021-03-26 10:31:19

人工智能AIOps

2024-02-04 07:20:00

AI模型

2025-03-14 11:09:41

2019-07-18 07:52:01

路由策略IP路由

2010-12-31 13:30:12

點贊
收藏

51CTO技術棧公眾號

国产免费一区二区三区四区| 国产精品久久久久9999爆乳| 国产精品国产三级国产普通话对白| 99久久九九| 欧美xxx久久| www日韩在线观看| a篇片在线观看网站| 99久久久久免费精品国产| 国产精品三级久久久久久电影| 丰满少妇被猛烈进入一区二区| 欧美亚视频在线中文字幕免费| 欧美日韩午夜在线视频| 2019日韩中文字幕mv| 爱久久·www| 99麻豆久久久国产精品免费 | 奇米精品一区二区三区四区| 久久91亚洲精品中文字幕| 91国模少妇一区二区三区| 免费观看在线一区二区三区| 色狠狠色狠狠综合| 日本免费a视频| 91亚洲国产精品| 欧美一二三区视频| 欧美影视一区| 中国人与牲禽动交精品| 制服丝袜在线第一页| 亚洲精品伊人| 欧美在线综合视频| 欧美一级视频免费看| 成人免费视屏| 欧美国产日韩一二三区| 精品视频高清无人区区二区三区| 国产精品无码一区二区桃花视频| 欧美一级视频| 午夜精品一区二区三区在线视 | 色哟哟无码精品一区二区三区| 久久久久毛片| 在线区一区二视频| 久久婷婷国产精品| √最新版天堂资源网在线| 亚洲人成网站精品片在线观看 | 亚洲视频高清| 久久成人综合视频| 91香蕉一区二区三区在线观看| 精品国产一级毛片| 亚洲偷欧美偷国内偷| 日本黄色网址大全| 欧美午夜18电影| 亚洲精品久久久久久久久久久久久| 中文字幕乱妇无码av在线| 日韩免费大片| 在线不卡中文字幕| www.久久91| www一区二区三区| 欧美一区二区三区在| 999热精品视频| 国产亚洲精aa在线看| 在线不卡a资源高清| 中文字幕22页| 99久久99九九99九九九| 国产精品网址| 亚洲国产日韩精品| 男人添女人下部视频免费| 午夜激情在线| 亚洲.国产.中文慕字在线| 成年人看的毛片| 永久免费毛片在线播放| 日韩欧美亚洲综合| 日本激情视频在线| 欧美成人xxxx| 日韩欧美色电影| 中文字幕乱视频| 久久影院资源站| 亚洲人成啪啪网站| 亚洲一二三四五六区| 亚洲天堂免费| 97人人模人人爽人人喊中文字| 亚洲国产成人无码av在线| 日日骚欧美日韩| 国产中文欧美精品| 亚洲精品国偷拍自产在线观看蜜桃 | 97一区二区国产好的精华液| 精品国产欧美一区二区| 中国极品少妇videossexhd| 九九综合久久| 日韩视频―中文字幕| 青娱乐av在线| 久久福利精品| 成人免费看黄网站| 熟妇人妻av无码一区二区三区 | 成人在线观看免费完整| 黄色亚洲精品| 国产精品电影观看| www.激情五月| 国产亚洲精品bt天堂精选| 欧美爱爱视频网站| 一区二区三区电影大全| 欧美一级片免费看| 少妇光屁股影院| 欧美国产激情| 国产国语videosex另类| www国产一区| 欧美国产乱子伦| 亚洲精品福利在线观看| 9191国产视频| 色香欲www7777综合网| 日韩一级黄色大片| 亚洲自拍偷拍图| 国语对白精品一区二区| 国产精品免费久久久久久| 亚洲xxxx天美| 国产精品成人免费| 欧美日韩在线不卡视频| 日韩中文字幕在线一区| 中文字幕久热精品视频在线| 国产成人无码精品| 国产一区二区精品久久99| 日韩精品大片| 蜜桃视频www网站在线观看| 91精品国产91久久久久久最新毛片 | a级网站在线观看| 日韩av中字| 日韩av综合中文字幕| av激情在线观看| 麻豆精品视频在线观看免费| 免费h精品视频在线播放| 高清电影在线观看免费| 91精品国产高清一区二区三区 | www.com日本| 亚洲国产精品久久久久蝴蝶传媒| 国产精品爱久久久久久久| 四虎在线视频免费观看| 亚洲高清免费一级二级三级| 99国产精品免费视频| 久久精品久久久| 国产男人精品视频| www.在线播放| 欧美三级欧美一级| 91麻豆精品国产91久久综合| 久久久久国产精品一区二区| 美女视频久久| 国产精品迅雷| 亚洲欧美成人一区二区在线电影| 男女啊啊啊视频| 99精品视频一区二区三区| 97超碰人人澡| 岛国精品一区| 2020久久国产精品| 天天干天天玩天天操| av女优在线| 欧美少妇xxx| 萌白酱视频在线| 毛片av一区二区三区| 亚洲国产一区在线| 日韩在线激情| 久久国产精品久久久久久| 国产绳艺sm调教室论坛| 亚洲美女屁股眼交| 欧美图片自拍偷拍| 亚洲精品九九| 欧美三级华人主播| 91看片一区| 综合国产在线观看| 国产女人高潮的av毛片| 亚洲激情图片小说视频| 18禁一区二区三区| 亚洲激情女人| 久久久福利视频| 播放一区二区| 美女扒开尿口让男人操亚洲视频网站 | 伊人成人在线视频| 精品乱码一区二区三区| 姬川优奈av一区二区在线电影| 中文字幕在线成人| av资源免费看| 精品久久久一区二区| 精品人妻一区二区三区四区| 久久99精品一区二区三区| 久久人妻无码一区二区| 丝袜美腿综合| 国产日产亚洲精品| 超碰97免费在线| 亚洲人高潮女人毛茸茸| 国产又粗又长又黄| 亚洲精品免费在线| 男生裸体视频网站| 久久www免费人成看片高清| 黄色网在线视频| 国产成人黄色| 99久久免费国| 日韩制服一区| 久久免费国产精品1| 成a人v在线播放| 欧美videossexotv100| 成年人晚上看的视频| 洋洋成人永久网站入口| 久久久久久久久久久久久久久| 国产制服丝袜一区| 免费高清在线观看免费| 中文字幕一区二区三区乱码图片 | 黄色视屏网站在线免费观看| 91精品国产综合久久精品性色| caoporn超碰97| 黄色免费在线播放| 91精品国产91热久久久做人人| 成人精品免费在线观看| √…a在线天堂一区| 一区二区三区免费在线观看视频| 国内国产精品久久| 国产精品69页| 日韩香蕉视频| 天堂а√在线中文在线| 成人6969www免费视频| 99在线观看| 免费成人高清在线视频| 日av在线播放中文不卡| 国产经典三级在线| 久久视频这里只有精品| 国产在线视频网站| 亚洲国产精品久久精品怡红院 | 国产亚洲精品久久久久久无几年桃| 26uuu亚洲综合色| 特级特黄刘亦菲aaa级| 激情综合网激情| 黑人粗进入欧美aaaaa| 日韩视频免费| 欧美视频免费看欧美视频| 亚洲午夜精品一区 二区 三区| 欧美一区二区三区电影在线观看 | 日韩经典一区| 69视频在线播放| av资源一区| 久久久久久久久久久免费精品 | 99久久九九| 一区不卡字幕| 99成人超碰| 亚洲视频在线观看日本a| 国产永久精品大片wwwapp| 久久亚洲综合网| 日韩美女国产精品| 蜜桃成人免费视频| 亚洲性视频大全| 免费av一区二区三区| 国产亚洲电影| 日韩高清av电影| 精品九九在线| 亚洲一区二区三区四区中文| 欧美亚洲国产激情| 亚洲欧洲日韩精品| 99久久夜色精品国产亚洲96| 欧美 日韩 国产 在线观看| 68国产成人综合久久精品| 中文字幕一区二区三区在线乱码| 欧美高清视频手机在在线| 国产91av视频在线观看| 外国成人免费视频| 先锋影音男人资源| 国产专区一区| 青娱乐自拍偷拍| 亚洲影音先锋| 91制片厂毛片| 国产九色精品成人porny| 日本一级大毛片a一| thepron国产精品| 精品国产av无码| 中文乱码免费一区二区| 欧美三级黄色大片| 亚洲一区二区偷拍精品| 黄色在线视频网址| 欧美日韩视频专区在线播放| 国产毛片毛片毛片毛片| 亚洲精品在线免费观看视频| 爽爽视频在线观看| 在线视频欧美性高潮| av网站在线免费看推荐| 午夜精品在线视频| av在线一区不卡| 91国产在线播放| 日本妇女一区| 亚洲图色在线| 亚洲激情二区| 在线观看日本一区二区| 成人精品国产免费网站| www.av欧美| 一区二区三区免费观看| 亚洲大片免费观看| 欧美一区二区福利视频| 男人天堂亚洲二区| 久久国产精品影视| 日本wwww视频| 欧美精品一卡| 91国视频在线| 国产在线看一区| 无码人妻精品一区二区三应用大全| 国产精品麻豆网站| 国产精品suv一区二区三区| 精品视频资源站| 国 产 黄 色 大 片| 社区色欧美激情 | 午夜裸体女人视频网站在线观看| 国产情人节一区| 免费国产自久久久久三四区久久| 午夜啪啪福利视频| 日韩av一级电影| 欧美xxxxx精品| 亚洲视频一区在线| 狠狠狠狠狠狠狠| 亚洲成人激情在线观看| 免费av在线网站| 国产成人精品久久久| 国产精品黄网站| 国产树林野战在线播放| 日韩精彩视频在线观看| 色哟哟无码精品一区二区三区| 中文字幕一区二区三区四区不卡| 毛片基地在线观看| 精品国产不卡一区二区三区| 久草资源在线| 国产精品一二三视频| 国产精品亚洲片在线播放| 亚洲男人的天堂网| www.99re7.com| 欧美一级艳片视频免费观看| 午夜伦理在线| 国产精品揄拍一区二区| 国产精品欧美三级在线观看| 国产一区二区网| 成人永久免费视频| 永久看片925tv| 欧美一区二区三区日韩视频| 91伦理视频在线观看| 国产精品久久久久秋霞鲁丝| 久久91精品| 超碰影院在线观看| 久久久午夜电影| 精品成人av一区二区在线播放| 亚洲国产欧美一区二区丝袜黑人| 性欧美猛交videos| 91手机在线视频| 影音先锋亚洲电影| 无码国产精品一区二区免费式直播| 亚洲精品成人悠悠色影视| 日本中文字幕在线观看视频| 亚洲性xxxx| 久久av日韩| 国产精品12p| 国产一区二区调教| 欧美成人三级视频| 日韩欧美国产综合| 成全电影大全在线观看| 国内不卡一区二区三区| 亚洲久久一区二区| www.自拍偷拍| 在线精品视频免费播放| 在线播放麻豆| 91免费福利视频| 国产一区久久| 久久无码人妻精品一区二区三区| 黑人精品xxx一区一二区| 九九热视频在线观看| 国产精品免费网站| 综合久久综合| 李丽珍裸体午夜理伦片| 色综合久久99| 麻豆视频在线播放| 粉嫩av一区二区三区免费观看| 在线一区免费观看| 成人午夜免费影院| 日韩一区二区三区四区五区六区| 国产精品186在线观看在线播放| 精品欧美一区二区三区久久久| 日日摸夜夜添夜夜添精品视频| 精品伦精品一区二区三区视频密桃 | 欧美成人一级| 六月婷婷在线视频| 久久精品日韩一区二区三区| 中文字幕一区二区免费| 欧美日韩国产123| 制服丝袜日韩| 五月天中文字幕在线| 亚洲一区在线看| 日本久久高清视频| 99精品免费视频| 欧美黄色高清视频| 日韩欧美电影一二三| 国产精品伦理| 欧美在线观看视频免费| 国产色91在线| 亚洲国产精品suv| 国产精品成人aaaaa网站| 欧美在线高清| 亚洲av无码国产精品麻豆天美| 日韩欧美你懂的| 精品亚洲a∨| 91免费国产精品| 中文av一区二区| 三级在线观看网站| 91精品中文在线| 久久永久免费| 国产精品第九页|