精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

三種文本相似計算方法:規則、向量與大模型裁判

發布于 2025-2-11 12:48
瀏覽
0收藏

文本相似計算

介紹

有一些工作需要評估出兩個字符串之間的相似程度。比如,要評估大模型生成的結果,與預設定的答案之間的相似程度。本文介紹三類方法用于評估兩個字符串的相似程度:規則、向量、大模型裁判。

  • 規則:基于字符 n-gram 的相似計算,常用算法,ROUGE、BLEU;
  • 向量:使用熱門的嵌入模型(Jina),把字符串編碼為向量,計算兩個向量之間的相似度;
  • 大模型裁判:使用大模型評估兩個字符串之間的相關性;

摘要

介紹了三種方法,評估兩個字符串之間的相似度:基于字符 n-gram 的規則算法,通過嵌入模型將文本編碼為向量并計算余弦相似度,以及使用大模型直接評判文本相關性。文章詳細探討了這些方法的實現細節及適用場景,并提供了 Python 示例代碼,幫助讀者理解和應用不同的方法來滿足具體需求。

規則

Find a metric on the Hub

本篇文章主要關注 Metric 方面的評估

Metric: measures the performance of a model on a given dataset, usually by comparing the model's predictions to some ground truth labels -- these are covered in this space.

裝包,主要依賴 nltk 這個包:

pip install transformers evaluate

眾多的自然語言處理評估方法會發布在 evaluate 這個包上。

google_bleu 網頁,若想瀏覽更多的例子請點擊查看,??https://huggingface.co/spaces/evaluate-metric/google_bleu??

三種文本相似計算方法:規則、向量與大模型裁判-AI.x社區

從 ??evaluate?? 加載工具的時候,需要科 學 上 網,解決方案如下:

  • 梯 子 開啟全局代理;
  • 嘗試把下述代理,加入到python代碼,7890是clash的端口

import os
  os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890'
  os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'


import evaluate
google_bleu = evaluate.load("google_bleu")

sentence1 = "the cat sat on the mat"
sentence2 = "the cat ate the mat"
result1 = google_bleu.compute(predictinotallow=[sentence1], references=[[sentence2]])
print(result1)
# result1 {'google_bleu': 0.3333333333333333}


result2 = google_bleu.compute(predictinotallow=[sentence1], references=[[sentence1]])
print(result2)
# result2 {'google_bleu': 1.0}

【注意】:references 是一個嵌套的二維列表。

references 設計為二維列表的原因是,針對同一個問題,可能有多個回答,最終的結果是返回與多個結果計算google_bleu的最大值。

predictions = ["The cat is on the mat."]
references = [["The cat is on the mat.", "There is a cat on the mat."]]
print(google_bleu.compute(predictinotallow=predictions, references=references))
>>> {'google_bleu': 1.0}

下述是中文的例子:

google_bleu.compute(
    predictinotallow=["我愛你"], 
    references=[["我愛我的祖國"]]
)
# >>> {'google_bleu': 0.0}

上述 ??我愛你??? 和 ??我愛我的祖國?? 如上述所示,google_bleu 不會原生支持漢字,原因在于英文可直接按照空格拆分開,但是漢語之間沒有空格。比如, ["我愛我的祖國"] 可拆分為:

  • ["我 愛 我 的 祖 國"] ,
  • ["我 愛 我 的 祖國"] , 祖國中間沒有空格分開

顯然 ??祖國??? 作為一個詞更好,若拆分為 ??祖和國?? 兩個字則會丟失原來的語義信息。

google_bleu.compute(
    predictinotallow=["我 愛 你"], 
    references=[["我 愛 我 的 祖 國"]]
)
# >>> {'google_bleu': 0.16666666666666666}

google_bleu.compute(
    predictinotallow=["我 愛 你"], 
    references=[["我 愛 我 的 祖國"]]
)
# >>> {'google_bleu': 0.21428571428571427}

使用合適的中文分詞技術,可提高 google_bleu 分數。如上所示,??祖國??? 變成一個詞后,google_bleu 從0.16 提高到 0.21。如果想嘗試中文分詞技術,可嘗試使用??pip install jieba??,支持添加新詞到字典中。

向量

使用經過訓練的嵌入模型,把文本編碼為向量,再計算兩個向量的余弦相似度。瀏覽 jina-embeddings-v2-base-zh 的介紹, https://modelscope.cn/models/jinaai/jina-embeddings-v2-base-zh

下述是一個簡單的例子:

!pip install modelscope
from modelscope import AutoModel
from numpy.linalg import norm

cos_sim = lambda a,b: (a @ b.T) / (norm(a)*norm(b))
# trust_remote_code is needed to use the encode method
model = AutoModel.from_pretrained('jinaai/jina-embeddings-v2-base-zh', trust_remote_code=True) 
embeddings = model.encode(['How is the weather today?', '今天天氣怎么樣?'])
print(cos_sim(embeddings[0], embeddings[1]))

import numpy as np
from numpy.linalg import norm
from modelscope import AutoModel

# 定義余弦相似度計算函數
cos_sim = lambda a, b: (a @ b.T) / (norm(a) * norm(b))


# 加載模型
model = AutoModel.from_pretrained('jinaai/jina-embeddings-v2-base-zh', trust_remote_code=True)

# 輸入字符串和候選字符串
input_string = 'How is the weather today?'
candidates = ['今天天氣怎么樣?', '我今天很高興', '天氣預報說今天會下雨', '你最喜歡的顏色是什么?']

# 計算輸入字符串的嵌入向量
input_embedding = model.encode([input_string])[0]

# 計算候選字符串的嵌入向量
candidate_embeddings = model.encode(candidates)

# 計算相似度并排序
similarities = [cos_sim(input_embedding, candidate_embedding) for candidate_embedding in candidate_embeddings]
sorted_candidates = sorted(zip(candidates, similarities), key=lambda x: x[1], reverse=True)

# 輸出排序結果
for candidate, similarity in sorted_candidates:
    print(f"({input_string} - {candidate}), Similarity: {similarity:.4f}")

上面代碼展示了,計算 input_string 與 candidates 候選字符串之間的向量余弦相似度分數,按照從高到低排序:

Downloading Model to directory: C:\Users\user_name\.cache\modelscope\hub\jinaai/jina-embeddings-v2-base-zh
(How is the weather today? - 今天天氣怎么樣?), Similarity: 0.7861
(How is the weather today? - 天氣預報說今天會下雨), Similarity: 0.5470
(How is the weather today? - 我今天很高興), Similarity: 0.4202
(How is the weather today? - 你最喜歡的顏色是什么?), Similarity: 0.1032

大模型裁判

制定一個基于規則的程序來評估輸出是非常具有挑戰性的。傳統的評估指標,基于輸出和參考答案之間的相似性(例如,ROUGE、BLEU;),對于這些問題也無效。[1] 在復雜場景下,可嘗試使用大模型進行判決。

主要針對復雜的場景,在基于規則與向量相似度均效果不顯著的情況下,可嘗試使用LLM進行判決。

提示詞參考:

JUDGE_PROMPT = """
You will be given a user_question and system_answer couple.
Your task is to provide a 'total rating' scoring how well the system_answer answers the user concerns expressed in the user_question.
Give your answer as a float on a scale of 0 to 10, where 0 means that the system_answer is not helpful at all, and 10 means that the answer completely and helpfully addresses the question.

Provide your feedback as follows:

Feedback:::
Total rating: (your rating, as a float between 0 and 10)

Now here are the question and answer.

Question: {question}
Answer: {answer}

Feedback:::
Total rating: """

參考資料

  1. 使用 LLM 作為評判者?????進行自動化和多方面的評估
  2. ??https://github.com/huggingface/evaluate ??

本文轉載自??AI悠閑區??,作者: jieshenai ????

收藏
回復
舉報
回復
相關推薦
亚洲h动漫在线| 成人免费毛片嘿嘿连载视频| 国产一区二区三区四区福利| 午夜宅男在线视频| 手机在线免费av| 99精品黄色片免费大全| 国产精品视频白浆免费视频| 中文字幕在线有码| 天海翼亚洲一区二区三区| 欧美日韩在线播放三区四区| 激情成人开心网| 国产女人在线观看| 国产成人日日夜夜| 国产精品久久久久久超碰| 麻豆国产尤物av尤物在线观看| 小嫩嫩12欧美| 日韩欧美www| 天堂中文视频在线| xxxx另类黑人| 亚洲男人的天堂在线观看| 麻豆av福利av久久av| 国产美女明星三级做爰| 麻豆成人精品| 国产综合在线视频| 国产精品视频一区二区三| 欧美禁忌电影| 精品福利一二区| 亚洲午夜精品一区| 韩国成人漫画| 亚洲国产精品久久一线不卡| 三年中文高清在线观看第6集| 免费黄色在线视频网站| 成人国产精品免费观看视频| 91在线中文字幕| 一区二区乱子伦在线播放| 国产精品入口66mio| 久久久久久久久久久久久久久久久久av| 久久精品色妇熟妇丰满人妻| 亚洲欧美成人vr| 日韩av在线电影网| 一区二区三区四区影院| 欧美综合社区国产| 欧美自拍偷拍一区| 成人在线激情网| 依依综合在线| 日韩欧美中文免费| 你懂的av在线| 免费h在线看| 无码av中文一区二区三区桃花岛| 91看片淫黄大片91| 亚洲91av| 亚洲一区二区高清| 久久亚洲国产成人精品无码区| 精品国产丝袜高跟鞋| 国产精品久久久久久久午夜片| 亚洲va韩国va欧美va精四季| 川上优的av在线一区二区| 国产亚洲美州欧州综合国| 欧洲一区二区在线| 丁香婷婷在线观看| 国产精品天干天干在观线| 视频一区亚洲| 免费黄网站在线| 日韩理论片在线| 国产一二三四五| 手机av免费在线| 亚洲高清在线精品| 99精品在线免费视频| 在线免费三级电影网站| 91福利国产精品| 91亚洲免费视频| 久久天堂久久| 亚洲第一精品福利| www.久久国产| 日韩成人三级| 久久精品国产精品亚洲| 2025国产精品自拍| 伊人久久亚洲影院| 日本一区二区在线免费播放| 天天天天天天天干| 精品一区二区国语对白| 成人av蜜桃| 日本一区二区三区在线观看视频| 国产欧美一区二区精品性色超碰 | 欧美三级午夜理伦三级小说| 亚洲精品国产精品自产a区红杏吧| 精品人妻互换一区二区三区| 偷拍欧美精品| 97在线视频免费播放| 午夜一区二区三区四区| 国产精品资源网站| 久久国产精品高清| 日韩av中文| 亚洲成人一区二区在线观看| 欧美视频免费播放| 国产精品欧美一区二区三区不卡 | 成人免费观看视频大全| 亚洲国产精品精华液网站| 成年人在线看片| 日韩欧美一级| 亚洲无亚洲人成网站77777| 午夜激情视频在线播放| 亚洲精品社区| 成人免费看吃奶视频网站| 亚州av在线播放| 亚洲视频 欧洲视频| 久久精品免费一区二区| 榴莲视频成人app| 亚洲欧美日韩久久久久久| 人妻人人澡人人添人人爽| 久久精品123| www.一区二区三区| 秋霞a级毛片在线看| 精品欧美国产一区二区三区| 91精品视频国产| 欧洲杯足球赛直播| 97色在线观看免费视频| va视频在线观看| 中文字幕在线不卡一区| 日韩avxxx| 超碰在线成人| 美女精品视频一区| 中文字幕免费观看视频| 2021中文字幕一区亚洲| 国产美女主播在线播放| 麻豆一区在线| 爽爽爽爽爽爽爽成人免费观看| 中日韩黄色大片| 成人免费视频视频在线观看免费 | 国产伦精品一区二区三区高清| 精品美女在线观看视频在线观看| 在线日韩国产精品| 香蕉视频黄色在线观看| 亚洲电影在线| 官网99热精品| 牛牛电影国产一区二区| 日韩一区二区三区在线| 国产suv精品一区二区68| 日韩极品在线观看| 欧美日韩大片一区二区三区| 91九色在线播放| 日韩精品一区二区在线| 国产免费美女视频| 精品中文字幕一区二区小辣椒| 天堂√在线观看一区二区| 黑人巨大亚洲一区二区久| 亚洲国产成人精品电影| 日本系列第一页| 成人毛片在线观看| 国产69精品久久久久999小说| 一区二区三区欧洲区| 欧美精品国产精品日韩精品| 亚洲AV无码精品国产| 一二三区精品视频| 国产伦精品一区二区三区精品| 伊人成年综合电影网| 国产私拍一区| 日韩大尺度黄色| 一本大道久久加勒比香蕉| 亚洲天堂aaa| 亚洲日本va午夜在线影院| 拔插拔插华人永久免费| 欧美99在线视频观看| wwwxx欧美| 日韩伦理在线| 国产一区二区三区在线| 一区二区三区日| 亚洲欧美电影院| 国产伦精品一区三区精东| 麻豆精品网站| 亚洲欧洲国产日韩精品| 精品一区二区三区在线观看视频| 久久97精品久久久久久久不卡| 人人妻人人澡人人爽人人欧美一区 | 精品少妇一区二区三区视频免付费| 久久久久亚洲av成人片| 91在线国内视频| 奇米影音第四色| 亚洲色图网站| 久久成人资源| 福利一区二区免费视频| 欧美大肥婆大肥bbbbb| 亚洲av电影一区| 精品视频在线免费看| 玖玖爱免费视频| 国产欧美视频在线观看| 在线免费黄色小视频| 国产精品久久久久久模特| 亚洲成人第一| 亚洲图片在线视频| 亚洲精品二区三区| 国产女人水真多18毛片18精品| 小h片在线观看| 久久精品久久久久电影| 五月婷婷伊人网| 88在线观看91蜜桃国自产| 香蕉视频一区二区| 日本一区二区成人在线| 男人女人拔萝卜视频| 久久久久国产精品一区二区| 成人一区二区av| 欧美男男gaytwinkfreevideos| 91免费精品视频| 中文字幕在线看片| 美女av一区二区| 国产一级片在线| 精品国产一区二区三区不卡 | 国产精品久久久久久久天堂第1集| 成人美女大片| 欧美激情精品在线| 日本三级视频在线播放| 亚洲美女在线看| 欧美 日韩 国产 成人 在线 91| 精品视频免费看| www.国产一区二区| 亚洲成人一二三| 91在线播放观看| 国产精品丝袜一区| 一级性生活大片| 不卡视频在线观看| 日本一区二区三区在线免费观看| 久久一区视频| 欧美a v在线播放| 国产精品九九| 国产免费xxx| 四虎成人精品永久免费av九九| 蜜桃导航-精品导航| 久久人人爽人人爽人人片av不| 亚洲综合在线做性| 亚洲网站免费| 国产欧美婷婷中文| 国产一区二区主播在线| 国产97色在线|日韩| 亚洲精品88| 欧美一性一乱一交一视频| 91黄页在线观看| 久久久久久久久国产| 天堂va在线| 九九九热精品免费视频观看网站| 视频免费一区| 色妞在线综合亚洲欧美| av基地在线| 在线视频欧美日韩精品| 国产美女视频一区二区三区| 亚洲人成亚洲人成在线观看| 三级做a全过程在线观看| 日韩成人在线网站| 欧美一区二区在线观看视频| 精品久久人人做人人爰| 亚洲国产精品欧美久久| 日韩免费观看高清完整版在线观看| 国产日本精品视频| 欧美一区二区女人| 丰满肉肉bbwwbbww| 精品国产一区二区三区不卡 | 中文字幕久久亚洲| av电影在线观看| 久久精品99国产精品酒店日本| 日本视频在线观看| 欧美裸体xxxx极品少妇| aa级大片免费在线观看| 91av在线免费观看视频| 日本不卡一二三| 国产精品亚洲精品| 成人国产精品一区二区网站| 91精品免费| 欧美绝顶高潮抽搐喷水合集| 欧美日韩一区二区三区在线视频| 精品久久影视| 400部精品国偷自产在线观看| 国产精品hd| 无码aⅴ精品一区二区三区浪潮 | 久久se这里有精品| 日韩一区二区高清视频| 一本色道久久综合一区| 亚洲 自拍 另类小说综合图区| 国产精品外国| 91久久在线视频| 激情在线小视频| 日韩亚洲成人av在线| av大片在线| 欧美日韩一区二区三区免费看 | 欧美成人网在线| 久久亚洲导航| 日韩电影中文字幕| 亚洲国产精品视频在线| 亚洲码国产岛国毛片在线| 欧美二区在线视频| 成人偷拍自拍| 色综合老司机第九色激情| 不卡在线视频| 色偷偷成人一区二区三区91 | 欧美激情国产精品| 国产精品乱子乱xxxx| 人妻丰满熟妇av无码久久洗澡| 亚洲自拍偷拍网| 色综合影院在线| 亚洲男人天堂网址| 国产一区二区三区的电影| 欧美午夜精品理论片a级按摩| 欧美a在线视频| 久久精品国产福利| 97婷婷大伊香蕉精品视频| 六九午夜精品视频| 久久精品国产99精品国产亚洲性色| 日韩免费视频| 日韩精品一区二区三区久久| 国产一区二区网址| 一级片视频免费看| 亚洲图片欧美综合| 一级片免费观看视频| 亚洲精品网站在线播放gif| 国产在线看片| 国产精品视频公开费视频| 日本天堂一区| av在线免费观看国产| 精品综合久久久久久8888| 舐め犯し波多野结衣在线观看| 亚洲国产一区二区三区 | 欧美sm一区| 亚洲综合精品一区二区| 日韩精品一区二区三区免费观影| 国产乱子伦农村叉叉叉| 国产99精品视频| 国产激情无码一区二区三区| 欧美中文字幕亚洲一区二区va在线| 天堂av中文字幕| 欧美片一区二区三区| 曰本一区二区| 亚洲bbw性色大片| 日本伊人精品一区二区三区观看方式| 成人网站免费观看| 午夜日韩在线电影| 亚洲国产视频一区二区三区| 欧美精品日韩www.p站| 四虎永久精品在线| 亚洲一区bb| 极品少妇xxxx偷拍精品少妇| 亚洲精品91在线| 在线看国产一区二区| 国产中文字幕在线| 日韩69视频在线观看| 日韩有码一区| 日韩人妻精品无码一区二区三区| 成人精品一区二区三区中文字幕| 久久久精品国产sm调教网站| 欧美一级国产精品| 日本中文字幕中出在线| 国产福利久久精品| 99精品视频网| 自拍视频一区二区| 欧美午夜影院在线视频| 蜜桃视频在线观看网站| 国产成人精品一区| 精品午夜久久| 亚洲涩涩在线观看| 亚洲三级在线看| 精品人妻无码一区二区| 久久久久久久久爱| 亚洲区小说区图片区qvod按摩 | 国产高清精品在线| 久热精品在线观看| 日韩高清免费观看| 你懂得影院夜精品a| 亚洲欧美日韩国产成人综合一二三区| 美女精品自拍一二三四| 国产suv精品一区二区68| 精品少妇一区二区三区在线视频| 136福利第一导航国产在线| 久久亚洲综合网| 蓝色福利精品导航| 久久久久久久久精| 精品在线欧美视频| 成人国产一区| 国产免费内射又粗又爽密桃视频| 成人午夜av电影| 波多野结衣 久久| 久久精品国产一区二区三区| 亚洲1区在线| 虎白女粉嫩尤物福利视频| 国产精品国产a| 好吊色一区二区三区| 国产精品v片在线观看不卡| 自拍偷拍欧美专区| 天天插天天射天天干| 欧美日韩精品一区二区三区蜜桃 | 欧美日韩国产中文字幕| 高清毛片在线看| 91久久精品国产91久久性色tv| 国产亚洲精品久久久久婷婷瑜伽| 国产精品麻豆免费版现看视频| 日韩欧美激情在线| 黄色亚洲网站| 日韩中文字幕在线不卡| 国产日韩欧美电影| 粉嫩小泬无遮挡久久久久久| 国产精品三级在线| 亚洲国产影院| 污污的视频在线免费观看| 日韩禁在线播放|