精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

可以提取圖像文本的五大 Python 庫(kù)

開發(fā)
在本文中,我將展示一些Python庫(kù),可以讓您輕松從圖像中提取文本,無(wú)需太多麻煩。這些庫(kù)的說明后面附有一個(gè)實(shí)際示例。所使用的數(shù)據(jù)集均來自Kaggle。

光學(xué)字符識(shí)別是一個(gè)古老但依然具有挑戰(zhàn)性的問題,涉及從非結(jié)構(gòu)化數(shù)據(jù)中(包括圖像和PDF文檔)檢測(cè)和識(shí)別文本。它在銀行、電子商務(wù)和社交媒體內(nèi)容管理等領(lǐng)域具有廣泛的應(yīng)用。

但與數(shù)據(jù)科學(xué)中的每個(gè)主題一樣,嘗試學(xué)習(xí)如何解決OCR任務(wù)時(shí)存在大量的資源。這就是為什么我寫下這篇教程,它可以幫助您入門。

在本文中,我將展示一些Python庫(kù),可以讓您輕松從圖像中提取文本,無(wú)需太多麻煩。這些庫(kù)的說明后面附有一個(gè)實(shí)際示例。所使用的數(shù)據(jù)集均來自Kaggle。

1. pytesseract

它是最流行的Python庫(kù)之一,用于光學(xué)字符識(shí)別。它使用Google的Tesseract-OCR引擎從圖像中提取文本。支持多種語(yǔ)言。

如果想知道是否支持您的語(yǔ)言,請(qǐng)查看這個(gè)鏈接:https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html。您只需要幾行代碼將圖像轉(zhuǎn)換為文本:

# installation
!sudo apt install tesseract-ocr
!pip install pytesseract


import pytesseract
from pytesseract import Output
from PIL import Image
import cv2


img_path1 = '00b5b88720f35a22.jpg'
text = pytesseract.image_to_string(img_path1,lang='eng')
print(text)

輸出:

我們還可以嘗試獲取圖像中每個(gè)檢測(cè)到的項(xiàng)目的邊界框坐標(biāo)。

# boxes around character
print(pytesseract.image_to_boxes(img_path1))

結(jié)果:

~ 532 48 880 50 0
...
A 158 220 171 232 0
F 160 220 187 232 0
I 178 220 192 232 0
L 193 220 203 232 0
M 204 220 220 232 0
B 228 220 239 232 0
Y 240 220 252 232 0
R 259 220 273 232 0
O 274 219 289 233 0
N 291 220 305 232 0
H 314 220 328 232 0
O 329 219 345 233 0
W 346 220 365 232 0
A 364 220 379 232 0
R 380 220 394 232 0
D 395 220 410 232 0
...

正如您所注意到的,它估算了每個(gè)字符的邊界框,而不是每個(gè)單詞!如果我們想提取每個(gè)單詞的框,而不是字符,那么應(yīng)該使用image_to_data的另一種方法,而不是image_to_boxes:

# boxes around words
print(pytesseract.image_to_data(img_path1))

這是返回的結(jié)果,并不是很完美。例如,它將“AFILM”解釋為一個(gè)單詞。此外,它沒有檢測(cè)和識(shí)別輸入圖像中的所有單詞。

2. EasyOCR

輪到另一個(gè)開源Python庫(kù):EasyOCR。與pytesseract類似,它支持80多種語(yǔ)言。您可以通過網(wǎng)絡(luò)演示快速而輕松地嘗試它,無(wú)需編寫任何代碼。它使用CRAFT算法來檢測(cè)文本并使用CRNN作為識(shí)別模型。此外,這些模型是使用Pytorch實(shí)現(xiàn)的。

如果在Google Colab上工作,建議您設(shè)置GPU,這有助于加快此框架的速度。以下是詳細(xì)代碼:

# installation
!pip install easyocr


import easyocr


reader = easyocr.Reader(['en'])
extract_info = reader.readtext(img_path1)


for el in extract_info:
   print(el)

與pytesseract相比,結(jié)果要好得多。對(duì)于每個(gè)檢測(cè)到的文本,我們還有邊界框和置信度級(jí)別。

3. Keras-OCR

Keras-OCR是另一個(gè)專門用于光學(xué)字符識(shí)別的開源庫(kù)。與EasyOCR一樣,它使用CRAFT檢測(cè)模型和CRNN識(shí)別模型來解決任務(wù)。與EasyOCR的不同之處在于,它使用Keras而不是Pytorch實(shí)現(xiàn)。Keras-OCR的唯一不足之處是它不支持非英語(yǔ)語(yǔ)言。

# installation
!pip install keras-ocr -q


import keras_ocr


pipeline = keras_ocr.pipeline.Pipeline()
extract_info = pipeline.recognize([img_path1])
print(extract_info[0][0])

這是提取的第一個(gè)單詞的輸出:

('from',
 array([[761.,  16.],
        [813.,  16.],
        [813.,  30.],
        [761.,  30.]], dtype=float32))

為了可視化所有結(jié)果,我們將輸出轉(zhuǎn)換為Pandas數(shù)據(jù)框:

diz_cols = {'word':[],'box':[]}
for el in extract_info[0]:
    diz_cols['word'].append(el[0])
    diz_cols['box'].append(el[1])
kerasocr_res = pd.DataFrame.from_dict(diz_cols)
kerasocr_res

神奇的是,我們可以看到我們有更清晰和更精確的結(jié)果。

4. TrOCR

TrOCR是一種基于transformers的生成式圖像模型,用于從圖像中檢測(cè)文本。它由編碼器和解碼器組成:TrOCR使用預(yù)訓(xùn)練的圖像變換器作為編碼器和預(yù)訓(xùn)練的文本變換器作為解碼器。有關(guān)更多詳細(xì)信息,請(qǐng)查看論文。Hugging Face平臺(tái)上還有這個(gè)庫(kù)的良好文檔。首先,我們加載預(yù)訓(xùn)練模型:

# installation
!pip install transformers


from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image


model_version = "microsoft/trocr-base-printed"
processor = TrOCRProcessor.from_pretrained(model_version)
model = VisionEncoderDecoderModel.from_pretrained(model_version)
在傳遞圖像之前,我們需要調(diào)整其大小并進(jìn)行規(guī)范化。一旦圖像已經(jīng)轉(zhuǎn)換,我們可以使用.generate()方法提取文本。
image = Image.open(img_path1).convert("RGB")
pixel_values = processor(image, return_tensors="pt").pixel_values
generated_ids = model.generate(pixel_values)
extract_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
print('output: ',extract_text)
# output: 2.50

這與先前的庫(kù)不同,它返回一個(gè)無(wú)意義的數(shù)字。為什么?TrOCR僅包含識(shí)別模型,而沒有檢測(cè)模型。要解決OCR任務(wù),首先需要檢測(cè)圖像中的對(duì)象,然后提取輸入中的文本。由于它只關(guān)注最后一步,它的性能不佳。要使其正常工作,最好使用邊界框裁剪圖像的特定部分,如下所示:

crp_image = image.crop((750, 3.4, 970, 33.94))
display(crp_image)

然后,我們嘗試再次應(yīng)用模型:

pixel_values = processor(crp_image, return_tensors="pt").pixel_values
generated_ids = model.generate(pixel_values)
extract_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(extract_text)

此操作可以重復(fù)應(yīng)用于圖像中包含的每個(gè)單詞/短語(yǔ)。

5. docTR

最后,我們涵蓋了用于從文檔中檢測(cè)和識(shí)別文本的最后一個(gè)Python包:docTR。它可以將文檔解釋為PDF或圖像,然后將其傳遞給兩階段方法。在docTR中,文本檢測(cè)模型(DBNet或LinkNet)后跟文本識(shí)別的CRNN模型。由于使用了這兩個(gè)深度學(xué)習(xí)框架,這個(gè)庫(kù)要求安裝Pytorch和Tensorflow。

! pip install python-doctr
# for TensorFlow
! pip install "python-doctr[tf]"
# for PyTorch
! pip install "python-doctr[torch]"

然后,我們導(dǎo)入使用docTR的相關(guān)庫(kù)并加載模型,它是一個(gè)兩步方法。實(shí)際上,我們需要指定文本檢測(cè)和文本識(shí)別的DBNet和CRNN的模型,文本檢測(cè)和文本識(shí)別的后端模型:

from doctr.io import DocumentFile
from doctr.models import ocr_predictor
model = ocr_predictor(det_arch = 'db_resnet50',
                      reco_arch = 'crnn_vgg16_bn',
                      pretrained = True
                     )

我們最終讀取文件,使用預(yù)訓(xùn)練模型,并將輸出導(dǎo)出為嵌套字典:

# read file
img = DocumentFile.from_images(img_path1)


# use pre-trained model
result = model(img)


# export the result as a nested dict
extract_info = result.export()
這是非常長(zhǎng)的輸出:
{'pages': [{'page_idx': 0, 'dimensions': (678, 1024), 'orientation': {'value': None, 'confidence': None},...

為更好地可視化,最好使用雙重循環(huán),僅獲取我們感興趣的信息:

for obj1 in extract_info['pages'][0]["blocks"]:
    for obj2 in obj1["lines"]:
        for obj3 in obj2["words"]:
            print("{}: {}".format(obj3["geometry"],obj3["value"]))

docTR是從圖像或PDF中提取有價(jià)值信息的另一個(gè)好選擇。

結(jié)論

五個(gè)工具各有優(yōu)點(diǎn)和缺點(diǎn)。當(dāng)選擇這些軟件包之一時(shí),首先考慮您正在分析的數(shù)據(jù)的語(yǔ)言。如果考慮到非英語(yǔ)語(yǔ)言,EasyOCR可能是最適合的選擇,因?yàn)樗哂懈鼜V泛的語(yǔ)言覆蓋和更好的性能。

責(zé)任編輯:華軒 來源: 深度學(xué)習(xí)愛好者
相關(guān)推薦

2024-12-20 09:00:00

Python科學(xué)計(jì)算庫(kù)

2021-01-13 15:13:07

Python開發(fā) 工具

2019-06-04 10:40:07

2023-11-28 11:22:51

Pythonitertools庫(kù)工具

2011-02-17 11:18:29

PythonWebRuby

2013-04-10 17:39:52

數(shù)據(jù)庫(kù)安全

2013-05-07 09:24:53

BYOD

2017-12-25 10:34:18

技術(shù)預(yù)測(cè)機(jī)遇

2025-08-08 05:00:00

IT職業(yè)CIOAI

2021-04-15 09:00:00

數(shù)據(jù)庫(kù)React Nativ開發(fā)

2019-08-13 11:39:29

編程語(yǔ)言技術(shù)Python

2015-07-02 09:48:11

2019-12-18 10:20:30

混合云公共云私有云

2015-08-27 10:11:18

2019-09-25 09:09:48

Linux內(nèi)核CPU

2021-08-06 11:12:19

首席信息官IT技術(shù)

2021-09-03 14:00:52

端點(diǎn)安全漏洞網(wǎng)絡(luò)安全

2021-03-17 08:36:28

XDR終端安全網(wǎng)絡(luò)安全

2014-04-14 10:31:56

DevOps

2019-04-01 06:23:54

MPLS網(wǎng)絡(luò)廣域網(wǎng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

风间由美一区二区av101| porn视频在线观看| 国产视频亚洲| 尤物yw午夜国产精品视频明星| 黄色三级视频片| 麻豆传媒在线观看| 成人av片在线观看| 国产精品黄页免费高清在线观看| 一本在线免费视频| 99a精品视频在线观看| 欧美日韩中国免费专区在线看| 日产中文字幕在线精品一区| 国产精品视频一区二区三区,| 黄页网站一区| 日韩中文在线中文网在线观看 | 中文字幕求饶的少妇| 97品白浆高清久久久久久| 色屁屁一区二区| 日韩成人午夜影院| 国产三级在线看| 高清不卡在线观看av| 奇米影视亚洲狠狠色| 国产一区二区三区在线视频观看| 妖精一区二区三区精品视频| 欧美一区二区三区婷婷月色| 激情五月开心婷婷| 欧美日韩经典丝袜| 亚洲欧洲国产日韩| 欧美日韩一区在线观看视频| a天堂在线视频| 日本亚洲欧美天堂免费| 91av视频在线| 国产在线视频第一页| 久久裸体网站| 精品视频久久久| 国产视频精品视频| 精品国产亚洲日本| 欧美精品日韩一本| 国产又大又黄又粗的视频| 国产福利片在线观看| 一区二区三区在线免费观看| 亚洲欧美影院| 福利小视频在线观看| 99久久免费视频.com| 91久久精品一区二区别| 91免费视频播放| 全部av―极品视觉盛宴亚洲| 国产99视频精品免视看7| 国产网站在线看| 欧美日韩精品免费观看视频完整| www.亚洲人.com| 99久久99久久精品免费| 精品国产精品久久一区免费式| 亚洲黄页视频免费观看| 稀缺小u女呦精品呦| 午夜久久av| 欧美一区二区三区在| 网站在线你懂的| 精品午夜视频| 日韩午夜在线观看| 自拍视频第一页| 日韩精品一区国产| 精品国产一区二区三区久久久蜜月 | 韩国欧美一区二区| 91精品国产综合久久久久久蜜臀| 一区二区视频免费观看| 九九**精品视频免费播放| 国产欧美一区二区三区在线看| 夜夜躁狠狠躁日日躁av| 国产精品综合一区二区三区| 91视频最新| 你懂的网站在线| 99re这里只有精品视频首页| 免费在线观看一区二区| 福利小视频在线观看| 中文字幕一区二区三区不卡| 免费看黄色a级片| 波多一区二区| 色88888久久久久久影院按摩| 亚洲欧洲日本精品| 麻豆国产精品| 亚洲精品久久久久中文字幕欢迎你 | 久久久加勒比| 欧美女孩性生活视频| 在线观看岛国av| 欧美亚洲人成在线| 欧美一区二区三区婷婷月色| 男插女视频网站| 国产精品成人**免费视频| 欧美一区二区三区思思人| 韩国三级丰满少妇高潮| 91精品导航| 精品视频偷偷看在线观看| 国产交换配乱淫视频免费| 精品国产视频| 精品国产自在精品国产浪潮| 无码人妻丰满熟妇啪啪欧美| 亚洲国产一成人久久精品| 欧美日韩成人在线播放| 久草手机在线观看| 免费看欧美美女黄的网站| 成人激情综合网| 亚洲男人天堂久久| 久久嫩草精品久久久精品一| 四虎永久在线精品免费一区二区| 久青草国产在线| 亚洲欧美国产77777| 和岳每晚弄的高潮嗷嗷叫视频| 伊人久久国产| 欧美老女人在线| 黄色激情在线观看| 精品福利久久久| 久久久国产精品x99av| 国产精品1000| 日韩国产欧美在线播放| 国产精品一区二区免费| 成人在线二区| 亚洲一区二区黄色| 日本a√在线观看| 秋霞影院一区| 亚洲欧美日韩网| 91嫩草|国产丨精品入口| 国产精品婷婷| 成人性色av| 137大胆人体在线观看| 亚洲午夜激情网站| 中文字幕国内自拍| 欧美爱爱网站| 久久综合九色九九| 国产成人无码专区| 国产成人精品免费| 欧美日韩在线精品| 毛片在线导航| 欧美无人高清视频在线观看| 亚洲一级Av无码毛片久久精品| 日韩av密桃| 51视频国产精品一区二区| 国产精品美女一区| 久久久一区二区三区| 久久久天堂国产精品| 亚洲精品555| 亚洲美女性视频| 精品一区在线视频| 福利视频网站一区二区三区| 五月天久久狠狠| 在线观看涩涩| 欧美一级精品在线| 成人欧美一区二区三区黑人一| 免费亚洲一区| 国产日韩欧美综合精品| 最新国产露脸在线观看| 日韩欧美极品在线观看| 日本黄色免费观看| 国产主播一区| 亚洲va男人天堂| 香蕉视频在线播放| 在线日韩av片| 一色道久久88加勒比一| 亚洲欧美日韩国产| 免费99视频| 久久人体大尺度| 精品视频偷偷看在线观看| 日韩三级免费看| 丁香一区二区三区| 欧美黑人在线观看| 午夜电影一区| 欧美激情视频在线| 亚洲av片一区二区三区| 午夜激情综合网| 呦呦视频在线观看| 在线欧美三区| 黑人巨大精品欧美一区二区小视频 | 欧美午夜一区二区| 免费网站在线高清观看| 久久一区视频| 色姑娘综合网| 欧美视频第一| 久久高清视频免费| www.超碰在线.com| 亚洲高清在线视频| xxxx黄色片| 欧美亚洲专区| 日韩免费毛片| 精品三区视频| 亚洲欧美另类在线| 日韩av高清不卡| 亚洲经典一区二区| 亚洲观看高清完整版在线观看| 中文字幕精品久久久| 国内激情久久| 欧美在线3区| 欧美一区=区三区| 久久夜精品va视频免费观看| 亚洲伦理在线观看| 欧美日韩国产一区中文午夜| 欧美性xxxx图片| 欧美亚洲视频| 杨幂一区欧美专区| 中文字幕亚洲在线观看| 91高潮精品免费porn| 不卡在线视频| 日韩欧美国产综合一区 | 国产欧美久久久| 一区二区久久久| 37p粉嫩大胆色噜噜噜| 日韩精品每日更新| av网站手机在线观看| 无码日韩精品一区二区免费| 国产精品女主播| 黄色av电影在线播放| 日韩欧美中文字幕公布| 久久一区二区三区视频| 国产欧美一区二区精品仙草咪| 超碰人人cao| 久久亚洲精品伦理| 中文字幕免费高| 日韩在线亚洲| 国产欧美精品在线播放| 123区在线| 中文字幕亚洲精品| 欧美熟妇另类久久久久久不卡| 日本国产一区二区| 国产乱国产乱老熟300| 91在线一区二区| 少妇愉情理伦片bd| 丝袜美腿亚洲色图| www.av91| 四季av在线一区二区三区| 国外成人免费视频| 国产精品3区| 成人免费大片黄在线播放| 看黄在线观看| 麻豆成人在线看| 久久久久久久久亚洲精品| 欧美成人精品高清在线播放| 亚洲精品一区二三区| 亚洲成人久久影院| 国产无遮挡裸体免费视频| 1000部国产精品成人观看| 欧美做受喷浆在线观看| 国产91丝袜在线播放0| 美女网站色免费| 免费欧美日韩| 综合久久国产| 日韩欧美中文| 日韩中文不卡| 夜夜躁狠狠躁日日躁2021日韩| 99热国产免费| 国产一区二区久久久久| 热re91久久精品国99热蜜臀| 在线手机中文字幕| 97超级碰碰碰| 另类视频在线| 欧美大片第1页| 国产三区在线观看| 神马久久久久久| 成人短视频在线观看| 亚洲欧美国产精品| 日韩av成人| 伊人久久大香线蕉av一区二区| 午夜在线视频观看| 精品国产91洋老外米糕| 亚洲男人天堂久久| 欧美成人三级在线| 亚洲经典一区二区| 亚洲精品国产精品自产a区红杏吧| 免费av一级片| 亚洲第一视频网| 色屁屁草草影院ccyycom| 欧美精品一区二区三| 国产成人精品毛片| 亚洲第一黄色网| 色噜噜在线播放| 亚洲精品www| 四虎在线免费观看| 亚洲男人天堂古典| 亚洲 精品 综合 精品 自拍| 精品无人区太爽高潮在线播放 | 国产一区一一区高清不卡| 欧洲成人免费视频| 新片速递亚洲合集欧美合集| 日本91av在线播放| 伊人久久高清| 国产欧美精品日韩精品| 亚洲一区二区av| 国产精品.com| 亚洲bt欧美bt精品777| 日本一区免费看| 成人a'v在线播放| 中国一区二区三区| 欧美韩日一区| 福利视频一二区| 久久狠狠一本精品综合网| 黄色片在线免费| 精品一区二区国语对白| 久久久男人的天堂| 不卡一区二区在线| 国产探花视频在线播放| 亚洲欧美日韩在线| 国产精品500部| 欧美中文字幕一二三区视频| 国产精品久久久久久久久久久久久久久久久久 | 91av久久| 欧美最猛黑人xxxx黑人猛叫黄| 日本美女久久| 成人福利网站在线观看| 西野翔中文久久精品字幕| 日韩精品av一区二区三区| 久久中文亚洲字幕| 欧美视频在线观看视频| 日韩福利视频导航| 玖玖爱在线精品视频| 国产精品美女久久久久久久久久久| 麻豆网址在线观看| 欧美日韩美女视频| 97成人在线观看| 一区二区三区国产视频| 色呦呦视频在线观看| 热re99久久精品国产66热| 国产麻豆一区二区三区| 国产久一道中文一区| 女同性一区二区三区人了人一| 九色在线视频观看| 韩国精品在线观看| 播金莲一级淫片aaaaaaa| 亚洲免费观看高清| 一级片在线免费观看视频| 亚洲精品91美女久久久久久久| 在线观看免费版| 777午夜精品福利在线观看| 91成人在线网站| 亚洲图片都市激情| 国产美女诱惑一区二区| 极品人妻一区二区| 国产亚洲欧洲997久久综合| 久久免费在线观看视频| 91精品国产福利在线观看| 国产三级在线免费| 91国在线精品国内播放| 国产精品高清一区二区| 日韩福利一区二区三区| 久久电影一区| 中国黄色片视频| 樱桃国产成人精品视频| 亚洲无码久久久久| 国产一区二区三区在线观看网站 | 久久精品人人做人人爽人人| 日本少妇xxxx动漫| 日韩免费电影一区| 国产色在线观看| 91免费国产网站| 免费看av成人| 男人天堂成人在线| 97精品电影院| 国产真实夫妇交换视频| 欧美一区二区精品| 成人p站proumb入口| 国产精品久久久久久久av大片| 日韩成人av在线资源| 成人中文字幕在线播放| 成人免费毛片app| 农村妇女精品一区二区| 日韩午夜三级在线| 八戒八戒神马在线电影| 96精品久久久久中文字幕| 亚洲二区三区不卡| 国产精品久久久久久久av福利| 中文字幕中文字幕一区二区| 一级片在线免费观看视频| 色老头一区二区三区在线观看| 亚洲欧美小说色综合小说一区| 欧美裸体网站| 视频一区免费在线观看| 人妻少妇无码精品视频区| 色婷婷av一区二区三区软件| 欧美特级特黄aaaaaa在线看| 97超碰蝌蚪网人人做人人爽| 清纯唯美亚洲经典中文字幕| 欧美亚洲日本一区二区三区 | 欧美bbbbb性bbbbb视频| 亚洲自拍偷拍网站| 亚洲狼人综合网| 欧美激情一区二区三区高清视频| 日韩精品一级| 两根大肉大捧一进一出好爽视频| 91麻豆精东视频| 国产免费a视频| 欧美成人在线免费| 久久亚洲道色| 激情网站五月天| 国产精品毛片高清在线完整版| 国模私拍一区二区| 久久久久久国产精品久久| 日韩有码一区| 91热这里只有精品| 日韩一区中文字幕| 深夜福利视频在线免费观看| 国产精品久久久久久久av大片| 五月开心六月丁香综合色啪| 麻豆免费在线观看视频|