精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用Python替代Adobe,零成本從PDF提取數據

開發 前端
通過利用Python強大的庫,可以自動化繁瑣的PDF數據提取任務。這種方法不僅成本低,而且提供了Python開發者所喜愛的靈活性和強大功能。

一、簡介

PDF文件是官方報告、發票和數據表的通用語言,然而從PDF文件中提取表格數據可能是一項挑戰。盡管Adobe Acrobat等工具提供了解決方案,但它們并不總是易于獲取或可自動化運行,而Python則是編程語言中的瑞士軍刀。本文將探討如何利用Python輕松實現PDF數據提取,而無需使用昂貴的軟件。

二、了解挑戰

PDF文件是為展示而設計的,而不是為提取數據。它們通常包含復雜的布局,在視覺上很吸引人,但在計算上卻無法訪問。因此,提取表格等結構化信息非常困難。

三、使用PyMuPDF提取文本

PyMuPDF是一款輕量級的庫,擅長讀取PDF文件并提取文本。只需幾行代碼,就可以讀取PDF并從任意頁面提取文本。本文從奔馳集團2022年第四季度年度報告中提取“股東權益變動綜合報表(Consolidated Statement of Changes in Equity)”,代碼如下。

import fitz  
import pandas as pd
import re

# --- PDF處理 ---
# 定義PDF文件的路徑并打開文檔
pdf_path = '..../Merc 2022Q4 Rep.pdf'
pdf_document = fitz.open(pdf_path)

# 選擇要閱讀的特定頁面
page = pdf_document[200]

# 獲取頁面的尺寸
page_rect = page.rect
page_width, page_height = page_rect.width, page_rect.height

# 定義感興趣區域的矩形(不包括腳注)
non_footnote_area_height = page_height * 0.90
clip_rect = fitz.Rect(0, 0, page_width, non_footnote_area_height)

# 從定義的區域提取文本
page_text = page.get_text("text", clip=clip_rect)
lines_page = page_text.strip().split('\n')

四、規整數據

提取的文本通常帶有不需要的字符或格式。這就是預處理發揮作用的地方。Python的字符串處理功能使用戶能夠清洗和準備數據以轉換為表格格式。

# --- 數據清洗 ---
# 定義要搜索的字符串并查找其索引
search_string = 'Balance at 1 January 2021 (restated) '
try:
    index = lines_page.index(search_string)
    data_lines = lines_page[index:]
except ValueError:
    print(f"The string '{search_string}' is not in the list.")
    data_lines = []

# 如果不是數字或連字符,則合并連續字符串條目
def combine_consecutive_strings(lines):
    combined = []
    buffer = ''
    
    for line in lines:
        if isinstance(line, str) and not re.match(r'^[-\d,.]+$', line.strip()):
            buffer += ' ' + line if buffer else line
        else:
            if buffer:
                combined.append(buffer)
                buffer = ''
            combined.append(line.strip())
    
    if buffer:
        combined.append(buffer)
    
    return combined

cleaned_data = combine_consecutive_strings(data_lines)

五、使用Pandas創建表格

一旦數據清洗完成,就可以使用pandas了。這個功能強大的數據分析庫可以將一系列數據點轉換為DataFrame,即一個二維的、大小可變的、可能是異構的帶有標記軸的表格數據結構。

# --- 創建DataFrame ---
# 根據列數將清洗后的數據分割成塊
num_columns = 6
data_chunks = [cleaned_data[i:i + num_columns] for i in range(0, len(cleaned_data), num_columns)]

# 定義DataFrame的表頭
headers = [
    'Description',
    'Share capital',
    'Capital reserves',
    'Retained earnings (restated)',
    'Currency translation (restated)',
    'Equity instruments / Debt instruments'
]

# 使用數據塊和表頭創建DataFrame
financial_df = pd.DataFrame(data_chunks, columns=headers)

# Display the head of the DataFrame to verify its structure
financial_df.head()

如下所示是從PDF文件中提取的表格結果。

圖片圖片

六、結語

通過利用Python強大的庫,可以自動化繁瑣的PDF數據提取任務。這種方法不僅成本低,而且提供了Python開發者所喜愛的靈活性和強大功能。

責任編輯:武曉燕 來源: Python學研大本營
相關推薦

2020-08-18 10:58:36

PC電腦智能手機電腦密碼

2022-10-28 12:00:03

前端開源

2011-05-04 14:24:04

iPad打印機

2018-07-25 09:06:18

數據中心機房容災

2010-05-13 09:24:39

2020-07-08 07:54:03

PythonPDF數據

2009-06-18 11:12:49

IP通信

2024-11-04 10:44:15

2017-09-19 12:17:53

共享醫療邵逸夫醫療

2024-06-03 08:48:16

2015-08-31 09:39:05

數據中心能源

2010-01-15 10:42:40

2010-01-14 20:29:51

2020-02-25 08:38:13

AI 數據人工智能

2018-11-23 10:48:04

云計算開源云服務

2011-04-22 19:41:35

Windows Emb嵌入式開發

2019-10-09 15:51:45

Python 開發編程語言

2024-04-15 08:53:07

OpenAISoraGIF動畫
點贊
收藏

51CTO技術棧公眾號

自拍偷拍欧美视频| 久久久久久久久久久久91| 国产一级在线播放| 欧美jizz19性欧美| 欧美主播一区二区三区| 一区二区免费在线视频| 888奇米影视| 亚洲经典在线| 中文字幕久久亚洲| 欧美激情一区二区三区p站| 成人免费网站www网站高清| 亚洲免费资源在线播放| 玛丽玛丽电影原版免费观看1977 | 韩国三级日本三级少妇99| 国产成人av片| h1515四虎成人| 亚洲大片免费看| 一区二区日本伦理| 青青久草在线| 亚洲精品网址| 亚洲欧美日韩综合| youjizz.com日本| 婷婷久久免费视频| 成人欧美一区二区三区视频网页| 国产在线一区二区三区四区| 国产美女精品视频国产| 另类天堂av| 国产69精品久久久久9| 一区二区三区影视| 欧美艳星介绍134位艳星| 亚洲白虎美女被爆操| 午夜免费一级片| 国产原创一区| 欧美影院一区二区| aa免费在线观看| 久久久久久久久亚洲精品| 国产一区高清在线| 国产精品99免视看9| 日本一道本视频| 亚洲警察之高压线| 亚洲第一区第二区| 日本人妻一区二区三区| 国产一区一区| 欧美一区二区视频免费观看| 亚洲娇小娇小娇小| 国内精品伊人| 欧美男男青年gay1069videost| 日韩中文字幕免费在线| 九色porny丨国产首页在线| 亚洲成人av在线电影| 日b视频免费观看| 色呦呦在线看| 亚洲激情男女视频| 国产91在线亚洲| 在线不卡日本v二区707| 亚洲免费大片在线观看| 在线观看成人免费| 在线免费观看的av| 亚洲午夜日本在线观看| 国产一区二区三区高清| 亚洲欧美激情在线观看| 高清在线不卡av| 国产精品日韩欧美一区二区三区| 亚洲精品综合网| 成人ar影院免费观看视频| 国产区一区二区| 涩爱av在线播放一区二区| 91麻豆精品秘密| 成人网中文字幕| 国产一区二区三区黄片| 国产精品18久久久久久久网站| 亚洲综合中文字幕68页| 丰满岳乱妇国产精品一区| 99久久婷婷国产综合精品电影| 欧美日韩另类综合| 91啦中文在线| 亚洲精品老司机| 国产v片免费观看| 欧美理论影院| 538prom精品视频线放| 成人免费黄色av| 欧美巨大xxxx| 中文字幕精品一区二区精品| 国产女人被狂躁到高潮小说| 亚瑟一区二区三区四区| 亚洲欧美一区二区三区四区 | 伊人久久大香线蕉综合网站| 一区二区成人av| 午夜精品福利在线视频| 99日韩精品| 国产精品久久久久影院日本| 精品人妻一区二区三区麻豆91| www.99精品| 亚洲高清123| 日本亚洲欧美| 国产精品女主播av| 高清欧美精品xxxxx| 97欧美成人| 亚洲精品一区二区在线观看| 欧美xxxx精品| 亚洲天堂久久| 国产精品你懂得| 东京干手机福利视频| 久久久激情视频| 欧美性猛交内射兽交老熟妇| 视频在线日韩| 欧美大胆人体bbbb| 毛片久久久久久| 国产亚洲在线| 亚洲xxx视频| 国产大学生校花援交在线播放| 一区二区三区欧美激情| 日韩av手机版| 亚洲肉体裸体xxxx137| 久久99亚洲精品| 欧美在线视频精品| 99精品视频一区| 国产一区二区三区播放| aaaa欧美| 亚洲免费av网址| 国产一级一片免费播放| 国产专区欧美精品| 亚洲精品一区二区三区蜜桃久 | 日韩av高清不卡| 蜜臀久久99精品久久久| 亚洲三级在线免费| 污污的网站18| 红桃成人av在线播放| 国模吧一区二区三区| 国产激情视频在线播放 | 亚洲国产精品一区在线观看不卡| 色在线视频观看| 欧美精品一区二区三区很污很色的 | 国产精品久久久久精k8| 麻豆传传媒久久久爱| 欧美三级午夜理伦三级在线观看 | 九九久久免费视频| 911久久香蕉国产线看观看| 国产福利精品在线| 视频二区在线| 狠狠综合久久av一区二区小说 | 97超碰人人模人人人爽人人爱| 久久久www免费人成精品| 久久久久久久激情| 久久不见久久见中文字幕免费| 2018日韩中文字幕| 免费在线黄色网址| 在线影视一区二区三区| 在线观看国产精品一区| 三级影片在线观看欧美日韩一区二区| 九九九九精品九九九九| 在线看的毛片| 亚洲激情电影中文字幕| 国产免费av一区二区| 91在线porny国产在线看| 青娱乐自拍偷拍| 日韩深夜福利| 国产精品白嫩美女在线观看| 第三区美女视频在线| 欧美视频一区二区在线观看| 久久精品色妇熟妇丰满人妻| 捆绑调教一区二区三区| 一区二区三区四区久久| 视频精品二区| 98精品国产高清在线xxxx天堂| 涩爱av在线播放一区二区| 欧洲一区二区三区在线| 亚洲色偷偷综合亚洲av伊人| 国产激情视频一区二区三区欧美| 精品少妇人欧美激情在线观看| 久久精品色播| 国产精品va在线| 久久黄色美女电影| 亚洲白拍色综合图区| 蜜臀99久久精品久久久久小说| 中文字幕成人在线观看| www.色.com| 国产日韩亚洲| 亚洲日本精品| 大型av综合网站| 国产97在线|亚洲| 综合图区亚洲| 亚洲欧美日韩天堂一区二区| 国产精品高潮呻吟久久久| 一区二区三区**美女毛片| 97人妻精品一区二区免费| 精品一区免费av| 午夜精品久久久久久久无码| 日产精品一区二区| 国产欧美日本在线| 欧美韩国亚洲| 欧美大片免费看| 久久久999久久久| 有坂深雪av一区二区精品| jlzzjizz在线播放观看| 极品尤物av久久免费看| 欧美爱爱视频免费看| 久久视频在线| 精品在线视频一区二区| 91精品国产一区二区在线观看| 992tv成人免费视频| 日本在线天堂| 亚洲女人天堂成人av在线| 国产成人精品免费看视频| 色综合久久久久久久久久久| 成年人av电影| 国产精品日日摸夜夜摸av| 国产 中文 字幕 日韩 在线| 国产在线精品不卡| av视屏在线播放| 亚洲另类自拍| 亚洲啊啊啊啊啊| 欧美日韩在线二区| 美国av一区二区三区| 成人高潮视频| 91精品久久久久久久久久久久久| 蜜桃av在线| 欧美精品videofree1080p| 成人无码一区二区三区| 欧美精品v日韩精品v韩国精品v| 国产亚洲欧美在线精品| 午夜一区二区三区视频| 欧美丰满熟妇bbbbbb| 亚洲免费精彩视频| 国产婷婷在线视频| 欧美性三三影院| 国产精品久久久久久久妇| 亚洲欧美激情小说另类| xxxxx99| 久久久久国产精品人| 日本69式三人交| 高清成人免费视频| 香蕉网在线视频| 国产呦萝稀缺另类资源| 亚洲综合欧美在线| 免费精品视频在线| 国产91色在线观看| 日本在线观看不卡视频| 国产极品美女高潮无套久久久| 亚洲视频1区| 亚洲熟妇国产熟妇肥婆| 亚洲伦伦在线| 奇米精品一区二区三区| 亚洲激情国产| 免费看日本毛片| 小嫩嫩精品导航| 久草精品在线播放| 丝袜美腿亚洲一区二区图片| 欧美成人黑人猛交| 日本v片在线高清不卡在线观看| 99免费视频观看| 蜜臀av性久久久久蜜臀aⅴ| 一区二区xxx| 美女视频黄频大全不卡视频在线播放 | 黄色在线视频观看网站| 亚洲色图国产精品| 国产黄色片在线播放| 日韩中文在线观看| av香蕉成人| 欧美高清一级片在线| 国产精品伦理一区| 日韩欧美二区三区| 天堂国产一区二区三区| 亚洲欧美日韩中文在线| 天堂地址在线www| 欧美激情2020午夜免费观看| av日韩国产| 日韩av免费在线看| 国产精品.xx视频.xxtv| 96pao国产成视频永久免费| www.亚洲一二| 欧美12av| 91精品1区| 99精品人妻少妇一区二区| 日韩av中文字幕一区二区| 青青青青在线视频| 国产乱码精品| 亚洲精品手机在线观看| 国产69精品一区二区亚洲孕妇 | 国产aⅴ爽av久久久久成人| 亚洲精品一区二区三区在线观看| 久久久久国产精品嫩草影院| 久久精品国产欧美激情| 国产高清中文字幕在线| 国产精品久久视频| 精品欠久久久中文字幕加勒比| 日本免费高清一区二区| 最新国产精品久久久| 欧美视频第一区| 国产精品一区不卡| 加勒比综合在线| 一级特黄大欧美久久久| 中文字幕欧美人妻精品| 日韩欧美主播在线| 国产网址在线观看| 欧美在线视频全部完| 亚洲精品中文字幕成人片 | av大大超碰在线| 琪琪亚洲精品午夜在线| 久久99精品久久久野外观看| 蜜桃成人在线| 国产伊人精品| 91最新在线观看| eeuss影院一区二区三区| 91麻豆精品久久毛片一级| 欧美性精品220| 精品欧美一区二区精品少妇| 国产午夜精品视频| 欧美一级鲁丝片| 亚洲综合在线中文字幕| 日韩在线欧美| 国产精品少妇在线视频| av网站一区二区三区| 欧美日韩中文字幕在线观看 | 亚洲免费黄色片| 久久亚洲电影天堂| 国产原创精品视频| 美女脱光内衣内裤视频久久网站| 91久久嫩草影院一区二区| 婷婷综合福利| 免费网站在线观看视频| 精品一区二区综合| 免费看污片网站| 亚洲成国产人片在线观看| 999久久久久| 日韩在线视频网站| 91精品国产66| 日本公妇乱淫免费视频一区三区| 亚洲激情女人| 97精品人人妻人人| 亚洲精品国产精品乱码不99| 亚洲天堂视频网| 中文字幕日韩在线视频| 欧美电影免费看| 日本成人三级电影网站| 久久久久国内| 欧美特级黄色录像| 色婷婷av久久久久久久| 亚洲av激情无码专区在线播放| 97碰在线观看| 91久久精品无嫩草影院 | 欧美高清电影在线| 98精品国产高清在线xxxx天堂| 国产区精品视频在线观看豆花| 国内少妇毛片视频| 岛国精品在线观看| 福利一区二区三区四区| 亚洲精品一区二区三区四区高清| ririsao久久精品一区| 国内精品久久国产| 国产精品久久久久毛片大屁完整版| 国产中文字幕日韩| 三级在线播放| 性日韩欧美在线视频| 极品国产人妖chinesets亚洲人妖| 91动漫在线看| 91色视频在线| 午夜视频网站在线观看| 最好看的2019的中文字幕视频| 热久久久久久| 国产精品久久久影院| 成人激情av网| 国产婷婷色一区二区在线观看| 亚洲视屏在线播放| 日本精品久久| 久久久久久久香蕉| www激情久久| 一区二区美女视频| 欧美日韩成人在线播放| 欧美挤奶吃奶水xxxxx| 男女无套免费视频网站动漫| 亚洲欧洲成人自拍| 色窝窝无码一区二区三区成人网站 | 国产三级精品三级观看| 欧美一级在线视频| av日韩国产| 亚洲电影网站| 夫妻av一区二区| 亚洲欧美另类在线视频| www欧美日韩| 久久久久观看| 免费看黄色一级大片| 亚洲精品v日韩精品| 人成免费电影一二三区在线观看| 欧美日韩在线三级| 青娱乐免费在线视频| 精品国产免费人成在线观看| 成人爽a毛片免费啪啪| 久久av秘一区二区三区| 99久久综合色| 国产一区二区女内射| 欧美一级免费看| 亚洲人metart人体| 日本一区二区在线免费观看| 欧美色倩网站大全免费| 男女羞羞视频在线观看| 日韩在线观看电影完整版高清免费| 国产精品资源在线| 国产真人无遮挡作爱免费视频| 久久成人精品一区二区三区|