精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

利用ChatGPT輔助處理Html數(shù)據(jù)

原創(chuàng)
開發(fā)
使用chatgpt進(jìn)行輔助編程首先要清晰描述自己需求,生成代碼通過不斷調(diào)試及優(yōu)化,最終完成任務(wù)。有它,對(duì)程序員是好事也是壞事。

一、確認(rèn)功能

請(qǐng)編程實(shí)現(xiàn)以下功能:

1.所有html保存在all文件夾下。

2.對(duì)all文件下的所有html進(jìn)行處理,提取表格中的數(shù)據(jù)。

3.自動(dòng)提取表格頭,列名以逗號(hào)進(jìn)行分割。

4.處理完畢的文件輸出為out+時(shí)間格式文件,用于區(qū)別不同時(shí)間處理的文件。

二、通過chatgpt來進(jìn)行編程

圖片

源代碼如下:

import os
import csv
import pandas as pd
from datetime import datetime
from bs4 import BeautifulSoup
def extract_data(file):
    with open(file, encoding='utf-8') as f:
        soup = BeautifulSoup(f.read(), 'html.parser')
        table = soup.find('table')
        if not headers:
            ths = table.find_all('th')
            headers.extend([th.text.strip().replace('\n', '') for th in ths])
        for tr in table.find_all('tr')[1:]:
            tds = tr.find_all(['th', 'td'])
            row = []
            for td in tds:
                text = td.text.strip().replace('\n', '').replace(',', ';')
                row.append(text)
            if len(row) == len(headers):
                rows.append(row)
def write_data(output_file):
    with open(output_file, 'w', encoding='utf-8', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(headers)
        writer.writerows(rows)
file_dir = 'all'
html_files = [os.path.join(file_dir, f) for f in os.listdir(file_dir) if f.endswith('.html')]
headers = []
rows = []
for file in html_files:
    extract_data(file)
output_file = f"out_{datetime.now().strftime('%Y-%m-%d_%H%M%S')}.csv"
write_data(output_file)
print(f'Data has been saved to {output_file}')

chatgpt給出的解釋:

具體地,我們使用BeautifulSoup庫(kù)解析HTML文件,通過查找<table>標(biāo)簽和其中的<th><td>標(biāo)簽來提取數(shù)據(jù)。其中,我們使用了一個(gè)headers列表來保存表格頭,使用一個(gè)rows列表來保存每一行數(shù)據(jù)。

在處理每個(gè)HTML文件時(shí),我們首先查找表格頭,并將其添加到headers列表中。隨后,我們依次遍歷表格的每一行,并將其中的數(shù)據(jù)添加到rows列表中,保證了處理結(jié)果的準(zhǔn)確性。對(duì)于每一行數(shù)據(jù),我們判斷其長(zhǎng)度是否與headers列表相等,如果不相等則說明該行數(shù)據(jù)有誤,我們就不予以保存。最終,我們將所有數(shù)據(jù)保存到一個(gè)CSV文件中,輸出文件名為out+當(dāng)前時(shí)間.csv,用于區(qū)別不同時(shí)間處理的文件。

這樣,我相信這份代碼能夠滿足您的需求。如有任何問題,請(qǐng)隨時(shí)和我聯(lián)系。

三、繼續(xù)優(yōu)化

1.提升效率

2.提供進(jìn)度條顯示

3.要及時(shí)保存數(shù)據(jù),處理意外情況發(fā)生

最終代碼如下:

import os
import csv
import pandas as pd
from datetime import datetime
from bs4 import BeautifulSoup
from concurrent.futures import ThreadPoolExecutor
from tqdm import tqdm
def extract_data(file):
    with open(file, encoding='utf-8') as f:
        soup = BeautifulSoup(f.read(), 'html.parser')
        table = soup.find('table')
        if not headers:
            ths = table.find_all('th')
            headers.extend([th.text.strip().replace('\n', '') for th in ths])
        for tr in table.find_all('tr')[1:]:
            tds = tr.find_all(['th', 'td'])
            row = []
            for td in tds:
                text = td.text.strip().replace('\n', '').replace(',', ';')
                row.append(text)
            if len(row) == len(headers):
                rows.append(row)
                # 每處理1000行數(shù)據(jù),就保存當(dāng)前數(shù)據(jù)
                if len(rows) % 1000 == 0:
                    output_file = f"out_{datetime.now().strftime('%Y-%m-%d_%H%M%S')}_{len(files)}.csv"
                    write_data(output_file)
                    files.append(output_file)
                    rows.clear()
# 將所有CSV文件合并為一個(gè)文件
def combine_files(output_file):
    with open(output_file, 'w', encoding='utf-8', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(headers)
        for file in files:
            with open(file, 'r', encoding='utf-8') as f2:
                reader = csv.reader(f2)
                next(reader)  # 跳過文件頭
                for row in reader:
                    writer.writerow(row)
            os.remove(file)  # 刪除臨時(shí)文件
        print('All files have been combined into one CSV file.')
def write_data(output_file):
    with open(output_file, 'w', encoding='utf-8', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(headers)
        writer.writerows(rows)
file_dir = 'all'
html_files = [os.path.join(file_dir, f) for f in os.listdir(file_dir) if f.endswith('.html')]
headers = []
rows = []
files = []
with ThreadPoolExecutor(max_workers=4) as executor:
    # 使用tqdm為整個(gè)map添加進(jìn)度條,可以同時(shí)顯示當(dāng)前文件和整體進(jìn)度
    for _ in tqdm(executor.map(extract_data, html_files), total=len(html_files), desc='Extracting data'):
        pass
# 處理剩余數(shù)據(jù),并保存到CSV文件中
if rows:
    output_file = f"out_{datetime.now().strftime('%Y-%m-%d_%H%M%S')}_{len(files)}.csv"
    write_data(output_file)
    files.append(output_file)
# 合并所有CSV文件為一個(gè)文件
output_file = f"out_{datetime.now().strftime('%Y-%m-%d_%H%M%S')}.csv"
combine_files(output_file)
print(f'Data has been saved to {output_file}')

執(zhí)行效果:

圖片

責(zé)任編輯:龐桂玉 來源: 51CTO
相關(guān)推薦

2023-05-05 19:29:41

2023-03-20 15:44:00

科研AI

2023-09-06 08:00:00

ChatGPT數(shù)據(jù)分析

2022-12-12 12:04:59

ChatGPT代碼軟件

2023-05-05 22:10:05

2023-10-10 09:08:50

2016-11-16 18:49:21

2012-12-06 10:59:51

大數(shù)據(jù)

2023-04-04 22:28:43

2023-12-13 09:00:00

2020-10-29 06:02:44

PythonPandasExcel

2023-11-01 06:56:56

2023-07-04 20:15:00

2023-03-13 22:23:30

2023-03-07 16:43:17

ChatGPT軟件人工智能

2025-02-26 11:25:26

2023-02-01 08:07:39

HTMLChatGPT互聯(lián)網(wǎng)

2012-07-18 11:37:59

ibmdw

2012-05-18 10:49:36

SAP大數(shù)據(jù)HANA

2016-12-20 16:07:13

Python數(shù)據(jù)預(yù)處理
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品久久久久久久妇| 欧美日韩亚洲一二三| 精品人妻午夜一区二区三区四区 | 免费不卡视频| 国产在线国偷精品免费看| 欧美日韩国产成人| 国产毛片久久久久久久| 电影一区中文字幕| 精品久久久久久久久久久久 | 久久大综合网| 精品粉嫩超白一线天av| 欧美污视频网站| 黄av在线播放| 久久亚洲一级片| 91久久精品一区二区别| 色屁屁影院www国产高清麻豆| 日韩欧美视频| 亚洲精品成人网| 国产探花在线看| www.综合| 亚洲色图制服丝袜| 欧美一区二区三区在线播放 | 亚洲第一国产精品| 91欧美视频在线| 色是在线视频| 亚洲综合在线第一页| 日韩资源av在线| 可以免费看毛片的网站| 久久国产欧美日韩精品| 538国产精品视频一区二区| 四虎影院中文字幕| 欧美人与物videos另类xxxxx| 欧美va天堂va视频va在线| 亚洲国产日韩欧美在线观看| 这里有精品可以观看| 亚洲黄色免费电影| 亚洲一区精品视频| 国产福利小视频在线| av一二三不卡影片| 91亚色免费| 91成人在线免费| 日韩成人av影视| 日本国产一区二区三区| 日韩乱码人妻无码中文字幕| 欧美精品大片| 欧美乱大交xxxxx另类电影| 欧美日韩国产黄色| 欧美综合在线视频观看| 亚洲欧美日韩一区在线| 7788色淫网站小说| caoporn成人| 在线综合视频播放| 亚洲涩涩在线观看| 亚洲一区二区小说| 欧美吻胸吃奶大尺度电影 | 欧美一区二区黄| 久久久久xxxx| 二区三区精品| 日韩一区二区视频| 色哟哟在线观看视频| 国产高清亚洲| 欧美一二三四在线| 国产sm在线观看| 日韩欧美激情电影| 欧美成人高清电影在线| 亚洲熟妇一区二区| 国产精东传媒成人av电影| 亚洲成色777777在线观看影院| 性猛交╳xxx乱大交| 中文在线综合| 亚洲精品99久久久久| 国产精品手机在线观看| 亚洲丝袜美腿一区| 国产一区二区日韩精品欧美精品| 天堂av网手机版| 91超碰成人| 欧美—级a级欧美特级ar全黄| 国产大片aaa| 亚洲综合电影一区二区三区| 国产精品成av人在线视午夜片| 中国精品一区二区| 国产一区二区三区久久久| 不卡一卡2卡3卡4卡精品在| 欧美一级性视频| 26uuu亚洲| 亚洲一区3d动漫同人无遮挡| 9191在线播放| 日韩欧美精品网址| 欧美激情第3页| 亚洲精品黑牛一区二区三区| 国产视频亚洲精品| 黑人狂躁日本娇小| 精品成人一区| 国产精品久久综合av爱欲tv| 国产理论视频在线观看| 成+人+亚洲+综合天堂| 日韩精品av一区二区三区| 久操视频在线| 香蕉久久一区二区不卡无毒影院 | 黄色a级片在线观看| 黄色av成人| 欧洲午夜精品久久久| 在线观看亚洲一区二区| 国产91精品免费| 视频一区免费观看| 91www在线| 欧美日韩在线不卡| 黄色av网址在线观看| 91视频久久| 欧美一级视频在线观看| 99精品在线视频观看| 久久奇米777| 欧美极品少妇无套实战| 性欧美hd调教| 亚洲白虎美女被爆操| 91免费在线看片| 亚洲欧美激情诱惑| 99精品国产高清在线观看| 国产资源在线观看| 亚洲成a人v欧美综合天堂下载| 中文字幕免费高清在线| 香蕉视频一区| 高清欧美性猛交| 国产av无码专区亚洲a∨毛片| 久久毛片高清国产| 亚洲熟妇无码一区二区三区| 95精品视频| 在线观看久久久久久| 国产福利拍拍拍| 国产成人免费视频网站| 一区二区三区四区五区视频| 国产伦精品一区二区三区视频金莲| 欧美成人vps| 波多野结衣爱爱视频| 免费不卡在线观看| 日本不卡久久| 中文字幕资源网在线观看免费| 欧美不卡视频一区| 91插插插插插插| 精品一区二区三区香蕉蜜桃 | 国产精品精品视频| 午夜在线视频免费| 亚洲h动漫在线| 国产精品入口麻豆| 亚洲午夜激情在线| 99国产在线视频| 欧美日韩经典丝袜| 精品少妇一区二区三区 | 精品国产1区2区| 黑森林av导航| 黄色在线成人| 99免费在线视频观看| 日韩aaaaa| 成人在线免费小视频| 日韩美女免费观看| 黄色片在线播放| 色噜噜狠狠成人中文综合| 亚洲乱码国产乱码精品精大量| 99日韩精品| 久久久福利视频| 亚洲精品动漫| 亚洲最新av网址| 在线免费观看一区二区| 亚洲欧洲成人精品av97| 一级片黄色免费| 91精品婷婷色在线观看| 亚洲wwwav| 黄页网站大全在线免费观看| 精品国产免费久久| 欧美精品亚洲精品日韩精品| 99久久精品国产麻豆演员表| 97国产在线播放| 国产精品探花在线观看| 国产精品女人久久久久久| 欧美精品日韩少妇| 日韩免费视频一区二区| 国产一级视频在线播放| 94色蜜桃网一区二区三区| 国产亚洲天堂网| 91综合网人人| 成人一区二区三区四区| 极品av在线| 国产亚洲欧美日韩美女| 97人妻人人澡人人爽人人精品| 亚洲精品第一国产综合野| 中文字幕乱视频| 免费看黄裸体一级大秀欧美| 亚洲精品一区二区三区四区五区| 精品成人18| 97国产真实伦对白精彩视频8| 国产三级视频在线播放线观看| 91精品欧美久久久久久动漫| 国产情侣在线视频| 中文字幕在线不卡视频| 日本一区二区在线观看视频| 日韩精品一级二级| 日本a在线天堂| 国产精品一区高清| 91在线视频成人| 欧美成人黑人| 免费成人高清视频| 韩国福利在线| 欧美大肚乱孕交hd孕妇| 中文字幕永久在线| 亚洲国产综合色| 色www亚洲国产阿娇yao| 成人的网站免费观看| 国产原创精品在线| 亚洲久色影视| 在线一区亚洲| 久久99久久人婷婷精品综合| 97久久人人超碰caoprom欧美| av在线不卡精品| 欧美精品福利在线| 黄色网在线免费看| 亚洲欧洲在线免费| 天天操天天射天天舔| 欧美一区二区三区在| 成人一二三四区| 亚洲成人第一页| 午夜精品福利在线视频| 欧美高清在线视频| 中文精品在线观看| 成人动漫中文字幕| 亚洲熟妇一区二区| 国产乱码精品一区二区三区五月婷| 熟妇人妻va精品中文字幕| 亚洲大黄网站| 国产中文字幕乱人伦在线观看| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 五月天激情播播| 日本色综合中文字幕| 日韩av三级在线| 99riav国产精品| 搞av.com| 韩国亚洲精品| 正在播放亚洲| 欧美国产偷国产精品三区| 日韩国产欧美一区| 国产一区日韩| 欧美亚州在线观看| 综合亚洲自拍| 欧美福利一区二区三区| 激情小说一区| 精品久久久久久亚洲| 红杏aⅴ成人免费视频| 岛国视频一区| 999在线精品| 高清av免费一区中文字幕| 亚洲一二av| 国产伦精品一区二区三区照片91 | 欧美成人免费在线| 亚洲97av| 欧美综合激情| 欧美精选一区二区三区| 亚洲电影网站| 婷婷综合社区| 女女百合国产免费网站| 欧美成人日韩| 草草视频在线免费观看| 9色精品在线| 日批视频在线免费看| 久久最新视频| 亚洲欧洲日本精品| 国产一区免费电影| 香蕉在线观看视频| 91丨九色丨国产丨porny| 欧美熟妇一区二区| 国产精品久久久久久久久搜平片| 久草手机视频在线观看| 亚洲色图在线视频| 日本熟女一区二区| 日本丶国产丶欧美色综合| 欧美激情一区二区三区免费观看| 欧美另类videos死尸| 国产三级小视频| 亚洲国产天堂久久综合| 免费福利在线观看| 久久天天躁狠狠躁夜夜躁2014| 欧美性video| 日本三级韩国三级久久| 国产69精品久久| av一本久道久久波多野结衣| 色88888久久久久久影院| 日产精品一线二线三线芒果| 综合激情婷婷| 日本中文字幕片| 经典三级在线一区| 日韩精品人妻中文字幕有码| 久久精品一区二区三区不卡 | 91香蕉国产线在线观看| 成人精品小蝌蚪| 乐播av一区二区三区| 亚洲码国产岛国毛片在线| 在线观看亚洲天堂| 91精品国产综合久久久久久漫画| 四虎免费在线观看| 日韩综合视频在线观看| 678在线观看视频| 91精品国产综合久久香蕉922| 北条麻妃一区二区三区在线| 欧美精品在线一区| 欧美 日韩 国产 一区| 日日碰狠狠添天天爽超碰97| 黑人巨大精品欧美黑白配亚洲| www.超碰97| 亚洲欧美偷拍三级| 日批视频免费在线观看| 日韩精品中文字幕在线不卡尤物| 国产尤物视频在线| 国内精品国产三级国产在线专| 久久亚洲资源中文字| 久久精彩视频| 欧美日本国产| 免费网站在线观看黄| 国产欧美日韩在线| 久久久久久久久久影院| 日韩女同互慰一区二区| 日本在线天堂| 国产精品成av人在线视午夜片| 久久久久久毛片免费看| 国产资源第一页| 免播放器亚洲一区| 一本加勒比北条麻妃| 亚洲大片一区二区三区| 国产成人av免费看| 最近免费中文字幕视频2019| 欧美电影h版| 久久久久久久免费| 在线欧美亚洲| 人妻换人妻a片爽麻豆| 伊人一区二区三区| 国产免费一区二区三区最新不卡| 在线观看久久久久久| 日本精品不卡| 欧美日韩一区综合| 夜夜嗨一区二区| 中文文字幕文字幕高清| 亚洲大片一区二区三区| 黄色av网址在线| 久精品免费视频| 伊人久久大香线蕉av超碰| 国产欧美自拍视频| 国产一区二区视频在线| 久久中文免费视频| 欧美一区二区播放| 在线免费观看a视频| 3d动漫精品啪啪一区二区三区免费| 婷婷综合在线| 免费高清视频在线观看| 亚洲激情网站免费观看| www.欧美国产| 久久久中文字幕| 牛牛视频精品一区二区不卡| 免费黄色日本网站| 久久综合丝袜日本网| 狠狠人妻久久久久久综合| 亚洲精品久久久久久久久久久久 | 久久经典视频| 国产精品激情自拍| 人人狠狠综合久久亚洲婷| 日韩不卡一二三| 亚洲男女一区二区三区| 亚洲成人精品女人久久久| 久久久伊人欧美| 人人精品视频| 欧美视频第三页| 中文字幕欧美一| 精品黑人一区二区三区国语馆| 久久久久久久久久亚洲| 日韩欧美在线精品| 男人搞女人网站| 亚洲图片激情小说| 亚洲黄色在线播放| 日av在线播放中文不卡| 欧美一二区在线观看| 中文字幕色网站| 精品高清一区二区三区| av午夜在线| 成人在线看片| 久久久久国产精品一区三寸| 欧美日韩国产一二三区| 精品国精品国产| 国产另类xxxxhd高清| 中国人体摄影一区二区三区| 粉嫩蜜臀av国产精品网站| 日本特级黄色片| 久久久国产精品视频| 嫩草国产精品入口| 中文字幕有码av| 亚洲综合另类小说| 国产在线观看黄| 岛国视频一区免费观看| 日韩激情在线观看| 欧美日韩人妻精品一区二区三区| 日韩精品小视频| 久久中文字幕一区二区| 成年人在线看片| 亚洲自拍偷拍九九九| 福利视频在线导航|