精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

借助ChatGPT進行數據清洗

原創
開發
對于少量文件可以刪除http頭信息后,另存為json文件,通過mysql的一些客戶端程序直接導入,但對于成百上千個,甚至超過10萬的json文件處理就比較麻煩,本文基于超過數萬json文件的批量處理進行探索,數分鐘解決了數據清洗。

在很多實際工作情況下,通過python等工具進行內容爬取,爬取的數據到本地后并不可用,需要進行清洗,清洗后導入到mysql數據庫進行數據分析。對于少量文件可以刪除http頭信息后,另存為json文件,通過mysql的一些客戶端程序直接導入,但對于成百上千個,甚至超過10萬的json文件處理就比較麻煩,本文基于超過數萬json文件的批量處理進行探索,數分鐘解決了數據清洗。

一、程序功能設計

1.3-用戶列表目錄存放burpsuite爬取的數據。

2.爬取數據的格式為json文件

3.爬取的文件帶有http頭內容,通過記事本等編輯器打開顯示頭文件內容為15行。

4.需要刪除每一個文件中的前15行。

5.對所有目錄下的文件命名為txt文件,處理完畢后命名為json文件。

6.依次讀取所有json文件,通過逗號分隔列名,保存為out.txt文件。

7.程序處理出錯,繼續運行,且保存出錯信息。

圖片

二、實現編程

這是一個 Python 程序,可以將一個目錄中的 JSON 文件轉換成 CSV 格式,然后將其寫入到一個名為 "3-用戶列表.txt" 的文件中,并記錄執行過程中的錯誤信息到 "error.log" 文件中。

程序的主要邏輯如下:

  1. 獲取目錄中所有的文件(只包括文件),如果沒有任何文件,則拋出異常;
  2. 遍歷文件,如果文件的后綴不是 ".txt",則重命名文件名字并改變文件名變量的值;
  3. 讀取文件內容,將前 15 行保留在一個字符串中,剩余部分作為新內容;
  4. 將新內容寫回文件中;
  5. 將文件后綴名從 ".txt" 改為 ".json" 并修改文件名變量的值;
  6. 讀取 JSON 文件的內容,并獲取其中 "data" 中 "list" 數組中的每個元素的 key 值,這些 key 值作為表格的列名,并將這些列名保存到數組 "columns" 中;
  7. 遍歷 "list" 數組中的每個元素,將每一行的值存入一個數組 "row_values" 中,最后將 "row_values" 中的所有值拼接成一個字符串,以逗號為分隔符,將其保存到數組 "rows" 中;
  8. 將 "columns" 和 "rows" 寫入到 "3-用戶列表.txt" 文件中。如果該文件的大小為0,那么先寫入 "columns";否則直接寫入 "rows" 內容;
  9. 打印信息表明某個文件的數據被寫入了 "out.txt" 文件中。

程序運行過程中出現錯誤,不會影響程序的整體執行,而是將錯誤信息記錄到 "error.log" 文件中。

三、不斷優化

優化內容:

  1. 增加了try-except語句,用于處理可能出現的異常情況;
  2. 增加了對目錄下是否存在任何文件的判斷,防止在空目錄中運行程序;
  3. 增加了錯誤提示,如果程序出錯會顯示錯誤信息;
  4. 代碼整體結構并沒有變化,只是在原有的代碼基礎上增加了一些出錯處理的邏輯。
import os
import json


dir = '3-用戶列表'


try:
    all_files = [f for f in os.listdir(dir) if os.path.isfile(os.path.join(dir, f))]
    if not all_files:
        raise Exception('該目錄下不存在任何文件')


    with open('error.log', 'a+', encoding='utf-8') as error_file:
        for file in all_files:
            try:
                if not file.endswith('.txt'):
                    os.rename(os.path.join(dir, file), os.path.join(dir, os.path.splitext(file)[0] + '.txt'))
                    file = os.path.splitext(file)[0] + '.txt'


                with open(os.path.join(dir, file), 'r', encoding='utf-8') as txt_file:
                    content = txt_file.readlines()


                deleted_content = '\n'.join(content[:15])
                new_content = ''.join(content[15:])
                with open(os.path.join(dir, file), 'w', encoding='utf-8') as txt_file:
                    txt_file.write(new_content)


                json_file = os.path.splitext(file)[0] + '.json'
                os.rename(os.path.join(dir, file), os.path.join(dir, json_file))


                with open(os.path.join(dir, json_file), 'r', encoding='utf-8') as j_file:
                    data = json.load(j_file)
                    columns = list(data['data']['list'][0].keys())
                    rows = []


                    for item in data['data']['list']:
                        row_values = []
                        for column in columns:
                            value = str(item[column]).replace('\n','').replace(',','')
                            row_values.append(value)
                        rows.append(','.join(row_values))


                    with open('3-用戶列表.txt', 'a+', encoding='utf-8') as out_file:
                        if out_file.tell() == 0:
                            out_file.write(','.join(columns) + '\n')
                        out_file.write('\n'.join(rows)+'\n')


                    print("文件{}中的數據已寫入out.txt文件中".format(json_file))


            except Exception as e:
                error_file.write('文件{}處理出錯:{}\n'.format(file, e))
                print('文件{}處理出錯:{}'.format(file, e))


except Exception as e:
    print("出錯了:", e)

四、注意事項

1.需要看json數據格式:

data對應list不同的json文件中list不一樣,需要在代碼中進行修改。

2.處理后的文件內容可能存在重復,需要去重以及處理一些臟數據

五、實際處理效果

圖片

圖片


責任編輯:龐桂玉 來源: 51CTO
相關推薦

2023-05-05 19:29:41

2025-04-07 00:30:00

DeepSeek大數據數字化

2024-10-28 12:57:36

Pandas數據清洗

2022-03-28 14:08:02

Python數據清洗數據集

2023-09-26 01:03:36

Pandas數據數據集

2021-07-27 15:40:39

Python數據清洗函數

2024-12-19 15:00:00

數據清洗Python

2018-04-03 12:07:53

數據清洗PandasNumpy

2023-06-13 08:00:57

ChatGPT語言模型

2011-03-09 14:18:37

SQL數據累加

2017-10-31 11:55:46

sklearn數據挖掘自動化

2009-01-06 09:23:00

VLAN網絡管理

2019-09-27 12:44:03

數據建模企業數據存儲

2019-09-30 10:12:21

機器學習數據映射

2013-06-08 14:50:10

rman數據恢復

2022-11-02 14:45:24

Python數據分析工具

2009-03-16 10:29:45

數據挖掘過濾器Access

2009-09-08 16:50:12

使用LINQ進行數據轉

2022-06-02 13:59:57

數據遷移數據

2024-01-29 18:06:39

SQL數據格式
點贊
收藏

51CTO技術棧公眾號

精品午夜一区二区三区| 欧美贵妇videos办公室| 亚洲一区二区三区四区五区| 麻豆网站视频在线观看| 国产不卡在线视频| 4438全国成人免费| 婷婷激情四射网| 精品久久对白| 91精品在线观看入口| a级黄色一级片| 丝袜美腿美女被狂躁在线观看| 国产福利一区二区三区视频在线| 欧美一级免费视频| 青青草手机在线视频| 精品国产乱码久久久| 日韩精品一区二区三区在线播放| 日韩精品免费播放| 黄频免费在线观看| 亚洲天堂中文字幕| 欧美一卡2卡3卡4卡无卡免费观看水多多| 一级片视频播放| 男女精品网站| 久久久久国产一区二区三区| 夫妇露脸对白88av| 亚洲人和日本人hd| 欧美精品一区二区三区蜜臀| 性欧美1819| a日韩av网址| 亚洲国产毛片aaaaa无费看| 亚洲一区二区不卡视频| 你懂的在线看| 成人99免费视频| 97人人澡人人爽| 91在线视频国产| 日韩高清在线一区| 欧美综合国产精品久久丁香| 欧美丰满艳妇bbwbbw| 91日韩在线| 伊人男人综合视频网| 女~淫辱の触手3d动漫| 韩国精品福利一区二区三区| 日韩一二三四区| 激情在线观看视频| 亚洲一区二区av| 欧美日韩视频在线观看一区二区三区| 中文字幕日本最新乱码视频| 激情aⅴ欧美一区二区欲海潮| 亚洲另类色综合网站| 国产精品夜夜夜爽张柏芝| 国产三级在线看| 国产嫩草影院久久久久| 日本精品一区二区三区不卡无字幕| 日本精品999| www.视频一区| 久久99精品久久久久子伦| 好吊色一区二区三区| 成人在线综合网| 国产欧美日本在线| 色wwwwww| 91麻豆高清视频| 日本免费高清一区| www.黄在线观看| 中文字幕精品在线不卡| 亚洲精品成人三区| 天堂а√在线资源在线| 亚洲免费在线观看| 国产激情在线看| 狂野欧美激情性xxxx欧美| 亚洲大片免费看| 女人和拘做爰正片视频| 欧美黑人巨大xxxxx| 欧美午夜不卡视频| www.久久久久久久久久久| 国产视频一区二| 亚洲精品一区二区在线观看| 成人精品在线观看视频| 欧美美女在线| 久久久999国产| 久久精品www人人爽人人| 99精品国产在热久久| 欧美在线视频一区二区| 中文字幕人妻精品一区| 国产一区视频网站| 精品无码久久久久久久动漫| 国产在线观看网站| 中文字幕字幕中文在线中不卡视频| 中文字幕乱码免费| 日本乱码一区二区三区不卡| 欧美午夜宅男影院| wwwww在线观看| 天堂俺去俺来也www久久婷婷| 最近2019中文字幕大全第二页| 四虎永久免费在线| 美女网站久久| 91久久精品视频| 少妇激情av一区二区| 国产精品灌醉下药二区| 日韩中文字幕在线免费| 国产91亚洲精品久久久| 亚洲成人免费在线视频| 中文字幕欧美激情极品| 韩日成人在线| 国产欧美精品一区二区三区介绍| 狠狠躁夜夜躁av无码中文幕| 亚洲国产精品精华液2区45| 日本免费成人网| 九九九精品视频| 亚洲国产精品成人精品| 顶级黑人搡bbw搡bbbb搡| 99亚洲一区二区| 亚洲一区中文字幕| aiai在线| 欧美性20hd另类| 欧美日韩久久婷婷| av一区二区高清| 午夜精品视频网站| aaa一区二区三区| 国产欧美在线观看一区| 日韩精品一区在线视频| 曰本一区二区| 中文字幕精品久久| 欧美一区二区三区网站| 国产不卡视频一区二区三区| 亚洲成人蜜桃| 日韩大尺度黄色| 亚洲国产中文字幕在线观看| 亚洲一级生活片| 久久精品国产亚洲a| 青青草成人网| 色吧亚洲日本| 亚洲国产另类久久精品| 久久久综合久久| 国产一区美女在线| 正在播放一区二区三区| 日韩高清不卡| 亚洲深夜福利视频| 中文字幕一区在线播放| 91小视频免费看| 欧美日韩黄色一级片| 97久久综合精品久久久综合| 久久精品一本久久99精品| 中文字幕理论片| 国产人伦精品一区二区| 欧美日韩中文在线视频| 无码日韩精品一区二区免费| 国内外成人免费激情在线视频| 午夜精品久久久久久久96蜜桃 | 中国xxxx性xxxx产国| 欧美在线网站| 97久草视频| 青青草原国产在线| 精品日韩av一区二区| 欧美日韩亚洲国产另类| 国产98色在线|日韩| 加勒比成人在线| 色先锋久久影院av| 日韩av电影手机在线| 国产乱视频在线观看| 欧美亚洲图片小说| 永久av免费网站| 国产一区二区三区在线观看免费视频 | 超碰在线人人干| 亚洲成人综合在线| 亚洲色图14p| 日韩激情视频网站| 自拍偷拍视频在线| 果冻天美麻豆一区二区国产| 青草青草久热精品视频在线观看| 精品美女视频在线观看免费软件| 欧美午夜片在线观看| 日韩av手机在线免费观看| 国产成人在线网站| 日日摸日日碰夜夜爽无码| 欧美男男gaytwinkfreevideos| 国产精品久久久久久搜索 | 91高清国产视频| 欧美日韩国产探花| 欧美h视频在线| 日本a人精品| 欧美激情影音先锋| 日韩精品系列| 欧美精品丝袜中出| 日韩成年人视频| 国产精品三级av在线播放| 久久精品久久99| 一区二区三区国产在线| 一区二区三区我不卡| 国产精品玖玖玖在线资源| 青青青国产精品一区二区| 黄色在线播放网站| 亚洲精品小视频| av在线免费在线观看| 粉嫩av一区二区三区免费野| 激情高潮到大叫狂喷水| 成人动漫视频在线| 欧美激情第3页| 国产日韩欧美高清免费| 自拍偷拍亚洲色图欧美| 极品束缚调教一区二区网站 | 久久网站热最新地址| 亚洲精品视频三区| 久久国产精品亚洲77777| 亚洲成人动漫在线| 精品国产一区探花在线观看| 91视频最新| 福利一区二区三区视频在线观看 | 亚洲一区二区91| 国产精品国产精品国产专区不蜜| 中文字幕乱码在线| 久久99国内精品| 欧美成人黑人猛交| 激情综合中文娱乐网| 国产麻豆电影在线观看| 国产精品三级| 久久久久无码国产精品一区| 人人爱人人干婷婷丁香亚洲| 国产精品第1页| 不卡视频观看| 欧美精品在线免费观看| av资源网站在线观看| 亚洲精品国产福利| 亚洲黄色在线观看视频| 91精品国产综合久久精品| 做爰无遮挡三级| 色综合久久88色综合天天6| 国产在线视频卡一卡二| 亚洲男人天堂一区| 中文字幕资源站| 中文字幕av一区二区三区高| 精品人妻一区二区三区香蕉| www.欧美日韩国产在线| 日本一区二区免费视频| 国产伦精品一区二区三区免费 | 妞干网在线观看视频| 国产精品v欧美精品v日本精品动漫| 中文字幕日韩精品久久| 成人激情开心网| 三级三级久久三级久久18| 妖精视频一区二区三区免费观看| 国产一区二区三区色淫影院| 美女国产精品久久久| 成人天堂噜噜噜| 国产精品一区二区精品视频观看| 国产一区二区色| 99久热在线精品视频观看| 91日本在线观看| 亚洲图片小说区| 97久久天天综合色天天综合色hd| 日韩欧美高清一区二区三区| 91精品国产99久久久久久红楼| 精品国产亚洲一区二区三区大结局 | 日本高清xxxx| 欧美精品不卡| 韩日视频在线观看| 国产日韩欧美一区在线| 久久国产乱子伦免费精品| 久久激情综合| 久久婷五月综合| 国产一区啦啦啦在线观看| 亚洲丝袜在线观看| a在线欧美一区| 泷泽萝拉在线播放| 亚洲国产精华液网站w| 国产三级aaa| 一级中文字幕一区二区| 日本在线观看中文字幕| 日本久久精品电影| 亚洲网站在线免费观看| 日韩一区二区在线免费观看| 蜜桃视频在线观看www| 日韩电影免费在线观看中文字幕| 日本大臀精品| 最近2019中文免费高清视频观看www99 | 久久久久久久久久久人体| free性护士videos欧美| 国产精品扒开腿做爽爽爽的视频| 日韩精品一页| 国产精品美女黄网| 国语产色综合| 神马午夜伦理影院| 亚洲影院一区| 国产美女视频免费看| av在线播放一区二区三区| 亚洲精品一区二区三区影院忠贞| 亚洲欧美经典视频| 久久人妻免费视频| 日韩亚洲欧美一区| 黄色在线视频观看网站| 久久中文精品视频| 免费电影日韩网站| 亚洲free性xxxx护士hd| 亚洲日产av中文字幕| 小泽玛利亚av在线| 免费一级片91| 国产美女视频免费观看下载软件| 欧美极品另类videosde| 日本特黄特色aaa大片免费| 欧美视频一区在线| 天堂在线中文资源| 久久精品国产91精品亚洲 | 欧美视频13p| 国产又黄又大又爽| 亚洲午夜av久久乱码| 色帝国亚洲欧美在线| 国产精品免费一区豆花| 国产区精品视频在线观看豆花| 亚洲伊人婷婷| 亚洲欧美成人综合| 乱码一区二区三区| 中文字幕综合网| 欧美高清69hd| 日韩精品福利在线| 国产蜜臀一区二区打屁股调教| 国产精品永久在线| 国产精品嫩草影院在线看| 久久久久久人妻一区二区三区| 九九九久久久精品| 丁香六月激情综合| 色天使久久综合网天天| 深夜福利视频网站| 欧美激情一区二区久久久| 国产一区二区| 中文字幕在线亚洲精品| 美腿丝袜在线亚洲一区| 在线 丝袜 欧美 日韩 制服| 性做久久久久久久久| 亚洲精品911| 欧美激情精品在线| 美女日韩一区| 18视频在线观看娇喘| 韩国精品免费视频| 艳妇荡乳欲伦69影片| 欧美乱妇20p| 免费网站看v片在线a| 国产精品香蕉国产| 日韩极品一区| 中文字幕丰满乱码| 国产精品久久精品日日| 最近中文字幕在线观看| 最近2019中文字幕mv免费看| 国产精品亚洲d| 亚洲国产精品毛片| 麻豆视频一区二区| 中文字幕精品亚洲| 欧美精品自拍偷拍| 成a人片在线观看| 97av影视网在线观看| 欧美二区视频| 年下总裁被打光屁股sp| 亚洲成av人片一区二区| 日韩中文字幕免费观看| 国产69精品久久久久久| 天海翼亚洲一区二区三区| 日韩精品一区中文字幕| 亚洲国产精品ⅴa在线观看| 91亚洲欧美激情| 欧美乱大交xxxxx| 精品国产一区二区三区不卡蜜臂| 国产视频九色蝌蚪| 国产婷婷一区二区| 一级特黄aaaaaa大片| 久久手机精品视频| 97se亚洲| 国产天堂在线播放| 国产精品理伦片| 国产av无码专区亚洲av| 亚州av一区二区| 国产在视频线精品视频www666| wwwwwxxxx日本| 亚洲伦在线观看| 天天操天天操天天干| 日本成人激情视频| 久久精品影视| 波多野结衣影院| 欧美在线一区二区三区| 黄网页在线观看| 久久精品国产一区二区三区不卡| 日韩av一级片| 欧美日韩免费一区二区| 日韩av在线一区二区| 黑人一区二区三区| 国产精品videossex国产高清| 久久久99免费| 国产精品无码天天爽视频| 久久久久久久久久国产精品| 国产永久精品大片wwwapp| 丰满少妇一区二区三区专区| 欧美日韩国产色| 黄色小网站在线观看| 免费观看成人高| 国产美女精品一区二区三区| 国产精品久久久久久久久久久久久久久久久 | 日韩一二三区不卡| 日本电影欧美片| 欧美这里只有精品| 国产精品入口麻豆原神| 懂色av成人一区二区三区| 国产精品啪视频| 一区二区三区四区五区精品视频| 在线视频这里只有精品|