精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用C#+Selenium+ChromeDriver 爬取網頁,模擬真實的用戶瀏覽行為

開發 后端
Selenium是一個用于Web應用程序測試的工具。Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。而對于爬蟲來說,使用Selenium操控瀏覽器來爬取網上的數據那么肯定是爬蟲中的殺手武器。

[[381769]]

本文轉載自微信公眾號「UP技術控」,可以通過以下二維碼關注。轉載本文請聯系UP技術控公眾號。

背景

Selenium是一個用于Web應用程序測試的工具。Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。而對于爬蟲來說,使用Selenium操控瀏覽器來爬取網上的數據那么肯定是爬蟲中的殺手武器。這里,我將介紹selenium + 谷歌瀏覽器的一般使用。

需求

在平常的爬蟲開發中,有時候網頁是一堆js堆起來的代碼,涉及很多異步計算,如果是普通的http 控制臺請求,那么得到的源文件是一堆js ,需要自己在去組裝數據,很費力;但是采用Selenium+ChromeDriver可以達到所見即所得的完美效果。

實現方式

項目結構:為了方便使用,用的winform程序,附nuget包

 

以下是form1.cs的代碼,這里就只放關鍵方法代碼了。需要安裝最新的chrome瀏覽器+代碼中使用的chromedriver是 v2.9.248315

  1. private void crawlingWebFunc() 
  2.         { 
  3.             SetText("\r\n開始嘗試..."); 
  4.             List<testfold> surls = new List<testfold>(); 
  5.             string path = System.Environment.CurrentDirectory + "\\圖片url\\"
  6.             DirectoryInfo root = new DirectoryInfo(path); 
  7.             DirectoryInfo[] dics = root.GetDirectories(); 
  8.             foreach (var itemdic in dics) 
  9.             { 
  10.                 string txt = ""
  11.                 StreamReader sr = new StreamReader(itemdic.FullName + "\\data.txt"); 
  12.                 while (!sr.EndOfStream) 
  13.                 { 
  14.                     string str = sr.ReadLine(); 
  15.                     txt += str;// + "\n"
  16.                 } 
  17.                 sr.Close(); 
  18.                 surls.Add(new testfold() { key = itemdic.FullName, picurl = txt }); 
  19.             } 
  20.  
  21.             ChromeDriverService service = ChromeDriverService.CreateDefaultService(System.Environment.CurrentDirectory); 
  22.             //  service.HideCommandPromptWindow = true
  23.  
  24.             ChromeOptions options = new ChromeOptions(); 
  25.             options.AddArguments("--test-type""--ignore-certificate-errors"); 
  26.             options.AddArgument("enable-automation"); 
  27.             //   options.AddArgument("headless"); 
  28.             //  options.AddArguments("--proxy-server=http://user:password@yourProxyServer.com:8080"); 
  29.  
  30.             using (IWebDriver driver = new OpenQA.Selenium.Chrome.ChromeDriver(service, options, TimeSpan.FromSeconds(120))) 
  31.             { 
  32.                 driver.Url = "https://www.1688.com/"
  33.                 Thread.Sleep(200); 
  34.                 try 
  35.                 { 
  36.                     int a = 1; 
  37.                     foreach (var itemsurls in surls) 
  38.                     { 
  39.                         SetText("\r\n第" + a.ToString() + "個"); 
  40.                         driver.Navigate().GoToUrl(itemsurls.picurl); 
  41.                         //登錄 
  42.                         if (driver.Url.Contains("login.1688.com")) 
  43.                         { 
  44.                             SetText("\r\n需要登錄,開始嘗試..."); 
  45.                             trylogin(driver); //嘗試登錄完成 
  46.                                               //再試試 
  47.                             driver.Navigate().GoToUrl("https://s.1688.com/youyuan/index.htm?tab=imageSearch&imageType=oss&imageAddress=cbuimgsearch/eWXC7XHHPN1607529600000&spm="); 
  48.  
  49.                             if (driver.Url.Contains("login.1688.com")) 
  50.                             { 
  51.                                 //沒辦法退出 
  52.                                 SetText("\r\n退出,換ip重試..."); 
  53.                                 return
  54.                             } 
  55.                         } 
  56.  
  57.                         //鼠標放上去的內容因為頁面自帶只能顯示一個的原因 沒辦法做到全部顯示 然后在下載 只能是其他方式下載 
  58.                         //  var elements = document.getElementsByClassName('hover-container'); 
  59.                         //  Array.prototype.forEach.call(elements, function(element) { 
  60.                         //  element.style.display = "block"
  61.                         //   console.log(element); 
  62.                         //  }); 
  63.  
  64.                         //   IJavaScriptExecutor js = (IJavaScriptExecutor)driver; 
  65.  
  66.                         //    var sss = js.ExecuteScript(" var elements = document.getElementsByClassName('hover-container');  Array.prototype.forEach.call(elements, function(element) {  console.log(element); element.setAttribute(\"class\", \"測試title\");  element.style.display = \"block\";  console.log(element); });"); 
  67.  
  68.                         Thread.Sleep(500); 
  69.                         var responseModel = Write(itemsurls.key, driver.PageSource, Pagetypeenum.列表); 
  70.                         Thread.Sleep(500); 
  71.                         int i = 1; 
  72.                         foreach (var offer in responseModel?.data?.offerList ?? new List<OfferItemModel>()) 
  73.                         { 
  74.                             driver.Navigate().GoToUrl(offer.information.detailUrl); 
  75.                             string responseDatadetail = driver.PageSource; 
  76.                             Write(itemsurls.key, driver.PageSource, Pagetypeenum.詳情); 
  77.                             SetText("\r\n第" + a.ToString() + "-" + i.ToString() + "個"); 
  78.                             Thread.Sleep(500); 
  79.                             i++; 
  80.                         } 
  81.                     } 
  82.                 } 
  83.                 catch (Exception ex) 
  84.                 { 
  85.                     CloseChromeDriver(driver); 
  86.                     throw; 
  87.                 } 
  88.             } 
  89.         } 

  1. #region 異常  退出chromedriver 
  2.  
  3.         [DllImport("user32.dll", EntryPoint = "FindWindow")] 
  4.         private extern static IntPtr FindWindow(string lpClassName, string lpWindowName); 
  5.  
  6.         [DllImport("user32.dll", EntryPoint = "SendMessage")] 
  7.         public static extern int SendMessage(IntPtr hWnd, int Msg, int wParam, int lParam); 
  8.  
  9.         public const int SW_HIDE = 0; 
  10.         public const int SW_SHOW = 5; 
  11.  
  12.         [DllImport("user32.dll", EntryPoint = "ShowWindow")] 
  13.         public static extern int ShowWindow(IntPtr hwnd, int nCmdShow); 
  14.  
  15.         /// <summary> 
  16.         /// 獲取窗口句柄 
  17.         /// </summary> 
  18.         /// <returns></returns
  19.         public IntPtr GetWindowHandle() 
  20.         { 
  21.             string name = (Environment.CurrentDirectory + "\\chromedriver.exe"); 
  22.             IntPtr hwd = FindWindow(nullname); 
  23.             return hwd; 
  24.         } 
  25.  
  26.         /// <summary> 
  27.         /// 關閉chromedriver窗口 
  28.         /// </summary> 
  29.         public void CloseWindow() 
  30.         { 
  31.             try 
  32.             { 
  33.                 IntPtr hwd = GetWindowHandle(); 
  34.                 SendMessage(hwd, 0x10, 0, 0); 
  35.             } 
  36.             catch { } 
  37.         } 
  38.  
  39.         /// <summary> 
  40.         /// 退出chromedriver 
  41.         /// </summary> 
  42.         /// <param name="driver"></param> 
  43.         public void CloseChromeDriver(IWebDriver driver) 
  44.         { 
  45.             try 
  46.             { 
  47.                 driver.Quit(); 
  48.                 driver.Dispose(); 
  49.             } 
  50.             catch { } 
  51.             CloseWindow(); 
  52.         } 
  53.  
  54.         #endregion 異常  退出chromedriver 

效果

 

總結

說一下思路:

1.跳轉到指定的網頁driver.Navigate().GoToUrl

2.確定數據源,從driver.PageSource讀取數據

3.對html數據進行解析

 

責任編輯:武曉燕 來源: UP技術控
相關推薦

2022-07-12 09:55:34

Selenium爬取數據

2021-11-24 17:22:06

網絡抓取網絡爬蟲數據收集

2023-05-19 07:43:11

2009-08-11 08:58:19

linux命令瀏覽網頁linux命令行參數linux命令行

2024-03-18 08:38:57

瀏覽器爬蟲直聘

2023-11-15 13:18:50

2009-06-24 17:39:07

TeamDefine

2015-04-01 14:14:38

Safari谷歌瀏覽器安全

2020-11-03 14:10:45

Python爬取天氣爬蟲

2019-01-02 12:23:30

Python金融數據爬取

2022-12-30 14:21:54

2011-11-15 08:53:52

用戶

2015-10-29 13:22:09

php數據分析爬蟲

2022-09-28 11:34:27

用戶行為數據業務

2013-07-15 15:47:35

App用戶行為

2024-10-08 10:44:32

2024-12-02 09:37:51

2017-11-08 10:05:17

2019-07-31 16:44:40

Python網絡爬蟲瀏覽器

2021-06-02 22:18:11

Python關鍵詞微博
點贊
收藏

51CTO技術棧公眾號

99精品中文字幕在线不卡 | 亚洲黄色片免费看| 天天躁夜夜躁狠狠是什么心态| 国产黄a三级三级看三级| 国产精品1luya在线播放| 欧美国产一区视频在线观看| 午夜精品在线观看| 亚洲一卡二卡三卡| 国产综合精品视频| www.丝袜精品| 色噜噜狠狠色综合欧洲selulu| 欧美综合在线第二页| 亚洲午夜精品在线观看| 美女国产在线| 图片婷婷一区| 精品久久久久久亚洲精品 | 成人免费短视频| 国产精品一区二区免费不卡| 在线日韩第一页| 日韩免费一级视频| 殴美一级特黄aaaaaa| 一区二区影院| 欧美一卡二卡三卡| 亚洲人成网站在线观看播放| 亚洲精品一区二区三区四区| 欧美日韩精品免费观看视频完整| 精品日韩中文字幕| 久久av一区二区三区漫画| 国产午夜福利精品| 亚洲v天堂v手机在线| 色婷婷综合激情| 日本在线一区| 国产一区二区波多野结衣| 婷婷成人基地| 亚洲精品一区二区三区福利 | 精品国精品国产自在久国产应用 | 成人在线爆射| 久久久www成人免费毛片麻豆| 日韩一区二区三区在线播放| 国产一级特黄a大片免费| av在线收看| 国产在线精品免费| 欧美国产日韩一区二区在线观看| 日韩一级在线免费观看| av福利精品| 国产精品一区二区三区99| 国产精品久久97| 黄色a级片在线观看| 涩涩屋成人免费视频软件| 亚洲成人免费视频| 日本视频精品一区| 国产精品爽爽久久| 国产日本精品| 日韩在线观看精品| 乱老熟女一区二区三区| 国产美女视频一区二区| 精品色蜜蜜精品视频在线观看| 日韩欧美国产二区| 成人影院免费观看| 国产精品入口麻豆原神| av色综合网| 亚洲图片在线视频| 亚洲国产日韩欧美在线| 日韩久久免费电影| 第四色婷婷基地| 55av亚洲| 亚洲视频一区二区在线观看| 国产欧美一区二区三区不卡高清| 日本黄色录像视频| 久久99偷拍| 欧美一三区三区四区免费在线看| 欧美一级欧美一级| 黄色片在线播放| 国产河南妇女毛片精品久久久| 中文字幕亚洲第一| 亚洲图片欧美另类| 91精品亚洲一区在线观看| 欧美午夜视频一区二区| 久久久无码中文字幕久...| 人妻偷人精品一区二区三区| 99久久99久久久精品齐齐| 成人福利在线观看| 亚洲精品久久久久久久蜜桃| 欧美三区美女| 欧美亚洲国产精品| 久久国产露脸精品国产| 性欧美69xoxoxoxo| 欧美激情一区二区三区久久久 | 992tv成人免费观看| 四虎精品成人影院观看地址| 久久国产日韩欧美精品| 57pao精品| 国产黄色免费视频| 国产一区二区精品在线观看| 国产在线一区二| 在线看免费av| 亚洲成人免费影院| 小明看看成人免费视频| 超碰一区二区| 在线不卡欧美精品一区二区三区| 99久热在线精品视频| 92国产在线视频| 一级中文字幕一区二区| 26uuu成人| 免费黄色在线观看| 欧美日韩视频免费播放| 日本精品一区在线| 九九久久电影| 亚洲一二三在线| 中文字幕被公侵犯的漂亮人妻| 韩国女主播一区二区| 亚洲成人你懂的| 91色国产在线| 你懂的在线观看一区二区| 亚洲二区在线播放视频| av漫画在线观看| 欧美激情偷拍自拍| 久久精品电影网站| 日本一二三区在线观看| 亚洲午夜精品一区 二区 三区| 亚洲性69xxxbbb| 日韩av电影网| 亚洲在线电影| 国产成人aa精品一区在线播放 | 亚洲精品视频免费看| 黄瓜视频免费观看在线观看www| 在线观看免费黄色| 午夜精品久久久久久久| 男人操女人免费软件| 日韩在线免费| 亚洲欧美www| 亚洲无人区码一码二码三码的含义| 亚洲欧洲色图| 91国语精品自产拍在线观看性色| 美女av免费看| 天天操综合网| 国产精品日韩欧美大师| 国产熟女一区二区丰满| 高潮精品一区videoshd| 久久久久久九九| 女同视频在线观看| 天天爽夜夜爽夜夜爽精品视频| 女人天堂av手机在线| 一区二区三区视频免费视频观看网站| 色88888久久久久久影院野外| 亚洲第一中文av| 亚洲视频自拍| 日韩中文字幕免费看| 青娱乐在线免费视频| 久久九九久久九九| 中文字幕欧美人妻精品一区| 123成人网| 中文字幕av一区二区| 午夜精品免费观看| 国产麻豆一精品一av一免费| 中文字幕一区二区三区四区五区六区 | 97蜜桃久久| 精品国产免费人成在线观看| 国产一卡二卡在线| 99久久精品99国产精品| 黄色免费视频大全| 精品国产一区二区三区香蕉沈先生| 另类美女黄大片| 日韩精品一区三区| 91丝袜呻吟高潮美腿白嫩在线观看| 亚洲综合成人婷婷小说| 中文字幕观看视频| 懂色av一区二区三区免费看| 国产伦精品一区二区三区视频黑人| 国产又黄又大又粗的视频| 中文字幕 久热精品 视频在线| 久久久久久久有限公司| 超碰激情在线| 91精品一区二区三区在线观看| 不卡中文字幕在线观看| 欧美a大片欧美片| 国产91在线播放| 亚洲精品成av人片天堂无码| 亚洲国产日产av| 精品人妻互换一区二区三区| 亚洲视频日本| 成人中文字幕在线观看| 国产三级电影在线观看| 欧美性极品xxxx娇小| 五月婷婷婷婷婷| 国产精品一级在线| 久久久久久久久久久视频| 日本一区二区在线看| 日本免费一区二区三区视频观看 | 久久精品久久99精品久久| 水蜜桃在线免费观看| 欧亚精品一区| 91麻豆国产精品| 性欧美xxx69hd高清| 欧美一区二视频| 日本在线播放视频| 亚洲欧洲日本在线| www.这里只有精品| 国产精品黄色| 亚洲高清不卡一区| 日本精品裸体写真集在线观看| 亚洲成人久久久久| 中文字幕av免费观看| 香蕉久久一区二区不卡无毒影院| 精人妻一区二区三区| 丝袜诱惑亚洲看片| 奇米精品在线| gogo久久日韩裸体艺术| 国产精品劲爆视频| а√在线中文在线新版| 色狠狠av一区二区三区香蕉蜜桃| 欧美日韩人妻精品一区二区三区| 怡红院精品视频在线观看极品| 日本国产精品视频| 男人影院在线观看| 亚洲色在线视频| 中文字幕av久久爽| 疯狂欧美牲乱大交777| 在线免费观看亚洲视频| 日本一区免费视频| 一二三不卡视频| 石原莉奈在线亚洲二区| 岛国大片在线播放| 天堂综合网久久| 91免费在线观看网站| 女同一区二区免费aⅴ| 日韩在线资源网| 超碰在线影院| 亚洲三级免费看| 欧美挠脚心网站| 欧美日韩一区小说| 成年人午夜剧场| 国产精品久久久久影视| www.黄色在线| 久久久不卡影院| 人妻体内射精一区二区| 97超碰欧美中文字幕| 91九色蝌蚪porny| 久久久国产亚洲精品| 亚洲一区二区高清视频| 久草成人在线| 欧美aaaaa喷水| 亚洲日本免费电影| 国产精品热视频| 欧美aaa级| 国内精品久久久久久| 日韩专区一区二区| 欧美日韩高清一区二区| 欧美黄色一区二区三区| 亚洲免费毛片网站| 欧美黄色免费看| 亚洲第一福利视频在线| 日本在线免费观看| 精品久久久久久| 国产精品自拍99| 亚洲人成小说网站色在线| 可以免费看av的网址| 亚洲视频狠狠干| 青娱乐国产精品| 午夜在线电影亚洲一区| 日本三级小视频| 色狠狠综合天天综合综合| 国产在线观看第一页| 一区二区三区日韩欧美| 男人的天堂官网| 国产精品伦理在线| 性欧美疯狂猛交69hd| 亚洲激情成人在线| 黄网在线观看视频| 91精品办公室少妇高潮对白| 亚洲视频一区二区三区四区| 欧美色道久久88综合亚洲精品| 又嫩又硬又黄又爽的视频| 中文字幕在线观看不卡| 欧美一区二区三区成人精品| 麻豆91小视频| 久久精品一二三四| 日韩—二三区免费观看av| 51xx午夜影福利| 亚洲欧洲一级| 国产一区二区三区乱码| 国产婷婷精品| 亚洲精品手机在线观看| 国产宾馆实践打屁股91| 好吊日免费视频| 自拍偷自拍亚洲精品播放| 亚洲一区 视频| 欧美日韩色一区| 日韩一级在线播放| 日韩在线视频导航| 欧美日韩在线观看首页| 高清欧美性猛交xxxx| 国产精品亚洲一区二区三区在线观看| 97人洗澡人人免费公开视频碰碰碰| 成人免费视屏| 少妇高潮久久久久久潘金莲| 大香伊人中文字幕精品| 欧美精品性视频| 在线观看a级片| 久久999免费视频| 色婷婷在线播放| 欧美激情手机在线视频| 99riav视频一区二区| 国产精品视频一区二区三区四| a一区二区三区| 亚洲v日韩v综合v精品v| 国产精品一区高清| 欧美一区二区三区在线免费观看| 久久这里只有精品一区二区| 亚洲一区二区精品在线| 久久国产日韩| 男女性杂交内射妇女bbwxz| 国产精品国产三级国产aⅴ入口| 亚洲天堂av中文字幕| 午夜精品福利一区二区蜜股av| 国产精品第9页| 天天av天天翘天天综合网色鬼国产 | 美女主播精品视频一二三四| 中国成人在线视频| 日韩成人av影视| 韩国无码一区二区三区精品| 亚洲亚洲精品在线观看| 日本少妇激情视频| 日韩三级中文字幕| 天堂网在线资源| 日韩精品在线免费观看视频| 欧美v亚洲v| 96久久精品| 欧美激情电影| 中文字幕永久有效| 国产精品日韩成人| 中文字幕1区2区3区| 中国人与牲禽动交精品| 欧美日韩美女| 国产一区二区在线免费视频| 视频精品一区二区三区| 亚洲一区精彩视频| 麻豆视频观看网址久久| 女人黄色一级片| 一区二区三区免费在线观看| 国产精品九九九九| 久久久久99精品久久久久| 最新亚洲国产| 法国空姐在线观看免费| 国产九色精品成人porny| 欧美视频www| 欧美不卡123| 超碰国产在线观看| 国产精品偷伦一区二区| 一区二区三区四区精品视频| 国产一二三四区在线观看| 国产专区欧美精品| 老女人性淫交视频| 亚洲精品一区二区三区影院 | 久久精品小视频| 免费成人黄色网| 男人日女人的bb| 成人精品在线视频观看| 国产成人精品一区二三区| 亚洲欧美国产另类| 成人国产一区| 久久精品在线免费视频| www.激情成人| 黄色录像免费观看| 日韩一区二区免费在线观看| 国产美女情趣调教h一区二区| 国产精品丝袜久久久久久不卡| 国内视频在线精品| 亚洲中文字幕无码不卡电影| 国产精品 日产精品 欧美精品| 日韩精品卡通动漫网站| 色诱视频网站一区| 嫩草在线视频| 激情一区二区三区| 中文字幕亚洲综合久久五月天色无吗''| 波多野结衣之无限发射| 首页欧美精品中文字幕| 69xxx免费| 日韩欧美精品在线| 欧美边添边摸边做边爱免费| 91国产丝袜在线放| 国产欧美91| 蜜桃av免费在线观看| 亚洲成人网av| 成人免费毛片嘿嘿连载视频…| 欧美三级网色| 亚洲一本视频| 中文天堂资源在线| 欧美电影免费提供在线观看| 东京一区二区| 精品久久久无码人妻字幂| 91色九色蝌蚪| 国产色视频在线| 日本中文字幕成人| 欧美不卡视频| 老熟女高潮一区二区三区| 色老汉av一区二区三区| 国产网红女主播精品视频| 亚洲国产一区二区三区在线播| 日韩精品一区第一页|