python selenium爬虫代码示例_python网络爬虫学习笔记之三 Selenium入门

女爷i 2023-01-09 01:13 130阅读 0赞

抓取动态的网页内容主要有两种办法，一种是通过开发者工具找到动态内容的接口，然后分析接口的参数和返回值来爬取网站的数据。另外一种是通过模拟浏览器来抓取数据。python的Selenium库就可以通过代码来模拟浏览器抓取数据。

一、概述

![Image 1][]

运行Selenium需要依赖于Python的selenium库，以及浏览器对应驱动器(WebDriver)。

安装selenium库

pip install selenium

项目地址： https://pypi.org/project/selenium/

下载WebDriver

WebDriver可以简单的理解为浏览器插件，是可执行的程序。不同的浏览器对应的WebDriver是不同的，比如火狐浏览器的WebDriver是geckodriver，Windows环境下是geckodriver.exe文件；Chrome浏览器的WebDriver是Chromedriver，Windows环境下是chromedriver.exe文件。

Webdriver下载之后解压缩，将exe文件复制到python目录下(只要目录在path环境变量中就可以)

火狐的webdriver下载

https://github.com/mozilla/geckodriver/

google chrome 的webdriver下载(按浏览器版本下载对应的webdriver，如果Chrome的版本与chromedriver.exe的版本不匹配，那么selenium的python程序会运行失败的)

http://chromedriver.storage.googleapis.com/index.html

二、例子

例子1：

from selenium import webdriver

browser = webdriver.Chrome()

browser.get('http://www.baidu.com')

assert '百度一下' in browser.title

\#elem = browser.find\_element\_by\_name("wd")

elem = browser.find\_element\_by\_xpath('//\*\[@id="kw"\]')

elem.send\_keys("selenium")

btn = browser.find\_element\_by\_id("su")

btn.click()

\#browser.quit()

例子2：

import  unittest

from selenium import webdriver

class BaiduTest(unittest.TestCase):

def setUp(self):

self.browser = webdriver.Firefox()

self.browser.get("http://www.baidu.com")

\#self.addCleanup(self.browser.quit)

def testTitle(self):

self.assertIn("百度一下", self.browser.title)

def testSearch(self):

\#self.browser.get("http://www.baidu.com")

searchInput = self.browser.find\_element\_by\_id("kw")

searchInput.send\_keys("selenium")

searchBtn = self.browser.find\_element\_by\_id("su")

searchBtn.click()

self.assertIn("selenium", self.browser.current\_url)

if \_\_name\_\_ == '\_\_main\_\_':

unittest.main(verbosity=2)

其他资源：

https://www.seleniumhq.org/download/

http://ftp.mozilla.org/pub/firefox/releases/ 火狐版本

https://www.cnblogs.com/givemelove/p/8482361.html 火狐、谷歌软件及webdriver

本文内容到此结束，更多内容可关注公众号和个人微信号：

![Image 1][]

![Image 1][]

[Image 1]:

发表评论取消回复

表情：

评论列表（有 0 条评论，130人围观）

还没有评论，来说两句吧...

相关阅读