成功安装好了 Selenium 库,但是它是一个自动化测试工具,需要浏览器来配合它使用,那么本节我们就介绍一下 Chrome 浏览器及 ChromeDriver 驱动的配置。
首先需要下载一个 Chrome 浏览器,方法多样,在此不再赘述。
随后我们需要安装一个 ChromeDriver 才能驱动 Chrome 浏览器完成相应的操作,下面我们来介绍下怎样安装 ChromeDriver。
相关链接
- 官方网站:https://sites.google.com/a/chromium.org/chromedriver
- 下载地址:https://chromedriver.storage.googleapis.com/index.html
准备工作
在这之前请确保已经正确安装好了 Chrome 浏览器并可以正常运行,安装过程不再赘述。
查看版本
点击 Chrome 的菜单,帮助->关于 Chrome,即可查看 Chrome 的版本号,在这里我的版本是 94.0.4606,如图所示:
请记住 Chrome 版本号,在后面选择 ChromeDriver 版本时需要用到。
下载 ChromeDriver
打开 ChromeDriver 的官方网站,链接为:https://sites.google.com/chromium.org/driver/downloads。可以看到到目前为止最新支持的 Chrome 浏览器版本为 95,最新版本以官网为准,如图所示:
每个版本都有相应的支持 Chrome 版本介绍,请找好自己的 Chrome 浏览器版本对应的 ChromeDriver 版本再下载,否则可能导致无法正常工作。
由于我这边的 ChromeDriver 版本是 94.0.4606,找到对应的下载列表,如图所示:
Windows 系统就下载 win32.zip,Mac 系统 Intel 芯片下载 mac64.zip,Mac 系统 M1 芯片下载 mac64_m1.zip,Linux 系统下载 linux64.zip,下载解压之后会得到一个 ChromeDriver 的可执行文件。
另外如果上面的链接打不开的话,也可以从对应的 ChromeDriver 镜像网站下载:https://chromedriver.storage.googleapis.com/index.html,同样地,版本对应好即可。
环境变量配置
下载完成后将 ChromeDriver 的可执行文件配置到环境变量下。
在 Windows 下,建议直接将 chromedriver.exe 文件拖到 Python 的 Scripts 目录下,如图所示:
也可以单独将其所在路径配置到环境变量,环境变量的配置方法请参见 Python3 的安装一节。
在 Linux、Mac 下,需要将可执行文件配置到环境变量或将文件移动到属于环境变量的目录里。
例如移动文件到 /usr/bin 目录,首先命令行进入其所在路径,然后将其移动到 /usr/bin:
1 |
sudo mv chromedriver /usr/bin |
当然也可以将 ChromeDriver 配置到 $PATH,首先可以将可执行文件放到某一目录,目录可以任意选择,例如将当前可执行文件放在 /usr/local/chromedriver 目录下,接下来可以修改 ~/.profile 文件,命令如下:
1 |
export PATH="$PATH:/usr/local/chromedriver" |
保存然后执行:
1 |
source ~/.profile |
即可完成环境变量的添加。
验证安装
配置完成之后,就可以在命令行下直接执行 chromedriver 命令了。
命令行下输入:
1 |
chromedriver |
输入控制台有类似输出,如图所示:
如果有类似输出则证明 ChromeDriver 的环境变量配置好了。
另外如果要配合代码进行测试的话,可以安装 Selenium,安装方式参考:https://setup.scrape.center/selenium,安装好了之后,随后再在程序中测试,执行如下 Python 代码:
1 |
from selenium import webdriver |
运行之后会弹出一个空白的 Chrome 浏览器,证明所有的配置都没有问题,如果没有弹出,请检查之前的每一步的配置。
如果弹出之后闪退,则可能是 ChromeDriver 版本和 Chrome 版本不简容,请更换 ChromeDriver 版本。
如果没有问题,接下来我们就可以利用 Chrome 来做网页抓取了。