基于linux配置selenium环境并实现运行
作者:crystal1126 发布时间:2021-12-17 02:30:11
一、在linux中使用selenium
1、安装chrome
用下面的命令安装Google Chrome
yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm
也可以先下载至本地,然后安装
wget https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm
yum install ./google-chrome-stable_current_x86_64.rpm
安装必要的库
yum install mesa-libOSMesa-devel gnu-free-sans-fonts wqy-zenhei-fonts
2、安装 chromedriver(末尾附chrome和chromedriver的对应版本)
chrome官网
wget https://chromedriver.storage.googleapis.com/2.38/chromedriver_linux64.zip
淘宝源(推荐)
wget http://npm.taobao.org/mirrors/chromedriver/2.41/chromedriver_linux64.zip
将下载的文件解压,放在如下位置
unzip chromedriver_linux64.zip
mv chromedriver /usr/bin/
给予执行权限
chmod +x /usr/bin/chromedriver
3、运行代码,查看是否成功(python下)
from selenium import webdriver
driver = webdriver.Chrome()
------------2019年兼容版本对照表-----------
ChromeDriver 78.0.3904.11 (2019-09-12)---------Supports Chrome version 78
ChromeDriver 77.0.3865.40 (2019-08-20)---------Supports Chrome version 77
ChromeDriver 76.0.3809.12 (2019-06-07)---------Supports Chrome version 76
ChromeDriver 75.0.3770.8 (2019-04-29)---------Supports Chrome version 75
ChromeDriver v74.0.3729.6 (2019-03-14)--------Supports Chrome v74
ChromeDriver v2.46 (2019-02-01)----------Supports Chrome v71-73
二、chrome * 面模式运行
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument('--no-sandbox')#解决DevToolsActivePort文件不存在的报错
chrome_options.add_argument('window-size=1920x3000') #指定浏览器分辨率
chrome_options.add_argument('--disable-gpu') #谷歌文档提到需要加上这个属性来规避bug
chrome_options.add_argument('--hide-scrollbars') #隐藏滚动条, 应对一些特殊页面
chrome_options.add_argument('blink-settings=imagesEnabled=false') #不加载图片, 提升速度
chrome_options.add_argument('--headless') #浏览器不提供可视化页面. linux下如果系统不支持可视化不加这条会启动失败
#创建浏览器对象
driver = webdriver.Chrome(executable_path=path, chrome_options=chrome_options)#executable_path:浏览器驱动路径
driver.get(url)
三、 * 面模式下下载文件
以前,以无头模式运行的Chromedriver无法正确下载文件,原因是它稀疏地解析提供给它的首选项文件。无头Chrome团队的工程师建议使用DevTools的“ Page.setDownloadBehavior”来解决此问题。此变更列表实现此修复程序。下载的文件默认为当前目录,可以在实例化chromedriver实例时使用download_dir进行设置。还添加了测试以确保正确的下载功能。
params = {'behavior': 'allow', 'downloadPath': r'C:\Users\Debanjan.B\Downloads'}
driver.execute_cdp_cmd('Page.setDownloadBehavior', params)
来源:https://www.cnblogs.com/crystal1126/p/13259204.html
猜你喜欢
- 一个论坛社区如果要发展壮大,一个必要条件就是要有人气,形成自己独特的、有别于其他社区的特色或者文化,并有对新人产生潜移默化的影响。Discu
- 《三联生活周刊》杂志封面小镇里混网吧的待业青年与身家千万的私营企业主,在多大的层面上会取得利益的一致?他们能否结成利益的共同体?这是一个社会
- 网站管理员们经常会面对诸多需要帮助用户重定向到其他页面的情况。不幸的是,对任意目的地开放的重定向很可能被滥用。这是一个防不胜防的滥用形式,因
- 下面教给Godaddy用户电子邮件转发的设置步骤:第一、登陆AccountManger.第二、在MyProducts部分,点击Email/E
- 周末竟然去加班,原因是客户那里有一台服务器不能提供服务,经过排查是突然断电后可能产生了磁盘坏道导致,所以使用e2fsck命令进行了磁盘修复。
- 网络营销已经成为旅游行业一种至关重要的推广模式,几乎所有的旅行社都拥有自己的网站,综合类的旅游网站也让人目不暇接,竞争之激烈可谓战火纷飞。但
- 1,Apache下载 https://www.apache.org/ 选择一个版本,点击Download点击File F
- 就像一位饱受争议的“明星大腕”,联通版iPhone在中国甫一登陆,似乎就“是非&
- spring Boot简化了Spring应用的开发过程,遵循约定优先配置的原则提供了各类开箱即用(out-of-the-box)的框架配置。
- 随着Exchange Server 2007(之前也称其为“Exchange 12”)的即将发布,其所蕴涵的强大功能也开始逐渐展现开来。作为
- 我在阿里妈妈上看到一个站长说李彦红根本没把阿里妈妈放在眼里,我们先不去说李彦红有没有讲过这句话,就这句话对于现在而言可以说是成立的。阿里妈妈
- 做英文站也有很长时间了,多少也摸索出了一些属于自己的方法,今天就把我的东西拿出来跟大家一起分享一下,觉得有用那么谢谢支持,觉得没用对不起浪费
- 在网络营销实战密码读者交流网站上,一个朋友问了一个关于首页链接的问题:“关于网站的逻辑结构,应该是和树型物理结构相吻合,也就是也就是由首页到
- 关于jdfwkey问题的讨论最近我的网站经常出现jdfwkey,形式如?jdfwkey=csscf,很多朋友可能也遇到过,可能不太清楚是什么
- 10月10日消息,淘宝内部人士向腾讯科技证实,淘宝已启用search.taobao.com域名,目前正在内测自己的独立搜索引擎。淘宝搜索内测
- 先写一段多线程程序。 makefile 加上 -g参数生成可调式信息, 可以进行调试。 pthread不是Linux下的默认的库,也就是在
- 适当的搜索引擎优化(seo)能帮助我们的网站在搜索引擎排名中取得好的名次,但是seo要注意一下十点,可能平常您并不会在意的问题。1.确定了错
- 使用wget命令下载父目录下的整个子目录使用wget命令下载父目录下的整个子目录,命令如下:wget -r --level=0 -E --i
- Google和百度对Description态度不同,Google黑板报和中文网站管理员博客发表了一篇翻译自去年的文章:使用更好的元描述来改善
- ·IIS中配置SSI的方法:1)在IIS管理界面里面点中 选择一个web站点,鼠标右键->属性->选择&a