位置：首页>> 网络编程>> Python编程>> 详解selenium + chromedriver 被反爬的解决方法

详解selenium + chromedriver 被反爬的解决方法

作者：黑蚂蚁　　发布时间：2022-03-20 18:40:46　

标签：selenium,chromedriver,反爬

问题背景：这个问题是在爬取某夕夕商城遇到的问题，原本的方案是用selenium + chromedriver + mitmproxy开心的刷，但是几天之后，发现刷不出来了，会直接跳转到登陆界面（很明显，是遭遇反爬了）

讲实话，这还是第一次用硒被反爬的，于是进行大规模的测试对比。

同台机器，用铬浏览器正常访问是不用跳转到登陆界面的，所以不是IP的问题。再用提琴手抓包对比了一下两个请求头，请求头都是一样的，所以忽略标头的反爬。

最后通过分析，可能是硒被检测出来了。于是就去查资料。大概的查到是和webdriver的有关系的。因为这个在服务端是可以检测到的。于是通过fiddler抓包，全局搜索了一下webdriver，发现在js中果然是有判断的。导致selenium爬取的时候，被转到登陆界面。

解决方法：mitmproxy

因为mitmproxy可以拦截请求，所以在响应中，将包含的webdriver的JS中的关键字替换成其他的字符就可以了。

if "/_next/static/js/common_pdd" in flow.request.url:
flow.response.text = flow.response.text.replace("webdriver", "userAgent")

我是这样替换的。这样js解析的参数就变了，问题花刃而解。可以正常爬取数据了。

另外国外网上也有很多方法，比如修改webdriver里的一些特定参数名称，我尝试了一下，没有生效。

来源：https://blog.csdn.net/weixin_39847926/article/details/82262048

0

投稿

猜你喜欢

Python实现账号密码输错三次即锁定功能简单示例
本文实例讲述了Python实现账号密码输错三次即锁定功能。分享给大家供大家参考，具体如下：初学Python—1#实现账号输错三次即锁定use
基于mysql+mycat搭建稳定高可用集群负载均衡主备复制读写分离操作
数据库性能优化普遍采用集群方式，oracle集群软硬件投入昂贵，今天花了一天时间搭建基于mysql的集群环境。主要思路简单说，实现mysql
server application error－－IIS故障
server application error－－IIS故障故障现象：Server Application Error The serve
Python Socket传输文件示例
发送端可以不停的发送新文件，接收端可以不停的接收新文件。例如：发送端输入：e:\visio.rar，接收端会默认保存为 e:\new_vis
python3处理word文档实例分析
直接使用word文档已经难不倒大家了，有没有想过用python构建一个word文档写点文章呢？当然这个文章的框架需要我们用代码一点点的建立，
CentOS 6、7下mysql 5.7 详细安装教程
做开发总得用到数据吧，Linux作为服务器，总得有一个数据库来存储测试用的数据，所以呢，这里附上CentOS6、7安装MySQL5.7的教程
python启动办公软件进程(word、excel、ppt、以及wps的et、wps、wpp)
#-*- coding:utf-8 -*- from win32com.client import Dispatch import time
Python入门教程(十四)Python的集合
集合（Set）集合是无序和无索引的集合。在 Python 中，集合用花括号编写。实例创建集合：thisset = {"apple&
oracle中rownum和row_number()
row_number()over(partition by col1 order by col2)表示根据col1分组，在分组内部根据col
MySQL教程：Group By用法
我们现在回到函数上。记得我们用 SUM 这个指令来算出所有的 Sales (营业额)吧!如果我们的需求变成是要算出每一间店 (store_n
Python HTML解析模块HTMLParser用法分析【爬虫工具】
本文实例讲述了Python HTML解析模块HTMLParser用法。分享给大家供大家参考，具体如下：简介先简略介绍一下。实际上，HTMLP
python GUI库图形界面开发之PyQt5线程类QThread详细使用方法
QThread是Qt的线程类中最核心的底层类。由于PyQt的的跨平台特性，QThread要隐藏所有与平台相关的代码要使用的QThread开始
JS+CSS实现仿雅虎另类滑动门切换效果
本文实例讲述了JS+CSS实现仿雅虎另类滑动门切换效果。分享给大家供大家参考。具体如下：这是仿照雅虎特色服务的一个Tab滑动切换效果，核心是
解析python高级异常和运算符重载
一、高级异常回顾异常相关的语句：try-except：用来捕获异常的通知try-finally：用来做一定要做的事reise：用来发生异常通
学习python处理python编码问题
概括、从python1.6开始就可以处理unicode字符了。一、几种常见的编码格式。 1.1、ascii，用1个字节表示。 1.2、UT
Python3字符串学习教程
字符串类型是python里面最常见的类型，是不可变类型，支持单引号、双引号、三引号，三引号是一对连续的单引号或者双引号，允许一个字符串跨多行
Python BeautifulSoup基本用法详解(通过标签及class定位元素)
如下：将html文件下载后，使用BeauifulSoup读取文件，并且使用html.parsertmp_soup.select里面的参数为：
Python使用shutil操作文件、subprocess运行子程序
一、shutil模块（了解）：高级的文件、文件夹、压缩包处理模块。import shutil# shutil.copyfileobj(fsr
Flask request 对象介绍
前言：一个完整的 HTTP 请求，包括客户端向服务端发送的 Request 请求和服务器端发送的 Response 响应。为了能方便的访问获
debian6配置mysql允许远程连接的方法(图)
debian6系统：首先先安装mysql吧：打开终端（root）用户登入apt-get purge mysql-server-5.5安装完成

Python科学画图代码分享

Pytorch 如何实现常用正则化

python下PyGame的下载与安装过程及遇到问题

Python 定义只读属性的实现方式

Python中return用法案例详解

Python使用matplotlib模块绘制图像并设置标题与坐标轴等信息示例

Python FTP文件定时自动下载实现过程解析

python中的psutil模块详解(cpu、内存、磁盘情况、结束指定进程)

python多进程使用apply_async的使用方法详解

python GUI库图形界面开发之PyQt5美化窗体与控件(异形窗体)实例

iPhone 被恶意远程锁定怎么办？如何避免这种情况？

SpringBoot整合ElasticSearch实践

Realtek高清晰音频管理器安装失败的解决教程

王者荣耀生日福利活动怎么玩

金铲铲之战小小李青怎么升级

Excel如何给数字取绝对值

iOS14什么时候推送正式版

Win10如何强行删除开机密码？

元气骑士咖喱棒好用吗-元气骑士咖喱棒属性效果一览

excel怎么限制输入? Excel通过数据有效性限制输入时间的教程

手机版 网络编程 asp之家 www.aspxhome.com