位置：首页>> 网络编程>> Python编程>> Python使用scrapy采集时伪装成HTTP/1.1的方法

Python使用scrapy采集时伪装成HTTP/1.1的方法

作者：pythoner　　发布时间：2023-07-07 01:28:40　

标签：Python,scrapy,采集

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下：

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件

from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class PageGetter(ScrapyHTTPPageGetter):
    def sendCommand(self, command, path):
        self.transport.write('％s ％s HTTP/1.1\r\n' ％ (command, path))
class HTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

0

投稿

猜你喜欢

一篇文章搞懂Python Unittest测试方法的执行顺序
Unittestunittest大家应该都不陌生。它作为一款博主在5-6年前最常用的单元测试框架，现在正被pytest，nose慢慢蚕食。渐
快速认识CSS中的overflow属性
即使页面上只有一个元素它也是一个矩形的盒模型。其大小、位置、行为都可以通过CSS来控制。这里的行为是指当盒模型内部以及周围的内容发生变化时的
python中使用多线程改进flask案例
前言：线程是指进程内的一个执行单元,也是进程内的可调度实体.与进程的区别:(1) 地址空间:进程内的一个执行单元;进程至少有一个线程;它们共
asp网站生成静态页面攻略
生成HTML方法主要步骤只有两个：一、获取要生成的html文件的内容二、将获取的html文件内容保存为html文件我在这里主要说明的只是第一
在FLASH中调用ASP的方法
在Flash中使用ASP需要的条件：1。你的ISP的server必须支持Active Server Pages并且最好支持数据库2。你应该要
树莓派用python中的OpenCV输出USB摄像头画面
本文实例为大家分享了python OpenCV来表示USB摄像头画面的具体代码，供大家参考，具体内容如下确认Python版本$ python
WEB前端开发经验总结
不错，这个是一个文章详细页，没有左右两栏布局，不过这里我重点要讲的是合理的布局，在稍后的文章中我会详细的介绍浮动元素。好，回到刚才的话题，大
Python3安装pip工具的详细步骤
前几天安装Python的时候没有装上pip工具，所以只能现在手动安装了。首先，访问https://bootstrap.pypa.io/get
基于Bootstrap使用jQuery实现简单可编辑表格
editTable.js 提供编辑表格当前行、添加一行、删除当前行的操作，其中可以设置参数，如：operatePos 用于设置放置操作的列，
使用python画个小猪佩奇的示例代码
基本原理选好画板大小，设置好画笔颜色、粗细，定位好位置，依次画鼻子、头、耳朵、眼睛、腮、嘴、身体、手脚、尾巴，完事儿。都知道，T
Go语言从单体服务到微服务设计方案详解
概述微服务是一种思想，与编程语言无关，编程语言是思想下具体的一种实现方式，怎么设计架构方案和实现主要看主要面临的业务场景。业务场景主站核心业
Python深度学习pytorch实现图像分类数据集
目前广泛使用的图像分类数据集之一是MNIST数据集。如今，MNIST数据集更像是一个健全的检查，而不是一个基准。为了提高难度，我们将在接下来
使用Python更换外网IP的方法
在进行数据抓取时，经常会遇到IP被限制的情况，常见的解决方案是搭建 * 池，或购买IP代理的服务。除此之外，还有一个另外的方法就是使用家里
使用Keras中的ImageDataGenerator进行批次读图方式
ImageDataGenerator位于keras.preprocessing.image模块当中,可用于做数据增强,或者仅仅用于一个批次一
python 在右键菜单中加入复制目标文件的有效存放路径(单斜杠或者双反斜杠)
在右键菜单中加入复制目标文件的有效存放路径（单斜杠或者双反斜杠）引言由于win10电脑自带的获取文件路径为双引号括起来的单反斜杠，如下图。&
asp常用数据库连接方法和技巧
<％ dim conn,mdbfile mdbfile=server.mappath("数据库名称.mdb") s
sql如何实现复合查询？
请问如何实现复合查询？我们用下面的代码来实现动态生成查询条件，动态显示结果的复合查询。set database to databasenam
PHP实现用户认证及管理完全源码
-- begin auth.inc -- <?php $
js“树”读取xml数据源码
最近看到大家都练习写树，偶也学习学习写了一个，大家多多批评，我好进步。不过我看了一些树的xml文档都是在xml中就已经有了树的结构，所以我写
利用python 读写csv文件
1、读文件import csvcsv_reader = csv.reader(open("data.file", enc

Python 统计Jira的bug 并发送邮件功能

pyecharts实现数据可视化

用Python做的数学四则运算_算术口算练习程序(后添加减乘除)

Python实现随机生成手机号及正则验证手机号的方法

python爬虫urllib中的异常模块处理

python中threading开启关闭线程操作

python实战教程之自动扫雷

Python3读取zip文件信息的方法

python高级语法之闭包和装饰器详解

Python 按字典dict的键排序,并取出相应的键值放于list中的实例

我的css样式写法总结

如何为excel2019表格中的日期添加精确计算

Java List 用法实例详解

iPhone12发烫严重怎么办

如何将WPS文档设置为可查看但不可修改、打印或复制

如何为macOS Monterey 创建可引导的USB 安装程序

火遍抖音的iPhone小技巧，快点用起来！

python中添加模块导入路径的方法

Win10系统全屏看视频总是显示任务栏的解决方法

Windows7出现蓝屏错误代码0x000000D1的原因和应对措施

手机版 网络编程 asp之家 www.aspxhome.com