位置：首页>> 网络编程>> Python编程>> python中使用urllib2伪造HTTP报头的2个方法

python中使用urllib2伪造HTTP报头的2个方法

作者：junjie　　发布时间：2022-10-19 07:05:06　

标签：python,urllib2,伪造报头,HTTP

在采集网页信息的时候，经常需要伪造报头来实现采集脚本的有效执行

下面，我们将使用urllib2的header部分伪造报头来实现采集信息

方法1、

#!/usr/bin/python
# -*- coding: utf-8 -*-
#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= "https://www.jb51.net"
send_headers = {
'Host':'www.jb51.net',
'User-Agent':'Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0',
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Connection':'keep-alive'
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

# sys.getfilesystemencoding()
html = html.decode('utf-8','replace').encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header
# print '####################################'
print html

方法2、

#!/usr/bin/python
# -*- coding: utf-8 -*-
#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

url = 'https://www.jb51.net'

req = urllib2.Request(url)
req.add_header('Referer','https://www.jb51.net/')
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0')
r = urllib2.urlopen(req)

html = r.read()
receive_header = r.info()

html = html.decode('utf-8').encode(sys.getfilesystemencoding())

print receive_header
print '#####################################'
print html

0

投稿

猜你喜欢

解析Python编程中的包结构
假设你想设计一个模块集（也就是一个“包”）来统一处理声音文件和声音数据。通常由它们的扩展有不同的声音格式，例如：WAV，AIFF，AU），所
python requests.post请求404问题及解决方法
问题场景有时候，在编写一段http接口请求程序时，发现代码中的header头和请求体中都是原网页中一样，但是，在实际请求时，接口却返回404
在Debian下配置Python+Django+Nginx+uWSGI+MySQL的教程
最近尝试把项目迁移到Python环境下，特别新装了一台干净的Debian系统，准备重新配置环境，上网找了一些运行Python Web的环境方
Python 代码性能优化技巧分享
如何进行 Python 性能优化，是本文探讨的主要问题。本文会涉及常见的代码优化方法，性能优化工具的使用以及如何诊断代码的性能瓶颈等内容，希
Python OpenCV获取视频的方法
之前有文章，使用Android平台的OpenCV接入了视频，控制的目标是手机的摄像头，这是OpenCV的好处，使用OpenCV可以使用跨平台
js实现一个日期联动下拉菜单
内容摘要：这篇文章的主旨是弄清楚如何根据实际需求实现一个联动菜单以及联动菜单的原理，实例是实现一个日期选择下拉菜单。首先来分析一下日期下拉菜
JSQL SQLProxy 的 php 版本代码
<?php date_default_timezone_set("PRC"); $host = stripslas
仅用几行Python代码就能复制她的U盘文件?
代码# -*- coding:utf-8 -*-import osimport timef
详解Python 多线程 Timer定时器/延迟执行、Event事件
Timer继承子Thread类，是Thread的子类，也是线程类，具有线程的能力和特征。这个类用来定义多久执行一个函数。它的实例是能够延迟执
FrontPage2002简明教程七：HTML在FrontPage中的应用
阅读上一篇：FrontPage2002简明教程六：图片库虽然FrontPage已经给我们提供了很多面很强大的所见即所得的工具，但是随着HT
简单介绍Python中的try和finally和with方法
用 Python 做一件很平常的事情: 打开文件, 逐行读入, 最后关掉文件; 进一步的需求是, 这也许是程序中一个可选的功能, 如果有任何
jQuery实现的简单分页示例
本文实例讲述了jQuery实现的简单分页。分享给大家供大家参考，具体如下：<!DOCTYPE html PUBLIC "-/
用python生成与调用cntk模型代码演示方法
由于一些原因，视频录制要告一段落了。再写一篇关于cntk的文章分享出来吧。我也很想将这个事情进行下去。以后如果条件允许还会接着做。cntk2
不要跳转或刷新实现网页区域选择显示
我们在制作网页时，有时会遇到这样的情况：根据用户的选择，显示不同的内容。比如，制作一个登录网页，上面有
Python性能优化的20条建议
优化算法时间复杂度算法的时间复杂度对程序的执行效率影响最大，在Python中可以通过选择合适的数据结构来优化时间复杂度，如list和set查
基于python生成英文版词云图代码实例
使用wordcloud模块，生成云图，测试文本为：Betty Botter bought some butter but she said
React redux 原理及使用详解
概述一个状态管理工具Store：保存数据的地方，你可以把它看成一个容器，整个应用只能有一个 Store。State：包含所有数据，如果想得到
C# 连接SQL数据库的方法及常用连接字符串
一：C# 连接SQL数据库 Data Source=myServerAddress;Initial Catalog=
Flask表单与表单验证实现流程介绍
表单介绍说到表单，在HTML中表单的创建时通过<form>标签实现的，在<form>标签内部，字段通过使用<i
SQL Server误区30日谈第28天有关大容量事务日志恢复模式的误区
误区 #28:有关大容量事务日志恢复模式的几个误区28 a)常见的DML操作可以被“最小记录日志” &nb

细数nn.BCELoss与nn.CrossEntropyLoss的区别

Python 内置高阶函数详细

python学习之使用Matplotlib画实时的动态折线图的示例代码

BeautifulSoup获取指定class样式的div的实现

Python如何使用opencv进行手势识别详解

Python-jenkins 获取job构建信息方式

Python代码阅读--列表元素逻辑判断

python一行输入n个数据问题

Python模拟简单电梯调度算法示例

Python将一个Excel拆分为多个Excel

WPF实现调用本机摄像头的示例代码

WPS表格计算公式怎么设置显示

凌云诺结谊怎么解除

神脑洞第40关如何通关？第40关通关流程图文分享

Win7系统不能上网怎么办？Win7系统卸载金山软件后无法上网的解决方法

九州异兽记麒麟异兽嗯么获取

DNF手游波罗丁套装波罗丁的夭祈胸甲怎么样

Win7系统中巴法络路由器的DD-WRT应该如何开启？

抖音想不到鸭年龄穿搭怎么过

如何设置页面如分隔符、背景、页面边框等对于WPS文本

手机版 网络编程 asp之家 www.aspxhome.com