位置：首页>> 网络编程>> Python编程>> Python爬虫爬取商品失败处理方法

Python爬虫爬取商品失败处理方法

作者：py　　发布时间：2021-04-11 11:26:31　

标签：Python爬虫,爬取失败

1.登陆网站，开启开发者模式。

可以在浏览器中点击右键检查或者F12打开开发者模式。

2.点选 NetWork，DOC，然后刷新页面。

在 network 中选择 doc，在请求的 headers 中搜索 cookie。

3.获取对应的 cookie 以及 user-agent。

4.在代码中添加到 headers 里面。

def getHTMLText(url):
kv = {
'cookie': 'adsgadfafegadsgadsfaefasdfaewfadsfag'
'uaer-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
}
try:
r = requests.get(url, headers=kv, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return "gg"

实例扩展：

程序的结构设计

提交商品搜索请求，循环获取页面
对于每个页面，提取商品名称和价格信息
将信息输出

遇到问题

爬取成功，数据有问题

打印 html 文件，返回如下

<script type="text/javascript">
TRLang = {
ERROR_NICK_BLANK: "请填写账户名",
ERROR_PASSWORD_BLANK: "请输入密码",
ERROR_NICK_PASSWORD_BLANK: "请输入账户名和密码",
ERROR_CHECKCODE_BLANK: "请输入验证码",
TIPS_REMEMBER_PASSWORD: "记住密码",
TIPS_NOT_REMEMBER_PSW_ON_PUBLIC: "不要在公共计算机记住密码，防止账户被盗"
};
</script>

来源：https://www.py.cn/jishu/spider/32181.html

0

投稿

猜你喜欢

django rest framework vue 实现用户登录详解
后端代码就不介绍了，可以参考 django rest framework 实现用户登录认证这里介绍一下前端代码，和前后端的联调过程在comp
用户凭什么跟你注册?
网站用户为什么注册？这个问题在平时我们讨论的并不多。我们常常单纯的在设想如何简化注册流程，如何从细节的关怀入手避免用户注册时填写错误信息造成
Access 2002的三个实用技巧
在ACCESS中更改控件的默认属性 Lisa Friedrichsen, 欧弗兰帕克,堪萨斯州如果您在设计一个Microsoft ACCE
MySQL数据库锁机制的相关原理简介
不同于行级或页级锁定的选项：· 版本(例如，为并行的插入在MySQL中使用的技术)，其中可以一个写操作，同时有许多读取操作。这明数据库或表支
python playwrigh框架入门安装使用
前言这是一篇罗里吧嗦的前言，可能更多的属于个人的感慨以及吐槽。首先打个广告：你每天点点点累么？面对越来越卷的环境你彷徨么？被要求 2 天做一
js给静态网页代码加密方法
给静态网页加密的方法有很多，有的简单有的复杂。前两天看见有人问静态网页加密问题，就写了这个代码思路：加密时：先把用户的密钥A用md5加密为B
asp会员系统如何实现“忘记密码”
会员注册以后，有些会员可能会遇到忘记登录密码的问题，因而网站具备“找回密码/忘记密码”功能不仅是必须的，而且是服务贴心的具体表现之一。在此，
Python中的pprint打印模块
1. 引言pprint的英文全称Data pretty printer，顾名思义就是让显示结果更加直观漂亮。print()和pprint()
python内置函数之eval函数详解
一、简介eval()函数用来执行一个字符表达式的值，并返回表达式的值二、语法具体语法：eval(expression[, globals[,
一篇文章搞懂Python反斜杠的相关问题
大家在开发Python的过程中，一定会遇到很多反斜杠的问题，很多人被反斜杠的数量搞得头大。首先我们写一段非常简单的Python代码，它的作用
python 包实现JSON 轻量数据操作
一、将对象转为json字符串json.dumps：将 Python 对象编码成 JSON 字符串json.loads：将已编码的 JSON
python并发爬虫实用工具tomorrow实用解析
tomorrow是我最近在用的一个爬虫利器，该模块属于第三方的一个模块，使用起来非常的方便，只需要用其中的threads方法作为装饰器去修饰
Python基础教程之异常详解
一、摘要Python使用被称为异常的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时，它都会创建一个异常对象。
Python设计模式之工厂方法模式实例详解
本文实例讲述了Python设计模式之工厂方法模式。分享给大家供大家参考，具体如下：工厂方法模式(Factory Method Pattern
解析：MySQL 数据库搜索中大小写敏感性
在默认情况下，MySQL搜索不区分大小写（但某些字符集始终区分大小写，如czech）。这意味着，如果你使用col_name LIKE
Python mutiprocessing多线程池pool操作示例
本文实例讲述了Python mutiprocessing多线程池pool操作。分享给大家供大家参考，具体如下：python — mutipr
DHTML 打造 Picture Spelling
不用切图，只要设置基本的图片及其属性即可！用鼠标右键控制图片翻转！<style>*{ FONT-SIZE: 12px; }se
python中set()函数简介及实例解析
set函数也是python内置函数的其中一个，属于比较基础的函数。其具体介绍和使用方法，下面进行介绍。set() 函数创建一个无序不重复元素
python opencv实现目标区域裁剪功能
这个任务是自己在项目中数据处理的一部分内容，待处理的图片如下所示：我需要将目标区域给裁剪出来，要不然在后期训练网络的时候整幅图像过大，且目标
Python编程源码报错解决方法总结经验分享
一、前言最近本都是开开心心的打开电脑写一些祖传BUG但一个报错阻碍了我写BUG的进度！这年代还有能阻碍我写BUG的报错？？？二、解决过程一个

使用Python操作excel文件的实例代码

Python爬虫HTPP请求方法有哪些

Pycharm连接远程服务器并远程调试的全过程

Python图像处理实现两幅图像合成一幅图像的方法【测试可用】

python matplotlib绘画十一种常见数据分析图

Python爬虫中urllib库的进阶学习

Python 如何求矩阵的逆

python实现基于信息增益的决策树归纳

用Python Flask创建简洁高效的URL短链接服务

如何在Python 中使用 join() 函数把列表拼接成一个字符串

手提电脑怎么用u盘安装win7系统_手提电脑用u盘安装win7系统的方法

C#判断系统是32位还是64位的方法

excel中vba变量类型和dim语句进行一些小结

MAC强制退出光盘的方法

虚拟化之VMware Workstation 10.0.x安装教程(图文)

在word文档中怎么输入省略号?

升级Win10过程中的80240020错误怎么解决

Win10快速预览版升级Build 15055下载失败提示0x80070228的解决办法

java实现马踏棋盘的算法

怎样删除win8中无用的网络连接(借助注册表来完成)

手机版 网络编程 asp之家 www.aspxhome.com