位置：首页>> 网络编程>> Python编程>> python爬虫爬取图片的简单代码

python爬虫爬取图片的简单代码

作者：宋宋大人　　发布时间：2021-08-04 10:19:27　

标签：python爬虫,爬取图片

Python是很好的爬虫工具不用再说了，它可以满足我们爬取网络内容的需求，那最简单的爬取网络上的图片，可以通过很简单的方法实现。只需导入正则表达式模块，并利用spider原理通过使用定义函数的方法可以轻松的实现爬取图片的需求。

1、spider原理

spider就是定义爬取的动作及分析网站的地方。
以初始的URL**初始化Request**，并设置回调函数。当该request**下载完毕并返回时，将生成**response ，并作为参数传给该回调函数。

2、实现python爬虫爬取图片

第一步：导入正则表达式模块

import re # 导入正则表达式模块
import requests # python HTTP客户端编写爬虫和测试服务器经常用到的模块
import random # 随机生成一个数，范围[0,1]

第二步：使用定义函数的方法爬取图片

def spiderPic(html, keyword):
print('正在查找 ' + keyword + ' 对应的图片,下载中，请稍后......')
for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL
print('正在爬取URL地址：' + str(addr)[0:30] + '...')
# 爬取的地址长度超过30时，用'...'代替后面的内容
try:
pics = requests.get(addr, timeout=100) # 请求URL时间（最大10秒）
except requests.exceptions.ConnectionError:
print('您当前请求的URL地址出现错误')
continue
fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb')
# 下载图片，并保存和命名
fq.write(pics.content)
fq.close()

来源：https://www.py.cn/spider/example/23017.html

0

投稿

猜你喜欢

浅谈Python数学建模之线性规划
一、求解方法、算法和编程方案线性规划（Linear Programming，LP）是很多数模培训讲的第一个算法，算法很简单，思想很深刻。
常用ASCII 码对照表
目前计算机中用得最广泛的字符集及其编码，是由美国国家标准局(ANSI)制定的ASCII码（American Stand ard C
Python中无限循环需要什么条件
无限循环如果条件判断语句永远为 true，循环将会无限的执行下去。如下实例#!/usr/bin/python# -*- coding: UT
python 读取二进制显示图片案例
我就废话不多说了，大家还是直接看代码吧！import matplotlib.pyplot as pltimport numpy as npf
Python 16进制与中文相互转换的实现方法
Python中编码问题：u'\xe6\x97\xa0\xe5\x90\x8d' 类型的转为utf-8的解决办法相信小伙伴们遇
python实现Decorator模式实例代码
本文研究的主要是python实现Decorator模式，具体介绍如下。一般来说，装饰器是一个函数，接受一个函数（或者类）作为参数，返回值也是
Django实现分页功能
Django提供了一个新的类来帮助你管理分页数据，这个类存放在django/core/paginator.py.它可以接收列表、元组或其它可
Python使用matplotlib实现交换式图形显示功能示例
本文实例讲述了Python使用matplotlib实现交换式图形显示功能。分享给大家供大家参考，具体如下：一代码from random i
Python办公自动化之教你用Python批量识别发票并录入到Excel表格中
一、场景描述这里有以四张发票为例（辰哥网上搜的），将发票图片放到pic文件夹下。随便打开一张发票提取目标：金额、名称、纳税人识别号、开票人。
Python迭代和迭代器详解
迭代器迭代器（iterator）有时又称游标（cursor）是程式设计的软件设计模式，可在容器物件（container，例如链表或阵列）上遍
layer ui 导入文件之前传入数据的实例
最近用layer ui上传文件遇到了一个问题，我想在上传文件之前把data-id传入后台，layer文档找了一下也没有找到类似的说明，经过一
Python 从相对路径下import的方法
例如我们有如下结构的文件：pkg/ __init__.py libs/ some_lib.py __init__.py components
Sql Server表死锁的解决方法分享
前些天写一个存储过程，存储过程中使用了事务，后来我把一些代码注释掉来进行调试找错，突然发现一张表被锁住了，原来是创建事务的代码忘记注释掉。本
用SQL语句添加删除修改字段、一些表与字段的基本操作、数据库备份等
用SQL语句添加删除修改字段 1.增加字段 alter table docdsp add dspcode char(200) 2.删除字段
在线HTML编辑器原理（eweb原理）
为什么能实现在线编辑呢? 首先需要ie 的支持，在 ie 5.5以后就有一个编辑状态，就是利用这个编辑状态,然后用javascript 来控
Python利用treap实现双索引的方法
前言：在很多应用场景下，我们不但需要堆的特性，例如快速知道数据最大值或最小值，同时还需要知道元素的排序信息，因此本节我们看看如何实现鱼和熊掌
Python学习pygal绘制线图代码分享
pygal的安装大家可以参阅：pip和pygal的安装实例教程线图：import pygalline_chart = pygal.Line(
ASP调用数据库常见错误的解决
下面是虚机维护中，经常碰到的一些ASP程序中的数据库调用的错误，现收集整理如下：
asp 快钱网关接口支付宝接口财付通接口代码
99bill: 1.md5.asp 代码如下:<％ '''''''&
Date对象格式化方法
/* * Date Format 1.2.3 * (c) 2007-2009 Steven Levithan * MIT license *

对Pytorch神经网络初始化kaiming分布详解

Python大数据量文本文件高效解析方案代码实现全过程

Python lambda 匿名函数优点和局限性深度总结

利用Python脚本实现传递参数的三种方式分享

Python远程控制Windows服务器的方法详解

自然语言处理之文本热词提取(含有《源码》和《数据》)

python 检查是否为中文字符串的方法

Python pyinotify模块实现对文档的实时监控功能方法

浅谈Python数学建模之线性规划

Python基于pyecharts实现关联图绘制

win8系统如何开启以太网？win8系统开启以太网的方法

用word怎么快速规范化数字格式?

惠普笔记本如何重装系统？惠普笔记本u盘重装系统教程

Win11输入法不见了怎么办？Win11输入法不见了的解决方法

如何在iPad上使用WPS移动版创建和使用Word文档

利用 excel 删除重复项和Vlookup函数组合给不连续的产品进行批量编号

win10系统如何关闭自带广告

xhunter1.sys不兼容程序怎么解决？

excel中如何将A表B表对比筛选出不相同的人员?

Excel2007基础教程：选择整行和整列

手机版 网络编程 asp之家 www.aspxhome.com