位置：首页>> 网络编程>> Python编程>> Python爬虫爬取一个网页上的图片地址实例代码

Python爬虫爬取一个网页上的图片地址实例代码

作者：powerpoint_2016　　发布时间：2021-07-25 09:58:25　

标签：python,爬虫,图片

本文实例主要是实现爬取一个网页上的图片地址，具体如下。

读取一个网页的源代码：

import urllib.request
def getHtml(url):
html=urllib.request.urlopen(url).read()
return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=％E5％A3％81％E7％BA％B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址：

import re
import urllib.request
def getHtml(url):
html=urllib.request.urlopen(url).read()
return html
def getImg(html):
r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
imglist=re.findall(r,html)
return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=％E5％A3％81％E7％BA％B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果：

来源：http://blog.csdn.net/m0_38066258/article/details/77388350

0

投稿

猜你喜欢

Python办公自动化之Excel介绍
前言Python处理Excel的包是openpyxl，其支持操作的文件类型为：.xlsx, .xlsm, .xltx, .xltmpip i
python3获取文件中url内容并下载代码实例
这篇文章主要介绍了python3获取文件中url内容并下载代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价
深入理解Python虚拟机中列表(list)的实现原理及源码剖析
列表的结构在 cpython 实现的 python 虚拟机当中，下面就是 cpython 内部列表实现的源代码：typedef struct
mysql split函数用逗号分隔的实现
1：定义存储过程，用于分隔字符串DELIMITER $$USE `mess`$$DROP PROCEDURE IF EXISTS `spli
python实现余弦相似度文本比较的示例
向量空间模型VSM：VSM的介绍：一个文档可以由文档中的一系列关键词组成，而VSM则是用这些关键词的向量组成一篇文档，其中的每个分量代表词项
自定义Django Form中choicefield下拉菜单选取数据库内容实例
工作中遇到的问题,自定义了一个forms.form表单,某项需要作出下拉菜单,下拉菜单中的选项需要从数据库(objectForm model
简单了解python模块概念
本文主要讲述的是Python中的模块的概念，具体如下。模块是python组织代码的基本方式：python的脚本都是用扩展名为py的文本文件保
Python 条件,循环语句详解
1、Python 条件语句Python 条件语句是通过一条或多条语句的执行结果来决定执行的代码块。Python 编程中 if 语句用于控制程
IE与Firefox的CSS兼容大全
CSS对浏览器器的兼容性具有很高的价值，通常情况下IE和Firefox存在很大的解析差异，这里介绍一下兼容要点。常见兼容问题：1、DOCTY
pandas如何处理缺失值
在实际应用中对于数据进行分析的时候，经常能看见缺失值，下面来介绍一下如何利用pandas来处理缺失值。常见的缺失值处理方式有，过滤、填充。一
Windows下ORACLE 10g完全卸载的方法分析
Windows下ORACLE完全卸载：使用OUI可以卸载数据库，但卸载后注册表和文件系统内仍会有部分残留。这些残留不仅占用磁盘空间，而且影响
javascript实现无法关闭的弹框
大家都见过某网页中的恶意广告，你关闭了又出来了！为何，JS来告诉你HTML<body> <h3 class=&
Node.js Domain 模块实例详解
Node.js Domain(域) 简化异步代码的异常处理，可以捕捉处理try catch无法捕捉的异常。Domain 模块可分为
用python制作游戏外挂
玩过电脑游戏的同学对于 * 肯定不陌生，但是你在用 * 的时候有没有想过如何做一个 * 呢？（当然用 * 不是那么道义哈，呵呵），那我们就来看一下如
python使用socket高效传输视频数据帧(连续发送图片)
遇到的问题网上找了一些代码，都是只能建立一次socket传输一张图片，然后断开重新连重新传。而建立一次socket代价不小，反复建立会非常消
python中dict()的高级用法实现
collections中defaultdict的用法一、字典的键映射多个值将下面的列表转换成字典一个字典就是一个键对应一个单值得映射，而上面
解决Golang time.Parse和time.Format的时区问题
一、问题描述在windows下，time.Parse()的时区和time.Format()的时区是一致的。但是在linux环境下，time.
Python数据相关系数矩阵和热力图轻松实现教程
对其中的参数进行解释plt.subplots(figsize=(9, 9))设置画面大小，会使得整个画面等比例放大的sns.heapmap(
pydantic-resolve嵌套数据结构生成LoaderDepend管理contextvars
pydantic-resolve 解决嵌套数据结构的生成和其他方案的比较pydantic-resolve和GraphQL相比GraphQL的
Python析构函数__del__定义原理解析
析构函数__del__定义:在类里定义，如果不定义，Python 会在后台提供默认析构函数。析构函数__del__调用：A、使用del 显式

Python 实现多表和工作簿合并及一表按列拆分

Python数值方法及数据可视化

Python 聊聊socket中的listen()参数(数字)到底代表什么

PyTorch中permute的基本用法示例

python 绘制斜率图进行对比分析

python中查看变量内存地址的方法

python实现断点调试的方法

Python 在字符串中加入变量的实例讲解

机器学习经典算法-logistic回归代码详解

网红编程语言Python将纳入高考你怎么看?

电脑搜狗输入法一直提示已停止工作怎么解决

excel自动醒目的小计

阴阳师点赞3次他人的战报怎么完成

Word将文字转换成表格技巧教程

Foxmail怎么再新建一个账号？再新建一个账号的操作步骤

地下城割草幽灵宠物强度怎么样

怎么用u盘安装win7系统？u盘安装win7系统的详细步骤

如何在 Mac 上将键盘用作鼠标?

win10声音怎么增强？Win10声音太小增强音质的详细方法

Win10 3月累计更新修复哪个漏洞？Win10 3月累计更新漏洞说明

手机版 网络编程 asp之家 www.aspxhome.com