位置：首页>> 网络编程>> Python编程>> 基于python实现获取网页图片过程解析

基于python实现获取网页图片过程解析

作者：哈哈哈天蝎　　发布时间：2023-10-08 21:57:59　

标签：python,获取,图片

环境：python3，要安 * s4这个第三方库

获取请求头的方法

这里使用的是Chrome浏览器。

打开你想查询的网站，按F12，或者鼠标右键一下选择检查。会弹出如下的审查元素页面：

然后点击上方选项中的Network选项：

此时在按Ctrl+R:

选择下方框中的第一个，单击：

选择Headers选项，其中就会有Request Headers，包括你需要的信息。

介绍：这个程序是用来批量获取网页的图片，用于新手入门

注意：由于是入门的程序在获取某些网页的图片时会出问题！！！！！

import os
import urllib.request
from bs4 import BeautifulSoup
# 网址
url = "http://www2017.tyut.edu.cn/"
# 建立请求对象
request = urllib.request.Request(url)
# 加入请求头（一定要换成自己的！！！！）
request.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36')
# 获取请求
code = urllib.request.urlopen(request)
# 得到html代码
html = code.read().decode('utf-8')
# 将html的标签转成对象（方便后面的操作）
bs = BeautifulSoup(html, 'html.parser')
# 提取所有的img标签
imagesUrl = bs.find_all('img')
sources = []
# 建立存放的路径（路径一定要存在！！！！！！）
filepath = os.getcwd() + '\\images\\'
def createFile(path: str, fpath):
urllib.request.urlretrieve(path, fpath)
# 获取图片的路径(网址+img标签的src属性的值)
for img in imagesUrl:
sources.append(url + str(img.get('src')))
for src in sources:
# 用split是防止请求带参
baseName = os.path.basename(src).split('?')
# 图片名
fileName = filepath + baseName[0]
print("url=" + src, "filename=" + fileName)
createFile(src, fileName)
print('这次您一共下载了图片' + str(len(sources)) + '张')

来源：https://www.cnblogs.com/li1234567980/p/12853173.html

0

投稿

猜你喜欢

Python IDLE清空窗口的实例
使用Python IDLE时发现并没有清空当前窗口的快捷键，也没有像 clear 这样的命令，使用非常不便。新建一个 ClearWindow
让ASP组件来保护你的网站，自定义加密方法的使用
大家做网站，特别是自己写的代码，常常担心被一些黑客入侵服务器，从而导致网站代码被盗，给自己带来一些损失。那么我们怎么样做，就算黑客盗了你的代
Python线程指南分享
本文介绍了Python对于线程的支持，包括“学会”多线程编程需要掌握的基础以及Python两个线程标准库的完整介绍及使用示例。注意：本文基于
python实现的正则表达式功能入门教程【经典】
本文讲述了python实现的正则表达式功能。分享给大家供大家参考，具体如下：前文：首先，什么叫正则表达式（Regular Expressio
oracle join on 数据过滤问题
select a.f_username from ( SELECT /*+parallel(gu,4)*/distinct gu.f_use
Python向日志输出中添加上下文信息
除了传递给日志记录函数的参数（如msg）外，有时候我们还想在日志输出中包含一些额外的上下文信息。比如，在一个网络应用中，可能希望在日志中记录
MySQL中Like概念及用法讲解
Like中文解释为喜欢的意思，但当应用于MySQL数据库中，Like则是一种语句，用于模糊查询，主要是针对字符型字段的，在一个字符型字段列中
python的变量与赋值详细分析
python的变量与赋值1.变量的命名规则变量其实通过一个标记调用内存中的值，而变量名就是这个标记的名称，但是万一这个标记已经被提前占用或者
python pyg2plot的原理知识点总结
1、说明PyG2Plot 原理其实非常简单，其中借鉴了 pyecharts 的实现，但是因为蚂蚁金服的 G2Plot 完全基于可视分析理论的
重命名SQLServer数据库的方法
企业管理器中没有改数据库名的功能，如果一定要用企业管理器来实现，你可以备份数据库，然后还原，在还原时候可以指定另一个库名，然后再删除旧库就行
Windows下的Python 3.6.1的下载与安装图文详解(适合32位和64位)
为什么，这么简单的一个python，我还要特意来写一篇文章呢？是因为留念下，在使用了Anaconda2和Anaconda3的基础上，现在需安
Web标准下该如何“插入”图像
遵循Web标准的思想，网页要表现出一种亲和力。那么，针对残障用户来说，其“阅读”器可不能读取图像上传递的信息的。所以我们会采用一种Using
MySQL 主从同步,事务回滚的实现原理
BinLogBinLog是记录所有数据库表结构变更（例如create、alter table）以及表数据修改(insert、update、d
Python中使用ConfigParser解析ini配置文件实例
ini文件是windows中经常使用的配置文件，主要的格式为：[Section1]option1 : value1option2 : val
微软建议的ASP性能优化28条守则(5)
阅读上一篇：微软建议的ASP性能优化28条守则(4)技巧 13：避免重新确定数组的维数应尽量避免 Redim 数组。就性能而言，如果计算机
使用python打印十行杨辉三角过程详解
杨辉三角，是二项式系数在三角形中的一种几何排列每个数等于它上方两数之和。每行数字左右对称，由1开始逐渐变大。第n行的数字有n项。第n行数字和
很多人都是用下面的js刷新站IP和PV
使用方法很简单,如果你有两个站,把这段代码放在访问高的那个站来刷自己的新站,放在那个文件里面呢?就放在INDEX里面吧.或者公用的头或者尾!
php遍历目录与文件夹的多种方法详解
遍历目录或遍历目录下指定类型的文件，这是每一个童鞋在写程序的时候难免会用到的。PHP本身也提供了很多灰常有用的函数，正确地使用它们，不会有错
Python pathlib模块实例详解
pathlib 模块提供了表示文件系统路径的类，可适用于不同的操作系统。使用 pathlib 模块，相比于 os 模块可以写出更简洁，易读的
Ubuntu Server 11.10安装配置lamp(Apache+MySQL+PHP)
准备篇：1、配置防火墙，开启80端口、3306端口说明：Ubuntu默认安装是没有开启任何防火墙的，为了服务器的安全，建议大家安装启用防火墙

Python图像分割之均匀性度量法分析

Python代码库之Tuple如何append添加元素问题

python使用openpyxl库读写Excel表格的方法（增删改查操作）

python没有gpu,如何改用cpu跑代码

Django配置文件代码说明

Python 实现局域网远程屏幕截图案例

Python自动生产表情包

python标识符的用法及注意事项

Python 微信公众号文章爬取的示例代码

matplotlib 使用 plt.savefig() 输出图片去除旁边的空白区域

长安幻世绘琴心剑心如何获取？琴心剑心获取攻略

wps2019怎么打印网格线？wps2019无法打印网格线怎么办？

Python2.7.10以上pip更新及其他包的安装教程

SpringBoot2使用Jetty容器操作(替换默认Tomcat)

Garden Planner中使用3D视图的技巧

WPS excel大表格的小技巧

Android自定义ActionBar实例

SQL语句练习实例之五 WMS系统中的关于LIFO或FIFO的问题分析

excel中var函数的使用方法，以及计算更加精准的方差替代函数VAR.S

Excel中OFFSET函数的具体使用方法

手机版 网络编程 asp之家 www.aspxhome.com