位置：首页>> 网络编程>> Python编程>> python抓取网页中链接的静态图片

python抓取网页中链接的静态图片

作者：zoujm-hust12　　发布时间：2023-04-17 04:27:27　

标签：python,抓取,图片

本文实例为大家分享了python抓取网页中链接的静态图片的具体代码，供大家参考，具体内容如下

# -*- coding:utf-8 -*-

#http://tieba.baidu.com/p/2460150866
#抓取图片地址

from bs4 import BeautifulSoup
import urllib.request
from time import sleep

html_doc = "http://tieba.baidu.com/p/2460150866"

def get_image(url):
req = urllib.request.Request(url)
webpage = urllib.request.urlopen(req)

html = webpage.read()
soup = BeautifulSoup(html, 'html.parser')

#抓取图片地址
#抓取img标签且class为BDE_Image的所有内容
img_src=soup.findAll("img",{'class':'BDE_Image'})
i = 1
for img in img_src:
img_url = img.get('src') #抓取src
# print(img)
req = urllib.request.Request(img_url)
u = urllib.request.urlopen(req)
data = u.read()
with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f:
sleep(2)
f.write(data)
i += 1

def getImg(url):
html = urllib.request(url)
page = html.read()
soup = BeautifulSoup(page, "html.parser")
imglist = soup.find_all('img') #发现html中带img标签的数据，输出格式为<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx，存入集合
lenth = len(imglist) #计算集合的个数
for i in range(lenth):
print imglist[i].attrs['src'] #抓取img中属性为src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,则输出为123456

来源：http://blog.csdn.net/shentong1/article/details/79108279

0

投稿

猜你喜欢

MySql数据库备份的几种方式
mysqldump工具备份备份整个数据库$> mysqldump -u root -h host -p dbname > bac
SQLSERVERS 数据整理方法
今天星期天,因数据库太慢,最后决定将数据库进行重新整理. (假定数据库名称为：DB_ste) 1、根据现在的数据库的脚本创建一个脚本文件（F
python判断数字是否是超级素数幂
如果一个数字能表示成 p^q，且p是一个素数，q为大于1的正整数，则此数字就是超级素数幂。 param number: 测试该数字是否是超级
简单了解Python write writelines区别
一、传入的参数类型要求不同：1、 file.write(str)需要传入一个字符串做为参数，否则会报错。write( "字符串&q
python中的tkinter库弹窗messagebox详解
〝古人学问遗无力，少壮功夫老始成〞python之tkinter库弹窗messagebox，常码字不易，出精品更难，没有特别幸运，那么请先
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
目前可以实现简单的计算。计算前请重置，设计的时候默认数字是0，学了半天就做出来个这么个结果，bug不少。 python3.5 + PyQt5
SQL恢复master数据库方法只有mdf文件的数据库如何恢复
首先先和大家讲一讲SQL Server恢复master数据库方法，具体步骤如下第一步：复制model.mdf、mastlog.ldf、mod
Python实战之实现简单的名片管理系统
一、前言实现名片管理系统，首先要创建两个python file ，分别是cards_main.py和cards_tool.py,前一个是主代
Mysql实现定时清空一张表的旧数据并保留几条数据(推荐)
要达到如下目的：Mysql数据库会每隔一段时间(可以是2小时，也可以是一天，这个可以自定义)，定时对一张库中的表做一个判断，如果这张表的数据
Python正则表达式常用函数总结
本文实例总结了Python正则表达式常用函数。分享给大家供大家参考，具体如下：re.match()函数原型：match(pattern, s
浅析C# web访问mysql数据库-整理归纳总结
基本对比使用方式使用场合优缺点是否需要安装需要的dll网址引用方式程序内引用程序初期确定使用MySql，前期添加引用大多数情况下使用在类文件
Python标准库sched模块使用指南
事件调度sched 模块内容很简单，只定义了一个类。它用来最为一个通用的事件调度模块。class sched.scheduler(timef
Python多线程操作之互斥锁、递归锁、信号量、事件实例详解
本文实例讲述了Python多线程操作之互斥锁、递归锁、信号量、事件。分享给大家供大家参考，具体如下：互斥锁：为什么要有互斥锁：由于多线程是并
python保留两位小数的3种方法实例
1.’％.2f’％f该方法会进行四舍五入代码如下所示：f = 2.3456789print('
vue 项目代码拆分的方案
目录背景目的拆分前流程设计目录结构设计存在的问题拆分后流程设计目录结构设计解决的问题关键代码总结其他实现方式背景由于之前的数据库防火墙产品与
asp如何正确理解和使用Command、Connection和 Recordset三个对象？
如何正确理解和使用Command、Connection和 Recordset三个对象？我知道它们都是连接数据库的“好手”，但在编程的具体应用
python tornado开启多进程的几种方法
以下各种方式仅供参考，本人亲测只有官方提供的方式比较靠谱。1. 使用多个进程启动多个Tornado实例import tornado.http
python GUI库图形界面开发之PyQt5单选按钮控件QRadioButton详细使用方法与实例
PyQt5单选按钮控件QRadioButton简介QRadioButton 继承自 QAbstractButton，其主要作用提供用户一些互
Python解决pip install时出现的Could not fetch URL问题
前言使用python直接使用pip install xx时，出现 Could not fetch URL https://pypi.pyth
Python使用正则表达式获取网页中所需要的信息
使用正则表达式的几个步骤：1、用import re 导入正则表达式模块；2、用re.compile()函数创建一个Regex对象；3、用Re

Python实现控制手机电脑拍照并自动发送邮箱

详解Python3中字符串中的数字提取方法

教你如何使用Python快速爬取需要的数据

使用python开发vim插件及心得分享

Scrapy抓取京东商品、豆瓣电影及代码分享

TCP协议用在python和wifi模块之间详解

Python基于DFA算法实现内容敏感词过滤

Python使用plotly绘制数据图表的方法

Python实现yaml与json文件批量互转

python __add__()的具体使用

Mysql数据库中数据表的优化、外键与三范式用法实例分析

Win8.1系统禁用兼容性要如何才能关闭？

sqlserver中操作主从关系表的sql语句

WPS的文字怎么居中显示？

Win7系统电脑开机动画消失的恢复方法

如何在爱奇艺万能播放器中调字幕爱奇艺万能播放器中调字幕的具体教程

宝可梦剑盾大钢蛇配招推荐-宝可梦剑盾大钢蛇如何配招

Python统计文件中去重后uuid个数的方法

iPhone 11 无线充电会自动断开怎么办？

删除win2003默认共享的打印机和传真、计划任务的方法[图文]

手机版 网络编程 asp之家 www.aspxhome.com