位置：首页>> 网络编程>> Python编程>> Python打印scrapy蜘蛛抓取树结构的方法

Python打印scrapy蜘蛛抓取树结构的方法

作者：pythoner　　发布时间：2022-01-16 03:46:18　

标签：Python,scrapy,蜘蛛

本文实例讲述了Python打印scrapy蜘蛛抓取树结构的方法。分享给大家供大家参考。具体如下：

通过下面这段代码可以一目了然的知道scrapy的抓取页面结构，调用也非常简单

#!/usr/bin/env python
import fileinput, re
from collections import defaultdict
def print_urls(allurls, referer, indent=0):
urls = allurls[referer]
for url in urls:
print ' '*indent + referer
if url in allurls:
print_urls(allurls, url, indent+2)
def main():
log_re = re.compile(r'<GET (.*?)> \(referer: (.*?)\)')
allurls = defaultdict(list)
for l in fileinput.input():
m = log_re.search(l)
if m:
url, ref = m.groups()
allurls[ref] += [url]
print_urls(allurls, 'None')
main()

希望本文所述对大家的Python程序设计有所帮助。

0

投稿

猜你喜欢

mysql分页的limit参数简单示例
Mysql的分页的两个参数select * from user limit 1,21表示从第几条数据开始查(默认索引是0,如果写1,从第二条
Postman传递对象参数(包含有集合对象)
项目场景：postman通常需要传递各式各样的参数，这样的话，进行写参数比较头疼，不知怎么进行传参。解决方案：可以考虑将参数对象写成json
python 实现的车牌识别项目
车牌识别在高速公路中有着广泛的应用，比如我们常见的电子收费（ETC）系统和交通违章车辆的检测，除此之外像小区或地下车库门禁也会用到，基本上凡
PHP实现设计模式中的抽象工厂模式详解
抽象工厂模式（Abstact Factory）是一种常见的软件设计模式。该模式为一个产品族提供了统一的创建接口。当需要这个产品族的某一系列的
python编码问题汇总
一、了解字符编码的知识储备1. 文本编辑器存取文件的原理（nodepad++，pycharm，word）打开编辑器就打开了启动了
MySql版本问题sql_mode=only_full_group_by的完美解决方案
1、查看sql_modeselect @@sql_mode查询出来的值为：ONLY_FULL_GROUP_BY,STRICT_TRANS_T
Python机器学习库scikit-learn使用详解
前言scikit-learn是Python中最流行的机器学习库之一，它提供了各种各样的机器学习算法和工具，包括分类、回归、聚类、降维等。sc
windows下mysql 5.7.20 安装配置方法图文教程
windows 下安装mysql，供大家参考，具体内容如下1.先下载好 mysql5.7 版本的安装包，可以去官网自己下载2.下载后双击安装
python在windows命令行下输出彩色文字的方法
本文实例讲述了python在windows命令行下输出彩色文字的方法。分享给大家供大家参考。具体分析如下：默认情况下python在控制台输出
python发送json参数的实例代码
在写脚本的过程中，除了发送form表单参数之外，我们还会发送json格式的参数。那么碰见json格式要怎么发送呢，这篇我们来解决这个问题。直
phpMyAdmin 2.10.2 配置方法
当成功安装了PHP，MYSQL后，我们一般要安装phpMyAdmin来管理你的mysql。本文介绍了phpMyAdmin 2.10.2的配置
使用 laravel sms 构建短信验证码发送校验功能
laravel 实现短信验证码功能，搜索资料发现比较流行的有两个包：一个是laravel sms 地址 https://gith
Python open读写文件实现脚本
1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。fi
十行Python3代码实现把情书写到图片中
1、引言小 * 丝：鱼哥，你说这就快到圣诞节了，我应该送女神什么礼物呢？小鱼：你的女神又不缺什么礼物，倒不如送点惊喜？小 * 丝：送什么惊喜呢？小鱼
mysql实现合并同一ID对应多条数据的方法
本文实例讲述了mysql实现合并同一ID对应多条数据的方法。分享给大家供大家参考，具体如下：如：CREATE TABLE `c_class
Mac下python包管理工具pip的安装
pip是常用的python包管理工具，用python的同学，都离不开pip ～～第一种在系统自带的python2.7的路径下pip是pyt
简单理解PHP的面向对象编程方式
与大多数可以面向对象的编程语言不一样， PHP 是同时支持面向过程和面向对象的编程方式， PHP 开发者可以在面向过程和面向对象二者中自由选
Sqlserver事务备份和还原的实例代码(必看)
废话不多说，直接上代码create database mydbuse mydbgocreate table account( i
mysql 修改用户密码图文介绍
目录mysqladmin命令UPDATE user 语句SET PASSWORD 语句root密码丢失的情况（待验证）mysqladmin命
MySQL InnoDB中的锁机制深入讲解
写在前面数据库本质上是一种共享资源，因此在最大程度提供并发访问性能的同时，仍需要确保每个用户能以一致的方式读取和修改数据。锁机制（Locki

浅谈Python基础之I/O模型

读写json中文ASCII乱码问题的解决方法

Python中Tkinter组件Button的具体使用

Python selenium根据class定位页面元素的方法

Python Serial串口基本操作（收发数据）

使用Python解决常见格式图像读取nii,dicom,mhd

wxpython中Textctrl回车事件无效的解决方法

python操作微信自动发消息的实现(微信聊天机器人)

python基础教程之简单入门说明(变量和控制语言使用方法)

scrapy结合selenium解析动态页面的实现

Mac如何快速浏览图片以及切换下一张图

玛娜希斯回响领队怎么换

Excel中sumif函数用法

Word如何拆分、合并多个文档？附Word制作表格快捷键

微票儿如何绑定微信？微票儿绑定微信的方法

你知道微信热搜榜在哪里吗？怎么查看微信热搜榜？

王者荣耀黄忠和谁配合最厉害？黄忠上分搭配英雄建议

王牌战士小丑突进有什么技巧？小丑突进玩法技巧分享

javascript常见数字进制转换实例分析

win10系统无法识别usb媒体设备该怎么办?

手机版 网络编程 asp之家 www.aspxhome.com