网络编程
位置:首页>> 网络编程>> Python编程>> scrapy 远程登录控制台的实现

scrapy 远程登录控制台的实现

作者:卑微小钟  发布时间:2023-05-22 14:27:00 

标签:scrapy,远程登录,控制台

远程登录控制台

Scrapy附带一个内置的telnet控制台,用于检查和控制Scrapy运行过程。telnet控制台只是一个运行在scrappy进程内部的常规python shell,因此您可以从中做任何事情。

telnet控制台是一个 built-in Scrapy extension 它在默认情况下是启用的,但如果需要,您也可以禁用它。有关扩展本身的更多信息,请参阅 Telnet控制台扩展 。

警告

通过公共网络使用telnet控制台是不安全的,因为telnet不提供任何传输层安全性。拥有用户名/密码验证不会改变这一点。
预期用途是本地连接到正在运行的Scrapy Spider(Spider进程和Telnet客户端在同一台计算机上)或通过安全连接(VPN、SSH通道)进行连接。请避免在不安全的连接上使用telnet控制台,或使用 TELNETCONSOLE_ENABLED 选择权。

如何访问telnet控制台

telnet控制台侦听中定义的TCP端口 TELNETCONSOLE_PORT 设置,默认为 6023 . 要访问控制台,您需要键入:

telnet localhost 6023
Trying localhost...
Connected to localhost.
Escape character is '^]'.
Username:
Password:
>>>

默认用户名为 scrapy 密码是自动生成的。自动生成的密码可以在垃圾日志上看到,如下例所示:

2018-10-16 14:35:21 [scrapy.extensions.telnet] INFO: Telnet Password: 16f92501e8a59326
默认用户名和密码可以被设置覆盖 TELNETCONSOLE_USERNAME 和 TELNETCONSOLE_PASSWORD .

警告
用户名和密码仅提供有限的保护,因为telnet不使用安全传输-默认情况下,即使设置了用户名和密码,通信也不会加密。

您需要在Windows和大多数Linux发行版中默认安装的telnet程序。

telnet控制台中的可用变量

elnet控制台就像一个运行在scrappy进程内部的常规python shell,所以您可以从中做任何事情,包括导入新模块等。

但是,telnet控制台附带一些为方便起见而定义的默认变量:

捷径描述
crawler残废的爬虫 (scrapy.crawler.Crawler 对象)
enginecrawler.engine属性
spider主动蜘蛛
slot发动机槽
extensions扩展管理器(crawler.extensions属性)
statsstats收集器(crawler.stats属性)
settingsScrapy设置对象(crawler.settings属性)
est打印发动机状态报告
prefs内存调试(请参见 调试内存泄漏)
p到的快捷方式 pprint.pprint()功能
hpy内存调试(请参见 调试内存泄漏)

telnet控制台使用示例

以下是使用telnet控制台可以执行的一些示例任务:

查看发动机状态
你可以使用 est() scrapy引擎使用telnet控制台快速显示其状态的方法:

elnet localhost 6023
>>> est()
Execution engine status

time()-engine.start_time                        : 8.62972998619
len(engine.downloader.active)                   : 16
engine.scraper.is_idle()                        : False
engine.spider.name                              : followall
engine.spider_is_idle()                         : False
engine.slot.closing                             : False
len(engine.slot.inprogress)                     : 16
len(engine.slot.scheduler.dqs or [])            : 0
len(engine.slot.scheduler.mqs)                  : 92
len(engine.scraper.slot.queue)                  : 0
len(engine.scraper.slot.active)                 : 0
engine.scraper.slot.active_size                 : 0
engine.scraper.slot.itemproc_size               : 0
engine.scraper.slot.needs_backout()             : False

暂停、恢复和停止报废发动机

暂停:

telnet localhost 6023
>>> engine.pause()
>>>

恢复:

telnet localhost 6023
>>> engine.unpause()
>>>

停止:

telnet localhost 6023
>>> engine.stop()
Connection closed by foreign host.

Telnet控制台信号

scrapy.extensions.telnet.update_telnet_vars(telnet_vars)
在telnet控制台打开之前发送。您可以连接到这个信号来添加、删除或更新telnet本地命名空间中可用的变量。为此,需要更新 telnet_vars 听写你的处理程序。

参数
telnet_vars (dict) – telnet变量的dict

远程登录设置

以下是控制telnet控制台行为的设置:

TELNETCONSOLE_PORT

违约: [6023, 6073]

用于telnet控制台的端口范围。如果设置为 None 或 0 ,使用动态分配的端口。

TELNETCONSOLE_HOST

违约: '127.0.0.1'

telnet控制台应该监听的接口

TELNETCONSOLE_USERNAME

违约: 'scrapy'

用于telnet控制台的用户名

TELNETCONSOLE_PASSWORD

违约: None

telnet控制台使用的密码,默认行为是让它自动生成。

来源:https://blog.csdn.net/zhongjianboy/article/details/129221371

0
投稿

猜你喜欢

  • 对于时间的选择问题,查到的大部分为两种情况:1.存在readonly属性的2.没有readonly属性的可直接赋值send_keys()测试
  • 首先Python不支持多态,也不用支持多态,python是一种多态语言,崇尚鸭子类型。在程序设计中,鸭子类型(英语:duck typing)
  • 异步编程带来的问题在客户端Javascript中并不明显,但随着服务器端Javascript越来越广的被使用,大量的异步IO操作使得该问题变
  • 最近做的一个项目对日期时间的处理比较多,最后整理到一个工具类里面,方便以后使用:1. 在utils文件夹下新建一个dateTimeUtil.
  • 简介每一门数据库语言语法都基本相似,但是对于他们各自的一些特性(函数、存储过程等)的用法就不大相同了,就好比Oracle与Mysql存储过程
  • 很多网站注册时都会要求输入电子邮箱,其应用场景是比较广的,例如注册账号接收验证码、注册成功通知、登录通知、找回密码验证通知等。本文将介绍如何
  • 写在前面这篇文章推荐一个由Golang编写的一个命令行工具——Glow,这个CLI工具可以在命令行读
  • 1 map()函数的简介以及语法:map是python内置函数,会根据提供的函数对指定的序列做映射。map()函数的格式是:map(func
  • ASP是Web上的客户机/服务器结构的中间层,虽然它使用脚本语言(Java Script,VB Script等)编写,程序代码在服务器上运行
  • 这篇文章主要介绍了Python zip函数打包元素实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要
  • 在多线程中使用lock可以让多个线程在共享资源的时候不会“乱”,例如,创建多个线程,每个线程都往空列
  • 每个PHP脚本都限制了执行时间,所以我们需要通过 set_time_limit 来设置一个脚本的执行时间为无限长;然后使用 flush()
  • 本文实例为大家分享了js canvas随机粒子特效的具体代码,供大家参考,具体内容如下前言canvas实现前端的特效美术结果展示代码html
  • 首先我是用pycharm完成的,要确定命令行和界面里是同一个环境。如果不确定可以设置再add在新增加的环境里看现在是哪个环境,只要选择已有的
  • 一个不错的js星级评分代码,可以评多个指标。相关文章推荐:用css制作星级投票评分功能 效果图:<script language=&q
  • 至此,我们的 Python零基础入门篇 的系列专栏到今天基本上算是结束了。今天没有任何的知识点,只是运用我们之前学习过的知识做两个小游戏的案
  • 一、Time 包中定时器函数go v1.20.4定时函数:NewTicker,NewTimer 和 time.After 介绍time 包中
  • 当列表菜单项目特别多的时候,使用JavaScript手风琴菜单(Accordion Menus)是个不错的选择。手风琴折叠菜单利于组织菜单项
  • 实际上前面我们就已经用到了图像的绘制,如:io.imshow(img)  这一行代码的实质是利用matplotlib包对图片进行绘
  • 目录1. 警告不是异常2. 警告能捕获吗3. 捕获警告方法一4. 捕获警告方法二5. 捕获警告方法三1. 警告不是异常你是不是经常在使用一些
手机版 网络编程 asp之家 www.aspxhome.com