Python Selenium自动化获取页面信息的方法
作者:小学弟- 发布时间:2023-08-22 18:29:31
标签:Python,Selenium,页面信息
1.获取页面title
title:获取当前页面的标题显示的字段
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
#打印网页标题
print(browser.title)
#输出内容:百度一下,你就知道
2.获取页面URL
current_url:获取当前页面的URL
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
#打印网页标题
print(browser.current_url)
#输出内容:https://www.baidu.com/
3.获取浏览器版本号
capabilities['version']):打印浏览器version的值
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
#打印网页标题
print(browser.capabilities['version'])
#输出内容:67.0.3396.87
4.获取元素尺寸
size:返回元素的尺寸
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
#定位输入框
input_box = browser.find_element_by_id('kw')
#打印输入框尺寸
print(input_box.size)
#输出内容:{'height': 22, 'width': 500}
5.获取元素的文本
text:返回元素的文本信息
from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
#定位备案元素
recordcode = browser.find_element_by_id('jgwab')
#打印备案元素信息
print(recordcode.text)
#输出内容:京公网安备11000002000001号
6.获得属性值
get_attribute('')方法
get_attribute('href'):获取href属性值
get_attribute('id'):获取id属性值
# coding=utf-8
import time
from selenium import webdriver
driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)
for link in driver.find_elements_by_xpath("//*[@href]"):
print (link.get_attribute('href'))
driver.quit()
来源:https://www.cnblogs.com/xiao-xue-di/p/11531894.html
0
投稿
猜你喜欢
- 1、最近公司实现部分数据统计、分析的报表进行每天定时发送到相关人员的邮箱之中的配置代码被人为删除了,需要重新恢复该功能,由于原先是在linu
- 前言这篇博客将介绍光流的概念以及如何使用 Lucas-Kanade 方法估计光流,并演示如何使用 cv2.calcOpticalFlowPy
- 引言在开发过程中,经常需要观察本地文件系统的更改。经过谷歌了几个小时后,到了一个简单的工具来做这件事。该工具就是fsnotify是一个Go跨
- 1 安装说明1.1 用到的软件软件版本下载地址linuxUbuntu Server 18.04.2 LTShttps://ubuntu.co
- GIT作为源码管理的方式现在是越来越流行了,在VisualStudio 2012中,就通过插件的现实对GIT进行了官方支持,并且这个插件在V
- 1. 基本环境安装 anaconda 环境, 由于国内登陆不了他的官网 https://www.continuum.io/downloads
- python 3.x版本print输出不换行的格式如下:print(x, end="")其中,end=&quo
- 定义临时变量:{% with i=1 %}{{i}}{% endwith %}定义对临时变量操作的tag在templatetags中创建se
- 在用jupyter notebook写python代码的过程中会产生很多变量,而关闭后或者restart jupyter kernel后所有
- 最近看到了两行 JavaScript 代码,很受启发。1. 封装 DOM 属性在 JavaScript 中,我们可以获取HTML元素的属性值
- 在IE 浏览器中使用 jquery的fadeIn() 效果 英文字符字体加粗的解决方法分享。<div id='tes
- 动态生成二级菜单树:<script>jQuery(function($) {/**********获取未处理报警信息总数****
- 近期在开发一个地方O2O租书项目,使用ASP.NET MVC技术,其中在图书详情页,用户可以输入借阅的数量,这里使用了js来控制数量的增减和
- property属性一种用起来像是使用实例属性一样的特殊属性,可以对应于某个方法既要保护类的封装特性,又要让开发者可以使用 对象.属性 的方
- golang中list包用法可以参看这篇文章但是list包中大部分对于e *Element进行操作的元素都可能会导致程序崩溃,其根本原因是e
- 首先,我们知道一副牌里有54张牌,然后牌里的数字是从 3 - 2 的里面总共有13张牌,然后 4 中花色 分别是 ♠?
- 昨天BOSS下了个命令让我用word宏的方式来快速生成sql,这样在我们建表的时候就不用在一条一条元数据的输入。从而提高效率节约成本:接到命
- 一、程序的组织结构任何简单的或者复杂的算法都可以由顺序结构、选择结构和循环结构这三种基本结构组合而成二、顺序结构程序从上到下顺序地执行代码,
- 只要不是HTTP_REFERER来源于(google.com google.cn *.google.com *.google.cn baid
- MacJi “偷懒”翻译了部分,下午冒着被 BOSS 开除的危险将其补完(原文链接)。使用 line-height 垂直居中line-hei