python中bs4.BeautifulSoup的基本用法
作者:bainianminguo 发布时间:2023-06-22 10:43:49
标签:python,bs4.beautifulsoup,用法
导入模块
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,"html.parser")
下面看下常见的用法
print(soup.a)
# 拿到soup中的第一个a标签
print(soup.a.name)
# 获取a标签的名称
print(soup.a.string)
# 获取a标签的文本内容
print(soup.a.text)
# 获取a标签的文本内容
print(soup.a["href"])
# 获取a标签的href属性的值
print(soup.a.get("href"))
# 查找第一个a标签的href的属性
print(soup.a.attrs)
# 获取a标签的所有的属性,返回一个字典
print(soup.find("a"))
# 查找第一个a标签
print(soup.find_all("a"))
# 查找所有的a标签
print(soup.find_all(id="a1"))
# 查找所有的的id为a1的标签
print(soup.find_all(class_="sistex"))
# 这里需要注意,如果需要通过class去查找,则需要一个下划线
print(soup.find_all(["a","p","br"]))
# 查找所有的啊标签,p标签和br标签
soup.find("a").attrs["class"] = "2b"
# 修改某个标签的属性值
del soup.find(id="a1").attrs["class"]
# 删除某个标签的class属性
import re
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
soup.select("a.syster")
# 这个可以放标签选择器
soup.select(".syster .abcd")
# 这个可以放标签选择器
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除
来源:https://www.cnblogs.com/bainianminguo/p/9986396.html


猜你喜欢
- 前言最近有人在Twisted邮件列表中提出诸如"为任务紧急的人提供一份Twisted介绍"的需求。值得提前透露的是,这个
- 本文实例讲述了Python 类的私有属性和私有方法。分享给大家供大家参考,具体如下:xx:公有变量_xx:公有变量或方法,不能通过impor
- 字符串’^198[0-9]$’可以匹配‘1980-1989’
- using System;using System.Collections.Generic;using System.Linq;using
- SOLyog的下载、安装以及使用很简单。我去了相关网站下载,它只有384K字节大小。它把两个文件(一个可执行文件.exe和一个动态链接库文件
- 实例引入我们知道 Python 是一种动态语言,在声明一个变量时我们不需要显式地声明它的类型,例如下面的例子:a = 2print('
- 普通卷积使用nn.Conv2d(),一般还会接上BN和ReLu参数量NNCin*Cout+Cout(如果有bias,相对来说表示对参数量影响
- 元数据简介元数据 (metadata) 最常见的定义为“有关数据的结构数据”,或者再简单一点就是“关于数据的信息”,日常生活中的图例、图书馆
- 本文实例讲述了PHP实现登录,注册及密码修改功能的方法。分享给大家供大家参考,具体如下:这里介绍注册,登录,修改密码的界面布局与功能实现:1
- 为了UED前端团队更好的协作开发同时提高项目编码质量,我们需要将Web前端使用工程化方式构建;目前需要一些简单的功能:  
- 在生产环境下,有时公司客服反映网页半天打不到,除了在浏览器按F12的Network响应来排查,确定web服务器无故障后。就需要检
- 这次用Python实现的是一个接球打砖块的小游戏,需要导入pygame模块,有以下两条经验总结:1.多父类的继承2.碰撞检测的数学模型知识点
- 因工作需要研究了支付宝即时到帐接口,并成功应用到网站上,把过程拿出来分享。即时到帐只是支付宝众多商家服务中的一个,表示客户付款,客户用支付宝
- 1.前言对于数据库引擎来说,内存是一个性能提升的重要解决手段。把数据缓存起来,可以避免在查询或更新数据时花费多余的时间,而这时间通常是从磁盘
- 列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。列表的数据项可以是不同的类型,可以是字符串,可以是数字类型,甚至
- MySQL5的乱码问题可以用下面的方法解决:1.设置phpMyAdmin Language:Chinese simplified (zh-u
- 概述从前面的对Python基础知识方法介绍中,我们几乎是围绕Python内置方法进行探索实践,比如字符串、列表、字典等数据结构的内置方法,和
- //定义一个对象数组 var data = [{ name: "jiang", age: 22 }, { name: &
- 一、类的构造函数与析构函数_init__ 函数是python 类的构造函数,在创建一个类对象的时候,就会自动调用该函数;可以用来在创建对象的
- python是支持多线程的,主要是通过thread和threading这两个模块来实现的。thread模块是比较底层的模块,th