python中bs4.BeautifulSoup的基本用法
作者:bainianminguo 发布时间:2023-06-22 10:43:49
标签:python,bs4.beautifulsoup,用法
导入模块
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,"html.parser")
下面看下常见的用法
print(soup.a)
# 拿到soup中的第一个a标签
print(soup.a.name)
# 获取a标签的名称
print(soup.a.string)
# 获取a标签的文本内容
print(soup.a.text)
# 获取a标签的文本内容
print(soup.a["href"])
# 获取a标签的href属性的值
print(soup.a.get("href"))
# 查找第一个a标签的href的属性
print(soup.a.attrs)
# 获取a标签的所有的属性,返回一个字典
print(soup.find("a"))
# 查找第一个a标签
print(soup.find_all("a"))
# 查找所有的a标签
print(soup.find_all(id="a1"))
# 查找所有的的id为a1的标签
print(soup.find_all(class_="sistex"))
# 这里需要注意,如果需要通过class去查找,则需要一个下划线
print(soup.find_all(["a","p","br"]))
# 查找所有的啊标签,p标签和br标签
soup.find("a").attrs["class"] = "2b"
# 修改某个标签的属性值
del soup.find(id="a1").attrs["class"]
# 删除某个标签的class属性
import re
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
soup.select("a.syster")
# 这个可以放标签选择器
soup.select(".syster .abcd")
# 这个可以放标签选择器
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除
来源:https://www.cnblogs.com/bainianminguo/p/9986396.html
0
投稿
猜你喜欢
- python是一个很有趣的语言,可以在命令行窗口运行。python中有很多功能强大的模块,这篇经验告诉你,如何使用python的pygal模
- 无论是在小得可怜的免费数据库空间或是大型电子商务网站,合理的设计表结构、充分利用空间是十分必要的。这就要求我们对数据库系统的常用数据类型有充
- 在对数值进行格式化的时候,一个常见的问题是按照千分位格式化,网上对这个问题已经有很多种解决方法了,还可以利用Array.prototype.
- 思路复原魔方困难问题的分解:1、用合适的数据结构表示出三阶魔方的六个面以及每一面的颜色2、每一次不同旋转操作的实现3、复原时如何判断当前魔方
- 接着第一篇继续学习。一、数据分类正确数据:id、性别、活动时间三者都有放在这个文件里file1 = 'ruisi\\correct%
- 今天有人问起,晚上试着写出来,供参考; 以下代码兼容主流浏览器IE6、IE7、Firefox、Opera。从最简单的开始…………一
- ipad的goodreader对JS文件支持不太好,虽然可以读取它但总是无法退出,回不了goodreader的主界面,因此我需要把js文件批
- 由于python2和python3在部分语法上不兼容, 导致有人打趣道:"Python2和Python3是两门语言"对于
- 本文实例讲述了Javascript与PHP验证用户输入URL地址是否正确的方法,分享给大家供大家参考。具体方法如下:1.javascript
- 如题,首先读取视频路径,其次根据视频名称创建对应的文件夹,再逐帧将视频帧读入。import cv2import argparseimport
- 1. 数据类型 type()#!/usr/bin/env python# -*- coding: utf-8 -*-# Yongqiang
- 前言现在最流行的本地存储莫过于 cookie 的应用,但浏览器对 cookie 有很多限制,最大的限制在于其对cookie 总大小
- MFCC梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。MFCC通常有以下之
- auth模块是什么auth模块时django自带的用户认证模块开发一个网站的时候,无可避免的需要设计实现网站的用户系统。此时我们需要实现包括
- (asp.net的应用). 在网上一搜有很多此类文章,但我需要将公司的复杂的,较大的web应用也以此方式操作,比较的头大。一般的文章建议将b
- 使用了application及结合数据库来保存统计数据 <html><head><title>
- 本文分析了PHP中$GLOBALS['HTTP_RAW_POST_DATA']和$_POST的区别。分享给大家供大家参考,具
- 本文为大家分享了python实现彩票系统的具体代码,供大家参考,具体内容如下功能:1、注册 2、登录 3、充钱&nb
- 目录0. 前言1. 测试环境及关键代码解释1.1 测试环境2. 模块介绍及演示2.1 platform模块使用示例2.2 netifaces
- Python时间处理Python在处理与时间相关的操作时有两个重要模块:time和datetime。在本文中,我们介绍这两个模块并为每个场景