Python安装Bs4及使用方法
作者:Bibabu135766 发布时间:2023-01-09 19:36:45
标签:Python,Bs4,使用,安装
安装方法一:
①进入python文件夹执行指令(前提是支持pip指令):
pip3 install Beautifulsoup4
②回车待安装完成,如果出现以下红框中内容,即代表安装成功
③验证是否可以运行成功,运行cmd执行,引用模块import bs4回车未报错,则证明安装完成,可以正常使用了:
安装方法二
(像我们公司这种各种网络限制,使用pip就会出现无法安装,一直循环在retry):
①进入官网下载压缩包:Beautiful Soup官网下载链接
②将压缩包解压至python文件中,进入解压文件后输入指令(前面的python不可缺少):
python setup.py install
③待运行完成后输入python,再输入help('modules')可以查看你当前python拥有的所有模块,如下:
④如上安装完成,同样检查是否可以正常引入bs4,输入:import bs4 回车
安装方法三
(如果是python3伙伴会发现,上面两种方法还是不行,运行help('modules')也找不到bs4模块,此时就需要使用以下方法了):
①同样进行上面第二种方法后,将BeautifulSoup4文件夹中的bs4文件夹拷贝到python安装目录下的lib中
②将python安装目录下的Tools/scripts/2to3.py文件也剪切到python安装目录下的lib中
③cmd中cd到lib目录,然后运行python 2to3.py bs4 -w即可
基本用法:
import bs4
from bs4 import BeautifulSoup
html_doc = """<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
创建一个BeautifulSoup 对象
soup = BeautifulSoup(html_doc,“html.parser”)
格式化文档输出
soup.prettify()
获取标题
soup.title.text
获取所有标签属性
soup.a.attrs
判断是否含有某个标签属性
soup.a.has_attr(‘class')
获取标签的子元素
list(soup.p.children)
list(soup.p.children)[0].text
取出所有标签
soup.find_all(‘a')
for a in soup.find_all(‘a'):
print(a.attrs[‘href'])
找寻指定id
soup.find(id=‘link3')
找出所有文字内容
soup.get_text()
来源:https://blog.csdn.net/Bibabu135766/article/details/81662981


猜你喜欢
- 按照 官方教程 ,下载安装包,点击安装后,如需在命令行启动,还需设置命令路径:在命令行中,打开配置文件 .bash_profile:vim
- 这样的问题是因为 数据库字符集,表字符集,字段字符集都设为:gbk_chinese_ci 注意数据库连接串里面的 Stmt=Set Name
- 今天有这样得一个需求,如果登陆人是客服的话,会查询订单是'该客服'以及还没有匹配客服的,刚开始想的是直接在sql语句上拼写&
- 所以呢,在引用js文档的时候,要设置被引用的文档是什么编码的。 如:一个utf-8的页面引用一个gb2312的js文档,那么就要这么写 &l
- 提示:本文多图,请手机端注意流量。前言利用python做图片识别,识别提取图片中的文字会有很多方法,但是想要简单一点怎么办,那就可以使用te
- 在所有信息技术领域,网页设计、网站设计长期是个几乎搞不清楚的、弱势的、被边缘化的职能职位。但近些年发展中,不断有远见卓识的从业者认识到,“设
- 本文实例讲述了python在windows下创建隐藏窗口子进程的方法。分享给大家供大家参考。具体实现方法如下:import subproce
- Ubuntu Server 16.04下mysql8.0安装配置图文教程1.从Mysql官网上下载安装文件。有两种方式可供选择:使用APT安
- 本文实例讲述了Python实现读写sqlite3数据库并将统计数据写入Excel的方法。分享给大家供大家参考,具体如下: src
- Scrapy批量运行爬虫文件的两种方法:1、使用CrawProcess实现https://doc.scrapy.org/en/latest/
- 本文为大家介绍了Python函数作用域的查找顺序,供大家参考,具体内容如下1.什么是LEGB? L:local 函数内部作用域 E:encl
- 文件操作TXT文件读取txt文件读取txt文件全部内容:def read_all(txt): ...: &nbs
- 一、DatasetDataset 类提供一种方式去获取数据及其标签主要有两个目的:获取每一个数据及其标签获取数据的总量大小1. 在控制台进行
- TensorFlow是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine
- SqlServer 在事务中获得自增ID实例代码在sqlserver 中插入数据时,如何返回自增的主键ID,方式有很多,这里提
- 基于微信开放的个人号接口python库itchat,实现对微信好友的获取,并对省份、性别、微信签名做数据分析。效果:直接上代码,建三个空文本
- 1. 欧几里德算法欧几里德算法又称辗转相除法, 用于计算两个整数a, b的最大公约数。其计算原理依赖于下面的定理:定理: gcd(a, b)
- 这篇文章主要介绍了PYTHON绘制雷达图代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以
- 本文实例讲述了Python实现的径向基(RBF)神经网络。分享给大家供大家参考,具体如下:from numpy import array,
- 我们都知道用聚合函数count()可以统计表的行数。如果需要统计数据库每个表各自的行数(DBA可能有这种需求),用count()函数就必须为