Python安装Bs4及使用方法
作者:Bibabu135766 发布时间:2023-01-09 19:36:45
标签:Python,Bs4,使用,安装
安装方法一:
①进入python文件夹执行指令(前提是支持pip指令):
pip3 install Beautifulsoup4
②回车待安装完成,如果出现以下红框中内容,即代表安装成功
③验证是否可以运行成功,运行cmd执行,引用模块import bs4回车未报错,则证明安装完成,可以正常使用了:
安装方法二
(像我们公司这种各种网络限制,使用pip就会出现无法安装,一直循环在retry):
①进入官网下载压缩包:Beautiful Soup官网下载链接
②将压缩包解压至python文件中,进入解压文件后输入指令(前面的python不可缺少):
python setup.py install
③待运行完成后输入python,再输入help('modules')可以查看你当前python拥有的所有模块,如下:
④如上安装完成,同样检查是否可以正常引入bs4,输入:import bs4 回车
安装方法三
(如果是python3伙伴会发现,上面两种方法还是不行,运行help('modules')也找不到bs4模块,此时就需要使用以下方法了):
①同样进行上面第二种方法后,将BeautifulSoup4文件夹中的bs4文件夹拷贝到python安装目录下的lib中
②将python安装目录下的Tools/scripts/2to3.py文件也剪切到python安装目录下的lib中
③cmd中cd到lib目录,然后运行python 2to3.py bs4 -w即可
基本用法:
import bs4
from bs4 import BeautifulSoup
html_doc = """<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
创建一个BeautifulSoup 对象
soup = BeautifulSoup(html_doc,“html.parser”)
格式化文档输出
soup.prettify()
获取标题
soup.title.text
获取所有标签属性
soup.a.attrs
判断是否含有某个标签属性
soup.a.has_attr(‘class')
获取标签的子元素
list(soup.p.children)
list(soup.p.children)[0].text
取出所有标签
soup.find_all(‘a')
for a in soup.find_all(‘a'):
print(a.attrs[‘href'])
找寻指定id
soup.find(id=‘link3')
找出所有文字内容
soup.get_text()
来源:https://blog.csdn.net/Bibabu135766/article/details/81662981
0
投稿
猜你喜欢
- 1 以下代码的输出结果为:print(round(-3.6))A.-4B.-4.0C.-3D. -3.02 以下代码的输出结果为(Pytho
- /** * 截取字符串 len为字节长度 * @param str * @param len * @return * @throws Uns
- 本文实例讲述了Python实现堆排序的方法。分享给大家供大家参考,具体如下:堆排序作是基本排序方法的一种,类似于合并排序而不像插入排序,它的
- 古巴比伦王颁布了汉摩拉比法典,刻在黑色的玄武岩,距今已经三千七百多年,你在橱窗前…熟悉吧?没错,这就是周董的爱在西元前歌词。前不久工作不是很
- Python中进行Base64编码和解码要用base64模块,代码示例:#-*- coding: utf-8 -*-import base6
- Windows 10 x64macOS Sierra 10.12.4Python 2.7准备好装哔~了么,来吧,做个真正意义上的绿色小软件W
- 新建py文件,在里面写入Python代码,代码的功能是打印10次“Hello!”,将代码文件保存到桌面上:在命令行中运行Python脚本,并
- header() 函数向客户端发送原始的 HTTP 报头。<?php//200 正常状态header('HTTP/1.1 20
- 1、更新包管理 apt-get install update.2、安装 pip3 :apt-get install python3-pip3
- 目录1.简介2.如何解决3.虚线框类代码4.测试UI界面如下图所示5.拖动时的效果图如下所示1.简介看到很多才学QT的人都会问为啥无边框拖动
- 调用 <script language="javascript" src="xxx.asp?m
- 假设有2个有序列表l1、l2,如何效率比较高的将2个list合并并保持有序状态,这里默认排序是正序。思路是比较简单的,无非是依次比较l1和l
- Yahoo!的Exceptional Performance团队为改善Web性能带来最佳实践。他们为此进行了一系列的实验、开发了
- 概述先来介绍一下xml格式的文件,从数据分析的角度去看xml格式的数据集,具有以下的优点开放性(能在任何平台上读取和处理数据,允许通过一些网
- 本文实例讲述了PHP面向对象的特性。分享给大家供大家参考,具体如下:Demo1.php<?php header('
- 1.引言环形图(圆环)在功能上与饼图相同,整个环被分成不同的部分,用各个圆弧来表示每个数据所占的比例值。但其中心的空白可用于显示其他相关数据
- range()是Python的内置函数,用于创建整数的列表,可以生成递增或者递减的数列。xrange也有相同的功能, 今天来看下它们之间的
- 很多开发人员对于IIS和ASP.NET的安装等问题困扰,特此做下面的小总结,请大家多交流!iis 坏了修复办法!一般IIS运行不了ASP.N
- 本文实例讲述了Python基于jieba库进行简单分词及词云功能实现方法。分享给大家供大家参考,具体如下:目标:1.导入一个文本文件2.使用
- 前言如同艺术家们用绘画让人们更贴切的感知世界,数据可视化也能让人们更直观的传递数据所要表达的信息。我们今天就分享一下如何用 Python 简