位置：首页>> 网络编程>> Python编程>> urllib和BeautifulSoup爬取 * 的词条简单实例

urllib和BeautifulSoup爬取 * 的词条简单实例

作者：powerpoint_2016　　发布时间：2023-10-25 21:46:59　

标签：python,爬虫,urllib,beautifulsoup

本文实例主要实现的是使用urllib和BeautifulSoup爬取 * 的词条，具体如下。

简洁代码：

#引入开发包
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
#请求URL并把结果用UTF-8编码
resp=urlopen("https://zh.wikipedia.org/wiki/Wikipedia:％E9％A6％96％E9％A1％B5").read().decode("utf-8")
#使用BeautifulSoup去解析
soup=BeautifulSoup(resp,"html.parser")
#print(soup)
#获取所有以/wiki/开头的a标签的href属性
listUrl=soup.findAll("a",href=re.compile("^/wiki/"))
#输出所有词条对应的名称和URL
for link in listUrl:
if not re.search("\.(jpg|JPG)$",link["href"]):
print(link.get_text(),"<----->","https://zh.wikipedia.org"+link["href"])

运行结果：

总结

总的来说，Python是简洁而又强大的，调用几个库，就能实现其他语言一大堆代码才能实现的功能。

来源：http://blog.csdn.net/m0_38066258/article/details/77751909

0

投稿

猜你喜欢

Python实现采用进度条实时显示处理进度的方法
本文实例讲述了Python实现采用进度条实时显示处理进度的方法。分享给大家供大家参考，具体如下：前言在大多数时候，我们的程序会一直进行循环处
js 混淆加密工具代码
又一个js加密工具：js混淆，完整源代码如下，有点长呵呵：<HTML><HEAD><TITLE>Cunf
在IE中使用高级CSS3选择器
别误会，IE是不支持CSS3高级选择器，包括最新的IE8（详见《CSS选择器的浏览器支持》），但是CSS选择器的确是很有用的，它可以大大的简
python基于moviepy实现音视频剪辑
目录实践步骤完整代码参考实践步骤1.寻找合适的Python库（安装是否麻烦、使用是否简便、执行会不会太久）moviepy 音视频库。分析需要
详解Python 模拟实现生产者消费者模式的实例
详解Python 模拟实现生产者消费者模式的实例散仙使用python3.4模拟实现的一个生产者与消费者的例子，用到的知识有线程，队列，循环等
Python+numpy实现一个蜘蛛纸牌游戏
1.过程蜘蛛纸牌大家玩过没有？之前的电脑上自带的游戏，用他来摸鱼过的举个手。但是现在的电脑上已经没有蜘蛛纸牌了。所以…
pytorch 使用单个GPU与多个GPU进行训练与测试的方法
如下所示：device = torch.device("cuda:0" if torch.cuda.is_availab
python使用rsa非对称加密过程解析
这篇文章主要介绍了python使用rsa非对称加密过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要
Python利用networkx画图绘制Les Misérables人物关系
数据集介绍《悲惨世界》中的人物关系图，图中共77个节点、254条边。数据集截图：打开README文件：Les Misérables netw
详细聊聊为什么Python中0.2+0.1不等于0.3
为什么Python中0.2+0.1不等于0.3大家请看下面的python程序代码：print(0.2+0.1)猜一猜运行结果是什么，是0.3
win10下Python3.6安装、配置以及pip安装包教程
0.目录1.前言2.安装python3.使用pip下载、安装包3.1 安装Scrapy3.2 安装PyQt3.3 同时安装多个包3.4 pi
Python实现将HTML转成PDF的方法分析
本文实例讲述了Python实现将HTML转成PDF的方法。分享给大家供大家参考，具体如下：主要使用的是wkhtmltopdf的Python封
python读写文件write和flush的实现方式
打开文件用open,该函数创建一个文件对象，这将用来调用与之关联的其他支持方式。file object = open(file_name [
Python中 join() 函数的使用示例讲解
Python中 join() 函数的使用函数：string.join()Python中有join()和os.path.join()两个函数，
SQL Server 2005数据库还原错误的经典解决方案
在SQL Server 2005数据库还原的过程中出现错误：备份集中的数据库备份与现有的'xxxx'数据库不同，网上找了几个
Pycharm中配置远程Docker运行环境的教程图解
捣鼓了一天一直报错：Error running ‘mypython': Can't run remote python in
2008年个性设计挂历参考
这是由十几位视觉设计师设计的挂历，每个月份都是不同的风格，就像每个月都有不同温度和心情一样，思维跳跃性很大，可以作为挂历设计参考。当然，如果
js获取指定字符前/后的字符串简单实例
如下所示：<!doctype html><html><head><meta charset=&qu
pyspark操作hive分区表及.gz.parquet和part-00000文件压缩问题
pyspark 操作hive表pyspark 操作hive表，hive分区表动态写入；最近发现spark动态写入hive分区，和saveAs
基于python3监控服务器状态进行邮件报警
在正式的生产环境中，我们常常会需要监控服务器的状态，以保证公司整个业务的正常运转，常常我们会用到像nagios、zabbix这类工具进行实时

深度解析Django REST Framework 批量操作

python交易记录整合交易类详解

python 爬虫请求模块requests详解

Python利用prettytable库输出好看的表格

Python使用matplotlib绘制正弦和余弦曲线的方法示例

python实现键盘控制鼠标移动

Python输出汉字字库及将文字转换为图片的方法

Python探索之pLSA实现代码

浅述python2与python3的简单区别

request基本使用及各种请求方式参数的示例

WORD可以批量删除错号和对号吗

python中随机函数random用法实例

如何利用Java正则表达式校验密码规则

python实现学生信息管理系统

马云：天下玩不腻的游戏是挣钱 20亿淘宝五年内必须花光

详解Python静态网页爬取获取高清壁纸

战双帕弥什沧翊辅助机技能怎么样

王牌战士有哪些角色？全英雄技能解析

在word文档中如何制作表格呢?

Excel快速输入内容的两种方法

手机版 网络编程 asp之家 www.aspxhome.com