Python获取百度热搜的完整代码
作者:国家一级保护咸鱼 发布时间:2023-09-06 11:33:32
标签:Python,百度热搜
好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓
程序运行输出结果截图 ↓↓↓
上代码 ↓↓↓
from lxml import etree
from lxml import html
import requests
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 从字符串解析
element = etree.HTML(html)
# 元素列表,获取的方式列出了如下两种
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')
#热搜文本内容
text = []
if len(ps) > 0:
for p in ps:
#输出节点的文本
text1 = p.text
text.append(text1)
else:
print("空")
x = element.xpath('//*[@class="s-hotsearch-content"]/li')
#热搜文本对应的排名
index = []
for x1 in x:
#获取节点的属性
index1 = x1.get("data-index")
index.append(index1)
print(text)
print(index)
#定义一个对文本和排名进行匹配的函数,返回一个字典型数据
def PP(index_array,text_array):
x = {}
i = 0
for index_a in index_array:
#index_a = int(index_a)
x[index_a] = text_array[i]
i = i + 1
return x
re_text = PP(index,text)
#对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))
来源:https://blog.csdn.net/qq_43225919/article/details/115442300


猜你喜欢
- 目录需求说明Do it需求说明如图,我想要实现当点击字母L,页面定位到L开头的城市名Do it1.找到字母表的页面在html标签绑定一个cl
- 下面示例代码是防止用网页刷新过快,如果多个页面使用,最好将<%...%>代码存为一个asp文件,在需要的页面最前面include
- 简介:1.霍夫变换(Hough Transform) 霍夫变换是图像处理中从图像中识别几何形状的基本方法之一,应用很广泛,也有很多改进算法。
- 下载好所需程序1.Selenium简介Selenium是一个用于Web应用程序测试的工具,直接运行在浏览器中,就像真正的用户在操作一样。2.
- 如果要得到返回值,需要用Command的方法。 首先说明,返回值有两种。一种是在存储过程中直接return一个值,就象C和VB的函数返回值那
- Go本地测试的思路我习惯在开发过程中及时测试自己开发的功能模块,这样能及时发现问题,节省后期功能耦合之后,debug的时间。为了统一管理要测
- 本文实例为大家分享了python3设计签名小程序的具体代码,供大家参考,具体内容如下首先,上一下要做的效果图:先是这样一个丑陋的界面(我尽力
- 本文实例为大家分享了js实现简单放大镜效果的具体代码,供大家参考,具体内容如下效果效果,鼠标在原图片移动,黄色小盒子跟随鼠标移动,黄色小盒子
- 前言RabbitMQ是一个在AMQP基础上完整的,可复用的企业消息系统。他遵循Mozilla Public License开源协议。MQ全称
- 正在看的ORACLE教程是:Oracle9i取得建表和索引的DDL语句。我们都知道在9i之前,要想获得建表和索引的语句是一件很麻烦的事。我们
- 今天打算通过绘制正弦和余弦函数,从默认的设置开始,一步一步地调整改进,让它变得好看,变成我们初高中学习过的图象那样。通过这个过程来学习如何进
- 链接的 target 属性怎么用 JS 来控制? 在HTML 4.0 Strict和XHTML 1.0 STRICT里不允许在<a&g
- xml_to_csv代码如下:import osimport globimport pandas as pdimport xml.etree
- 本文介绍在Python环境中,实现随机森林(Random Forest,RF)回归与各自变量重要性分析与排序的过程。其中,关于基于MATLA
- 分页程序sub show_page参数说明:total_records 总记录数everypage_records 每页显示条数
- 感谢LeXRus为我们带来他费心制作的教程,这是一个非常棒的动画教程,教程中不仅有 DW MX 2004 的操作方法,还有一些代码的写作和方
- Select CONVERT(varchar(100), GETDATE(), 0): 05 16 2006 10:57AM Select
- 遇到这样的错误如:“Last_IO_Error: Got fatal error 1236 from master when reading
- 一、简介eval()函数用来执行一个字符表达式的值,并返回表达式的值二、语法具体语法:eval(expression[, globals[,
- cupy我觉得可以理解为cuda for numpy,安装方式pip install cupy,假设import numpy as npim