Python采集王者最低战力信息实战示例
作者:极客飞虎 发布时间:2021-09-29 17:54:13
🥩数据采集
🍖确定网址
王者新赛季马上就要开始了,大家都开始冲榜了,准备拿一个小省标,那么,本文,就来练习获取各地最低战力的爬虫采集实战。
确定好我们的目标网址之后,我们要找到我们需要的数据源,通过开发者工具分析,我们不难发现其数据地址。
请求URL:
https://www.sapi.run/hero/select.php
请求方式:
GET
参数:
参数名 | 必选 | 类型 | 说明 |
---|---|---|---|
hero | 是 | string | 英雄名 |
type | 是 | string | 选aqq、awx、iqq、iwx |
请求示例
https://www.sapi.run/hero/select.php?hero=孙悟空&type=aqq
返回示例
{
"code": 200,
"data": {
"uid": "167",
"name": "孙悟空",
"alias": "齐天大圣-孙悟空",
"platform": "安卓-扣扣区",
"photo": "https://game.gtimg.cn/images/yxzj/img201606/heroimg/167/167.jpg",
"area": "武强县",
"areaPower": "3693",
"city": "潮州市",
"cityPower": "5501",
"province": "天津市",
"provincePower": "7274",
"guobiao": "11404",
"stamp": "1654640093",
"updatetime": "2022/06/08 06:14:53",
"clientIP": "119.0.0.126"
},
"msg": " "
}
下面,我们开始写代码。
🍖获取数据
第一步,发送请求,获得数据。
import requests
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
}
hero_url = 'https://pvp.qq.com/web201605/herolist.shtml'
response = requests.get(url=hero_url, headers=headers)
这段代码中,我们使用 Python 的 requests
模块发送了一个 GET 请求,请求的 URL 为 https://pvp.qq.com/web201605/herolist.shtml
,并且使用了 headers
参数来设置请求头信息。请求头信息包括了 user-agent
字段,用于指定浏览器的 User-Agent 信息。
请求返回的结果是一个 Response
对象,我们可以使用 response.text
属性来获取请求的响应内容。在这个例子中,我们使用了 response.json()
方法来将响应内容转换为 JSON 格式,并将其存储在 response.text
属性中。
response.encoding='gbk'
heros = re.findall('alt=".*?">(.*?)</a>',response.text)[0:93]
这段代码中,我们使用 Python 的 re
模块中的 findall()
函数来查找 JSONP 回调函数的参数。findall()
函数可以返回一个列表,其中包含了所有匹配的子字符串。
在这个例子中,我们使用 findall()
函数来查找 JSONP 回调函数的参数,并将其存储在 response.text
变量中。然后,我们使用 [0:93]
来获取第一个匹配的子字符串,并将其存储在 heros
变量中。
需要注意的是,findall()
函数返回的子字符串列表中可能包含多个匹配的子字符串,因此我们需要使用 [0:93]
来获取第一个匹配的子字符串。
🍖解析数据
我们发现,我们得到了这样英雄名字
的数据,下面,我们就可以构建url,获取战力信息。
for hero in heros:
print(hero)
url = f'https://www.sapi.run/hero/select.php?hero={hero}&type=qq'
res = requests.get(url)
data = res.json()['data']
name = data['name']
area = data['area']
areaPower= data['areaPower']
city = data['city']
cityPower = data['cityPower']
province= data['province']
provincePower = data['provincePower']
platform= data['platform']
updatetime = data['updatetime']
这段代码中,我们使用 Python 的 requests
模块发送了一个 GET 请求,请求的 URL 为 https://www.sapi.run/hero/select.php?hero={hero}&type=qq
,并且使用了 json()
方法将响应内容转换为 JSON 格式,并将其存储在 res.json()
变量中。
请求返回的结果是一个 Response
对象,我们可以使用 response.json()
方法将响应内容转换为 JSON 格式,并将其存储在 res.json()
变量中。
在这个例子中,我们使用了 res.json()
变量来获取响应内容,并将其存储在 data
变量中。然后,我们使用 name
变量获取了英雄名称,使用 area
变量获取了区域名字,使用 areaPower
变量获取了区域战力,使用 city
变量获取了市,使用 cityPower
变量获取了市战力,使用 province
变量获取了省份,使用 provincePower
变量获取了省份战力,使用 platform
变量获取了平台,使用 updatetime
变量获取了更新时间。
保存数据
dit = {
'英雄名称':name,
'服务区':platform,
'更新时间': updatetime,
'铜牌区域':area,
'铜牌分数': areaPower,
'银牌区域':city,
'银牌分数': cityPower,
'金牌区域':province,
'金牌分数':provincePower ,
}
这段代码是一个 Python 代码片段,它定义了一个字典,其中包含了一些英雄的信息,包括英雄名称、服务区、更新时间、铜牌区域、铜牌分数、银牌区域、银牌分数、金牌区域、金牌分数等。
下面就是数据的写入了。其实,把字典数值写入到csv文件里面,特别简单,只需呀四行代码就可以实现。
f = open('最低战力.csv', mode='a', encoding='utf-8_sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['英雄名称', '服务区', '更新时间', '铜牌区域', '铜牌分数',
'银牌区域', '银牌分数', '金牌区域','金牌分数'])
csv_writer.writeheader()
这段代码打开了一个名为 '最低战力.csv'
的文件,并将其以追加模式打开。它还指定了文件的编码为 UTF-8 和行结束符为空字符串(newline=''
)。
然后,代码创建了一个 csv.DictWriter
对象,并将其与文件对象关联起来。fieldnames
参数指定了字典中的键和值的名称。
接下来,代码调用 writeheader()
方法来写入表头。这个方法将字典中的键值对写入文件中,并将其作为表头。
写入字典数值。
csv_writer.writerow(dit)
这时候,我们就会在文件夹里面找到最低战力的csv文件,我们打开看看效果。
来源:https://juejin.cn/post/7221459086814806075


猜你喜欢
- 代码如下:<% Function Bytes2bStr(vin,cSet) Dim BytesStream,StringReturn
- PostgreSQL引进“分区”表特性,解放了之前采用“表继承”+“触发器”来实现分区表的繁琐、低效。而添加分区,都是手动执行SQL。演示目
- 一、MySQL Workbench简介MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。
- 1、要连接MySql数据库必须首先下载MySql官方的连接.net的文件,文件下载地址为http://dev.mysql.com/downl
- 本篇博客参考Wuming Zhang的文章“An Easy-to-Use Airborne LiDAR Data Filtering Met
- 如果你正在负责一个基于SQL Server的项目,或者你刚刚接触SQL Server,你都有可能要面临一些数据库性能的问题,这篇文章会为你提
- 前言实现一个帧动画,使用的一个图,根据不同的时间显示不同的图。使用的就是如下所示的一张图,宽度780 * 300 ,使用加载图片 260 *
- asp程序运行速度试验实验:1。作相同的分支条件判断:IF 比 SELECT慢。用以下程序测试:
- 本文我们为大家介绍 Python3 使用 PyMySQL 连接数据库,并实现简单的增删改查。什么是 PyMySQL?PyMySQL 是在 P
- package work;import java.io.BufferedReader;import java.io.IOException;
- 英文文档:staticmethod(function)Return a static method for function.A stati
- 本文实例为大家分享了Python实现井字棋小游戏的具体代码,供大家参考,具体内容如下import osdef print_board(boa
- 先发官方文档的地址:官方文档学习使用的书籍是Python网络数据采集(Ryan Mitchell著),大约是一些笔记的整理。Beautifu
- 本文实例为大家分享了Python3实现汉语转换为汉语拼音的具体代码,供大家参考,具体内容如下工具: Python3.6.2,pycharm1
- 周期置换密码参考教材:《现代密码学教程》P47 3.1.2加密解密过程周期置换密码是将明文p串按固定长度m分组.然后对每组中的子串按1,2&
- 本文实例讲述了java使用正则表达式判断邮箱格式是否正确的方法。分享给大家供大家参考。具体如下:import java.io.*;publi
- 在实际生活中,经常会有文件重复的困扰,即同一个文件可能既在A目录中,又在B目录中,更可恶的是,即便是同一个文件,文件名可能还不一样。在文件较
- MyISAM和MEMORY采用表级锁(table-level locking)BDB采用页面锁(page-leve locking)或表级锁
- Macromedia Dreamweaver MX 2004提供了更多功能强劲的可视化设计工具、应用开
- 用div+css制作页面,想实现左右两部分固定宽度,而中间部分不固定,并随着屏幕分辨率的的变化而自动伸缩。大家可知道应该如何实现? &nbs