位置：首页>> 网络编程>> Python编程>> python爬虫基于requests模块发起ajax的get请求实现解析

python爬虫基于requests模块发起ajax的get请求实现解析

作者：minger_lcm　　发布时间：2022-01-02 05:04:04　

标签：python,爬虫,requests,ajax,get,请求

基于requests模块发起ajax的get请求

需求：爬取豆瓣电影分类排行榜 https://movie.douban.com/中的电影详情数据

用抓包工具捉取使用ajax加载页面的请求

鼠标往下下滚轮拖动页面，会加载更多的电影信息，这个局部刷新是当前页面发起的ajax请求，

用抓包工具捉取页面刷新的ajax的get请求，捉取滚轮在最底部时候发起的请求

这个get请求是本次发起的请求的url

ajax的get请求携带参数

获取响应内容不再是页面数据，是json字符串，是通过异步请求获取的电影详情信息

start和limit参数需要注意，改变这两个参数获取的电影详情不一样

import requests
import json
# 指定ajax-get请求的url（通过抓包进行获取）
url = 'https://movie.douban.com/j/chart/top_list?'
# 封装ajax的get请求携带的参数(从抓包工具中获取) 封装到字典
param = {
'type': '13',
'interval_id': '100:90',
'action': '',
'start': '20', # 从第20个电影开始获取详情
'limit': '20', # 获取多少个电影详情
# 改变这两个参数获取的电影详情不一样
}
# 定制请求头信息，相关的头信息必须封装在字典结构中
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36',
}
# 发起ajax的get请求还是用get方法
response = requests.get(url=url,params=param,headers=headers)

# 获取响应内容：响应内容为json字符串
data = response.text
data = json.loads(data)
for data_dict in data:
print(data_dict["rank"],data_dict["title"])

'''
芙蓉镇
沉静如海
淘金记
马戏团
情迷意乱
士兵之歌
战争与和平
怦然心动
大话西游之月光宝盒
罗马假日
音乐之声
一一
雨中曲
我爱你
莫娣
卡比利亚之夜
婚姻生活
本杰明·巴顿奇事
情书
春光乍泄
'''

从21个电影开始获取信息，总共获取20个电影详情信息

来源：https://www.cnblogs.com/mingerlcm/p/11378848.html

0

投稿

猜你喜欢

微信小程序实现页面跳转传递参数（实体，对象）
首先我们有这么一种需求，就是我在一个列表中点击了某个item，跳转到详情界面，那么我就需要把item的实体数据从列表页面传递到详情页面，那么
大家都对vertical-align的各说各话
最近几天仔细研究了一下vertical-align这个属性，结果让我大吃一惊，这个很“资深”的CSS标准竟然在各个浏览器里面的表现都各不相同
在Python中使用NLTK库实现对词干的提取的教程
什么是词干提取？在语言形态学和信息检索里，词干提取是去除词缀得到词根的过程─—得到单词最一般的写法。对于一个词的形态词根，词干并不需要完全相
PHP开发实现微信退款功能示例
本文实例讲述了PHP开发实现微信退款功能。分享给大家供大家参考，具体如下：最近在调微信退款接口，发现有许多坑，更大家分享一下① 要是在测试的
轻松接触SQL Server 2000实例的命名规则
由于可将 Microsoft? SQL Server? 2000 设置为包含一个或多个命名实例和一个默认实例（也可无），所以要用新命名规则来
Google Chrome的hack写法以及CSS的支持程度
Chrome的CSS支持程度：Green / √ means current support.Orange / Δ means that
文字的减法
认知心理学家Donald A. Norman将人类的行动分解成七个阶段：1. 确定目标2. 确定意图3. 明确行动内容4. 执行5. 感知外
django 解决manage.py migrate无效的问题
问题描述：已有的model，修改之后，想重新建模，于是将migrations文件夹中除__init__.py之外其他文件都删掉，再次执行以下
oracle 分页很棒的sql语句
CREATE OR REPLACE PROCEDURE PROC6338196642095312503719(输入新闻主题 Varchar2
asp form 表单验证函数
'************************************* '检测是否只包含英文和数
互联网一家之言（一）：叫用户为你买单
很长时间以来，一直想将自己的一些零碎的想法总结下，给自己一个完整的思维，也算是做个存档。一家之言，绝不敢说对别人会有什么帮助，对外人的层面上
css彩色虚线表格及JS鼠标指向单元格变色制作方法
在我们制作主页的过程中，用到表格的地方非常多，灵活运用表格技巧可以为我们的网页增色不少，这里我就详细介
怎样在SQL Server 2005中用证书加密数据
提到SQL Server 2005证书，很多人可能以为它只是用来在传输数据的时候起到加密作用的，但在深入了解后，你会发现它的用处还有很多。
python装饰器三种装饰模式的简单分析
学设计模式中有个装饰模式,用java实现起来不是很难,但是远远没有python简单,难怪越来越火了!这里就简单讨论下python的几种装饰模
在Win 2003中配置ASP.net环境
大家知道，Microsoft为了更好地预防恶意用户和攻击者的攻击，在默认情况下，没有将 IIS6.0 安装到 Windows Server
Javascript调用XML制作连动下拉框
传统的HTML页面中连动下拉框采用了两种方法：1）直接将下拉框中的内容hardcode于html的javascript中，调用javascr
python 用pandas实现数据透视表功能
透视表是一种可以对数据动态排布并且分类汇总的表格格式。对于熟练使用 excel 的伙伴来说，一定很是亲切！pd.pivot_table()
zen coding的dreamweaver插件安装教程
在我发表上一篇《Zen Coding: 一种快速编写HTML/CSS代码的方法》之后，有网友表示不知道怎么在Dreamweaver上使用ze
30个出色的分页设计
分页设计我们经常会见到，这里有30个分页设计，以供大家欣赏欣赏借鉴。
python爬取音频下载的示例代码
抓取“xmly”鬼故事音频import json # 在这个url，音频链接为JSON动态生成，所以用到了json模块impor

python去除空格和换行符的实现方法(推荐)

Ubuntu下使用python读取doc和docx文档的内容方法

Python面向对象基础入门之设置对象属性

Python爬虫工程师面试问题总结

opencv python 图片读取与显示图片窗口未响应问题的解决

python判断正负数方式

python实现图像边缘检测

浅谈终端直接执行py文件,不需要python命令

Python实现常见的4种坐标互相转换

Python version 2.7 required, which was not found in the registry

微信朋友圈发文字怎么加表情?

可持续更新 Win10 Mobile正式版10586.218支持机型有哪些？

MAC地址怎么改 Win7系统电脑修改物理地址的方法

修复Windows XP和LINUX双系统引导菜单方法

升级Win10 Mobile预览版10581后开始屏幕花屏的解决办法

win10如何将逻辑分区改为主分区_win10将逻辑分区改为主分区的解决方法

电脑系统关闭tablet pc输入面板的操作方法

如何在 iPhone 或 iPad 将完整的网页保存为 PDF？

Android中使用背景色Alpha值遇到的一个坑

轻松配置网站Robots.txt文件

手机版 网络编程 asp之家 www.aspxhome.com