位置：首页>> 网络编程>> Python编程>> python 爬取学信网登录页面的例子

python 爬取学信网登录页面的例子

作者：宇风-飞扬　　发布时间：2022-11-25 22:04:39　

标签：python,爬取,登录,页面

我们以学信网为例爬取个人信息

**如果看不清楚

按照以下步骤：**

1.火狐为例打开需要登录的网页–> F12 开发者模式（鼠标右击，点击检查元素）–点击网络 –>需要登录的页面登录下–> 点击网络找到一个POST提交的链接点击–>找到post（注意该post中信息就是我们提交时需要构造的表单信息）

import requests
from bs4 import BeautifulSoup
from http import cookies
import urllib
import http.cookiejar

headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0',
'Referer':'https://account.chsi.com.cn/passport/login?service=https://my.chsi.com.cn/archive/j_spring_cas_security_check',
}

session = requests.Session()
session.headers.update(headers)
username = 'xxx'
password = 'xxx'
url = 'https://account.chsi.com.cn/passport/login?service=https://my.chsi.com.cn/archive/j_spring_cas_security_check'
def login(username,password,lt,_eventId='submit'): #模拟登入函数
#构造表单数据
data = { #需要传去的数据
'_eventId':_eventId,
'lt':lt,
'password':password,
'submit':u'登录',
'username':username,
}
html = session.post(url,data=data,headers=headers)

def get_lt(url): #解析登入界面_eventId
html = session.get(url)
#获取 lt
soup = BeautifulSoup(html.text,'lxml',from_encoding="utf-8")
lt=soup.find('input',type="hidden")['value']
return lt

lt = get_lt(url)#获取登录form表单信息以学信网为例
login(username,password,lt)
login_url = 'https://my.chsi.com.cn/archive/gdjy/xj/show.action'
per_html = session.get(login_url)
soup = BeautifulSoup(per_html.text,'lxml',from_encoding="utf-8")
print(soup)
for tag in soup.find_all('table',class_='mb-table'):
print(tag)
for tag1 in tag.find_all('td'):
title= tag1.get_text();
print(title)

来源：https://blog.csdn.net/eb_num/article/details/75050702

0

投稿

猜你喜欢

MySQL环境下导入数据时是否需要禁用索引
问题：导入数据时是否需要禁用索引?解答：在使用load data导入数据时，如果导入的表是MyISAM的，对于空表，MySQL数据库会把所有
oracle 存储过程和触发器复制数据
一。存储过程的创建和使用1.创建程序包，并在程序中创建存储过程create or replace PACKAG
详解MySQL与Spring的自动提交(autocommit)
1 MySQL的autocommit设置MySQL默认是开启自动提交的，即每一条DML（增删改）语句都会被作为一个单独的事务进行隐式提交。如
PHP连接和操作MySQL数据库基础教程
从这里开始我的博客，后台数据库是什么？没错，就是MySQL，服务器端使用的脚本就是PHP，整个框架使用的是WordPress。PHP和MyS
Python3读写ini配置文件的示例
ini文件即Initialization File初始化文件，在应用程序及框架中常作为配置文件使用，是一种静态纯文本文件，使用记事本即可编辑
深入理解Javascript中的观察者模式
简介观察者模式又叫发布订阅模式（Publish/Subscribe），它定义了一种一对多的关系，让多个观察者对象同时监听某一个主题对象，这个
只用50行Python代码爬取网络美女高清图片
一、技术路线requests：网页请求BeautifulSoup：解析html网页re：正则表达式，提取html网页信息os：保存文件imp
python 利用opencv实现图像网络传输
本代码主要实现的是利用网络传输图片，用在我的树莓派项目之上。该项目在PC上运行服务端，树莓派上运行客户端，两者连接到同一局域网中，修改代码中
解决pycharm 格式报错tabs和space不一致问题
报错如下：TabError: inconsistent use of tabs and spaces in indentation我推荐一种
python实现nao机器人身体躯干和腿部动作操作
本文实例为大家分享了python实现nao机器人身体躯干和腿部动作的具体代码，供大家参考，具体内容如下跟上一篇类似，代码没什么难度，可以进行
SQL Server 在Management Studio中使用Web浏览器
我们在SQL Server Management Studio中写SQL 的时候，避免不了在浏览器和SSMS两者之间频繁切换，并浪费时间，殊
采用XMLHTTP编写一个天气预报的程序
本人就职于一个本地门户网站，每天网站上的天气都得更新。久而久之感到相当麻烦，于是写了一个定时的新闻小偷，帖出来大家参考一下系统
python nohup 实现远程运行不宕机操作
远程运行最怕断电，训练了几个小时的数据说没就没，或者停止运行。用nohup 记录代码的输出，还可以不受断电的影响。方法1. 用nohup 运
SQL语法CONSTRAINT约束操作详情
CONSTRAINT约束，即对数据库表中的数据进行约束，以保证数据记录的完整性和有效性。比较常用的是，创建表时添加约束，但是为了整理记录，这
Python简单生成随机姓名的方法示例
本文实例讲述了Python简单生成随机姓名的方法。分享给大家供大家参考，具体如下：用到random.choice(序列)在一个序列中随机选取
golang 语言中错误处理机制
与其他主流语言如 Javascript、Java 和 Python 相比，Golang 的错误处理方式可能和这些你熟悉的语言有所不同。所以才
Eclipse + Python 的安装与配置流程
一、Eclipse 的安装Eclipse的安装是很容易的。Eclipse是基于java的一个应用程序，因此需要一个java的运行环境（JRE
彻底解决MySql在UTF8字符集下乱码问题
为了顺利的开发一个多语言的国际化J2EE程序，需要修改数据库字符集，我的做法如下：安装 MySq时选择字符集为UTF-8修改MySql安装目
如何使用w3 upload上传组件上传文件？
看看下面的w3 upload组件例子，很简单： upload.asp<html> <head>
MySQL基础教程之事务异常情况
测试异常情况-- 1. 查询张三余额select * from account where name = '张三';-- 2

代码详解Python的函数基础(2)

用python打印1~20的整数实例讲解

Python闭包及装饰器运行原理解析

解决python运行效率不高的问题

python+excel接口自动化获取token并作为请求参数进行传参操作

详解如何通过Python制作一个密码生成器

Python timeit模块原理及使用方法

Python pip 安装与使用(安装、更新、删除)

Django配置文件代码说明

如何使用python读取Excel指定范围并转为数组

坎公骑冠剑9-5关卡怎么三星通关

魔兽世界怀旧服黑石之王任务奖励是什么？黑石之王任务奖励及玩法介绍

Windows10系统默认应用设置的深度攻略

Excel隔行插行技巧

word中的图片怎么批量删除 word批量删除图片图文教程

崩坏3预料之外好打吗？预料之外简单打法分享

Win10如何设置登录密码输入错误一定次数即锁定帐户？

logging level级别介绍

战锤混沌祸害最终BOSS怎么打最简单?最终boss简单打法视频介绍

天涯明月刀手游送命捏脸怎么捏

手机版 网络编程 asp之家 www.aspxhome.com