Python爬虫破解登陆哔哩哔哩的方法
作者:꧁༺北海以北的等待༻꧂ 发布时间:2021-03-28 14:17:40
标签:Python,爬虫,破解,登陆
写在前面
作为一名找不到工作的爬虫菜鸡人士来说,登陆这一块肯定是个比较大的难题。
从今天开始准备一点点对大型网站进行逐个登陆破解。加深自己爬虫水平。
环境搭建
Python 3.7.7环境,Mac电脑测试
Python内置库
第三方库:rsa、urllib、requests
PC端登陆
全部代码:
'''PC登录哔哩哔哩'''
class Bilibili_For_PC():
def __init__(self, **kwargs):
for key, value in kwargs.items(): setattr(self, key, value)
self.session = requests.Session()
self.__initialize()
'''登录函数'''
def login(self, username, password, crack_captcha_func=None, **kwargs):
# 若参数中给入代理,则设置
self.session.proxies.update(kwargs.get('proxies', {}))
# 是否需要验证码
is_need_captcha = False
while True:
# 需要验证码
if is_need_captcha:
captcha_img = self.session.get(self.captcha_url, headers=self.captcha_headers).content
data = {'image': base64.b64encode(captcha_img).decode('utf-8')}
captcha = self.session.post(self.crack_captcha_url, json=data).json()['message']
# 获得key值
appkey = '1d8b6e7d45233436'
data = {
'appkey': appkey,
'sign': self.__calcSign('appkey={}'.format(appkey))
}
response = self.session.post(self.getkey_url, data=data)
response_json = response.json()
key_hash = response_json['data']['hash']
pub_key = rsa.PublicKey.load_pkcs1_openssl_pem(response_json['data']['key'].encode('utf-8'))
# 模拟登录
if is_need_captcha:
data = "access_key=&actionKey=appkey&appkey={}&build=6040500&captcha={}&challenge=&channel=bili&cookies=&device=pc&password={}&permission=ALL&seccode=&subid=1&ts={}&username={}&validate=" \
.format(appkey, captcha, urllib.parse.quote_plus(base64.b64encode(rsa.encrypt('{}{}'.format(key_hash, password).encode(), pub_key))), int(time.time()), urllib.parse.quote_plus(username))
else:
data = "access_key=&actionKey=appkey&appkey={}&build=6040500&captcha=&challenge=&channel=bili&cookies=&device=pc&password={}&permission=ALL&seccode=&subid=1&ts={}&username={}&validate=" \
.format(appkey, urllib.parse.quote_plus(base64.b64encode(rsa.encrypt('{}{}'.format(key_hash, password).encode(), pub_key))), int(time.time()), urllib.parse.quote_plus(username))
data = "{}&sign={}".format(data, self.__calcSign(data))
response = self.session.post(self.login_url, data=data, headers=self.login_headers)
response_json = response.json()
# 不需要验证码, 登录成功
if response_json['code'] == 0 and response_json['data']['status'] == 0:
for cookie in response_json['data']['cookie_info']['cookies']:
self.session.cookies.set(cookie['name'], cookie['value'], domain='.bilibili')
print('[INFO]: Account -> %s, login successfully' % username)
infos_return = {'username': username}
infos_return.update(response_json)
return infos_return, self.session
# 需要识别验证码
elif response_json['code'] == -105:
is_need_captcha = True
# 账号密码错误
elif response_json['code'] == -629:
raise RuntimeError('Account -> %s, fail to login, username or password error' % username)
# 其他错误
else:
raise RuntimeError(response_json.get('message'))
'''计算sign值'''
def __calcSign(self, param, salt="560c52ccd288fed045859ed18bffd973"):
sign = hashlib.md5('{}{}'.format(param, salt).encode('utf-8'))
return sign.hexdigest()
'''初始化'''
def __initialize(self):
# 登陆请求头
self.login_headers = {'Content-type': 'application/x-www-form-urlencoded'}
# 破解验证码请求头
self.captcha_headers = {'Host': 'passport.bilibili.com'}
# 获取key密钥URL
self.getkey_url = 'https://passport.bilibili.com/api/oauth2/getKey'
# 获取登陆URL
self.login_url = 'https://passport.bilibili.com/api/v3/oauth2/login'
# 获取验证码URL
self.captcha_url = 'https://passport.bilibili.com/captcha'
# 破解网站来自: https://github.com/Hsury/Bilibili-Toolkit
# 破解验证码URL
self.crack_captcha_url = 'https://bili.dev:2233/captcha'
# 请求头都得加这个
self.session.headers.update({'User-Agent': "Mozilla/5.0 BiliDroid/5.51.1 (bbcallen@gmail.com)"})
移动端登陆
移动端与PC端类似,网址URL差异以及请求头差异。在此不过多介绍。
全部代码:
'''移动端登录B站'''
class Bilibili_For_Mobile():
def __init__(self, **kwargs):
for key, value in kwargs.items(): setattr(self, key, value)
self.session = requests.Session()
self.__initialize()
'''登录函数'''
def login(self, username, password, crack_captcha_func=None, **kwargs):
self.session.proxies.update(kwargs.get('proxies', {}))
# 是否需要验证码
is_need_captcha = False
while True:
# 需要验证码
if is_need_captcha:
captcha_img = self.session.get(self.captcha_url, headers=self.captcha_headers).content
data = {'image': base64.b64encode(captcha_img).decode('utf-8')}
captcha = self.session.post(self.crack_captcha_url, json=data).json()['message']
# 获得key值
appkey = 'bca7e84c2d947ac6'
data = {
'appkey': appkey,
'sign': self.__calcSign('appkey={}'.format(appkey))
}
response = self.session.post(self.getkey_url, data=data)
response_json = response.json()
key_hash = response_json['data']['hash']
pub_key = rsa.PublicKey.load_pkcs1_openssl_pem(response_json['data']['key'].encode('utf-8'))
# 模拟登录
if is_need_captcha:
data = "access_key=&actionKey=appkey&appkey={}&build=6040500&captcha={}&challenge=&channel=bili&cookies=&device=phone&mobi_app=android&password={}&permission=ALL&platform=android&seccode=&subid=1&ts={}&username={}&validate=" \
.format(appkey, captcha, urllib.parse.quote_plus(base64.b64encode(rsa.encrypt('{}{}'.format(key_hash, password).encode(), pub_key))), int(time.time()), urllib.parse.quote_plus(username))
else:
data = "access_key=&actionKey=appkey&appkey={}&build=6040500&captcha=&challenge=&channel=bili&cookies=&device=phone&mobi_app=android&password={}&permission=ALL&platform=android&seccode=&subid=1&ts={}&username={}&validate=" \
.format(appkey, urllib.parse.quote_plus(base64.b64encode(rsa.encrypt('{}{}'.format(key_hash, password).encode(), pub_key))), int(time.time()), urllib.parse.quote_plus(username))
data = "{}&sign={}".format(data, self.__calcSign(data))
response = self.session.post(self.login_url, data=data, headers=self.login_headers)
response_json = response.json()
# 不需要验证码, 登录成功
if response_json['code'] == 0 and response_json['data']['status'] == 0:
for cookie in response_json['data']['cookie_info']['cookies']:
self.session.cookies.set(cookie['name'], cookie['value'], domain='.bilibili')
print('[INFO]: Account -> %s, login successfully' % username)
infos_return = {'username': username}
infos_return.update(response_json)
return infos_return, self.session
# 需要识别验证码
elif response_json['code'] == -105:
is_need_captcha = True
# 账号密码错误
elif response_json['code'] == -629:
raise RuntimeError('Account -> %s, fail to login, username or password error' % username)
# 其他错误
else:
raise RuntimeError(response_json.get('message'))
'''计算sign值'''
def __calcSign(self, param, salt="60698ba2f68e01ce44738920a0ffe768"):
sign = hashlib.md5('{}{}'.format(param, salt).encode('utf-8'))
return sign.hexdigest()
'''初始化'''
def __initialize(self):
self.login_headers = {
'Content-type': 'application/x-www-form-urlencoded'
}
self.captcha_headers = {
'Host': 'passport.bilibili.com'
}
self.getkey_url = 'https://passport.bilibili.com/api/oauth2/getKey'
self.login_url = 'https://passport.bilibili.com/api/v3/oauth2/login'
self.captcha_url = 'https://passport.bilibili.com/captcha'
# 破解网站来自: https://github.com/Hsury/Bilibili-Toolkit
self.crack_captcha_url = 'https://bili.dev:2233/captcha'
self.session.headers.update({'User-Agent': "Mozilla/5.0 BiliDroid/5.51.1 (bbcallen@gmail.com)"})
来源:https://blog.csdn.net/qq_45414559/article/details/109726283


猜你喜欢
- 本篇博客介绍如何使用Python调用百度地图WEB服务API获取地点对应坐标值,现有一系列结构化地址数据(如:北京市海淀区上地十街十号),目
- 出现这个问题的原因不是'/xxx.frm'这个文件不见了,而是这些文件的权限(应该要是mysql)不知道为什么变成了root
- 首先总结的意义就是让杂乱无章变得更加井然有序,这样在使用的过程思路会更加清晰。数组使用方法注意点:变异方法和非变异方法。即变异方法使用会改变
- 1. 稀疏矩阵的建立:coo_matrix()from scipy.sparse import coo_matrix# 建立稀疏矩阵data
- 1.python 中创建进程的两种方式:from multiprocessing import Processimport timedef
- 前言在使用自动化登录网站的时候,经常输入用户名和密码后会遇到验证码。今天介绍一款通用验证码识别 OCR库,对验证码识别彻底说拜拜,它的名字是
- Python中有哪几种方法安装第三方模块,安装Python第三方模块的方法有很多,这里介绍三种方法安装第三方模块。【方法一】: 通过setu
- 一、表单验证form1、创建一个新的表单:<form id="id是唯一的,不可重复" name=“可重复”,me
- 建立池连接可以显著提高应用程序的性能和可缩放性。SQL Server .NET Framework 数据提供程序自动为 ADO.NET 客户
- 也许是这样的。下面我们来推荐一个简单的分页程序,代码和说明见下(两段虚线“-----”间的代码是实现该功能的重要语句):chunfeng.a
- 本文实例讲述了用python实现面向对像的ASP程序的方法。分享给大家供大家参考。具体实现方法如下:平时我们写ASP时,一般都用vbscri
- 关于英文的写作有一本十分著名的书,The Elements of Style(风格要素),编写程序也有一本The Elements of P
- 代码: <?php $page=$_GET['page']; include($page.'php')
- 实例如下:String.prototype.trim = function (char, type) { if (char) {
- 本文实例讲述了python实现支持目录FTP上传下载文件的方法。分享给大家供大家参考。具体如下:该程序支持ftp上传下载文件和目录、适用于w
- 本文实例分析了Python中的对象,方法,类,实例,函数用法。分享给大家供大家参考。具体分析如下:Python是一个完全面向对象的语言。不仅
- 使用sql的计划任务可以处理一些特殊环境的数据,除了使用windows系统的计划任务来定时处理,不过要配合程序才行,有些事情可以直接使用sq
- 前言大家好,说起动态条形图,之前推荐过两个 Python 库,比如Bar Chart Race、Pandas_Alive,都可以实现。今天就
- 在目标检测的模型训练中, 我们通常都会有一个特征提取网络backbone, 例如YOLO使用的darknet SSD使用的VGG-16。为了
- 1、选取最适用的字段属性MySQL 可以很好的支持大数据量的存取,但是一般说来,数据库中的表越小,在它上面执行的查询也就会越快。因此,在创建