位置：首页>> 网络编程>> Python编程>> python爬取免费代理并验证代理是否可用

python爬取免费代理并验证代理是否可用

作者：小军递　　发布时间：2021-12-24 20:02:48　

标签：python,爬取免费代理,验证代理

分享一个python脚本，使用代理ip来访问网页，方便抓取数据什么的~并自动验证ip是否可以用

什么情况下会用到 * ？比如你要抓取一个网站数据，该网站有100万条内容，他们做了IP限制，每个IP每小时只能抓1000条，如果单个IP去抓因为受限，需要40天左右才能采集完，如果用了 * ，不停的切换IP，就可以突破每小时1000条的频率限制，从而提高效率。

脚本开始：

import requests
from lxml import etree
# 获取快代理首页的代理
def get_proxy_list():
url = "https://www.jxmtjt.com/"
payload = {}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36",
'Accept': 'application/json, text/javascript, */*; q=0.01',
}
response = requests.request("GET", url, headers=headers, data=payload)
res = []
_ = etree.HTML(response.text)
type_dct = {
"HTTP": "http://",
"HTTPS": "https://"
}
data_list = _.xpath("//tbody/tr")
for data in data_list:
ip = data.xpath("./td[1]/text()")[0]
port = data.xpath("./td[2]/text()")[0]
type = data.xpath("./td[4]/text()")[0]
res.append(type_dct[type] + ip + ':' + port)
return res
# 测试代理
def check(proxy):
href = 'http://www.baidu.com/'
if 'https' in proxy:
proxies = {'https': proxy}
else:
proxies = {'http': proxy}
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 11_2_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4396.0 Safari/537.36'
}
try:
r = requests.get(href, proxies=proxies, timeout=5, headers=headers)
if r.status_code == 200:
return True
except:
return False
if __name__ == '__main__':
proxy_list = get_proxy_list()
print(proxy_list)
for p in proxy_list:
print(p, check(p))
大家代码复制后，把获取代理ip的网址改一改就可以用了，代码我一直在用，大家也可以cnblogs，百度搜索一下有没有免费的代理ip获取网址~

来源：https://www.cnblogs.com/xiaojuntest/p/15771517.html

0

投稿

猜你喜欢

解决GOPATH在GOLAND中的坑
首先我的环境已配置好：GO的目录结构是：add.gopackage calc//函数名必须大写首字母，不然外部包找不到func Add(a
python GUI库图形界面开发之PyQt5信号与槽事件处理机制详细介绍与实例解析
PyQt5中信号与槽可以说是对事件处理机制的高级封装，如果说事件是用来创建窗口控件的，那么信号与槽就是用来对这个控件进行使用的，比如一个按钮
php文件下载后无法打开的处理方案及代码
PHP下载图片后文件打开显示损坏问题用php写个图片下载方法，测试发现下载的图片大小都没问题，但是无法打开文件。解决方法如下：首先打开文件下
在JScript中使用ADODB.Stream判断文件编码
在实现TextStraem的时候，找到判断文件编码的代码是VBS的，但是在JScript中是没有ASC等函数的，也不能对二进制数据进行处理，
隐藏并修改文件的最后修改时间的asp-webshell
隐藏并修改文件的最后修改时间的asp-webshell。源码：<％ '隐藏并修改文件的最后修改时间的aspshell '
python二分法实现实例
1.算法：（设查找的数组期间为array[low, high]）（1）确定该期间的中间位置K（2）将查找的值T与array[k]比较。若相等
sqlserver数据库主键的生成方式小结(sqlserver,mysql)
主键的生成方式主要有三种：一. 数据库自动生成二. GUID 三. 开发创建严格讲这三种产生方式有一定的交叉点，其定位方式将在下面进行
python爬虫beautiful soup的使用方式
前言简述bs4：使用pip install beautifulsoup4将bs4包安装到当前的python解释器环境，使用fro
Python远程开发环境部署与调试过程图解
这篇文章主要介绍了Python远程开发环境部署与调试过程图解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需
基于Oracle的高性能动态SQL程序开发
摘要：对动态SQL的程序开发进行了总结，并结合笔者实际开发经验给出若干开发技巧。关键词：动态SQL，PL/SQL，高性能 1．静态SQL
Python的argparse库使用详解
argparse是python标准库里面用来处理命令行参数的库命令行参数分为位置参数和选项参数：位置参数就是程序根据该参数出现的位置来确定的
ASP存储过程应用全接触
内容摘要：ASP与存储过程(Stored Procedures)的文章不少，但是我怀疑作者们是否真正实践过。我在初学时查阅过大量相
php判断输入不超过mysql的varchar字段的长度范围
但是如果在utf-8编码下，一个汉字是占3个字符长度的，比如字符串$str=”你好啊!!”; 如果你用strlen函数来判断，长度是11，正
Python实现从url中提取域名的几种方法
从url中找到域名,首先想到的是用正则，然后寻找相应的类库。用正则解析有很多不完备的地方，url中有域名，域名后缀一直在不断增加等。通过go
PHP缓存集成库phpFastCache用法
本文实例讲述了PHP缓存集成库phpFastCache用法。分享给大家供大家参考。具体分析如下：phpFastCache是一个开源的PHP缓
Google开源的Python格式化工具YAPF的安装和使用教程
目前用于Python的格式化程序（如autopep8和pep8ify）都用于删除代码中的lint错误。这有很明显的局限性。YAPF采用了不同
如何利用SQL Server 2005中的模板参数
如果你用SQL Server 2005 Management Studio建立函数或存储过程，你会注意到这些新窗口中都是模板。通常，你可以获
QQ影音感念亲恩皮肤，不只是大按钮这么简单
QQ影音至9月发布之后一直口碑很好，视觉界面和交互设计也颇受好评，这是设计师们努力的结果，也是众多用户反馈的功劳。我们希望可以提供更多价值回
sqlserver中查询横表变竖表的sql语句简析
首先是三张表， CNo对应的是课程，在这里我就粘贴了。主表人名表按照常规查询SELECT s.SName, c.CName,s2.SCgra
python开发入门——set的使用
介绍本文主要介绍Python中set的基本知识和使用。Python中什么是setdict的作用是建立一组 key 和一组 value 的映射

Python基于百度AI实现抓取表情包

python 实现简单的FTP程序

Python实现基于标记的分水岭分割算法

Python基于QQ邮箱实现SSL发送

python3 深浅copy对比详解

python web框架Flask实现图形验证码及验证码的动态刷新实例

Python如何创建装饰器时保留函数元信息

PyTorch预训练Bert模型的示例

Python 类属性与实例属性，类对象与实例对象用法分析

Django模板继承与模板的导入实例详解

SUMIF求和函数的用法

MybatisPlus代码生成器含XML文件详解

XP系统桌面图标隐藏的技巧方法

深入浅析Python中join 和 split详解(推荐)

Excel文本清洗类函数，数据清洗轻松搞定，left函数、right函数、trim函数、Replace函数等

excel2019怎么取消超链接？excel2019禁止网址替换为超链接方法

Win8系统下网站证书错误怎么解决？

word删除空白页技巧汇总

Windows7需要什么配置？Win7最低硬件配置详细介绍

Win11扬声器声音小怎么办? Win11启用扬声器音频增强的技巧

手机版 网络编程 asp之家 www.aspxhome.com