位置：首页>> 网络编程>> Python编程>> 详解python 爬取12306验证码

详解python 爬取12306验证码

作者：daqinjun　　发布时间：2022-07-17 20:38:20　

标签：python,12306,验证码

一个简单的验证码爬取程序

本文介绍了在Python2.7环境下爬取网站验证码：

思路就是获取验证码对应的url，然后发起requst请求，读取该URL对应的内容，然后写入到一个本地文件，实现一个验证码的保存。大量下载可以把以上程序写入一个死循环

代码实现部分：

import ssl
import urllib2
i=1
import time
while(1):

#不加的话，无法访问12306
ssl._create_default_https_context = ssl._create_unverified_context
# headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
# req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
# https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
u=urllib2.urlopen(req)
data = u.read()
f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
print i
# time.sleep(1)#有时需要加延时，以防被封。
i=i+1
f.write(data)
f.close()

以下就是爬取的照片的截图

12306的验证码经常让人眼花缭乱，眼睛仔细看也不能100％的对，算是验证码中比较难是别的。一般由八幅图和一个问题组成，而且图片大小位置固定，问题的位置也是固定的，这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体，有一个和它比较像。不过有一点暂时没法确定，就是样本库到底有多大，或者说是到底有多少个类别，如果进行训练的话，我们必须获取每个类别个的一定数量的图片作为样本。

以上所述是小编给大家介绍的python爬取12306验证码详解整合网站的支持！

来源：https://blog.csdn.net/daqinjun/article/details/72600235

0

投稿

猜你喜欢

asp截取指定英汉混合字符串_支持中文
说明：本函数作用是截取指定英汉混合字符串，并保持显示长度一至。就是将一个汉字当两英文来截取。用途：一般会用在标题显示列表，可以避免截取的字符
django缓存配置的几种方法详解
为什么要用缓存？首先说，为什么要用缓存的，由于Django是 * 站，所有每次请求均会去数据进行相应的操作，当程序访问量大时，耗时必然会更加
SQL Server 2005 输入框不能输入中文问题
最近遇到SQL Server 2005 输入框不能输入中文，在网上查了N久，试验了十几次奏这个法子有用：“把你表中的自动编号列放到最后面”。
请站在用户的角度上说话
前几天，酋长同学在日志里提到了关于Google宽松的管理制度，一个产品任务下来是没有时间限制的，Google深信在有时间限制下的产品肯定是不
Python基础面向对象之继承与派生详解
一、面向对象三大特征之继承python三大特征：封装、继承、多态三者中继承最为核心，实际应用多，感受较为直观封装和多态略微抽象1、继承的概念
sql如何删除数据库中数据记录
本文详细介绍了asp中如何使用sql语句删除数据库中的记录，初学asp者来看看！1，首先要明确删除哪条记录无非还就是SQL语句了，比如对应到
十“问”DreamWeaver
1．问：在DW中如何设置页面边距为0？答：在DW中似乎没有直接设置的方法，你只有在Html文档中插入以
深入理解Django的自定义过滤器
前言本文主要给大家介绍了关于Django自定义过滤器的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍：过滤器与函数d
python3.6+selenium实现操作Frame中的页面元素
有时网页中会嵌套一个或者多个Frame，此时我们直接去找嵌套在Frame里面的元素会抛出异常，所以在操作的时候我们需要将页面焦点切换到Fra
try finally 妙用,防止内存泄漏
<div id="d1"></div> <script > fu
Python定时任务sched模块用法示例
本文实例讲述了Python定时任务sched模块用法。分享给大家供大家参考，具体如下：通过sched模块可以实现通过自定义时间，自定义函数，
python文件和目录操作方法大全（含实例）
一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录，即当前Python脚本工作的目录路
php广告加载类用法实例
本文实例讲述了php广告加载类的用法，非常实用。分享给大家供大家参考。具体方法如下：该php广告加载类，支持异步与同步加载。需要使用Jque
python数字图像处理之对比度与亮度调整示例
skimage包的exposure模块图像亮度与对比度的调整，是放在skimage包的exposure模块里面1、gamma调整对原图像的像
对python requests发送json格式数据的实例详解
requests是常用的请求库，不管是写爬虫脚本，还是测试接口返回数据等。都是很简单常用的工具。这里就记录一下如何用requests发送js
oracle数据库下统计专营店的男女数量的语句
Web_THBC 为表示层也就是页面（.aspx） BLL_THBC 为业务逻辑层 DAL_THBC 为数据库交互层（向数据库执行SQL语
MSSQL数据库排序规则如何更改
1.sp_helpsort SELECT SERVERPROPERTY ('Collation') 查看你的排序规则. 不过
详解Python实现图像分割增强的两种方法
方法一import randomimport numpy as npfrom PIL import Image, ImageOps, Ima
Python使用Selenium、PhantomJS爬取动态渲染页面
背景在爬取网站数据时，我们通常会遇到一些动态渲染页面的网站。传统的静态网站我们可以直接通过 requests.get() 函数获取页面源代码
PHP 引用的概念
目录什么是引用？引用在数组和对象中的使用引用的传递引用的返回引用的取消总结什么是引用？在 PHP 中引用意味着用不同的名字访问同一个变量内容

Python SQLite3数据库操作类分享

Python 写小游戏吃金币+打乒乓+滑雪(附源码)

Python调用飞书发送消息的示例

python本地文件服务器实例教程

wxPython窗口的继承机制实例分析

Python基于Tkinter实现的垃圾分类答题软件代码

python查询mysql中文乱码问题

Python实现读取文件夹按数字排序功能

Python基于list的append和pop方法实现堆栈与队列功能示例

python实现一个点绕另一个点旋转后的坐标

iOS11设置飞行模式技巧

Win11玩游戏自动弹回桌面怎么办？

win11dns异常无法上网怎么办？两种方法完美解决！

苹果优惠活动：AirPods/Beats 用户可免费领取 6 个月 Apple Music 订阅服务

python中实现迭代器（iterator）的方法示例

Word怎么设置语言优先级顺序

微信摇一摇怎么替换背景图

Excel中not函数的操作使用

在苹果Mac中如何使用 BetterZip 批量解压压缩文件？

Windows10系统提高桌面应用启动速度的方法

手机版 网络编程 asp之家 www.aspxhome.com