python正则匹配查询港澳通行证办理进度示例分享
发布时间:2021-05-09 19:29:55
import socket
import re
'''
广东省 * 厅出入境政务服务网护照,通行证办理进度查询。
分析网址格式为 http://www.gdcrj.com/wsyw/tcustomer/tcustomer.do?&method=find&applyid=身份证号码
构造socket请求网页html,利用正则匹配出查询结果
'''
def gethtmlbyidentityid(identityid):
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
host = 'www.gdcrj.com';
suburl = '/wsyw/tcustomer/tcustomer.do?&method=find&applyid={0}'
port = 80;
remote_ip = socket.gethostbyname(host)
s.connect((remote_ip , port))
print('【INFO】:socket连接成功')
message = 'GET '+ suburl.format(identityid) +' HTTP/1.1\r\nHost: '+ host +'\r\n\r\n'
# str 2 bytes
m_bytes = message.encode('utf-8')
# send bytes
s.sendall(m_bytes)
print('【INFO】:远程下载中...')
recevstr = ''
while True:
# return bytes
recev = s.recv(4096)
# bytes 2 str
recevstr += recev.decode(encoding = 'utf-8', errors = 'ignore')
if not recev:
s.close()
print('【INFO】:远程下载网页完成')
break
return recevstr
'''
利用正则表达式从上步获取的网页html内容里找出查询结果
'''
def getresultfromhtml(htmlstr):
linebreaks = re.compile(r'\n\s*')
space = re.compile('( )+')
resultReg = re.compile(r'\<td class="news_font"\>([^<td]+)\</td\>', re.MULTILINE)
#去除换行符和空格
htmlstr = linebreaks.sub('', htmlstr)
htmlstr = space.sub(' ', htmlstr)
#匹配出查询结果
result = resultReg.findall(htmlstr)
for res in result:
print(res.strip())
if __name__ == '__main__':
identityid = input('输入您的身份证号码(仅限广东省居民查询):')
try:
identityid = int(identityid)
print('【INFO】:开始查询')
html = gethtmlbyidentityid(identityid)
getresultfromhtml(html)
print('【INFO】:查询成功')
except:
print('【WARN】:输入非法')
input('【INFO】:按任意键退出')
猜你喜欢
- 日一二三四五六'.split('') ['日','一','二
- 以上是效果图,本图表使用d3.js v4制作。图表主要功能是在六边形格子中显示数据,点击底部图标可以切换指定格子高亮显示,图表可以随浏览器任
- 语句如下:alter table tableName engine=InnoDB; 用到的表 CREATE TABLE IF NOT EXI
- 第一个坑:'geckodriver' executable needs to be in PATH1.如果启动浏览器过程中报
- 上节基本完成了SVM的理论推倒,寻找最大化间隔的目标最终转换成求解拉格朗日乘子变量alpha的求解问题,求出了alpha即可求解出SVM的权
- 本文讲解了一个使用XML技术上传文件的例子,使用该方法没有传统方法中的种种限制。 这个例子讲述了如何使用MSXML3.0和ADO Strea
- 定时任务:1、 线程睡眠函数 sleep() ——粗暴!一直占有 CPU 资源,导致后续操作无法执行2、 threading.Timer(1
- 首先安装pip install ruamel.yaml用于修改yaml文件#coding:utf-8from ruamel import y
- vscode中安装ms-vscode.go插件后可以开启对go语言的支持,ms-vscode.go插件需要依赖一些工具,安装完成后提示goc
- 前言入门爬虫很容易,几行代码就可以,可以说是学习 Python 最简单的途径。刚开始动手写爬虫,你只需要关注最核心的部分,也就是先成功抓到数
- 一、 Scott用户下的表结构SCOTT。是在Oracle数据库中,一个示例用户的名称。其作用是为初学者提供一些简单的应用示例,不过其默认是
- 序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。Pyt
- '==' 比较的是两个对象的值'is' 比较的是两个对象的内存地址(id)下面我们着重理解 'is&
- 本文实例讲述了Python实现matplotlib显示中文的方法。分享给大家供大家参考,具体如下:【注意】可能与本文主题无关,不过我还是想指
- 最近看Python看得都不用tab键了,哈哈。今天看了一个经典问题--八皇后问题,说实话,以前学C、C++的时候有这个问题,但是当时不爱学,
- 1. 鼠标的哪个按键被点击?<html><head><script type="text/javas
- 首先看middleware的定义:auth模块有两个middleware:AuthenticationMiddleware和SessionA
- 现在,比较牛的设计师和开发者都认识到了可用性在他们工作中的重要性。可用性好的网站会极大地提高用户体验,并且好的用户体验会让用户更加快乐。用聪
- 回忆一下mysql 5.5 安装配置方法,整理mysql 5.5 安装配置教程笔记,分享给大家。MySQL下载地址:http://dev.m
- 本篇我们将以分析历史股价为例,介绍怎样从文件中载入数据,以及怎样使用NumPy的基本数学和统计分析函数、学习读写文件的方法,并尝试函数式编程