Python正则表达式匹配HTML页面编码
作者:junjie 发布时间:2023-07-29 06:50:36
标签:Python,正则表达式,HTML,页面编码
html页面一般都会指定一个编码,如何获取到是处理html页面的第一步,因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个:
import re
a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
'<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
'<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
'<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
'<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
'<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
'<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
]
b = "<meta[ ]+http-equiv=["']?content-type["']?[ ]+content=["']?text/html;[ ]*charset=([0-9-a-zA-Z]+)["']?"
B = re.compile(b, re.IGNORECASE)
for ax in a:
r1 = B.search(ax)
if r1:
print r1.group()
print r1.group(1), len(r1.group())
else:
print 'not match'


猜你喜欢
- 事件调度sched 模块内容很简单,只定义了一个类。它用来最为一个通用的事件调度模块。class sched.scheduler(timef
- pickle的作用:1:pickle.dump(dict,file)把字典转为二进制存入文件.2:pickle.load(file)把文件二
- 前言上一篇介绍了客户端流式RPC,客户端不断的向服务端发送数据流,在发送结束或流关闭后,由服务端返回一个响应。本篇将介绍双向流式RPC。双向
- 如果说goroutine是Go语言程序的并发体的话,那么channels则是它们之间的通信机制。一个channel是一个通信机制,它可以让一
- CSS+DIV是网站标准(或称“WEB标准”)中常用的术语之一,通常为了说明与HTML网页设计语言中的表格(table)定位方式的区别,因为
- 今天继续给大家介绍MySQL相关知识,本文主要内容是MySQL索引相关内容。一、MySQL索引简介索引是MySQL数据库为了加快数据查询的速
- 1、在Asp页面首部加入Response.Buffer = True Response.ExpiresAbso
- Sequence Typessequence类型有六种:strings, byte sequences (bytes objects), b
- mysql数据库没有增量备份的机制,当数据量太大的时候备份是一个很大的问题。还好mysql数据库提供了一种主从备份的机制,其实就是把主数据库
- 实际的项目网站中或多或少的或用到多选框,我选用的一款是 Bootstrap Multiselect。 官
- Neo4j是面向对象基于Java的 ,被设计为一个建立在Java之上、可以直接嵌入应用的数据存储。此后,其他语言和平台的支持被引入,Neo4
- 一朋友委托我帮他投票,地址在: http://publish.sina.com.cn/04/13/413/search.php 投票的链接是
- 代码如下:vbcrlfvbs常量相当于vbcr & vblf 就是常见的那个 chr(13) & chr(10),用Chr(
- 一、前端工具vscode1.1、概述前端开发是创建Web页面或app等前端界面呈现给用户的过程,通过HTML,CSS及JavaScript以
- 引子Tornado 是一个网络异步的的web开发框架, 并且可以利用多进程进行提高效率, 下面是创建一个多进程 tornado 程序的例子.
- 装饰器对与Python新手以至于熟悉Python的人都是一个难理解, 难写的东西. 那么今天就分享一下我对Python 装饰器的理解所谓装饰
- 小引 笔者认为web开发包括设计html,javascript,css,以及一种高级语言,比如c#,java等等,本文分为三部分,第一部分为
- 前言这节课很重要。。界面整洁美观与否就看布局了。。这里讲布局方法,至于设计的天赋与最终界面的美感那就看造化了。。本文主要讲述Qt Desig
- BootStrap模态框简单概述Bootstrap Modals(模态框)是使用定制的 Jquery 插件创建的。它可以用来创建模态窗口丰富
- 1.1. 下载:官网下载zip包,我下载的是64位的:下载地址:https://dev.mysql.com/downloads/mysql/