位置：首页>> 网络编程>> Python编程>> Python正则表达式匹配HTML页面编码

Python正则表达式匹配HTML页面编码

作者：junjie　　发布时间：2023-07-29 06:50:36　

标签：Python,正则表达式,HTML,页面编码

html页面一般都会指定一个编码，如何获取到是处理html页面的第一步，因为错误的编码必然带来后面处理的问题。这里我用python的正则表达式写了个：

import re

a = ["<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />",
'<meta http-equiv=Content-Type content="text/html;charset=gb2312">',
'<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">',
'<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
'<meta http-equiv="content-type" content="text/html; charset=utf-8" />',
'<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />',
'<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />'
]

b = "<meta[ ]+http-equiv=["']?content-type["']?[ ]+content=["']?text/html;[ ]*charset=([0-9-a-zA-Z]+)["']?"

B = re.compile(b, re.IGNORECASE)

for ax in a:
r1 = B.search(ax)

if r1:
print r1.group()
print r1.group(1), len(r1.group())
else:
print 'not match'

0

投稿

猜你喜欢

Python标准库sched模块使用指南
事件调度sched 模块内容很简单，只定义了一个类。它用来最为一个通用的事件调度模块。class sched.scheduler(timef
python用pickle模块实现“增删改查”的简易功能
pickle的作用：1：pickle.dump(dict,file)把字典转为二进制存入文件.2：pickle.load(file)把文件二
Go gRPC服务双向流式RPC教程
前言上一篇介绍了客户端流式RPC，客户端不断的向服务端发送数据流，在发送结束或流关闭后，由服务端返回一个响应。本篇将介绍双向流式RPC。双向
详解Golang中Channel的用法
如果说goroutine是Go语言程序的并发体的话,那么channels则是它们之间的通信机制。一个channel是一个通信机制，它可以让一
DIV+CSS设计时容易犯的一些错误
CSS＋DIV是网站标准（或称“WEB标准”）中常用的术语之一，通常为了说明与HTML网页设计语言中的表格（table）定位方式的区别，因为
MySQL数据库之索引详解
今天继续给大家介绍MySQL相关知识，本文主要内容是MySQL索引相关内容。一、MySQL索引简介索引是MySQL数据库为了加快数据查询的速
ASP技巧：禁用清除页面缓存的五种方法
1、在Asp页面首部加入Response.Buffer = True Response.ExpiresAbso
Python3.2中的字符串函数学习总结
Sequence Typessequence类型有六种：strings, byte sequences (bytes objects), b
Mysql 数据库双机热备的配置方法
mysql数据库没有增量备份的机制，当数据量太大的时候备份是一个很大的问题。还好mysql数据库提供了一种主从备份的机制，其实就是把主数据库
Bootstrap Multiselect 常用组件实现代码
实际的项目网站中或多或少的或用到多选框，我选用的一款是 Bootstrap Multiselect。官
在Python中使用Neo4j的方法
Neo4j是面向对象基于Java的，被设计为一个建立在Java之上、可以直接嵌入应用的数据存储。此后，其他语言和平台的支持被引入，Neo4
用ajax实现的自动投票的代码
一朋友委托我帮他投票，地址在： http://publish.sina.com.cn/04/13/413/search.php 投票的链接是
asp vbcrlf是什么意思
代码如下:vbcrlfvbs常量相当于vbcr & vblf 就是常见的那个 chr(13) & chr(10),用Chr(
一步步教你安装VSCode(附带图解步骤)
一、前端工具vscode1.1、概述前端开发是创建Web页面或app等前端界面呈现给用户的过程，通过HTML，CSS及JavaScript以
Tornado 多进程实现分析详解
引子Tornado 是一个网络异步的的web开发框架, 并且可以利用多进程进行提高效率, 下面是创建一个多进程 tornado 程序的例子.
简单说明Python中的装饰器的用法
装饰器对与Python新手以至于熟悉Python的人都是一个难理解, 难写的东西. 那么今天就分享一下我对Python 装饰器的理解所谓装饰
Web开发之JavaScript
小引笔者认为web开发包括设计html，javascript,css，以及一种高级语言，比如c#,java等等，本文分为三部分，第一部分为
PyQt Qt Designer工具的布局管理详解
前言这节课很重要。。界面整洁美观与否就看布局了。。这里讲布局方法，至于设计的天赋与最终界面的美感那就看造化了。。本文主要讲述Qt Desig
浅析BootStrap模态框的使用(经典)
BootStrap模态框简单概述Bootstrap Modals（模态框）是使用定制的 Jquery 插件创建的。它可以用来创建模态窗口丰富
安装mysql8.0.11及修改root密码、连接navicat for mysql的思路详解
1.1. 下载：官网下载zip包，我下载的是64位的：下载地址：https://dev.mysql.com/downloads/mysql/

Django model 中设置联合约束和联合索引的方法

用Python实现大文本文件切割的方法

人工智能学习pyTorch的ResNet残差模块示例详解

通俗的讲解深度学习中CUDA,cudatookit,cudnn和pytorch的关系

Tortoise-orm信号实现及使用场景源码详解

基于Python实现视频转字符画动漫小工具

数据挖掘之Apriori算法详解和Python实现代码分享

用 Python 定义 Schema 并生成 Parquet 文件详情

MediaPipe API实现骨骼识别功能分步讲解流程

Python流程控制语句的深入讲解

XP系统如何设置虚拟内存教你如何设置XP系统虚拟内存

荒野乱斗公牛在各模式下强度如何？

Keep如何隐藏跑步地图_Keep隐私地图设置

Word中进行封面、目录与正文设置不同页码的操作方法

win10系统占用多少内存空间？windows10系统占多大内存空间详解

win10桌面便签功能快速打开方法

win10系统切换账户、桌面、应用、设置等常见问题

LOL云顶之弈赌炸弹人怎么玩？

Win10下IE等浏览器无法上网的解决办法

宝可梦剑盾草系道馆如何通关？草系道馆通关流程图文分享

手机版 网络编程 asp之家 www.aspxhome.com