避免Adodb.Stream输出UTF-8时自动写入的BOM(asp)
作者:zhtc009 发布时间:2011-08-24 20:32:56
asp生成html如果采用utf8编码方式,多数采用的是Adodb.Stream组件,因为fso并不能支持Utf-8
最近在写一个生成HTML页面的程序,模板是一个UTF-8的HTML文件,在这个文件里已经去除了BOM。现在用ADODB.STREAM读取模板,添加内容,然后输出为UTF-8的HTML网页。但我检查这个HTML时发现被自动加上了BOM。导致<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">申明错误,从而使div布局的页面样式发生错误。
关于什么是BOM这里不作讨论,如果不明白可以去google一下,但是在这个实例中我们不希望文件开头包含这个BOM。
有没有解决办法?
最直接简单的做法可以这样:
我们已经知道BOM占用3个字节,那么我们可以在stream中写入UTF-8字符串之后,将stream转换为二进制类型,然后跳过头3个字节,并将剩下的字节用CopyTo()方法拷贝到一个新的stream中去。不过这样好像有潜在的很严重的性能问题,如果这个文本流比较大,那么处理这个流是不是就要耗费双倍的资源?
那我们将上面的方案改进一下。
经过测试发现,stream在“UTF-8”编码的Text方式下首次调用WriteText()方法时,会自动在stream的最开始加入3个字节。
更严格的说,在以下状态下
stream.Position = 0; // 流的位置在最开始时
stream.Type = 3; // adTypeText
stream.Charset = 'UTF-8';
调用stream.WriteText()方法时,stream会自动先在流的最开始插入3个字节的BOM。
而stream.Position在任何非0值的情况下,调用WriteText()方法都不会再插入BOM了,可以利用这一点来避免自动插入BOM。
假如我们需要朝stream中写入10个UTF-8字符,我们先按照通常方式在一个刚创建的stream中只写入第一个UTF-8字符。
之后将stream转换为二进制类型(adTypeBinary),跳过stream开始的3个BOM字节,并读出剩余的字节(这些字节应该只包含刚刚一个字符的数据,不含其它杂质)。
再回到流的开始,将刚刚读出的字节重新写入流,写完后立即调用SetEOS()方法将当前位置设为流末尾。
然后将stream重新转换回文本类型(adTypeText),并将流当前位置移到流末尾。
此时继续写入剩余的9个UTF-8字符,stream会将其编码后的字节数据直接添加到尾部,而不会再插入BOM了。
此后若需要继续往stream中写入文本,直接调用WriteText()方法即可。
通过测试可以发现,如上方式写入的UTF-8字符串通过ReadText()方法也能正常读出,但是stream.Size却比传统方式直接写入UTF-8的stream小3,很明显就是少了那3个“多余”的BOM字节。
问题到此还未结束。
此时你可能想直接调用stream.SaveToFile()方法保存到文件,你可能会发现,这时保存的文件中还是带有BOM,上述方法无效?
出现这种情况,是因为你漏掉了关键的一步:在调用SaveToFile()方法之前,需要将流转换为二进制类型。
原来还是Adodb.Stream在自作聪明,输出的时候发现UTF-8文本流的开头缺少BOM,又会再次将其加上。
但是若将流类型改为二进制,输出时就可以绕过Adodb.Stream的BOM监测了。
'***********************************************
'函数名:LoadFile
'作 用:利用ADODB.Stream读取模板文件
'参 数:File:要读取的文件
'Author:Evller
'***********************************************
Function LoadFile(ByVal File)
Dim objStream
On Error Resume Next
Set objStream = Server.CreateObject("ADODB.Stream")
If Err.Number=-2147221005 Then
Response.Write "<div align='center'>非常遗憾,您的主机不支持ADODB.Stream,不能使用本程序</div>"
Err.Clear
Response.End
End If
With objStream
.Type = 2
.Mode = 3
.Open
.LoadFromFile Server.MapPath(File)
If Err.Number<>0 Then
Response.Write "<div align='center'>文件<font color='#ff0000'>"&File&"</font>无法被打开,请检查是否存在!</font></div>"
Err.Clear
Response.End
End If
.Charset = "utf-8"
.Position = 2
LoadFile = .ReadText
.Close
End With
Set objStream = Nothing
End Function
'******************************************************************************
'函数名:SaveToFile
'作 用:生成html静态页面,去掉bom标签文件
'参 数: Content内容,FileName路径
'Author:Evller
'******************************************************************************
Sub SaveToFile (Content,FileName)
dim stm:set stm=server.CreateObject("adodb.stream")
stm.Type=2 '以文本模式读取
stm.mode=3
stm.charset="utf-8"
stm.open
stm.Writetext (content)
stm.Position = 3
dim newStream:Set newStream = Server.CreateObject("adodb.stream")
With newStream
.Mode = 3
.Type = 1
.Open()
End With
stm.CopyTo(newStream)
newStream.SaveToFile server.MapPath(FileName),2
stm.flush
stm.Close
Set stm = Nothing
Set newStream = Nothing
End Sub
实例:
List="news list!"
Content=LoadFile("template.htm")'先利用LoadFile读取模板template.htm内容
Content = Replace(Content,"{$list$}",list)'把模板中的内容替换
Call SaveToFile(Content,"index.htm")'生成文件html文件
Response.Write "生成成功!"
下载Demo :demo.rar (1.77 KB)
文章首发易维网络,转载请注明出处。


猜你喜欢
- Pytest和Unittest测试框架的区别?如何区分这两者,很简单unittest作为官方的测试框架,在测试方面更加基础,并且可以再次基础
- 转眼间上次写文章已经是 2022年12月15日的事情啦,本来从2022年7月份开始写作之后保持着每周一篇,然而从12月15日后断更了这么久,
- 一、变量的定义程序中,数据都是临时存储在内存中,为了更快速的查找或使用这个数据,通常我们把这个数据在内存中存储之后,给整个数据定义一个名称,
- 数字序号① ①② ②③ &
- 目录0. 前言1. 测试环境及关键代码解释1.1 测试环境2. 模块介绍及演示2.1 platform模块使用示例2.2 netifaces
- 如果你是个赛车手,并且按一下按钮就能够立即更换引擎而不需要把车开到车库里去换,那会是什么感觉呢?MySQL数据库为开发人员所做的就好像是按按
- 写这篇博客主要是因为在修改DataFrame列值的时候经常遇到bug,但到目前还没把这种错误复现出来。DataFrame是Pandas中的主
- Pytorch转ONNX的意义一般来说转ONNX只是一个手段,在之后得到ONNX模型后还需要再将它做转换,比如转换到TensorRT上完成部
- 最近在碰到有同学问我,vue父组件怎么使用外部对象,具体例子如下:有组件a:<div @click="onClick&quo
- innerHTML,outerHTML innerHTML检索或设置标签内的内容;outerHTML检索或设置整个标签的内容(包含标签)。&
- 在python中,通过导入random库,就能使用randint 和 randrange这两个方法来产生随机整数。那这两个方法的区别在于什么
- 使用SQLSERVER的应该经常遇到“Unable to read local eventlog (reason:事件日志文件已在读取时间更
- 在神经网络计算过程中,经常会遇到需要将矩阵中的某些元素取出并且单独进行计算的步骤(例如MLE,Attention等操作)。那么在 tenso
- 环境准备 python3.52 pycharm5.05 Pillow 自制的验证码工具包/utils/check_code 验证码的作用防恶
- SQLPlus是进行Oracle操作的主要前台工具,用户名和密码分别为用户名和密码,连接ORACLE数据库可见,显示的比较混乱,可以通过以下
- 最近游戏项目在多个国家上线,每个国家都对应两份儿svn目录(一份是本地策划目录,一份是线上目录)。于是乎维护变得很烦躁。需要先更新本地策划s
- 本文实例讲述了Python动态生成多维数组的方法。分享给大家供大家参考,具体如下:多维数组其实就是多个一维数组的嵌套,Python中有原生的
- 关于Python数据分析中pandas模块在输出的时候,每行的中间会有省略号出现,和行与行中间的省略号....问题,其他的站点(百度)中的大
- Python之POST调用Restful接口示例# -*- coding: utf-8 -*-import jsonimport reimp
- 1.获取当前时间的两种方法:import datetime,timenow = time.strftime("%Y-%m-%d %