网络编程
位置:首页>> 网络编程>> Asp编程>> asp 采集程序常用函数分析

asp 采集程序常用函数分析

 来源:asp之家 发布时间:2011-03-16 11:03:00 

标签:asp,采集程序

原理
采集程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。比如新闻采集程序,很多都是调用了sina的新闻网页,并且对其中的html进行了一些替换,同时对广告也进行了过滤。用采集程序的优点有:无须维护网站,因为采集程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般采集程序就几个文件,所有网页内容都是来自其他网站。缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么采集程序也要进行相应修改;速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。

一、事例
下面就XMLHTTP在ASP中的应用做个简单说明

代码如下:


<%
'常用函数
'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码

function getHTTPPage(url) 
dim Http 
set Http=server.createobject("MSXML2.XMLHTTP") 
Http.open "GET",url,false 
Http.send() 
if Http.readystate<>4 then 
exit function 
end if 
getHTTPPage=bytesToBstr(Http.responseBody,"GB2312") 
set http=nothing 
if err.number<>0 then err.Clear 
end function '2、转换乱玛,直接用xmlhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换

Function BytesToBstr(body) 
dim objstream 
set objstream = Server.CreateObject("adodb.stream") 
objstream.Type = 1 
objstream.Mode =3 
objstream.Open 
objstream.Write body 
objstream.Position = 0 
objstream.Type = 2 
objstream.Charset = "GB2312" '转换原来默认的UTF-8编码转换成GB2312编码,否则直接用XMLHTTP组件调用有中文字符的网页得到的将是乱码 
BytesToBstr = objstream.ReadText 
objstream.Close 
set objstream = nothing 
End Function 
Dim Url,Html 
Url=http://www.cidianwang.com; 
Html = getHTTPPage(Url) 
Response.write Html 
%> 

二、几个常用的函数
(一)InStr 函数
描述
返回某字符(string2)串在另一字符串(string1)中第一次出现的位置。
语法
InStr(string1, string2)
例如:

Dim SearchString, SearchChar 
SearchString ="http://www.cidianwang.com" ' 要在其中搜索的字符串。 
SearchChar = "jb51" ' 搜索 "jb51"。 
MyBK = Instr(SearchString, SearchChar) ' 返回 8 
'如果找不到则返回“0”,例如: 
SearchChar = "BK" 
MyBK = Instr(SearchString, SearchChar) ' 返回 0 (二)Mid 函数
描述
从字符串中返回指定数目的字符。
语法
Mid(string, start, over)
例如:
Dim MyBK
MyBK = Mid("我们的BK(www.google)设计", 7, 12) '截取字符串"我们的BK(www.google)设计"第7个字符以后的12个字符
'此时MyBK的值就变成了"www.google"
(三)Replace 函数
Dim SearchString, SearchChar
SearchString ="我们的BK设计是一个网站建设资源网站" ' 要在其中搜索的字符串。
SearchString =Replace(SearchString,"BK设计","Www.google")
'此时SearchString的值就变成了"我们的Www.google是一个网站建设资源网站"

0
投稿

猜你喜欢

  • 这个仿msn的右下角popup提示窗口效果很久以前收集的,现在整理出来给大家分享,需要的朋友可以拿去用,特点,提示窗口内容和js代码分离容易
  • 原文:Creating a Star Rater using CSS链接:http://komodomedia.com/blog/index
  • replace 方法返回根据正则表达式进行文字替换后的字符串的复制。stringObj.replace(rgExp, replaceText
  • 现在我将清除页面缓存的一些方法总结如下:1、在Asp页面首部加入<% Response.Buffer = True
  • aspjpeg版本:v1.801  将pic.jpg打上logo.png,可根据图片大小对水印图做适当调整 &
  • 人的大脑通过双眼来辨别视觉图形获取信息。大脑根据储存的经验,将所看到的视觉图形建立起优先级。由此可见,一个良好的视觉设计可以帮助大脑迅速有效
  • 要使数据库具备更强的抵御侵犯的能力,你要采取几步措施。有些措施只是良好的服务器管理的一部分,如拥有SQL Server最新的补丁,其他则包括
  • 用新云还不是很熟,一点点学习中。今天遇到一个文章列表前有小圆点的问题,把去除方法记一下。文章列表前有小圆点有这么几种情况:1、li的默认样式
  • 利用FSO取得BMP,JPG,PNG,GIF文件信息:大小,宽、高尺寸等 ’:::::::::::::::::::::::::::
  • 在windows操作系统上使用IE作为浏览器时。常常会发生这样的问题:在浏览使用UTF-8编码的网页时,浏览器无法自动侦测(即没有设定“自动
  • 安装时建议你为MySQL管理创建一个用户和组。由该组用户运行mysql服务器并执行管理任务。(也可以以root身份运行服务器,但是不推荐)第
  • 今天在群(CSS森林:30247792)里讨论了border的样式写法,发现border的写法还真是灵活,做了一下总结,希望对大家有用:bo
  • 可以使用 XDR(简化 XML-Data)架构创建关系数据的 XML 视图。然后可以使用 XPath 查询来查询这些视图。这类似于使用 CR
  • 最近,在搞这个东西,网上也找不到asp相关的,如果有人很早弄出来了,也不要笑话偶;费了好久,总算搞定;原理:用stream对象预读文件的头两
  • asp时间加减运算 和转换问题 a=2007-07-24 2:23:15 b=2005-06-25 2:23:15 问题1 如何将a转换成2
  • 你不可能随时备份数据,但你的数据丢失时,或者数据库目录中的文件损坏时, 你只能恢复已经备份的文件,而在这之后的插入或更新的数据,就无能为力了
  • 人们对于产品设计这类事情,往往容易眼高手低,在宇宙层面上夸夸其谈,却落不了地,只能飘着。真正到了自己动手的时候,才会发现问题很多,实践和理论
  • asp函数实现把数字格式化为每3个数字时以逗号间隔的数字见下:<%Function Comma(str)If No
  • 使用SQL SERVER的[导入]功能,便可将access数据转换,但要注意原来的'自增字段'需要修改,将相应字段标识修改为
  • 第一招、mysql服务的启动和停止net stop mysqlnet start mysql第二招、登陆mysql语法如下: mysql -
手机版 网络编程 asp之家 www.aspxhome.com