ASP小偷(远程数据获取)程序的入门教程
来源:CSDN 发布时间:2007-09-21 12:48:00
标签:小偷,采集,xml
这里所说的“小偷”指的是在ASP中运用XML中的xmlhttp组件提供的强大功能,把远程网站上的数据(图片,网页及其他文件)抓取采集到本地,经过各种处理后显示到页面上或者存储进数据库的一类程序。你可以通过这种小偷程序,完成过去一些似乎完全不可能实现的任务,比如说把某个站的页面偷梁换柱后变成自己的页面,或者把某个站的一些数据(文章,图片)保存到本地数据库中加以利用。
“小偷”的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省大量的服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。缺点在于:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。怎么样,听起来很神奇吧?我们现在就开始来学习一些“小偷”程序的入门知识吧!
我们拿个简单点的东西来研究一下吧,qq网站上的天气预报程序
代码如下:
1<%
2On Error Resume Next
3Server.Scripttimeout=9999999
4Function Gethttppage(Path)
5T = Getbody(Path)
6Gethttppage=Bytestobstr(T,"Gb2312")
7End Function
8
9’ 首先,进行小偷程序的一些初始化设置,以上代码的作用分别是忽略掉所有非致命性错误,把小偷程序的运行超时时间设置得很长(这样不会出现运行超时的错误),转换原来默认的utf-8编码转换成gb2312编码,否则直接用xmlhttp组件调用有中文字符的网页得到的将是乱码。
10
11Function Getbody(Url)
12On Error Resume Next
13Set Retrieval = Createobject("Microsoft.Xmlhttp")
14With Retrieval
15.Open "Get", Url, False, "", ""
16.Send
17Getbody = .Responsebody
18End With
19Set Retrieval = Nothing
20End Function
21
22’然后调用xmlhttp组件创建一个对象并进行初始化设置。
23
24Function Bytestobstr(Body,Cset)
25Dim Objstream
26Set Objstream = Server.Createobject("Adodb.Stream")
27Objstream.Type = 1
28Objstream.Mode =3
29Objstream.Open
30Objstream.Write Body
31Objstream.Position = 0
32Objstream.Type = 2
33Objstream.Charset = Cset
34Bytestobstr = Objstream.Readtext
35Objstream.Close
36Set Objstream = Nothing
37End Function
38
39Function Newstring(Wstr,Strng)
40Newstring=Instr(Lcase(Wstr),Lcase(Strng))
41If Newstring<=0 Then Newstring=Len(Wstr)
42End Function
43
44’处理抓取回来的数据需要调用adodb.Stream组件并进行初始化设置。%>


猜你喜欢
- 之前很多次用到的时候总会忘一些,这次记下来,后面再忘了就直接来这查~。string转其它string --> int:将字符串13转换
- (一)Python 是如何进行内存管理的?答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制⒈对象的引用计数机制Pyth
- dotnet run 介绍dotnet 相关命令是属于 .NET Core command-line (CLI) 的一部分,Microsof
- 用tensorflow构建简单的线性回归模型是tensorflow的一个基础样例,但是原有的样例存在一些问题,我在实际调试的过程中做了一点自
- 通常操作系统和软件开发包中都包含文本编辑器,可以用来编辑配置文件,文档文件和源代码。下面是笔者总结的10个最好的免费代码文本编辑器:1.NO
- 本文实例为大家分享了python获取本机所有IP地址的具体代码,供大家参考,具体内容如下import socket# 查看当前主机名prin
- 说明和代码如下:<%@ language = vbscript%><% 
- 大部分面向对象的编程语言(除了C++)都只支持单继承,而不支持多继承,为什么呢?因为多继承不仅增加编程复杂度,而且容易导致莫名其妙的错误。P
- 我们都知道Jupyter notebook更换主题后看着会很舒服,但是有个问题主题更换后工具栏不显示了。usename$ jt -lAvai
- 本文为大家分享了mysql 5.7.17 winx64解压版安装配置方法,供大家参考,具体内容如下一、下载下载地址二、配置1. 解压下载的m
- 前言本篇文章介绍如何查询 Binlog 的生成时间。云上 RDS 有日志管理,但是自建实例没有,该脚本可用于自建实例闪回定位 Binlog
- 一、selenium截取验证码import jsonfrom io import BytesIOimport timefrom test.t
- python的numpy库提供矩阵运算的功能,因此我们在需要矩阵运算的时候,需要导入numpy的包。一、numpy的导入和使用from&nb
- 正则表达式正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为&q
- 我的数据库如图结构我取了其中的name age nr,做成array,只要所取数据存在str型,那么取出的数据,全部转化为str型,也就是a
- 关于代码调试的技巧,我之前写过很多的文章,关注比较早的同学,也应该都有看过。还没看过的同学,欢迎前往查阅:更多Python代码调试技巧其中有
- 1. 需要用到的Python库pygametkinter2. 简易UI设计audio_player = Tk()audio_player.t
- 根据代码中运行的结果来看,主要由以下几种:1. sum():将array中每个元素相加的结果2. axis对应的是维度的相加。比如:1、ax
- 起步在django框架中,用的是 pytz 库处理时区问题,所以我也尝试用这个库来处理。但发现了一个奇怪的问题:import datetim
- vue异步更新源码中会有涉及事件循环、宏任务、微任务的概念,所以先了解一下这几个概念。一、事件循环、宏任务、微任务1.事件循环Event L