asp 小偷采集程序原理与常用函数方法(2)
来源:asp之家 发布时间:2011-03-06 10:36:00
二、几个常用的函数
InStr 函数
描述 返回某字符(string2)串在另一字符串(string1)中第一次出现的位置。
语法 InStr(string1, string2)
例如:
Dim SearchString, SearchChar
SearchString ="http://www.cidianwang.com" ' 要在其中搜索的字符串。
SearchChar = "blue1000" ' 搜索 "blue1000"。
MyBK = Instr(SearchString, SearchChar) ' 返回 8
'如果找不到则返回“0”,例如:
SearchChar = "BK"
MyBK = Instr(SearchString, SearchChar) ' 返回 0
Mid 函数
描述: 从字符串中返回指定数目的字符。
语法 Mid(string, start, over)
例如:
Dim MyBK
MyBK = Mid("我们的BK(www.cidianwang.com)设计", 7, 12) '截取字符串"我们的BK(www.cidianwang.com)设计"第7个字符以后的12个字符'
Replace 函数
Dim SearchString, SearchChar
SearchString ="我们的BK设计是一个网站建设资源网站" ' 要在其中搜索的字符串。
SearchString =Replace(SearchString,"BK设计","www.cidianwang.com")'此时SearchString的值就变成了"我们的www.cidianwang.com是一个网站建设资源网站"
三、截取指定区域的HTML代码
例如我只想获取以下HTML代码中"<td>"和"</td>"之间的的文字部分:
<html>
<title>BK(www.cidianwang.com)谷歌搜索引擎</title>
<body>
<table>
<tr><td></td></tr>
<tr><td id="Content">(www.cidianwang.com)词典网是个资源多多的站点……</td></tr>
</table>
</body>
</html>
<%
……
Dim StrBK,start,over,RsBK
StrBK=getHTTPPage(网页的地址)
start=Instr(StrBK,"<td id=""Content"">") '此处的作用是获取字符串开始地方的定位。这里要有人问了:原来的代码是<td id="Content">,怎么你这里调用的是<td id=""Content"">啊?答案:asp中(准确的说是VBscript中是用两个双引号来表示一个双引号的,因为双引号对于程序来说是个敏感字符。) over=Instr(StrBK,"…</td></tr>")'此处的作用是获取字符串结束地方的定位。'这里又要有人问了:( :程序调用HTML代码干吗前面多出来3个点点"…"啊?答:提示:上面一行也有一个</td></tr>,如果这里用</td></tr>来定位的话,程序会错误地把上面一行的</td></tr>当成欲获取字符串的结束部分了。 RsBK=mid(StrBK,start,over-start) '此处的作用是取出StrBK中第start个字符到第over个字符之间的字符串。mid函数前面一节我也讲过了;over-start是为了计算出开始位置和结束位置之间的距离,也就是字符数。
response.write(RsBK) '最后输出程序获取的内容
%>
不要高兴的太早,当你运行的时候,你会发现页面的html代码有错误,为什么呢?因为你获取的html代码是:<td id="Content">(www.cidianwang.com)词典网是个资源多多站点…
看到了吧?有残缺的HTML代码啊!怎么办呢?start=Instr(StrBK,"<td id=""Content"">")这个语句获取的是"<td id="Content">"在
StrBK中的位置数,现在我们可以在程序语句的后面加上17,那么程序就会将位置指向<td id="Content">后面的那个字符.
好的,程序将改成这样:
<%
……
Dim StrBK,start,over,RsBK
StrBK=getHTTPPage(网页的地址)
start=Instr(StrBK,"<td id=""Content"">") + 17
over=Instr(StrBK,"…</td></tr>") '这里你也可以减去七(-7)把3个点去掉
RsBK=mid(StrBK,start,over-start)
response.write(RsBK)
%>
这样就OK了,我们就可以将我们想要的东西偷过来显示在我们自己的页面了,呵呵~
四、删掉或修改获取的字符
将RsBK中的"BK(www.cidianwang.com)"换成"BK":
RsBK=replace(RsBK,"BK(www.cidianwang.com)","BK")
或者直接把"(www.cidianwang.com)"删掉:
RsBK=replace(RsBK,"(www.cidianwang.com)","")
好了,现在RsBK就变成了:"BK谷歌搜索引擎是个资源多多的站点……"了.但是事实中,有些情况可能replace函数是不适应的,比如我们想把某个字符串里面的所有连接都去掉.连接可能包括很多种类型,replace只能替代其 * 定的一个,我们不可能用一个又一个对应的replace函数来替换吧?


猜你喜欢
- 1、文件编码:指的是页面文件(.html,.php等)本身是以何种编码来保存的。记事本和Dreamweaver在打开页面时候会自动识别文件编
- 新一代W3C,xhtml代码规范,大家在设计网站的时候务必遵循这一规范 ,这将对网站的优化,网站的推广,搜索引擎的友好
- SQL错误日志记录了数据库运行过程的遇到的各种问题及一些重要信息,作为排错需要,我们通常都不会主动去清理这些日志文件,只有每次重启服务器时,
- 1 用mysql客户端登入 2 选择数据库 mysql>use test 3 查询当前数据库有哪些存储过程 mysql>show
- '****'函数名称: strReplace(Str)'函数功能: 过滤单引号'参数说明: Str 
- 一. 分析需求1. 需求说明在项目开发过程中,我们有时会频繁的更新代码, 流程大概为:(1) 本地git push提交代码至git托管平台(
- 本文实例讲述了Python模拟登录12306的方法。分享给大家供大家参考。具体实现方法如下:#!/usr/bin/python# -*- c
- django-debug-toolbar介绍django-debug-toolbar 是一组可配置的面板,可显示有关当前请求/响应的各种调试
- 1、前言通常,我们在开发过程中,难免需要去部署我们的服务,但是,我们应该如何去做呢?如果主机重启了,服务怎么自己启动呢?可能你的心里已经有了
- 前言在这篇文章中,准备用 Python 从头开始实现一个全连接的神经网络。你可能会问,为什么需要自己实现,有很多库和框架可以为我们做这件事,
- 目录1.字典的介绍2.访问字典的值(一)根据键访问值(二)通过get()方法访问值3.修改字典的值4.添加字典的元素(键值对)5.删除字典的
- 目前python 提供了几种多线程实现方式 thread,threading,multithreading ,其中thread模块比较底层,
- ECharts作为一个图标库已经被大家广泛使用,它提供了各式各样的图表类型,但是在我们日常使用中可能只会用到其中的某几个图表类型,常用的基本
- 实战目的封装一个自定义的input组件,只适用于 input元素type属性为text或password.实战效果核心思想准备: 需要两个文
- 首先要明确,python里有json这个库,但并没有json这个类,所以所谓的json对象本质上就是一个dict;而json这个库,用于实现
- 今天有人问起,晚上试着写出来,供参考; 以下代码兼容主流浏览器IE6、IE7、Firefox、Opera。从最简单的开始…………一
- 问题定义一个int型的一维数组,包含40个元素,用来存储每个学员的成绩,循环产生40个0~100之间的随机整数,(1)将它们存储到一维数组中
- 目录问题注意总结问题如何在一张表上对多个表进行外键关联from django.db import modelsclass Appliance
- python变量1. 定义变量 (创建变量)变量就是一种用来保存数据的容器,使用变量就是使用变量中保存的数据语法:变量名 = 数据1.变量名
- 有时候我们想要的数据合并结果是数据的轴向连接,在pandas中这可以通过concat来实现。操作的对象通常是Series。Ipython中的