使用Abot中文分词组件来开发ASP站内搜索引擎
来源:西祠 发布时间:2007-10-18 13:36:00
标签:分词,abot,搜索
1、汉语分词的由来使用ASP开发的中小企业的网站,对于站内搜索,往往只是简单的通过SQL语句匹配数据库。对于比较短的词语搜索,这个方法是有效的;但对于相对较长的词语,其局限性不难看出。
举个例子:1、用户在中小企业网站上搜索"宾馆",简单的SQL语句模糊查询,可以得到想要的结果,这是没有问题的。2、用户搜索"上海的宾馆",那么这个通过上述方法就很难找到答案了。这种情况下,我们有必要引入汉语分词机制,将"上海的宾馆"分解为"上海"、"宾馆","的"可以省略,然后根据拆分的词语,到数据库中去匹配答案。
2、ASP环境下的分词组件由于ASP是解释性语言,用ASP开发一套汉语分词系统的可行性不大。我们这里通过类似ASP调用ODBC等组件的方式,调用汉语分词组件。目前支持这方面的功能的组件不是很多,但是google一把,还是大海捞针找到了一个,在这里推荐给大家。
组件名称:Abot汉语分词系统使用方法:直接执行安装,分词组件会在系统中自动注册。在安装目录下,可以找到ACWPSCOM.asp的文件,是例子。
3、调用方法
Step 1:安装ACWPS20.exe
Step 2: 编辑ASP文件
'装载组件
Set obj = Server.CreateObject("ACWPSCOM.ACWPS")
'先装载词典
obj.init_Dict()
'然后分词
strRes = obj.doCWP("上海的宾馆", 12, 124)
strRes = obj.doCWP("要分词的内容", 12, 124)
'分词完成后释放词典
obj.release_Dict()
'释放组件
set obj = nothing
要分词的内容可以通过参数传递过来;strRes是分词的结果,用'|'分隔开了。我们用asp提供的Split函数,将结果保存到一个数组里。
Dim WordArrayWordArray = Split(strRes, "|")
Dim ArraySize As IntegerArraySize = UBound(WordArray)
For i = 0 To ArraySize - 1
search_db (WordArray(i))
Next
如此以来,在ASP环境下也可以做出功能强大的站内搜索引擎,就这么简单。
0
投稿
猜你喜欢
- 前言本文主要讲述numpy数组的计算与转置,讲相同尺寸数组的运算与不同尺寸数组的运算,同时介绍数组转置的三种方法。numpy数组的操作比较枯
- 一、简介本篇文章将通过实现一个简易版的Web服务器,帮助读者理解Python网络编程的基本概念和技巧。我们将分为以下几个部分来展开本文的内容
- 阅读目录什么是设计模式单体模式:工厂模式:单例模式观察者模式(发布订阅模式)策略模式模板模式代理模式外观模式设计模式太多了,貌似有23种,其
- 作者:AngelGavin 出处:CSDNInternet Explorer 5.0 对 XML 提供哪个级别的支持?Inter
- 代码很简单,会继续完善。。。 按住鼠标键不动,拖动鼠标,会看到效果 <html> <head&
- 定义神经网络继承nn.Module类;初始化函数__init__:网络层设计;forward函数:模型运行逻辑。class NeuralNe
- MySQL 当记录不存在时插入(insert if not exists) 在 MySQL 中,插入(insert)一条记录很简单,但是一些
- 1.高阶函数# 1.变量指向函数# 调用函数和函数本身print("-10的绝对值为:",abs(-10))print(
- 以下的文章主要是介绍SQL Server数据转换服务的4妙用之执行一些自动化的操作。在SQL Server数据库的实际操作管理中,数据库管理
- 本文记录了mysql 8.0.12 安装配置方法,供大家参考,具体内容如下1、从官网下载MySQL for Windows:https://
- Hello,World,几乎是程序猿学习各种语言的第一个程序,心血来潮,有空拿主流开发语言如何实现,汇总并整理了下.包括大致快速了解下这门语
- 【OpenCV】⚠️高手勿入! 半小时学会基本操作 ⚠️ 图像轮廓概述OpenCV 是一个跨平台的计算机视觉库, 支持多语言, 功能强大.
- APSchedulerAPScheduler 四个组件分别为:调度器(scheduler)、触发器(trigger),作业存储(job st
- 系列前言这个系列是我第一个想要更下去的系列。每篇会全面介绍一个 OpenCV 函数,会给出 API 和示例。示例主要是用 Python 去写
- 1. 概述在Numpy 1.24版本中,删除了像np.float、np.int 这样的 Python 内置类型的 alias,因此以后在代码
- PS:这段时间有点不在状态,刚刚找回那个状态,那么我们继续曾经的梦想今天我们来补充一下文件的上传的几种方式:首先我们先补充的一个知识点:一、
- 关于鼠标回调函数的说明可以参考:opencv-python的鼠标交互操作cv2.rectangle()函数说明参数说明导入cv2后,通过he
- 代码实现:<!DOCTYPE html><html lang="en"><head>
- 使用php就不一样了,php包含了zlib的链接库,可以直接使用其相关功能,下面是我写的压缩和结压缩swf文件的例子: //没有加入判断sw
- 不过首先你会发现,你在不同的地区或者不同的网络(电信、联通、移动)的情况下,转换后的IP地址很可能是 不一样的,这首先涉及到负载均衡的第一步