网站运营
位置:首页>> 网站运营>> 信息过量抓取有限:谈搜索引擎相关性技

信息过量抓取有限:谈搜索引擎相关性技

作者:思亿欧 来源:seo.com.cn 发布时间:2008-11-12 11:28:00 

标签:搜索引擎,PageRank,原理,排序

相关性,是搜索引擎优化中的重点。但是对于相关性的搜索引擎工作原理,相信大部分的SEOER对于都缺乏了解。但是只需要我们主流搜索引擎技术的方向,你就可以知道搜索引擎时代的脉搏。

相关度,排序技术的产生主要是由搜索引擎的特点决定的。

首先,现代搜索引擎能够访问的Web网页数量已经达到上十亿的规模,哪怕用户只是搜索其中很少的一部分内容,基于全文搜索技术的搜索引擎也能返回成千上万的页面。即便这些结果网页都是用户所需要的,用户也没有可能对所有的网页浏览一遍,所以能够将用户最感兴趣的结果网页放于前面,势必可以增强搜索引擎用户的满意度。

其次,搜索引擎用户自身的检索专业能力通常很有限,在最为普遍的关键词检索行为中,用户一般只是键人几个词语。例如,Spink等曾对Excite等搜索引擎的近300位用户做过实验调查,发现人均输入的检索词为3.34个。国内部分学者也有相似的结论,发现90%左右的用户输入的中文检索单字为2~6个,而且2字词居多,约占58%,其次为4字词(约占18%)和3字词(约占14%)。

过少的检索词事实上无法真正表达用户的检索需求,而且用户通常也不去进行复杂的逻辑构造,只有相当少的用户进行布尔逻辑检索、限制性检索和高级检索等方法,仅有5.24%的检索式中包含有布尔逻辑算符。

国内的部分学者的研究结果也表明,约40%的用户不能正确运用字段检索或二次检索,80%左右的用户不能正确运用高级检索功能,甚至还发现用户缺乏动力去学习复杂的检索技能,多数用户都寄希望于搜索引擎能够自动地为他们构造有效的检索式。由于缺乏过去联机检索中常常具备的检索人员,因此,用户实际的检索行为与用户理想的检索行为存在事实上的差距,检索结果的不满意也是不奇怪的。正是由于这个特点,搜索引擎就必须设法将用户最想要的网页结果尽可能地放到网页结果的前面,这就是网页相关度排序算法在搜索引擎中为什么非常重要的原因。

0
投稿

猜你喜欢

手机版 网站运营 asp之家 www.aspxhome.com