Yahoo 搜索引擎优化和排名技术(2)
作者:lela 来源:SEO观察 发布时间:2008-01-07 12:27:00
二、分类原理
InternetScoutProject 的分类专家AimeeGlassel认为,“印度著名分类专家和图书馆专家阮岗纳赞的冒号分类法理论体系与Yahoo网络信息资源的主体目录之间存在着密切的联系”,从而揭示了Yahoo应用分面分析方法进行网络信息资源的分类实质。具体说来,可从以下几点来深入地理解Yahoo的分面分类原理或基本过程。
1. 采用宽泛的主题领域建立分类索引
为了使其分类体系既具有无限的容纳性,又具有相当的专指性,Yahoo采用较为宽泛的主题领域,通过分析兼综合的方法建立较为完整的分类索引。这与分面分类的思想不谋而合,因为将知识分为宽泛的类目即分面,多方面地反映主题内容以避免列举式类表的线性单向式的结构正是阮岗纳赞冒号分类法的主要原则所在。
2. 根据上下文进行信息内容的组合
从Yahoo 的分类结构外表看,也许会认为它与叙词表很相近,因为Yahoo也是使用词汇而非符号来组成相应的概念词串。但是,从组合类目的能力看,它远远比普通的叙词表复杂得多。通过分析Web页面的内容特征,得到由Yahoo分类体系结构中某些类目词组成的概念词串或标引词串,将其放入相应的类目层次中。在Yahoo的概念词串或检索词串中包含的独立的词汇都含有自身的名字,但是一旦与其它词组合,则产生了一个上下文关系,拥有了一深层次的涵义。从这一点上说来,与分面分类法也是极为相似的。
3.利用冒号标记信息内容
现以“20世纪60年代印度在肺结核治疗方面的研究”作为待分类标引的信息内容来具体考察两者的标记制度:
在阮岗纳赞的冒号分类法中,该内容标引为:L,45;421;6;253;f.44‘N5
用词代替相应的符号,则为:
Medicine,Lungs;Tuberculosis:Treatment;X-ray:Research.India‘1950
如果将分面公式中的相应标点符号用冒号代替,由此所形成的字符串形式就是在Yahoo中用于描述信息内容的 方法,相应地表示为:
Health:DiseasesandConditions:Tuberculosis
可见两者在信息描述上何其相似!Yahoo利用冒号作为统一的分隔符进行了信息内容的组织和描述,既保留了 原先的分面标记的特点,又在一定程度上简化了标记制度,从而极大地提高了信息分类标引的效率。
4. 提供不同的分类路径入口
“虚拟的信息集合”是Yahoo的一大优点,体现在其拥有的概念模式和引用次序(即分面排列次序)的灵活性上。在传统的图书馆中,一本书只能放在书架的某一固定位置上。但在数字化的世界里,电子信息资源却不用再限制在唯一的物理位置上。我们可以将某一信息源分到类目结构的不同位置上。通过将分面分析方法应用到网络信息资源的组织中,Yahoo能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,这样就使其能够从不同的路径,为检索相同内容的不同用户提供服务,从而完成查询。
例如,现欲查找美国Wisconsin-Madison大学所在的网页,Yahoo就能提供如下几种分类或检索路径:
(1)若从Regional:类目入手,则相应的分类路径为:Regional:U.S.States:Wisconsin:Cities:Madison:Education:CollegesandUniversities:
UniversityofWisconsin-Madison。
(2)若从Education类目入手,开始的几级路径为:Education:HigherEducation: CollegesandUniversities,在CollegesandUniversities目录下选择地理区域的子类目 “UnitedStates@”后,可以看到,又返回到Regional目录下,之后就与上述路径相同了。其中的奥妙就在于符号“@”的运用,它提供类似于相关参照(crossreference)的作用,能够指引用户由某一子类目进入Yahoo的浏览性等级结构的其它分支中。
猜你喜欢
- 随着google product search产品(http://www.google.com/prdhp?tab=wf)的低调上线,马总关
- Exchange 2007的变化包括:采用统一的收件箱,支持语音邮件,并改进了Outlook客户端电子邮件软件。①立即升级的公司廖廖无几。高
- 2)连接命令设置:前面介绍的是从根本上彻底解决windows 2000 server和windows 2003非人性化问题,将我们的系统设置
- 由于各种原因,我们有时候需要在一个IP地址上建立多个web站点,在IIS5中,我们可能通过简单的设置达到这个目标.在IIS中,每个 Web
- 网上翻阅了很多的资料,很多人都说用netstat无法查看单个商品的使用状况。其实,很简单,用以下命令就可以得到一个商品的占用善。以下是以11
- 个人化搜索给传统SEO(搜索引擎优化)带来的冲击是全方位的,虽然其影响将在今后的时间内逐渐显现出来,目前过早地对其下任何结论都显得草率,但无
- 10月14日下午消息,继数月前推出芒果手机游戏乐园之后,湖南卫视金鹰网又推出“芒果游戏乐园”的网络游
- 北京时间10月12日消息,国外著名科技博客Mashable发文称,日前英国《每日电讯报》曾宣称Twitter正在考虑增加视频消息功能,但Tw
- 如何从博客中扩展我们的外部链接。但需要申明一点的是:思亿欧所说的不是通过大量注册博客增加自己链接的方式。而是,参与到跟自己主题相关的博客中分
- site语法格式:site : 网址 关键词 或者 关键词 site : 网址注意事项:1、site:后边跟的冒号必须是英文的“:”,中文的
- Linux服务器操作已经非常简单,但是难免会有人犯下一些小的错误,比如说误删文件,该文章将告诉你如何快速解决此问题。服务器误删了/usr/b
- 由于Apache具有相当高的可移植性,它支持超过30种操作系统,包括Unix、Windows 及Darwin等系统,所以目前在网络上已注册的
- 备受业界关注的新浪分众合并案最终以失败告终。9月28日,新浪与分众传媒同时宣布,将不再延长去年十二月宣布的新浪与分众传媒合并交易的截止日。此
- Google的成功首先是技术的成功,Google的服务创造了无可争辩的社会价值。但是,公司的商业成功与否并不总是由其创造的社会价值所决定的(
- 说实话,今天讲这个主题纯属纸上谈兵,请各位高人莫怪,至今惭愧没有一个像样的站,不过因为经常为别人做技术以及做空间销售过程中接触过不少站长,了
- 首先我们来看看一些知名网站的名字吧,研究别人成功的经验总是有益处的,看看知名的网站:搜狐、新浪、中华网、8848等,无不简短易记。以chin
- 网络经济的持续发展,电子商务观念也得到大多数人的认同之际,一向在网络上从事窃取、破坏资料的黑客也同样变得异常活跃。黑客的网络捣乱行为每年可能
- 目前中国分类信息网的竞争可以说已经到了白炽化成程.口啤网目前来说还是处于导先地位,当然我今天不来批论这些网站的盈利情况.今天我们来看一下同城
- Exchange 2007的变化包括:采用统一的收件箱,支持语音邮件,并改进了Outlook客户端电子邮件软件。①立即升级的公司廖廖无几。高
- 在godaddy空间转移dedecms的问题,给大家说说,希望对大家有所帮助,毕竞用dede的人是不少了首先,我们备份旧的资料,我使用的是帝