网站运营
位置:首页>> 网站运营>> Google工程师 讲述网页搜索排名背后的技术

Google工程师 讲述网页搜索排名背后的技术

作者:Amit Singhal  发布时间:2008-08-02 12:51:00 

标签:google,排名,搜索

这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的理解。

Google 搜索排名的核心技术源自已有50年历史的学术课题 Information Retrieval (IR),IR 技术使用统计学原理对文字的使用频率等属性进行研究并对结果进行排名。建立在 IR 理论上的 Google 搜索同时借助链接,网页结构等等技术形成独特的搜索技术。

理解网页:

Google 多年来在网络爬虫与索引系统上投入巨资,因此,Google 拥有非常庞大并且是最新的网页索引,除此之外,Google 还使用一些最新技术提高索引质量,比如,他们开发了一种技术,可以在字面意思之外理解一个网页所表达的重要概念,人们使用意大利语言搜索 "galleria sprovieri londra",会找到伦敦的 Sprovieri Gallery,尽管 Sprovieri Gallery 主页上既没有 London,也没有 Londra 字样。在美国,人们搜索 "cool tech pc vancouver, wa",会找到 www.cooltechpc.com,然而 www.cooltechpc.com 的主页上没有任何文字表明他们位于 Vancouver。其它技术包括,区分一个网页中的重要或非重要文字,以及网页内容的新鲜度。

理解语义:

Google 可以通过用户提供的几个搜索关键词,理解用户的真实意图。他们在拼写纠正,词义,以及概念分析方面处于非常领先的位置。很多人都或多或少体验过 Google 的拼写纠正功能,比如搜索 "kofee annan",Google 会问你搜索的是否 "kofi annan",然而,当有人搜索 "kofee beans",Google 会纠正成 "coffee beans"。(Google 事实上已经在尝试语义技术 - 译者)

词义是 Google 尝试理解查询语义的基础,也是 Google 遇到的最大难题。一些在人看来显而易见的东西,机器却很难自动处理。用户并不想对使用什么词汇进行查询而费神,人们甚至压根不知道该使用什么进行查询。在这种时候,Google 的词义系统便可以发挥作用,词义系统可以对查询语句进行非常复杂的修正,比如,查询 "Dr Zhivago" 的时候,Google 知道 Dr 代表 Doctor ,而查询 "Rodeo Dr" 的时候,Dr 代表 Drive。用户搜索 "back bumper repair" 的时候,结果是 rear bumper repair,而搜索 "Ramstein ab",Google 能够将 ab 理解成 Air Base,"b&b ab" 会理解为 Alberta 的 Bed and Breakfasts 。Google 将这种词义理解系统发展到上百种不同语言。

Google 在搜索排名中使用的另一项技术是概念识别,该技术可以对查询的内容进行概念识别,比如,我们查询 "new york times square church",Google 知道我们实际上查询的是纽约时代广场上的那座著名教堂,而不是纽约时报中的某篇文章。概念识别技术并不止这些,Google 还对其进行加强以正确地识别语义,比如,搜索 "PC and its impact on people",事实上是搜索计算机对社会的影响。Google 的搜索分析算法中这类技术比比皆是,而且面向几乎所有语言。

理解用户:

Google 尝试理解用户的目的是为用户返回他们真正需要的结果,而不是他们在搜索语句中所说的东西。该技术基于一个世界级的本地化系统,外加先进的个性化技术,以及各种用户意图识别技术。

Google 对本地结果的重视体现在他们的本地化工作中。同样一个查询语句在不同国家会返回不同结果,比如,查询 "bank]",在美国返回的是银行,而英国则可能是 Bank Fashion 的服装连锁店,或者英国的银行,而在其它英语国家,如澳大利亚,加拿大,新西兰,南非,返回的则应仍旧是当地的银行。如果你在一些非英语国家查询这个词,象埃及,以色列,日本,俄罗斯,沙特,瑞士,返回的结果将更有趣。就象 Football 在美国和英国表示不同的运动项目一样,同一个词在不同国家查询的结果可能截然不同。

个性化查询是 Google 另一项先进搜索技术,一个已经登录的用户,如果开通了 Web History 服务,随着他查询时间的增长,Google 会根据他的查询历史,自动调整返回的结果,比如,一个经常查询 Football 相关话题的人,会逐渐从 Google 得到更多足球相关的结果。如果你青睐某个购物站返回的结果,在以后的查询中,会从那个购物站得到更多结果。

Google 在返回用户真正想要的结果方面的另一个例子是,假如你搜索 "chevrolet magnum",我们知道 Magnum 不是 Chevrolet 产的,是 Dodge 产的,Google 会自动返回 dodge magnum 的结果。还有一个例子,有人搜索 "bangalore",不仅返回 Bangalore 这个城市的主页,而且返回 Bangalore 的地图,以及一些与 Bangalore 市景,交通相关的视频,这些视频会让你有身临其境的感觉。

个性化查询是 Google 另一项先进搜索技术,一个已经登录的用户,如果开通了 Web History 服务,随着他查询时间的增长,Google 会根据他的查询历史,自动调整返回的结果,比如,一个经常查询 Football 相关话题的人,会逐渐从 Google 得到更多足球相关的结果。如果你青睐某个购物站返回的结果,在以后的查询中,会从那个购物站得到更多结果。

Google 在返回用户真正想要的结果方面的另一个例子是,假如你搜索 "chevrolet magnum",我们知道 Magnum 不是 Chevrolet 产的,是 Dodge 产的,Google 会自动返回 dodge magnum 的结果。还有一个例子,有人搜索 "bangalore",不仅返回 Bangalore 这个城市的主页,而且返回 Bangalore 的地图,以及一些与 Bangalore 市景,交通相关的视频,这些视频会让你有身临其境的感觉。

0
投稿

猜你喜欢

  • 从刚开始做站开始自己就有一个目标,那就是绝对不能做垃圾站,但是回首一个月以来做站的历程,发现自己的网站确实已经变得垃圾起来,没有任何的新意,
  • 先说:这是俺一个菜鸟建站到如今想到的,俺的原则是--写自己的帖子,让高手笑去吧,在别人的笑声中我们能得到更多(这好像是几年前看到阿江老大的一
  • 有Godaddy主机用户或许还不了解ColdFusion还有ColdFusion DNS,下面给大家介绍下什么是ColdFusion? 如同
  • 第 1 步:选择推介区域 选择特定广告前,您需要指定国家/地区和语言首选项。为了最大限度地增加转换机会,请选择能充分反映用户情况的组合。有些
  • 鉴于大部分网站入侵都是利用asp木马完成的,特写此文章以使普通虚拟主机用户能更好地了解、防范asp木马。也只有空间商和虚拟主机用户共同做好防
  • 今天的互联网已经不同于以往,其中最主要的特点表现是网站众多。当然,这里还包括许多独立的博客。个人博客可以是生活里的琐事,也正是因为这种琐事,
  • 做为论坛来说,运营思路和常见的CMS的操作是不一样的,CMS不用担心用户活跃,只需要引进用户,提供优质内容和体验留住用户就可以,但是BBS需
  • 看完入门篇和进阶篇后,稍加练习,破解一般的网站是没问题了。但如果碰到表名列名猜不到,或程序作者过滤了一些特殊字符,怎么提高注入的成功率?怎么
  • Content Design(内容设计)即涉及产品需求也涉及到(产品和用户)互动过程中的具体环节。大多数团队中只有PM才会涉及到相关工作,一
  • 之前写了篇文章说博客的事,但是关于微博的这部分,也许有误读。原来的观点是:原来把博客当成圈子的人,转移到交流更加方便的SNS,微博客去了。其
  • 北京时间11月6日消息,据国外媒体报道,Ancestry.con本周四在纳斯达克上市,交易代码为“ACOM&rd
  • 酷影小何是我在网上用得最多的名字,我从2003年开始接触计算机网络,以前都是做免费的个人主页,2006年接触kingcms后,在大S的影响下
  • 你是否还在为网站某些关键字的排名上不去而苦恼?你是否还在为一个日流量几百IP的关键词消失了而苦恼?这个时候,你可以尝试检查一下你的网站是不是
  • O&O Defrag V8.5 For Windows 2003 Server 测试手记我一直在寻觅一套工作于WINDOWS平台的磁
  • 福建日报2月21日报道 近年来,福建省互联网行业发展迅猛,多项指标居全国前列。全省网民数达866万人,网民数居全国第6位,占全国网民数4.1
  • 有两台邮件服务器分别为192.168.1.1(windows下主机名为b.test.cn)和192.168.1.3(linux下主机名为a.
  • 首先,我门要明白什么是SEO,什么是SEM,什么是网络营销。SEO:搜索引擎最佳化(Search Engine Optimization),
  • 我曾经写过一篇文章叫“不要在国内注册域名”,讨论不要使用国内的域名注册商进行域名注册,甚至不要用使用国内网站查询域名,之后我发现有很多人留言
  • 11月11日消息,据外国媒体报道,eBay首席执行官John Donahoe称,eBay将关注中国的出口商,并与与中国当地的公司扩大合作。D
  • 本文主要讲解WordPress邮件订阅按钮以及Feed订阅按钮添加方法,已经会的童鞋,请直接飘过。一、邮件订阅按钮添加方法本身就是从网上学到
手机版 网站运营 asp之家 www.aspxhome.com