百度与谷歌搜索质量与理念对比
来源:第一财经日报 发布时间:2009-02-19 13:13:00
谷歌百度谁更“搜”?
孙琎
谷歌和百度搜索引擎谁的搜索质量更好,这在互联网上一直是个争论的话题。只要进行搜索,就会发现有大批博客和机构曾用不同的方法比较和讨论过。但由于评价一个搜索引擎质量总会有用户和统计者主观因素的介入,结果总是各执一词。
事实上,谷歌和百度都在持续投入提高搜索质量,对于单个用户来说,由于自身的认知、偏好和搜索方式等不同,短期就会有差异化的选择,这样就是为什么有baigoogledu(百谷歌度)这样同时提供两者搜索结果的网站存在。而到底使用何种因素来评价一个搜索引擎的质量,一时的得失难以量化,长期看最终还是要落到“沉默的大多数”用长时间的鼠标累计投票。
偏好差异
你喜欢用哪个搜索引擎,如果一个用户问自己身边的人,那么得到的推荐结果会有很多变数。如果是这一幕发生在上海办公楼,那么结果可能是谷歌,因为根据谷歌自身的统计,谷歌在上海最得办公人士的青睐,而如果在网吧中,那些青少年或许会推荐百度。
尽管搜索引擎是一个普遍服务,但却客观上形成了以地域和人群区分的偏好差异。谷歌大中华区总裁李开复对《第一财经日报》表示,他每天上班的第一件事就是打开电脑看看流量,他会连续看很多个不同维度的流量,比如从网吧访问谷歌的流量,三四级城市来的流量,甚至从大学生来的流量。
从城市看,上海一直是对谷歌接受度最高的城市,而李开复也发现,到周六周日谷歌的流量就出现下降,这说明还是办公人群使用谷歌的比例高。谷歌相对落后的市场还是在三四级城市、网吧等领域。
对于影响搜索质量的最重要因素,百度相关人士告诉记者,包括搜索速度、搜索内容是否全面、搜索更新是否及时、搜索结果是否准确等。
谷歌负责人则认为,是客观公正的排序原则和排序算法保证了搜索质量。
但有多少用户可以这么理性的比较从而选择适合的搜索引擎呢?各种因素在影响着用户的选择。记者通过长时间的调查,曾经得到过多种理由,有人就是喜欢百度这个品牌,因为“众里寻他千百度”,实在是太有诗意。有人则说,谷歌经常在节日等出现的创意logo打动了他,因此就会一直用谷歌。
有人喜欢用百度贴吧,因此也就一直用百度搜索,而有人觉的Gmail用的顺手,所以谷歌才是首选。有人用自己的名字和手机号测试,发现哪个搜索引擎排序高就用哪个。
测试词
事实上,用常用词或者热门词搜索,两家差异并不巨大。百度给记者提供的测试词是使用最近很受关注的魔术师“刘谦”的名字搜索,会发现百度和谷歌的搜索结果看起来差异较大,但是都能满足用户需求。
百度搜索结果页第一个是刘谦简介(百度百科),第二个是刘谦的表演(百度视频),第三个是刘谦粉丝聚会讨论(百度贴吧)。而谷歌呈现的是焦点新闻聚合,百度百科,视频搜索在第五条出现,博客搜索在最下方。
而谷歌推荐的测试词是电影《疯狂的赛车》,谷歌出现的依次是整合搜索中的放映时间、预告片、评论、影院信息和地图、焦点新闻聚合等。而百度出现的是片花、影评和电影简介等信息。比较而言,谷歌多了影院信息和地图。
双方的工程师对此次搜索评价的量化打分如何,不得而知,但对用户有意义的是,是否便捷、精准地找到自己想要查找的信息。
如果搜索者带有强烈的个人欲望去搜索,那么对于百度和谷歌都是挑战。因为在搜索引擎上,任何人搜索同一个词的结果都是一样,这不能满足所有访问者。科学家搜索“星球”,可能是希望了解星球的知识,但普通人可能是想找“星球大战”电影。
搜索引擎的排序涉及到很多让普通用户眼花缭乱的技术,比如超链分析、PageRank、HillTop算法、锚文本、页面版式等。如今,如何提升网页在搜索引擎中的排序,已经形成了叫SEO(Search Engine Optimization)搜索引擎优化的专门行业,针对搜索引擎排序的技术,帮助客户提高网页排序。
也有专家建议,由于各家搜索引擎的算法不一,蜘蛛抓取网页结果不一,排序的方法不一,最终导致了信息数据抓取范围的差异。使用多个搜索引擎,对它一次性信息的满足率更好一些。
评价
如果不摒除品牌、用户环、先发优势、市场占有率等因素的影响,很难做到纯粹的搜索质量评价,这就如同一个女人选择化妆品,品牌、美白、抗皱、保湿、滋润等因素,都会成为影响的参数,而一盒日霜到底哪个好,每个女人都有自己的答案。
这就用到了“盲测”,让一些用户在不知情的情况下来比较,两年前就有个人网站使用匿名搜索应用,摒除了谷歌与百度搜索页面中的广告内容以及特征元素,让用户做出 “搜索质量对比”,而非“搜索体验对比”,结果是谷歌略好。
正望咨询此前也有过一个盲测结果,在盲测参与者完成的全部11864次测试中,判断谷歌搜索结果好于百度的比例为48.2%,百度搜索结果好于谷歌的比例为39.8%。
百度内部人士表示,盲测是常用的搜索引擎市场调研方法中的一种。在百度的用户体验部,百度的产品人员也经常采取盲测的方法来对比搜索结果,寻找出不同结果对用户搜索体验影响的差异,再加以不断的改进,帮助百度在搜索引擎市场保持优势。
然而,由于搜索引擎用户需求的多样性,一些个人和机构组织的盲测往往采纳的样本单一,不能客观公正代表整个搜索引擎群体使用状况,因而往往不能反映实际问题。而百度和谷歌的内部测试结果也无法对外公开。
谷歌高层则认为,目前谷歌的索引至少比任何公司大两三倍,只要用户搜一个偏僻一点的词(例如手机号码)就知道,而且谷歌的整合搜索已经造成盲测意义不是很大了,因为有了整合搜索,谷歌的搜索在三公尺之外就看得出差别,不需要再做盲测了。
李开复曾表示,根据各种统计,谷歌的搜索质量经过一段时间的提高,其实已经超过了竞争对手,但是中国用户不认,他们不比较,也看不出来。
但李开复也承认,之前很多用户跑到百度贴吧、知道和MP3搜索就出不来了,这说明谷歌中国的娱乐性还有不足,谷歌正在不断地推出细分的服务。
对于搜索引擎的观察和比较,一些有经验的个人一直在进行。搜房网的王峰最近发表了一个博客,认为近期谷歌网页收录数量已经超过百度,谷歌依靠自己的技术力量提升很多很重要的服务。这使得之前已经抛弃了谷歌的他渐渐变成了双搜索引擎用户,也就是说如果某个搜索引擎搜不到一定要换另外一个试一下。他身边有不少朋友在做网站,最近很多人都感觉谷歌要比百度收入的内容更快。
另一个角度是,搜索引擎对于常用词来说,搜索效果都不会太差,但是偏僻词和长尾词会看出一些区别,能不能找到长尾词,关键在有多少的网页收入。
但有的用户认为,如果加入市场因素,那么有多少用户会在意长尾词的结果而更改搜索引擎呢?因为一个难搜的词,用户会有足够的耐心多翻几页,多加上几个词来搜索,这对用户的影响太细微,只能在很长的时期才能看出来。
猜你喜欢
- 据笔者了解,即将于11月7日13:00在江苏南京科技馆盛大召开的由主办江苏站长站和承办炎黄网络联合发起的“2009江苏站长年会暨江苏 (南京
- 影响网站排名的因素据说有300多个,但对于网站优化来说,将这300多个因素都考虑到并且做得尽善尽美其实并不现实,也没必要。但下面列出的五个因
- 给系统文件设置权限系统文件对系统的稳定性有无可争议的作用,同时对系统的操作也是通过这些系统文件进行的。通过设置系统文件的访问权限,让一些操作
- 最新消息,在广大站长的殷切期盼下,7月8日康盛创想官方开发团队又一次更新了旗下的UCenter Home(简称UCHome)官方站(u.di
- 拥有7亿多用户和300多个互联网产品的马化腾如何在多元化的急速扩张中掌控航向,超越“跟风者”的形象,并构建一个世界上前所未有庞大的Web2.
- 尊敬的QQ用户,经过持续努力,QQ2010 Beta版本即将与广大用户见面,在此,我们诚邀您报名参与QQ最新版本的优先体验。QQ2010 B
- 我并不是一个善于思考的人,我做网站的最初目的是消磨时间,因为大学让人感觉很空虚。但是慢慢的随着对做网站的深入,我也慢慢的喜欢上了站长这些可爱
- 做网站的流量,一个必不可少的步骤就是友情链接,诚然,与权重高、友链又少的网站做友情链接,可以大大有利于网站在搜索引擎中的权重,能带来大量的流
- 架设FTP站点似乎已经不是什么困难的事情了,我们不需要借助任何外来工具的帮忙,只需要使用Windows服务器系统自带的IIS功能,就能轻易地
- 想必大家都知道,在给网站做seo优化技术时,选择合适的关键字是非常重要的一步。那么选择这些关键字,除了了解用户习惯外,我们还可以通过一些关键
- 目前最新版本是Discuz! 7.2。本期教程笔者为大家讲解Discuz!论坛“阅读区域宽度”及“帖内图片最大宽度”的功能设置。“阅读区域宽
- 最近在研究Linux下Firewall的配置,发现配置好防火墙以后ftp就有问题了,一直都不能够用Filezilla 和 CuteFTP登录
- 作为企业的信息化安全人员,其主要任务就是如何在保障服务器性能的前提下提高服务器的安全性。而要做到这一点,服务器的访问权限控制策略无疑是其中的
- What's more important to your web site: pictures or text? If you h
- 基于网络的电子邮件是一种基于Internet的电子邮件系统,它可以让你从一个Web浏览器来发送、接收电子邮件讯息。只要有Internet连接
- 理论:分析流量统计报告,挑选核心关键词。实践:“阿江守候”网站已安装“51.la流量分析系统”,想知道网站的哪些关键词比较热门,并做出具有针
- FTP命令是Internet用户使用最频繁的命令之一,不论是在DOS还是UNIX操作系统下使用FTP,都会遇到大量的FTP内部命令。熟悉并灵
- 无论你是一个Web开发人员,网页设计师或博客,你可能不得不为许多不同大小和不同格式的图像处理转换的事而感到头痛。如果你把所有图片放在手头上,
- 现阶段的网站多如牛毛,或者说比牛毛也多,但是基本的情况都是基于WEB 1.0模式,多数的用户上去的方式集中有两种:百度和友情链接