不是那么一回事 中文搜索引擎的十大误区(2)
作者:佚名 来源:医学园地 发布时间:2008-12-14 07:21:00
误区6、中英文混合检索词是不被支持的
当你输入“MP3” 时,有些网站会认为你在查找英文网页,进而自动将你送到一个英文搜索引擎上;更多的网页搜索服务不能对“甲A”、“F-1一级方程式”等中英混合查询作出恰当的反应。然而搜索技术并非对此无能为力,百度搜索就完全解决了中英文混查的问题。
误区7、中文搜索引擎的相关性无法与英文相媲美
中文与英文最大的不同之处在于中文中有词的概念,检索字串与网页中文字的简单匹配并不见得就是语义上的匹配;要想提高中文搜索的相关性,必须结合中文词和中文字,并使用一些先进的算法,如新一代信息检索(IR)算法、超链分析(Link Analysis)等。中文搜索也有许多英文搜索望尘莫及之处,如中文网页极少有针对搜索引擎的欺骗(Spamming)行为,中文没有单复数、时态等的变化,大多数先进的算法也完全适用于中文。中文搜索的相关性完全可以与英文媲美。百度搜索使用了目前国际上先进的搜索引擎技术,并结合中文的语言特点和文化特点,成功地解决了中文搜索的相关性问题。
误区8、用户要找的信息在网上不存在
目前大多数的中文搜索引擎都收集了较少数量的网页,收集上百万的就算是信息量很大了;可是随着中国互联网的繁荣、政府、企业和各行各业对互联网的重视,以及大量风险投资的进入,中文互联网的内容日益丰富,网页数量激增。另外很多搜索引擎不支持新的中文编码标准,但是却在GBK编码中可以找到。所以许多网上存在的信息在当前的主要搜索引擎中无法找到很可能是因为您用的搜索引擎不好,而不是因为您要找的信息在网上不存在。
误区9、搜索引擎数据更新最快要30天
对于那些依靠海外服务器提供检索的网站来说,这也许是对的;网易掌门丁磊辞职的消息传出后的三个星期内,各大门户网站的网页搜索服务都无法查到任何相关的网页。但这绝不是说及时更新数据是做不到的。百度搜索就巧妙地解决了数据更新的瓶颈,整个中文网页的数据库可以最快每天更新一次。
误区10、搜索引擎不能查找动态生成的网页
目前世界上没有一家主要的搜索引擎支持动态页,因为大多数负责搜索网页的蜘蛛软件不敢去碰动态页,怕被变化无穷的动态系统黑洞吸进去出不来。然而,网站使用动态页生成工具乃是大势所趋,ASP、 PHP、 JSP 等编程工具日益流行,解决动态页查找的问题已经是人心所向。


猜你喜欢
- 看到起点被收编了、hao123也回家数钱玩了、QQ挂机、 * 短信、各种 * 都火了,赚钱了。于是乎,工作室、soho、再创业者也就多了。千奇百
- 假设在math目录下已编辑好add.c sub.c div.c mul.c func_point.c文件,func_point.c为包含ma
- Google AdSense 提供了十多种不同大小的广告格式,但是我们还是收到一些发布商的反馈,能否针对他们的网页布局提供个性化的广告格式。
- 国内的SEO市场毕竟尚未趋于规范和成熟,并且相对国外的SEO博客,应该说国人更缺少一些无私分享的精神。但是由于语言问题,国外的SEO博客一直
- 10月23日消息 一面高调叫嚣“反盗版”,一面被法院裁定网络影视盗版第一案,在网络视频维权大戏中,正
- Google Adsense低价广告过滤清单提供下载,本清单使用目的:主要是为了过滤部分广告主的恶意低价广告(如非主流、6位QQ等点击单价几
- Flickr今天宣布将支持开放街道地图(OpenStreetMap,OSM)网站的标签。OSM是一家类似维基的地图网站,允许用户创建和编辑地
- 本文为大家分享了VMware Workstation安装银河麒麟,供大家参考,具体内容如下1.下载软件:VMware Workstation
- 今天登录google adsense后台,发现Google的搜索广告多出了一项,从样式图片来看,很像百度以前推出的搜索框:文字描述中我们可以
- 一、安装muttyum install mutt -y二、配置muttvim /etc/Muttrc在里面找到下面几行,并将内容修改为你自己
- 如果要问全球最简单的广告系统是什么?那答案也许就是 Google 的在线广告系统。的确,你只要交了钱,来自无数网民的和你的线上业务有关的关键
- 通常利用Apache的rewrite模块对 URL 进行重写的时候, rewrite规则会写在 .htaccess 文件里。但要使
- DedeCms 是公认的在SEO优化方面做得做好的CMS,可能很多人会说,优化是靠个人的,与CMS无关,这其实也不尽正确,因为必须程序提供商
- 分布式Hibernate Search与Apache Tomcat6,ActiveMQ 和Spring.今天我将跟大家分享我的经验,以mas
- 最近用dedecms做了个网站 www.iiseo.com 找了半天终于知道了一个简单的生成sitemap的方法,好东西不敢独享
- 11月6日消息,据中国法院网报道,由于盗播热映电影,爆米花视频网的主办公司普信通(北京)科技有限公经法院主持调解同意赔偿还款,但还款事宜此后
- DEDE评论效果: 修改后的效果: 修改步骤一、5.5版本(5.6版本请往下看)1、修改/plus/feedback_a
- 腾讯科技讯(乐天)5月21日消息,360公司今日宣布正式推出全球首款“木马防火墙”,宣称可有效解决传统安全软件查杀木马的滞后性缺陷,为网民减
- 还是在几年前,如果你在借助网络做生意,你就要考虑加入商业联盟和B2B、B2C等商业模式的网站以及行业协会组织或相关产业的专业化组织。然而当今
- 1. kali linux 系统版本查看 命令:cat /etc/issue2. kali linux系统内核信息查看命令:uname -a