充分展示网站标题 百度最新分词算法说明
作者:天刃 来源:CHINAZ 发布时间:2008-12-17 10:46:00
因为种种原因,已经有很长时间没有发过东西了。天刃今天抽时间,把大家最近反应最多的问题整理下,和大家聊聊。
第一个问题就是百度最近算法调整的影响,让很多朋友都没有了头绪。其实这次最大的调整在分词上,很多朋友也都注意到了。就像前几天说的,原来大家只要把干词做好,周围辅助做好长尾词就OK了,不管你用什么词搜,排名就像百度竞价一样牢牢不可动摇。但是貌似这次百度算法调整后就不是这么回事了,你做的主词还一样可以排好,但那些长尾词却很少可以搜到了……
那么这次的分词算法改在哪儿呢?天刃就拿最基本的TITLE撰写来给大家说明一下。百度31汉字的TITLE里,相信SEOER们都会充分利用的。朋友们都知道,在TITLE里将关键词隔开我们常会用到英文半角的逗号,或是“|”来区分,而百度这次分词算法调整之后,虽然还是会把这些认为是分隔符,但用法已经没有原来那么规范了。原因很简单,百度对它的分词越来越自信,已经慢慢放弃或减轻对传统分隔符的依赖了。
现在的百度,可以很容易的识别整个句子中的特定分词,而刻意的将我们想要的关键词用分隔符进行强调有的时候收到的效果是相反的,一个很明显的现象就是,你的TITLE里将你想要的各个关键词用分隔符清清楚楚的列出来,但最后你在搜索结果看到的情况却是:明明这个句子里很明显的有这个分词(两个分开的关键词),但却没有给你加红。也就是说百度根本没有认出你这个句子里的关键词。
这是怎么回事呢?不是百度分词技术垃圾,而是百度放弃了这个句子。(说到这里可能朋友们有些晕了,那我就简单的举个例子。关键词“AAABBB”其中“AAA”“BBB”分别是百度分词库里的独立关键词,而这个时候,你的TITLE这样写:“AAA长尾BBB长尾,AAABBB长尾”,结果你搜索“AAABBB”时,百度的搜索结果里有时竟是:“AAA长尾BBB长尾,AAABBB长尾”,前面句子里的AAA和BBB并没有被百度认为是关键词。)
当然,百度并没有自大到否认一切分隔符,而是根据中文的使用习惯对不符合中文撰写习惯的作法进行淘汰。或者也可以从另一个角度去理解,百度这个更改有针对SEO的原因,一个中英文混写的TITLE,避免不了优化的嫌疑。(也就是很多SEOER朋友开玩笑时说的,百度有的时候允许你作弊,但也不会允许你优化)
那么,现在我们该如何来撰写TITLE呢?天刃通过最近一段时间的琢磨,TITLE的撰写,我们要放弃原来为了给仅有的31个汉字节省字符来刻意使用英文符号的作法,这种作法虽还没有完全被百度摈弃,但这个趋势朋友们应该可以看的出来。“英文半角逗号,英文中间杠(占半个字符)”,这些符号可以换成中文的符号,哪怕损失了放长尾词的字符也是值得的。“|”这个分隔符现在 已经介乎字符与分隔符之间了,所以这个符号现在应该完全的淘汰了。难道我们以后TITLE的分隔符就没有合适的了吗?当然不是。通过对百度自身产品以及新浪的观察,现在最合适的分隔符是只占半个字符的“_”下杠,以后大家可以试着考虑用下这个。当然,必须要照顾中文句子的语法。
关于分词,这里就说下TITLE的撰写,其他的就不一一细说了。TITLE的分词算法绝对不适用用其他元素,这点大家不要混淆。(trseo.org)


猜你喜欢
- 简介众所周知在Linux操作系统中,有一个系统软件包,它的功能类似于Windows里面的“添加/删除程序”,但是功能又比“添加/删除程序”强
- 10月14日,中国软件资讯网据外电报道,当苹果的市值又再度超越Google时,这次它能够一直保持领先吗?《BusinessWeek》专栏作家
- (一)硬件准备一台HP ProLiant DL160 G5服务器(硬盘拓展到480G)一台个人电脑(windows操作系统)一个Lenovo
- 照着GUN/Linux编程指南中的一个例子输入编译,结果出现如下错误:undefined reference to 'pthread
- 前言今天发现es日志未记录,检查了filebeat、elasticsearch、logstash之后发现es的索引都变成了只读状态,手动修改
- 休闲游戏开发商PopCap今天宣布,去年风靡全球的小游戏《植物大战僵尸》(Plants vs. Zombies)在移植到iPhone平台后,
- 北京时间10月24日消息,据国外媒体报道,微软证实了数百名用户在安装Windows 7过程中出现的一个问题。微软一名支持工程师昨天表示,“用
- CentOS 开机启动自定义脚本有些时候我们需要在服务器里设置一个脚本,让他一开机就自己启动。方法如下:cd /etc/init.d vi
- 一.软件简介 本文主要讲述如何用IIS+Tomcat3.1支持JSP及servlet环境。正常情况下IIS不支持servlet及JSP环境。
- 确保Windows Server 2003域上的域名解析系统(domain name system,简称DNS)安全,是非常基本的一个要求。
- 上一篇介绍了在Linux的CentOS下如何安装Nginx服务器,并且实现在Linux上访问Nginx服务器。本篇主要介绍VMVare下基于
- 昨天,淘宝网透露将再次向炒作信誉的黑色产业链宣战,将联合 * 、工商等部门打击外部炒信网站,力图从源头上掐断炒信黑色产业链。据悉,这是淘宝网针
- 地方门户网站,除了广告还能靠什么盈利?作为一个商业 * 来说,虽说下沙网已拥有了坚实的群众基础,点击率颇高,但即使是这样的人气,也要时刻做好
- 今天19点左右打开百度就看到了百度的LOGO换了,这不是《士兵突击》中王宝强扮演的许三多吗?开始有点疑问,为什么百度的logo换了?后来就搜
- 网站中发布的文章除了需要按时间、栏目分类、类别调用外,往往需要根据编辑的推荐进行不同的调用,那么CMS自然少不了推荐位功能。一般推荐位的设计
- linux alarm函数简介上代码:#include <stdio.h>#include <unistd.h>#i
- 提到FTP服务器,可能大家都会想到Serv-U、vs-FTP等软件,其实微软内置在IIS里的FTP服务已经够用,不信请往下看。实现对多用户的
- UCenter Home 默认有 8 个分组,如下图所示: 很多会员想修改默认的会员分组,下面我们仔细讲解如何修改好友分组的名称。
- 拷贝数据远程拷贝数据的时候,我们一般使用rsync命令,但是如果拷贝大量的小文件,会导致rsync的传输速度慢。使用tar pv lz4打包
- 原因:你的网站是utf-8编码,但iis的错误信息输出默认使用的是gb2312编码。导致iis出现运行时错误的时候显示的页面是乱码。解决办法