网站运营
位置:首页>> 网站运营>> 从关键词分析看百度算法

从关键词分析看百度算法

作者:fuqingjiajia  发布时间:2009-09-14 19:11:00 

标签:关键词分析,百度算法

我们都知道关键词分析在算法中起着承上启下的作用。百度在还没调整算法之前所用的关键词分析是最大匹配法:正向匹配法,逆向匹配法和双向匹配法。比如输入小学生作文(用GG):他分割为:小学生/作文(看快照)。百度框计算没出来,算法没调整之前。分割与GG一样。自从百度发布了框计算,他的算法也做了很大的调整。包括关键字分析,超链接分析,域名,收录等。首先他对关键字分析做了很大的改变。我们都知道百度技术大会中所说的框计算就是:用户输入内容-》百度框判断内容是属于算数,购物,股票,外汇还是我们常规的关键词。当我们在百度输入1+1.5的时候百度会直接给出答案。当我们输入股票代码的时候百度会直接给出股票走势图。这一切的一切都是百度所说的提高用户体验。其实说白点就是:百度的关键词分析的算法变了,变成了:“基于理解的分词方法”那什么叫基于理解的分词方法呢?

其基本思想在分词时候同时进行句法,语义分析。模拟人对句子的理解过程。由于汉语语言知识庞大与复杂。这种分词法实现起来是非常的困难。以百度现在的状况只能说明这种系统处在试验阶段。因为只有这种分词算法才能达到用户最想要的结果真正的提高用户体验。但百度用这种方法提高了用户体验吗?

只能说提高一部分,但忽略了根本。一部分就是刚才所说的。输入算数自己给出答案等等。忽略了根本在那呢?就是之前的关键词匹配法。现在百度弄不清方向了,当我们搜索平常关键词(不包括算数,股票,购物等关键词)的时候如:小学生作文为例。第一页排名的都是老站。而且老站的主站一个,子目录一个。有时候还有一些博客的文章。10个位置,重复了3个站。新站呢?基本在第二页。这说明了什么?说明了百度管你三七二十一老站排前,新站第二页去。(老站排前面的原因是什么呢?不知道大家有没有想过。)当我们输入:“小学生作文大全”的时候,百度给出的结果都是网络购物关于“小学生作文大全”书籍的信息。试问一下:有多少人输入“小学生作文大全”为了就是买书?这恰恰又降低了用户体验。

说道用户体验不得不说下SOSO。腾讯搜搜一直都是很低调的。在百度提高用户体验的这些算法。Soso去年就实现并用于实践中,那时SOSO还是用GG的搜索接口。体验度比百度还好。现在SOSO独立了。不用GG的接口。它在搜索平常关键词时候就做到了重复性这个问题。10位置。给了主站位置基本很少给子目录一个位置。相比之下SOSO用户体验比百度强一点。

百度这算法能否再改变呢?能否改变为之前的算法。还是继续他所谓试验中的用户体验呢?我们拭目以待。

0
投稿

猜你喜欢

手机版 网站运营 asp之家 www.aspxhome.com