SEO的外链建设相关性详细分析
作者:关雷 来源:seowhy.com 发布时间:2009-01-08 15:59:00
记住,“蜘蛛”是个抓取“程序”,不是“人工智能”。他不会用人类的判断逻辑来判断相关性,而是一些“逻辑程序”,毕竟蜘蛛程序并不复杂(相对而言)。
明白了上述情况,我来说说我自己对“相关性”的看法和建设心得,不对之处,还请大家指正。
你的网页和你网页中的内容相关性,在蜘蛛程序中的判断:
假设你的网页是新的网页,刚做了不到2天,刚提交,蜘蛛根据"抓取索引",过来抓取(或通过其他形式的链接)。
首先,蜘蛛通过各种连接来到了你的网页,对于他来说,新的网页特征就是从网页代码中的head部分中的title标签里的元素来判断的。
假设蜘蛛来到的你这个网页,抓取了网页中的title文字:我的动漫论坛 -新动漫 - 动漫新主张!蜘蛛首先会以抓取title中的文字做为“关键词”为参考,然后去从网页代码中去寻找相关的“关键词”。
你可以放心,蜘蛛可以判断一些JS代码和页面中的标签,他会比较重视正文和div块中的标题部分的“关键词”,也就是h1-h4一系列的。这也可以验证大家说的,为什么h1-h4中的内容,会比其他body中的文本内容权重高的原因。然后蜘蛛会把tilte中在正文body部分重复次数最多的词,定为 “参考关键词”(当然了,有个重复限度,搜索引擎会设定并嵌入蜘蛛程序里)。
然后蜘蛛自己也会根据“参考关键词”判断“关键词扩展”(根据搜索引擎的相关类的常用数据关键词和title中关键词分析对比),综合以上,确定大体的“关键词”,做为下一步页面抓取的参考。
下一步,蜘蛛会计算(这个简单的数据计算功能还是有的)所有关键词在网页代码中出现的数量,作为基数。然后计算body标签中“关键词”的数量,作为分子(汗,想不出什么词了,通俗第一)。然后一除,就得出了你这个页面的关键词密度。
密度出来了以后,搜索引擎自己会有个标准判断(人为设计的参数),有个等级,?-?是最合理的,?—?是一般的,?—?是最差的,这个标准时刻在变,总之是根据一段时期的数据进行调整的(就是让你隔段时间闹一回心)。
好了,密度的判断出来后,进行本页的关键词差别对比。
以tilte中的关键词为基础,综合了“扩展关键词”的参考,对比在body部分中抓取的“关键词”,对比他们每个文字上的差别。(比如搜索引擎定下的关键词为“动漫”,而body文本中有:动漫论坛,新动漫-等等),差别也分个等级,差别不大的,成为了长尾关键词,差别大的,就被舍弃做为这个页面的搜索关键词,这个和“关键词密度”判断方法相同。这样,页面长尾词和搜索关键词就确定了下来。
当密度和页面关键词差别这2项得到了2个结果后,会有个权数加的计算公式(引擎自己定的,也定期根据数据调整),得出一个对“相关性”的得分(类似baidu指数的算法),从而判断页面的关键词,确定页面内容和关键词的相关性联系程度。
页面的关键词和页面内容的相关性就这么得出来的。
那么,外部链接的相关性怎么判断?好,下面谈谈,进入第2部分
外部连接和网页相关性的判断:
单向链接:
他网页链接到你的网页的链接,在他的网页上,你网站的链接锚文字描述必须是和他链接到你的这个页面的关键词相关,或相近,蜘蛛的判断方法和第一部分一样,只不过起始的“关键词”参考,变成了在他网页上,你的网页的链接錨文字。(交流QQ:56770978)


猜你喜欢
- 我在很多帖子里一直大力提倡运行自己的电子商务网站。也许有的人会误解,网站赚钱靠广告不行。其实广告是网站盈利模式的其中一个方法,不是不行,而是
- 随着Web 2.0的发展,互联网的互动性已经越来越强,不过据IT安全公司Radware安全运营中心主管Itzik Kotler的警告,Jav
- 查看文件属性有多种方法,且这些方法中偏向不同,具体如下:1,ls ls -a 查看所有文件 &
- 前言现在Linux系统中基于xinetd的服务越来越少了,但Linux系统中还是有基于xinetd的服务的,所以我们还是需要了解一下基于xi
- Rand Fishkin(Randfish) :搜索引擎专家倪英伟: 厦门时义浩维科技有限公司副总裁,网络营销专家陈小华(石头):
- 11月19日上午消息,火石软件今日发布代理商更换公告,公告中表示《水浒Q传》将结束同金山的运营合作。同时,火石软件将向畅游公司提供《水浒Q传
- 服务器安全设置1、系统盘和站点放置盘必须设置为NTFS格式,方便设置权限。2、系统盘和站点放置盘除administrators 和syste
- 花时间流连社交网站Facebook有助训练脑力,这是研究“工作记忆力”的苏格兰史特灵大学心理学家亚洛
- DoS 攻击、DDoS攻击和DRDoS攻击相信大家已经早有耳闻了吧!DoS是Denial of Service的简写就是拒绝服务,而DDoS
- 大家都知道页面加载速度对博客流量有非常重要的影响。最近越来越多人也在讨论页面加载速度很可能成为谷歌和其他搜索引擎一个重要的SEO因素。目前.
- 现在,一些网站推出了G容量的免费邮箱,引来许多网友纷纷注册使用。实际上,我们利用自己的服务器,使用任何一款邮件服务器软件,就能架设千兆甚至万
- 上一篇文章已经安装好了虚拟机和Linux系统了,这次就来简单的说一下LInux系统的网络配置吧简单介绍Linux的文件夹bin:存放的是用户
- Blogger.com网站首页截图北京时间3月6日消息,综合海外媒体报道,Blogger.com是全球最大的博客网站,被称为互联网诞生15年
- 01. 命令概述md5sum - 计算检验MD5效验码md5sum命令采用MD5报文摘要算法(128位)计算和检查文件的校验和。一般来说,安
- 相信这对广大的商家是个好消息!动易BizIdea 2.5版已经与支付宝实现了全面无缝整合,这将使得上万的BizIdea商家能够共享支付宝的1
- 李彦宏昨日在香港科技大学演讲时,首度披露了进军日本市场涉及的搜索内容,“我们在日本市场已经推出网页搜索、图像搜索、视频搜索,而我们进军全球市
- 据国外媒体报道,微软周五发布了2010财年第一季度财报,在线服务部门连续15个季度出现亏损。本季度,微软营收129.2亿美元,同比下滑14%
- 首先下载JDK.这里使用的是jdk-8u181-linux-x64.tar.gz下载Tomcat.这里使用的是apache-tomcat-8
- 网上找了一些资料部署,出现不一样的问题,现在总结一下自己的部署流程。1、资源准备Dockerfile文件# "ported&quo
- 虽然现在的站长界,无论是个人站还是门户站,都或多或少的用了“采集”的方式来建站,比如猫扑这个看起来不至于用采集的“大站”,而众多的个人网站就