什么是人肉搜索引擎及人肉搜索引擎起源
作者:aspgood 来源:aspgood 发布时间:2008-07-18 12:33:00
顾名思义,人肉搜索就是利用现代信息科技,变传统的网络信息搜索为人找人、人问人、人碰人、人挤人、人挨人的关系型网络社区活动,变枯燥乏味的查询过程为“一人提问、八方回应,一石激起千层浪,一声呼唤惊醒万颗真心”的人性化搜索体验。
人肉搜索不仅可以在最短时间内揭露某某门背后的真相,为某三某七找到大众认可的道德定位,还可以在网络无法触及的地方,探寻并发现最美丽的丛林少女,最感人的高山牧民,最神秘的荒漠洞窟,最浪漫的终极邂逅……人肉搜索追求的最高目标是:不求最好,但求最肉。
人肉搜索引擎就是指更多的利用人工参与来提纯搜索引擎提供的信息的一种机制。猫扑的人肉搜索引擎就是其中一个比较成功的例子。后面我们会根据猫扑的人肉搜索引擎给出一个更加具体的描述。
针对搜索引擎的LinkFarm和Spam也许永远不会停止,因为他们能够从他们的作恶中得到利益。我们知道得到利益不是作恶的唯一原因,然而大规模的产业化的作恶唯一的原因当然是那样可以得到利益。
所以,这是一场永远无法结束的战争,只要搜索引擎还是应用最广泛的一种互联网应用,只要搜索引擎还是用户找到合适服务的最主要手段。很多人把问题归结于PageRank技术,当年人们也是这样抱怨META关键字和描述技术。也许Google或者其他的公司能够研究出来更加伟大的技术,来取代PageRank,但是谁知道这新的技术什么时候又会变成明日黄花。
搜索引擎是利用机器自动化的收集网络信息并有序化的一种技术。搜索引擎高效快速,然而因为现在人工智能并不完善,搜索引擎还很难甄别刻意的、修饰过的信息,所以SEOSpam才会那么猖獗。所以,有些人想从搜索引擎的反面来解决问题,那就是更多的利用人工把搜索引擎得到的信息进一步萃取,进一步有序化,我们称之为人肉搜索引擎。
人肉搜索引擎的起源
很多人知道的,中国有一个叫做猫扑的论坛,人气非常旺。Tiny在2001年到2004年期间是这个论坛的忠实用户。在我的印象中,人肉搜索引擎的概念应该出自于猫扑。
跟很多论坛一样,猫扑上面也经常有人问这个问题、那个问题。同时,猫扑有种虚拟货币叫做Mp,问问题的人往往会用Mp来奖励可以帮助他们的人。虽然Mp不能吃、不能喝,但是还是有很多人醉心于挣取更多的Mp。那些惯于通过回答问题挣取Mp的人,在猫扑一般叫做赏金猎人。
于是很有趣味的一幕出现了,某人需要解决一个问题,就在猫扑发贴并许诺一定数量的Mp作为酬谢。很快,就会有赏金猎人看到这个贴子,他们就会去用搜索引擎来寻找问题的答案,然后争先恐后地把找到的答案回在帖子里面邀功。最后,提问题的人得到了答案,赏金猎人得到了Mp,皆大欢喜。这也就形成了所谓的人肉搜索引擎的机制。有趣的是,我们可以发现人肉搜索引擎的搜索流程和搜索引擎,在不同服务器之间的分布式搜索流程看起来是那么的相似,区别仅仅在于发动和执行流程的是人,还是机器。
人肉搜索引擎的质量怎样保证呢?这是一个非常有趣的问题,从刚才的流程上大家可以发现,如果有足够多的赏金猎人,他们之间就会产生竞争,寻找资料速度的竞争、资料准确性的竞争。竞争的结果是,一个速度又快、资料又准确、全面的赏金猎人,会有越来越多的Mp,这会给他带来更多的成就感,同时他也会更加的醉心于赏金猎人的工作。甚至,据我所知很多赏金猎人会形成自己的职业道德和行为准则,这样可以给他们更大的自我实现,同时提高了用户的满意程度。这就形成了一个正反馈、一个良性循环,前提是有足够的激励(Mp)投入和足够产生竞争的参与者(赏金猎人)。
同时,很多人也为自己是一个人肉搜索引擎的用户感到自豪,因为这确实太好用了,不需要担心分词不准确,不用担心电脑错误的理解了你的话,不用担心搜索引擎收录范围不同造成的风险,甚至不需要学习搜索引擎怎么用,而且答案也不会仅仅局限于搜索引擎所能找到的信息,虽然绝大部分问题是通过搜索引擎就可以找到的。
然而,人肉搜索引擎几年来仅仅是一个概念,还没有成为一种产品。在猫扑,人肉搜索引擎只能帮助猫扑提升人气,并不能成为一个产品给猫扑带来效益,同时也给更多的人服务。这是为什么呢?我想可能有4点原因:
1、猫扑人肉搜索引擎和论坛的差异不够明显。或者说在猫扑里,人肉搜索引擎只是论坛的一种应用而已,任何需要人肉搜索引擎服务的人必须是论坛的用户,这降低了用户普及度。
2、Mp过于游戏化。Mp是虚拟货币,是游戏化的货币,这也给猫扑的人肉搜索引擎加上了游戏性的标签。做赏金猎人的人仅仅是喜欢这个游戏化氛围的人,或者说是能被Mp这样的虚拟货币激励的人,这影响了赏金猎人队伍的扩大,从而影响了人肉搜索引擎的扩大。
3、人肉搜索引擎的反映比较慢。Google可以在0.00001秒内给你一个答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出结果才会有所反应。
4、猫扑人肉搜索引擎不能保留历史纪录,每次有一个问题出现,就会引发一次分布式搜索。即使问题是重复的,也会同样引发这个流程,而且相同的问题在不同的时间问,答案可能迥异,不能对相同答案给予一致性的结果。
猜你喜欢
- 以前自己弄的东西,现在帖出来,希望对大家有点用:)1.1 什么是FTP:文件传输协议原理1.1.1 命令选择1.1.2 命令格式1.2 wu
- 很久没写文章了,前段时间GG帐户又被封了,损失了几千刀.稍微休息了下,08年想做个英文站玩一下.2月16那天ARY来我家拜年,聊了一些关于英
- SEO的趋势如何? 2009年SEO的工作好找吗? 昨天百度知道里一位SEO新人这样提问。今天我回答一下以上问题:第一个问题:SEO的趋势如
- 目前最新版本是Discuz! 7.2。本期教程笔者为大家讲解Discuz!论坛“阅读区域宽度”及“帖内图片最大宽度”的功能设置。“阅读区域宽
- 不管是Windows2000或者是WindowsXP,系统默认的注册表编辑器都不能摆脱这样的事实:只要是修改注册表键值,就必须在注册表编辑中
- 一、屏蔽1433端口(以win2000为例):设置安全策略:“控制面板”—〉“管理工具”—〉“本地安全策略”选择IP安全策略—〉创建IP安全
- 谷歌声称其 AdWords的实时定位和详细报告为客户抵御经济衰退找到了一个有效的方式。 该公司提供了六个详细战术使您的AdWords投资最大
- 性能是任何成功网站的一个关键因素。越来越多的人选择使用WordPress搭建个人博客、CMS内容展示或是企业网站,但可能由于高流量或一些未知
- 这次google历经三个月之久,终于又释放和大放血了。这让很多站长都为之疯狂。虽然多数国内站长都比较在乎和以百度为主,当google的作用也
- 一个网站内部的链接构架、关键词布局、URL、内容建设等方面都网站优化工作完成之后,并不能直接SEO效果,因为这只是打好了SEO的基础,要想获
- 在上次写完《史上最牛GOOGLE收录单页面时间记录:60秒》之后对WordPress的优化更有感触,于是这里总结下WordPress创建CM
- 《三联生活周刊》杂志封面小镇里混网吧的待业青年与身家千万的私营企业主,在多大的层面上会取得利益的一致?他们能否结成利益的共同体?这是一个社会
- server|window
- z-blog最新版,给文章页侧栏弄得都是js调用,要加强制代码才能是include调用,这样才符合某些SEO大人的要求。拿荆棘鸟博客来说,侧
- Linux操作系统以其独有的开放性、稳定性、高效率等特点,受到越来越多有识之士的青睐。随着IT产业巨头纷纷宣布对Linux的支持,Linux
- 在地方网站中比较成功的往往是一些分类信息站点,例如新疆地区的乌鲁木齐网、内蒙古地区的找查发网站,都是以发布各种信息为主,极大的丰富和方便了当
- 由外国破解小组透露出的最新消息表明,暴雪不久前开始Beta测试的新一代即时战略游戏《星际争霸2》在破解进度上取的重大突破,目前已经可以进入单
- 前段时间很多typecho用户反映受到垃圾评论的困扰,因为某些国内服务器无法连接到Akismet服务,所以垃圾评论肆虐。有的用户即使启用了A
- 10月14日消息,据国外媒体报道,今年第二季度,中国网络游戏收入同比增长了39.5%至9.06亿美元,腾讯公司上升至榜首,领先于竞争对手盛大
- 粗略算下来,阿里妈妈离开张已经有一段时间了,跟一开始的高调宣传有所不同的是,阿里妈妈在做完了前期的网站积累之后,开始了自身消化的过程,炒作的