验证码的故事
作者:kaopulity 发布时间:2010-08-09 12:48:00
老网民们大概都记得,刚开始上网的时候,是不存在验证码(capcha)这么一种东西的。这造成的结果是,垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各种方式轰炸人民群众的眼球。
最先想要解决这一问题的是雅虎——作为互联网时代早期最重要的免费邮件提供商,他们一方面要解决用户们每天遇到的数以百计的垃圾邮件轰炸,另一方面,他们自己的免费邮箱,恰恰又是垃圾邮件的最爱——耗费无数资源所阻止的垃圾邮件,都来自于自己的服务器。这让雅虎开始认真考虑如何解决人机辨识问题。
互联网最早出现的capthca
他们找到一位当时刚刚21岁的天才——Luis von Ahn。 而Luis Von Ahn给出的方案,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码 Capcha。计算机辨识技术还很落后,对于经过扭曲、污染的文字,无法辨识。而人类却可以轻松认出这些文字。这是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符串的图像进行随机的污染,扭曲,再显示给显示器前的人或者机器。凡是能够辨识这些字符的,即为人类。
故事还没完,Luis Von Ahn是那种追求完美的科学家。当全世界数以十亿计的人每天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,他开始思考,其中浪费的人脑智力是否能得到更好的应用呢?
Luis Von Ahn的最终设计是,让人们用这些脑力解决一些计算机无法解决的图书数字化。
在计算机时代以前,印刷术已经存在了数百年,但这些印刷术所产生的书本和报纸等等,对于计算机来说都是模拟信号,仅以图像的形式存在,而非以数字化的形式存在。但是,早期的印刷术并不精确,文字大小不一,形象有差别。而且因为印刷品年代久远,拥有各种细微的缺损和污染。这对人眼来说不是什么大问题,但对计算机来说就麻烦了。
目前在google、yahoo、youtube等各个网站都能看到的双capcha,一个是需要辨认的文档图像,一个是计算机生成的capcha
因此,2002年,luis Von Ahn开始让capcha引用各种无法被计算机辨识的文字图像,目前,已经有上万网站采用他的新一代capcha。每天帮助辨识数以百万计的古老文档。
问题在于,对于最初的capcha来说,计算机实际上是知道答案的。而Luis希望人们辨识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢?
解决这个问题的方法依然体现了Luis一贯的简洁和优美,他让人们每次辨识两个,而非一个capcha,其中一个来自于计算机随机生成的字符串,而另一个则是从文档中选取的计算机不认识的字符图像。只要人们对前一个字符串给出的答案是正确的,那么就判定,人们对后一个capcha的辨识是正确的。
用这一方法,luis的capcha2.0 已经帮助完成了整个纽约时报130年的报纸存档数字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了。
当然,这是美国人在capcha中找到的人肉商机。而相对的,知道中国人和印度人怎么从capcha中寻找人肉商机吗?
简单来说,通过一系列程序转换,亚洲劳动密集型产业把各种垃圾邮件注册、电子游戏金币农民所需要解决的capcha辨认问题,集中给几个专门负责辨认capcha的人手里,这些人的工作就是,替垃圾邮件注册软件辨认capcha,一遍他们能冒充人类,每辨认一个获得半个卢比,每天需要辨认成千上万个capcha。
劳动密集型经济体和资本密集型经济体对人类脑力就是如此区别定价的。


猜你喜欢
- 1、使用Akisment或者Math Comment插件,保护博客不受垃圾链接的侵扰;2、将Google Analytics等统计服务代码尽
- 先说明一下,其实我只是个菜鸟,我做淘宝客也就是两个月的时间,在众多的高手中我只能算是入门罢了。只是前两天我的一个小小经验,我写出来和大家分享
- 在linux 没有实现epoll事件驱动机制之前,我们一般选择用select或者poll等IO多路复用的方法来实现并发服务程序。在linux
- 在安装配置过程中走过很多弯路,现在就简单点总结。方便大家学习参考。安装步骤如下:1、安装ftp,相信这步很简单# yum -y instal
- 随着站点规模的扩大,在线人数的上升,免费空间已经不适用了,就很有必要为自己选择一款收费空间,下面先简单介绍下国外的主机类型,大致分这么几种,
- 最近在调研关联数据的一些东西,需要用到rdf数据库,所以接触了virtuoso数据库。安装的坑其实并不多,之前在windows 10上安过一
- 用NT(2000)建立的Web站点在所有的网站中占了很大一部分比例,但NT的安全问题也一直比较突出,使得一些每个基于NT的网站都有一种如履薄
- “淘宝客”是指帮助淘宝卖家推广商品赚取佣金的人(之前叫淘客)。只要获取淘宝商品的推广链接,让买家通过您的推广链接进入淘宝店铺购买商品并确认付
- 今天来介绍下Godaddy主机域名的转移、转出问题,一定要仔细看哦!PendingTransfers网页可以使你轻松的监测正在转移到你的帐户
- google adsense的搜索广告,有二种形式,一是传统的搜索框,二是不久前推出的“搜索联盟”。这二种有何区别呢?下面做一下介绍。一、搜
- 导读:美国IT网站eWeek今日撰文列举了谷歌发展历程中10件很少为外人所知的事情。以下为文章全文:1、布林曾效力于竞争对手上世纪90年代,
- 其实学生站长是幸福的,因为你们没有经济的强大压力。其实学生站长前途是光明的,因为你们有的是青春年华。其实学生站长是充满活力的,因为新点子,新
- DDoS(分布式拒绝服务)攻击是利用TCP/IP协议漏洞进行的一种简单而致命的网络攻击,由于TCP/IP协议的这种会话机制漏洞无法修改,因此
- 漫画/张建辉在深圳给什么公司打工收入最高?华为一直是网络和媒体热炒的对象,如今,腾讯已成为其强有力的竞争者。昨日下午,香港上市的腾讯控股发布
- Discuz!X自它诞生以来就饱受争议,无论是正面的还是侧面的,它被康盛推出了,那么,它就有他的优势之所在,而discuz作为我们站长运营过
- 如题,我的网站是新开的网站,网站的域名也没有任何记录的新域名。如果大家不相信,就可以新去站长网的站长工具栏目查看下我的域名注册信息,我的域名
- 看完入门篇和进阶篇后,稍加练习,破解一般的网站是没问题了。但如果碰到表名列名猜不到,或程序作者过滤了一些特殊字符,怎么提高注入的成功率?怎么
- 1、查看SSH客户端版本有的时候需要确认一下SSH客户端及其相应的版本号。使用ssh -V命令可以得到版本号。需要注意的是,Linux一般自
- 网站浏览视觉原理SEO出现不是突然的,而是长期以来网站主们在不知不觉中地在揣测人们浏览网站的行为,设法将网站出现在人们眼睛所聚焦的地方。通过
- 1.简介telnet命令用于登录远程主机,是基于Telnet协议的远程登录程序,对远程主机进行管理。telnet因为采用明文传送报文,安全性