0
点赞
收藏
分享

微信扫一扫

每次输入验证码,你都在义务为Google劳动


最近看到了一篇文章,一个小小的验证码,它可以玩的很高端,惊叹歪果仁的思维真超前,方案确实有前瞻性。

今天,应用最广的验证码系统就是 ​​reCAPTCHA ​​(Completely Automated Public Turing Test To Tell Computers and Humans Apart,区分人机的全自动图灵测试系统)了。

那么,reCAPTCHA 到底做了多大贡献呢?

2007 年推出之初,reCAPTCHA 每天都能帮助录入 3000 万个字符。2008年,这个数字飙升到了 6000 万个。粗略统计,在今天,全世界每天都有 2 亿个字符通过 reCAPTCHA 录入,相当于人类 15 万小时的工作量。

也就是说,一个人要不吃不喝不睡连轴转两年半,才能完成 reCAPTCHA 一天的工作量。

到今天为止, reCAPTCHA 已经录入了从 1851 年至今的所有《纽约时报》,共计 1300 万篇文章。除《纽约时报》外,reCAPTCHA 还数字化了超过 2500 万本书,而全球的图书数量约为 1.3 亿本。

路易斯在接受媒体 The Hustle 采访时这样评价 reCAPTCHA :“我创造了一个系统,以十秒为单位,数百万小时为增量,来利用世界上最宝贵的资源:人的大脑。

2007 年,reCAPTCHA 的创始人之一,卡内基梅隆大学教授路易斯·冯·安(Luis von Ahn)想到:“如果人类与机器各有擅长,能不能利用验证码系统,让人类和机器共同解决问题呢?”,当时,一个亟待解决的问题就是,如何把浩如烟海的人类纸质典籍数字化。想要数字化文本,一种方法是手工录入。这种方法费时费力,还容易出现录入错误。另一种方法是先扫描文本,再结合光学文字识别技术录入文字。听起来很美,但有些年代久远或本身质量就差的文本扫描出来后实在是太糊了……为了解决文本数字化的问题,2007 年,路易斯推出了新的验证码系统 reCAPTCHA

2009 年,Google 以大约 2780 万美元的价格收购了 reCAPTCHA,并开始利用 reCAPTCHA 帮助标注数据。

2012 年,Google 开始把 Google 街景中难以识别的门牌和路牌加入验证码,请用户帮忙标注。

对于这一目的,Google 也并不避讳。在 reCAPTCHA 官网上,Google 公开说明了 reCAPTCHA 集众人之力标注数据、训练 AI 的“众包”模式。

如今,Google AI 已经能精确辨认路牌上的文字和数字,准确度和人眼不相上下。

举报

相关推荐

0 条评论