又到了一年一度的春运抢票季,为了显示自己在过去一年里并没有闲着,铁道部又在购票上采取了新举措,除了与马云合作,从自身后台分离出余票查询系统,并布署到“云端”,从而保证了服务器不瘫痪以外,为了防止抢票软件与黄牛,12306还祭出了一套全新的验证码系统——图形验证码。购票者需要在八张图片中,选出符合要求的一到数张,才能通过验证进入抢票环节。
图形验证码刚刚推出的时候,的确难倒了不少黄牛和抢票软件,也让普通的购票者叫苦不迭。据360浏览器提供的大数据显示,12306后台共有581种图片验证码,按照要输入两个关键词的规则,排列组合高达336980道。一次性输入准确的比例只有8%,2次输入准确的比例为27%,3次甚至4次以上的比例才到65%,不及2015年高考录取率75%。许多购票者都吐槽说,“12306的验证码,已经击败了全国99%的购票者,我已经找不到回家的路了。”“不买票,真不知道自己见识少。”
但这仅仅是一开始的情况。在经过预热并熟悉了套路之后,输入验证码的准确率便有了迅速的提升,大部分购票者还是能够成功的通过验证买到火车票。后来铁道部的相关负责人也作出了回应,“根据今年预售春运车票以来12306网站10多天的后台监测及统计数据,放票时段图形验证码的一次识读正确率为70%,非放票时段更高。”
而与之相伴随的是,黄牛党和抢票软件也找到了破解该图形验证码的方法。昨日某知名抢票浏览器就宣称,图形验证码已被破解。据业内人士介绍,这种验证码可以被光学字符识别技术加一些后台软件轻松破解。采取图片技术之后,破解的难度相对提高,图片对应字符也增加了难度。但根据实际测试表明,借助于Google等巨头的智能识图技术,电脑软件能够识别大部分图片的涵义,准确率达到85%。另外职业黄牛们也表示,即便没有先进的破解工具,他们也可以“去一些人工成本较低的地区,雇一些人专门刷验证码,其他的流程则交给机器。”
从目前的情况看,12306的图形验证码仅仅只是拦住了部分图盲用户,并没有挡住汹涌而来的抢票者。
“中国铁路网的图形验证码还是太简单了。”来自旧金山的IT工程师、前google职工Brandon Maxwell告诉记者。Google曾经成立了recapcha项目,该项目的主要工作就是设计专门的验证码,并提供给各种网站使用。Brandon Maxwell曾在recapcha项目工作过,她表示recapcha的难度要大得多,相比之下12306还只是小儿科。
据Brandon Maxwell介绍,所谓验证码(CAPTCHA),其实就是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)。该测试得名于计算机科学之父、人工智能之父艾伦·图灵,主要内容是通过一定的方法,来区分计算机与人。最初图灵提出,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。而2002年路易斯·冯·安第一次将扭曲的文字用于区别人和计算机,就是我们现在普遍见到的英文字符验证码,后来他将验证码公司Re-CAPTCHA卖给了google.
然而无论是图灵还是路易斯·冯·安,都没有想到今天的计算机会发展到如此先进的地步,而图灵测试也逐渐演变为人类与计算机之间的一场拉锯战。随着计算机的进步,区分人类与计算机的验证码也被设计得越来越难。“这是一种必然的趋势。”Brandon Maxwell表示。而且为了有效区分人类与计算机,这些验证码必须由人来进行设计,这意味着真正面临考验的不是那些要通过验证码的用户,而是验证码的设计者。
正因如此,中国铁道科学研究院才决定面向社会,公开招募一批能够胜任这项工作的“验证码设计师”。
几年前,为了维护网络购票秩序,打击黄牛及抢票软件,中国铁道科学研究院专门成立了一个验证码研发中心,并招募了一批优秀的工程师进行设计和研发,在他们手中,12306网站的验证码逐步升级,从简单数字,到数字加字母,到加减法算式,到闪烁变形字母(动态码),再到中间添加干扰线的变形字母,并最终进化成为今天的图形验证码。据了解,最初那581种图片正是这批工程师的功劳。
随着抢票软件的升级,验证码图片库也不得不继续更新,并因此出现了许多更高难度的验证码,从内容看,这些验证码涉及了多方面的知识,包括娱乐圈知识、地理知识、军事知识、电影知识乃至武侠小说知识。虽然在网友们看来,这些验证码的知识面已经惊为天人,但在验证码研发中心的马主任看来,却“远远不够”。
马主任告诉记者,据铁道部“黄牛及抢票软件情报中心”的侦察显示,目前黄牛党和抢票软件开发者们已经组成了“反验证码特种小组”,专门负责研究如何攻克12306的图形验证码。这些小组汇集了来自国内知名高校的在校生与毕业生,既有核工程出身的纯正工科生,也有油画系毕业的文艺青年,其中不乏硕士以上学历者。每当12306推出新的图形码,他们就会第一时间分析研究并给出破解方案。
在“高材黄牛”面前,12306在人力上已经有些捉襟见肘,看着自己绞尽脑汁想出来的验证码被黄牛轻易攻破,一些设计师当场吐血三升,倒地不起。整个验证码研发中心都承受着巨大的压力。如何才能应对日益强大的反验证码特种小组呢?马主任指出,唯一的办法只能是补充兵源、扩大队伍、强化素质。
在验证码设计师的招募令上,铁道部对应聘者做出了极高的要求,首先在学历上,必须至少是国内知名高校的硕士以上学历;在工作经验上,则要求一到两年的相关从业或实习经验,最好能有项目成果;在专业知识上,要求必须精通自己所在的专业,同时对其他领域知识也有一定涉猎。另外在视力上,铁道部也做出了非常严苛的规定,要求必须能够分辨低像素图片,拒绝脸盲、色盲及中度以上近视者。