文/吕方锐
除了咱们能看到的图片验证码,12306还做了其他很多努力。
想在抢票之余锻炼一下眼力,拼一拼智商,那么你绝对不能错过12306(中国铁路客户服务中心)最新的图形验证码系统。从8张图片中仔细辨别正确的答案,能体会到玩“连连看”“大家来找茬”等游戏的乐趣。当然,你还必须具备广博的学识,要随时准备应对诸如“请点击下图中所有上过3.15晚会的企业”“请选出所有的秦国货币”这样的“高冷”考题。
为了对付黄牛,12306官网可谓煞费苦心,单单是验证码一个环节就不断升级:数字、字母、加减法、闪烁变形字母、干扰线变形字母、图片……
验证码,验证的到底是啥
验证码存在的唯一意义,就是借以区分在这个页面上进行输入的到底是人还是机器。12306的验证码“进化史”,是一部不断与黄牛和抢票软件斗智斗勇的“血泪史”,从一开始的简单数字、字母、加减法,再到闪烁变形字母、干扰线变形字母……由于数字和字母组合可被抢票软件自动分析识别,自今年3月16日起,12306又启用了被广大网友吐槽不断的图形验证码。
据统计,目前12306的图形码数量已多达581种,可细分为12个品类。根据输入两个关键词的登录规则,用户将有机会尝试336980道不同的验证码题目,由于存在一些模糊难辨的图片,再加上特定的“文化差异”,导致一次性输入正确率不高。难怪有网友感慨:“12306的验证码,已经击败了全国99%的购票者,我已经找不到回家的路了。”
随着抢票软件的不断升级,验证码图片库也持续更新,验证难度进一步增加,加入了天文、地理、军事、文学等诸多知识,需用户动用抽象思维能力,但12306的验证码设计者表示“这还远远不够”。
据著名黑客、中国互联网界“老司机”周帅介绍,验证码最早是出现在各种论坛上,主要为了防止恶意注册、灌水、谩骂等特殊情况。早期的验证码是随机数字或字母模式,中期出现了图片文字验证码,现在则普遍流行逻辑验证码,即必须依靠人脑的一些判断才能通过验证。验证码主要是为了确定进行注册、发帖等活动的是个真正的用户,而不是一个自动程序或软件。
具体到12306上,难以辨认的图片验证码为的是防机器自动刷票,对付抢票软件。猎豹浏览器移动工程师李铁军告诉记者,目前有一些不计后果的刷票软件,每秒钟数次提交刷新页面或购票等请求,会给12306网站带来沉重的流量压力,尤其是在购票高峰时段。而难以被软件程序轻易识别的验证码,就能有效防止其反复高频的抢票。
“奇葩”验证码真能防住黄牛?
“黄牛不可能人工去买票,必然是使用抢票软件,”李铁军解释道,“相对普通购票者,黄牛使用的很可能是专业的定制软件,功能更强大,更不守规则。但是目前的抢票软件,对12306图片验证码的识别率都不高,大部分需要肉眼识别。”
据周帅介绍,早期的随机数字或字母验证码,确实可以通过编写对应软件解决;中期的图片文字验证码,带OCR的软件也可以绕过;而目前的这种图片结合逻辑判断的验证码,从技术上对抗机器人软件确实效果不错,除非网站代码自身有漏洞,否则很难绕过。所以12306的图片验证码,对黄牛软件确实可以实现有效的封堵。但目前来看,逻辑验证码的缺陷是逻辑问题的设定上需要花费大量精力和技巧,最好能实现简单清晰。北京邮电大学网络技术研究院教授马严也表达了相同观点,虽然有些验证码难度较大,但对于抢票软件还是比较有效的。
“在肉眼识别验证码上,黄牛和正常人相比,优势不明显。相反,如果没有验证码或验证码很简单被破解,被黄牛抢走的概率会远比现在高,普通人买票只会更难。”李铁军补充道。
你跟黄牛之间差了多远
据李铁军介绍,目前市面上专业抢票软件,对验证码进行破解的方式主要分为两种。一种是利用第三方“打码”平台,另一种是对图片进行标注匹配。
这里“打码”指的是人工识别验证码。即有专业的识别验证码的人工团队,配合软件进行刷票工作——软件负责常规的操作步骤,人工团队负责识别验证码,人工团队为外挂机器人服务。这种方式最早源于游戏产业,游戏为了拦截游戏外挂登录,设了验证码,这时就有一拨人建立了平台,每天的工作就是识别各种验证码后,将结果反馈给平台。这种平台就被称为打码平台。
对图片进行标注匹配可以适用于图片数量一定、图片库不常更新的验证码。假设12306的验证码都来源于一个图片库,里面有1000张图片,通过随机抽取其中8张图片构成验证码。那么就存在一种方法,即人工识别1000张图片后标注关键词,将被标注的图片存入识别软件,当随机出现验证码时,识别软件通过匹配已保存的图片找出关键词,回答出验证码问题。
由于12306的图片并不是固定不变的,源源不断地更新图片有效封堵了第二种软件。而对于第一种的“打码”平台,黄牛相比普通旅客,对验证码的识别并没有更快速准确,也就失去了意义。
即使在人工验证上,黄牛和普通旅客打了平手,但黄牛还有软件帮忙呢,咱们能抢得过黄牛吗?
防黄牛仅靠验证码还远远不够
其实除了咱们能看到的图片验证码,12306还做了其他很多努力。据李铁军介绍,验证码拦截只是表面,12306还用了很多其他措施防黄牛。普通旅客是注意不到的,只会吐槽验证码带来的不方便,却不明白正是这套机制才给了普通人成功买到票的机会。
这些措施包括:禁止账号多处登录。以往一个账号可以在多个浏览器,多台电脑或手机上同时登录抢票,这是当时黄牛惯用的手段,现在已经无法实现了。刷票过于频繁的账户,直接封锁其IP地址。黄牛高频操作远多于正常人,软件频繁刷票抢票会导致黄牛的IP地址被网站封锁。强化实名制。通过前一阵账号和手机号的双向绑定,使盗取他人身份信息注册的账号被废。限制账号添加联系人。一个账号目前最多只能加15个联系人,且半年不能删除。也就是说,一个黄牛账号最多只能买15张票;一个身份证最多只能被5个账户加为联系人。
这些措施可以防止黄牛冒用他人身份注册、买票,结合让人头疼的图片验证码,也基本封堵了黄牛的抢票活动。
另外,12月10日,中国铁道部总公司宣布将剔除12306部分难辨识验证图,小伙伴们敲起鼓来打起锣!
道理我都懂,为啥票还是买不到
最后我们不得不承认,抢票难是因为铁路运力有限,票少人多。
其实12306官方推出了刷票程序。打开12306“车票预订”界面后,在“更多选项”中设定好购票条件,勾选“自动提交”,在有符合设定条件的车票时网页就会自动提交订单。
另外今年买票还有一些特殊情况,兴许会成为你的救命稻草。据中国经营网中经观察报道,由于涉及到列车运行图调整,目前北京发往全国各地的多趟列车还未放票,备注一栏也写着“列车运行图调整,暂停发售”的提示,仍有抢到票的可能。这是因为自明年1月10日零时起,全国铁路将实行新的列车运行图,增开旅客列车285.5对,其中增开动车组列车281.5对。这些受到调图影响的车次也将提供很大一部分运力,只是现在具体开售时间还未确定。
此外,临近春节时,铁路部门还将加开大量旅客列车,这些列车都是提前40天售票,从12月16日起售。因此,建议旅客随时关注12306网站相关车次、车票信息,方便第一时间买到心仪车票。
同时,除去在发售第一时间抢票,旅客也不要放过“捡漏”机会。根据中国铁路总公司发布的购票攻略,“捡漏”关键节点有以下几个,第一个是起售45分钟后,再一个是开车前15天,第三个机会是开车前48小时,第四个机会是开车前24小时。■