“看脸黑科技”另有用意
人眼摄像机50米内“盯”上你“看脸黑科技”另有用意
记者/李晶
电脑上只安装了一件小小的设备,屏幕上瞬息万变地显示着从云端获取的信息分析结果,只需要输入人物的特征,使用车辆的特征,即使那个要找的他远在天边,也能在几分钟之内行踪遁现。这是《速度与激情7》中的一个片段。现实中,科技发达的美国在寻找马拉松爆炸案凶手的时候,并没有这样的一套设备,而是通过电视等媒体广泛征集线索,最终通过“人肉”的方式,才将凶手捉拿归案。
影片和现实的差距不言自明,而现在,就在我们身边也许有一只“眼睛”已经接近那个《速度与激情7》里演绎过的片段,它的名字就叫做“人眼摄像机”。
像人眼一样看世界
让计算机看懂世界,是很多人工智能企业的目标。在实现这个目标的过程中,格灵深瞳又迈出了一大步。10月25日的安防展上,格灵深瞳公布了一款名为“深瞳人眼摄像机”的设备。在它面前,数十米的范围内,你已经被“盯”上了。
说被“盯”上了,可能还不够准确。实际上,“深瞳人眼摄像机”带来的是一个“既能看得远又能看得广”的解决方案。因为这个灵感来源于人的眼睛,索性名字中也就加入了“人眼”两个字。
为什么要像人眼一样看世界呢?这和人类眼睛的构造及功能息息相关。我们知道人眼平视时,可视角度超过了180度,尽管视觉系统会把焦点放在前方,旁侧的视野范围只提供了模糊的画面,但这正是眼睛最独特的地方,它将关注点集中在一处,其他非重要的信息只留给余光去观察。
如果,摄像头能像眼睛这么“聪明”,会发生什么呢?
那么,在可视的范围内,那些更值得关注的区域被分配更多像素,重点看清,而其他的地方则一般看清即可。传统摄像头一般在安防领域应用最广,其次还有交通管理及办公环境管理等,这就意味着摄像头观察的最重要的目标是人和车辆。换言之,只要把人和车辆看清楚,摄像头就能完成它的使命。
无论是蓝天白云,或是雾霾阴沉,无论是碧树绿茵,或是枯枝落叶,这些都不是安防监控摄像头应该关注的重点,并不需要将宝贵的像素浪费在这些地方。
说到这,“人眼摄像机”的目标就明确了,只要看懂人,看懂车辆,就算完成基本任务。不过,这可不是个容易的任务!
▲人脸拍摄测试,理论上说看清一张人脸需要至少75×75 像素
看得广和看得远,二者不能兼得?
传统摄像机拍到的人和车辆作为视频输出时,遇到的最大挑战是分辨率的问题。一般情况下,1080P级别的摄像机拍摄距离10米左右时,其人脸的识别像素只能达到30×30左右;2013年4K摄像机推出,同样的10米距离,人脸的识别像素可以达到1080P摄像机的4倍,即约为60×60像素;去年更高级别的7K摄像机由一家加拿大公司推出,同样10米距离,它可视的人脸分辨率约为 120×120像素。
然而,问题是看清一张人脸需要至少75×75像素,这就意味着当前应用的1080P摄像机和因成本过高尚未得到广泛应用的4K摄像机几乎都难以满足“看清”人脸的要求,7K摄像机虽然有可能“看清”人脸,但这样一台设备的售价高达20余万元。
从理论上说,更为高清的摄像机把人脸“看清”只是迟早的事情,但我们似乎忘了另一件事,就是越来越高清的视频意味着需要更大容量的空间进行存储。一个数据显示,硬盘厂商每生产两块硬盘,其中一块就用于安防视频的存储。尽管如此,安防视频通常也只会保留一两个月,现有的存储介质就会被覆盖上新的视频内容。
人眼摄像机如何解决“视觉”矛盾?
不得不提到格灵深瞳的独特算法。他们模仿“人眼”的构造,让人眼摄像机在满足传统摄像机同样视频画面需求的同时,能够通过人工智能算法识别关键的信息(人和车辆),将摄像机的焦点实时地、动态地分配给关键目标。这种技术就是他们所说的“瞬时动态分布”。
采用这一技术,人眼摄像头可以在50米左右的范围内,识别人脸信息。与传统摄像机相比,同样在10米范围内,可提供的人脸识别图像能达到300×300左右,相当于图像呈现的画质得到了将近100倍的提升。
10月19日,人眼摄像机的媒体发布会上,在雾霾天气下进行了一次现场测试,当40多位媒体记者正常地行走在路上时,人眼摄像机在动态下拍摄了每个人的人脸特写。几分钟后,与网络摄像机拍摄的人脸对比,所有测试者均被100%地比对出来,而现场提取的图片显示,有一位距离人眼摄像机41米外拍下的人脸,仍然较为清晰,肉眼就可识别特征,当然,计算机更能轻松地看懂她的脸。
计算机不解美丑 “看脸”另有用意
看懂,只是人眼摄像机的第一个用途,而它更令人期待的是内置的一款功能强大的人工智能芯片。有了这颗“芯”,它在看懂的基础上,还能提供另一个强大的功能——模拟人脑的智能。
芯片上运行着格灵深瞳已经大量训练和巨幅调优的深度算法,在人眼摄像机拍摄监控画面的同时,这颗“芯”已经在做信息分析,并将这些分析结果以“结构化”的方式上传给云端或其他存储介质。
这种在视频前端进行的“结构化”输出,可将视频中的关键目标(人和车辆)的特征进行标示。比如看出人的性别、有没有胡子、服装颜色、是否背包等,以及看出车辆的品牌、颜色、车型,甚至是不同年份稍有修改的车款也能分辨。
试想一下,当寻找失踪儿童时,公安部门可能只有时间线索以及嫌疑人的衣着特征。按照现有的技术手段,需要调用大量警力集中查阅无数的视频。如果利用人眼摄像机,由于其“结构化”输出的特点,只需输入时间和嫌犯衣着特征,就像网页搜索时输入关键字一样,很快就能找到匹配的线索。
有数据显示95%的犯罪与车辆有关。人眼摄像机能够结构化输出车牌、车型等信息,并且还能在一定范围内观察到车辆内部的情况,比如驾驶舱中人的样子。
80后主导的“黑科技”团队
把科幻带到现实中的是一位名叫蔡炀的80后,他曾就读于美国卡内基梅隆大学,而后来到了格灵深瞳这个大家庭。实际上,格灵深瞳也是一家非常年轻的企业,是由前美国谷歌资深研究员、谷歌眼镜的核心研发团队成员之一的赵勇,于2013年才回国创立的。蔡炀介绍说,现在他们的人眼摄像机的项目聚集了公司40多名同事,大家拥有不同的专业背景,走在一起却碰出了别样的火花。■