学校首页 | 学院首页

科普讲堂

科技课堂

厉害了,大数据——从劳荣枝落网,谈基于大数据的人脸识别技术

1128日上午9时许,身负七条人命、潜逃20年的逃犯劳荣枝在厦门某商场被捕。随后126日央视《法治在线》节目中,曝光了抓捕劳荣枝的更多细节,称“大数据精准研判,锁定犯罪嫌疑人”。这则新闻一出,一时间人们震惊于犯罪嫌疑人的残忍至极,同时也惊叹于大数据技术的“机”智过人。



那在过去了20年的时间,而且犯罪嫌疑人被证实已整容,样貌已发生较大改变的情况下,何以精准锁定嫌疑人呢?甚至警方透露的视频中可以看到,嫌疑人的匹配度高达97%以上,这是如何实现的呢?其实,这些都要归功于警方的大数据研判系统。

大数据研判系统,是借助于数据云技术的一种新型应用系统。首先警方将大量在逃人员信息上传到云端,形成云端的数据库,即数据云,数据云可以通过互联网被系统内人员随时随地的访问和调用。而公共场所的监控摄像头——“天眼”监控系统会对拍摄到的每个人的数据进行采集和筛查,通过智能的人脸及体态识别,与云端数据库里的在逃人员信息进行比对,一旦发现信息吻合度达到某个特定值,一般是80%-90%,就会触发数据研判系统,对采集到的的信息进行进一步的分析、判断,并同步传输到相关警务部门,提示关注或建议实施抓捕。


这个研判系统的核心就是基于大数据的人脸识别技术。所谓人脸识别技术,是基于人的脸部特征信息进行身份识别的一种生物识别技术。首先,通过摄像头采集到不同的包括人脸信息的图像或视频,其次,基于人脸检测算法进行预处理,将图像中人脸的位置和大小标定出来。之后提取出人脸图像的若干特征数据,并与数据库中存储的身份确定的对应特征数据进行比对,获取特征相似度。设定阈值,当相似度超过这一阈值时,则认定人脸匹配成功,并把匹配得到的结果输出。


(图片来自网络)

而基于大数据或者深度学习的人脸识别则是在识别之初,建立数据库时,给计算机提供某个人的大量的图片数据,并刻意让这些图片涉及不同的拍照角度、姿态、发型、年龄、肤色等信息,并“告诉”计算机,这些信息是来自于同一个人。经过大量数据的学习,计算机就会从纷繁复杂的信息中提取出多个相对稳定的,不会随年龄、肤色等变化的特征,其中既包括可以用人类语言描述的特征,比如人眼间距,又包括部分不可用人类语言描述的特征。计算机以数字形式描述这些特征,每个特征对应一个或一组数字,将所有特征按顺序排列,就会形成一个高维度的坐标(x, y, z,……),即特征向量,因此一幅人脸图像就可以用一个特征向量表示。当计算机进行人脸识别时,其实就是比较未知图像的特征向量与数据库中已知图像的特征向量。两者空间距离越近,说明相似度越高。

比如下面这两组照片,对于我们人眼来说,我们观察两幅对比图片时往往更容易被图像中人物的发型、胖瘦、肤色、皮肤纹理等表象信息所吸引,造成无法正确匹配的问题。


   

而对于机器来说,排除了干扰信息,提取到特征向量,通过比较特征向量,匹配的结果可能是下面的样子。

所以劳荣枝案中,即使犯罪嫌疑人变老了,整容了,都没有办法完全改变她的面部特征,尤其是那些稳定的特征,计算机还是可以从茫茫人海中把她找出来。

事实上,利用大数据技术协助侦查这并不是第一次,之前轰动一时的北大吴某某弑母案,犯罪嫌疑人成功落网也是因为其触动了重庆江北机场的人脸识别系统,通过信息比对,锁定了吴某某。此外,还有大家都知道的“歌神”张学友演唱会捉逃犯事件,并不是“歌神”威力大,而是大数据技术太强大。

除了协助警方探案捉贼,在寻人寻亲方面,基于大数据的人脸识别技术也正在发挥着重要作用。比如20195月播出的一期《等着我》节目中,首次引入的AI人脸识别寻人技术,通过将孩子小时候照片和现在照片进行特征对比分析,给出相似度,实现跨年龄人脸识别。AI人脸识别技术通过与四川警方合作,找回了共计10名被拐儿童。



目前,基于大数据的人脸识别已经是一个相对比较成熟的技术了,应用的案例不胜枚举。最后,再给大家分享一个离我们学习生活很近的细思极恐的应用吧。在教育信息化2.0时代,人脸识别签到系统已经被引进越来越多的学校和课堂。学生刷脸签到时,通过与其课前提交的照片数据比对,可以准确判断签到人员信息,不仅节约了课堂点名时间而且有效防止代签到。并且随着这项技术的深入研发,不仅能够实现签到功能,还能全程自主的监控每位学生的学习情况,比如上课玩手机、瞌睡等等,之后形成相应的统计数据,并且准确匹配到每一位学生。有了这个系统,妈妈再也不用担心我的学习了。

最后的最后,希望大家都能认真上课,好好学知识学文化,不要成为新技术的奴隶。

                                                


   作者:刘卿卿    

                                                                 编辑:刘卿卿