译 | 人脸识别技术综述

人脸识别| 2018-06-14

人脸识别是机器学习的直接应用，这项技术已经被消费者、行业和执法机关广泛采用，它可能为我们的日常生活带来了便利，但也有严重的隐私问题。人脸识别已经超过了人类的工作效率，但是，在某些应用中实际实现时还存在问题。

立足于九十年代MIT的Eigenfaces方法，人脸识别第一次成功的大规模实现是2014年Facebook的DeepFace项目，准确性在实验室条件下达到了人类水平。从2014年开始，更大的训练数据集、GPU以及神经网络架构的快速发展进一步提高了人脸识别在通向现实世界可靠应用的更为丰富的上下文中的效率。

人脸识别的应用可以分类两类：身份验证和识别。这两种场景起初都会把一组已知的主体注册到系统中（图库），在测试期间，提供一个新的主体（测试图像）。人脸验证会计算图库和测试图像之间一对一的相似性，从而确定两副图像是否是相同的主体。例如，iPhone X基于人脸的登录功能或者机场的边境检查就是使用了这样的生物特征身份认证解决方案。目前，HSBC和Ticketmaster都考虑在他们的移动应用程序中使用人脸验证。另一方面，人脸识别计算一对多的相似性，从而在预先做好识别的人物图库中正确地识别出测试图像。它的主要应用是把未标记的照片和已知的资料进行匹配。其中，执法机关会使用这项技术从人群中识别出他们感兴趣的人。

人脸识别技术还可以用于推断人的特征和行为，如情绪、年龄或健康状况。斯坦福大学最近一项颇具争议的研究表明，基于一个从Tinder抽取的数据集，使用人脸分析方法预测一个人的性取向时准确率可达81%。

全球人脸识别市场主要在消费品、工业应用和执法三个领域，据Allied Market Research和Report Buyer介绍，到2022年，这个市场有望达到90亿美元。生物识别解决方案市场的主要参与者包括Safran（FR）、NEC Corporation（JA）、Cognitec（DE）和Face++（CH）。

但是，人脸识别是一种不同于其他技术的生物识别工具。乔治敦隐私&技术法律中心执行董事、人脸识别专家Alvaro Bedoya在近日接受USA Today采访时说，“你可以删除cookies。你可以修改浏览器设置。你可以把手机忘家里，但你不能删除你的脸，你不能把它忘家里”。人脸识别是一种不需要同意的生物认证工具。

越来越多的公民自由和隐私协会指出人脸识别的使用存在违反公民自由和隐私的危险，包括ACLU、人权观察、电子前线基金会以及英国的老大哥观察。有40家协会在一封给Amazon的、有关人脸识别系统Rekognition的邮件上签名，要求Amazon不再允许政府使用AWS Rekognition。2016年，作为Amazon Web Services云业务的一部分，Amazon推出了Rekognition。Facebook在加利福尼亚州也面临着一场根据生物信息隐私法案提起的针对其使用人脸识别的集体诉讼。在谷歌上搜索“Facebook Face Recognition”，第一页的前10个结果中，有6个是关于关闭人脸识别特性，这可以说明人们对这项技术的广泛质疑。

这项技术已经发展了好多年，在标准训练集上得分很高。不过，现实环境会带来一些特殊的挑战。例如，由于姿势的原因，一个人脸部的差别可能比不同人脸部的差别还要大。光照、表情、年龄和眼镜、帽子等遮挡物的差异也会妨碍识别。我们并不是总能获得主体的正面照，使用其他角度的照片会让处理过程增加额外的校准步骤。英国大都会警察局最近在节日期间使用人脸识别的情况就可以说明在现场人群中推广实验室实验还存在困难，超过95%的匹配都是误报。

可靠起见，人脸识别需要大型的训练数据集和强大的匹配模型。谷歌和Facebook利用人们上传到其平台的照片构造了大型的专有数据集。也有开源的大型数据集可供使用。Wild中的Labeled Faces（LFW）于2007年发布，其中包含6000人的13000张正面图像。MS-Celeb-1M是当前最大的名人人脸识别公共数据集，其中包含10K名顶级知名人士的10M图像，而MegaFace的训练集中包含670K不同个体的4.7M照片和1M的干扰项。

一般来说，人脸识别分为三个步骤：定位、标准化和识别。系统首先会定位图像中的人脸并探明轮廓。标准化是调整原始照片，使它接近于正面版本。然后，人脸识别模块会作用于这些经过重定位的人脸。标准化步骤有一种变体，为了模拟不同的姿势，它会通过生成正面照的多种表示来扩大目标空间。从2D图像重构出3D模型，生成姿势的各种变化，然后重新投射到各种2D的变化，就是这种增强技术的一个例子。

从90年代开始，人脸识别就已经不再以手工创建的局部特征为基础，而是转而使用深度学习模型。Facebook的Deepface模型是在LFW数据集上训练的，这是第一个达到人类效率的模型。经典的卷积神经网络（CNN）和架构，如AlexNet、VGGNet、GoogleNet和ResNet，被广泛地用作人脸识别的基线模型。后来，这些模型被用于专门为促进识别和泛化而设计有激活函数和损失函数的人脸识别。Face++、MegaFace、FaceNet是其他一些专门设计用来人脸识别的神经网络模型。

当前，人脸识别面临的挑战包括实现不同姿势、不同年龄人脸变体识别的健壮性、使用“照片简图（photo-sketches）”代替真正的照片、处理低分辨率照片、识别遮挡、彩妆及欺骗技术。

本文文字及图片出自 InfoQ