×
嵌入式 > 技术百科 > 详情

大库时代下的挑战重重,的卢深视人脸识别未来如何?

发布时间:2024-04-23 发布时间:
|

近日,由雷锋网 & AI 掘金志主办的第三届中国人工智能安防峰会,在杭州正式召开。

本届峰会以「洗牌结束,格局重构」为主题,会上代表未来新十年的 15 家企业,为现场 1000 余位听众和线上几十万观众,分享迎接安防新十年的经营理念与技术应用方法论。

在下午场的演讲环节上,的卢深视CEO 户磊为峰会带来了精彩的演讲。

户磊提到,大库时代,金融、交通、应急管理等众多场景亟需千万级精准人脸识别技术方案。目前行业内现有方案为多引擎,多层级,分库管理模式,具有系统复杂、软硬件开销大、成本高、效率低等诸多不足。

理想的大库识别方案应该具备以下几点:千万级别底库,万亿分之一误识别率,鲁棒性好,高度兼容性,以及价格适宜。的卢深视是全国首个实现省级规模三维人像应用的 AI 公司。

在系统架构方面,分为三个层次,由前端多维智能感知系统、千万大库云端中台和基于大数据的多模态关联分析与预测后台组成。

在技术架构方面,自下而上分为核心算法层、平台技术层、业务中台层和应用层。在算法层,围绕 3D 视觉技术的深度感知算法族、三维重建算法族和人脸识别算法族至关重要。在业务中台层,如何通过数据接入、数据管理、大库管理和人脸比对算法等各技术模块的不断优化,从而提升应用效率至关重要。

再者,的卢深视建立三维数据标准及评价打分体系,这是后续确保三维应用效果的基础,的卢深视结合实际工程应用经验,提出了数据质量要求及评价标准。

户磊还总结了的卢深视 3D 识别的优势:

准确率高,错误率低于万亿分之一,满足金融支付标准。

鲁棒性好,基于深度信息能够做到不受光线影响,针对大角度、浓妆、多肤色多人种等识别场景,也能够准确识别。

安全性高,在活体检测方面,能够实现 2D 平面伪装攻击方式 100%防御。

以下是户磊演讲全文,雷锋网 AI 掘金志作了不改变原意的整理与编辑:

大家好!我是的卢深视的创始人兼 CEO 户磊,今天非常感谢各位行业的专家和嘉宾老师们来听我分享,也特别感谢主办方雷锋网,今年在疫情背景下,AI 安防特别需要一个这样的行业交流机会。

一、大库时代,千万级刷脸系统落地面临的挑战

任何场景的 AI 落地都需要有需求,千万级精准人脸识别是有其需求的,尤其是今年新冠疫情,给我们国家和城市包括应急管理体系、常住人口信息化管理、大交通等在内的领域都带来了全面的考验。

其实在这之前已经有相应的趋势。自改革开放以来,中国从原来的城乡二元化结构逐步走向全面的城市化,特别是近 10 年到 15 年,超级城市不断涌现。

大家应该能感受到,除了北上广深以外,原来所谓的二线城市、准二线城市规模逐步增长,千万级人口的城市不断出现。

千万级人口聚集在一个城市,如何管理?如何服务?这是千万级库才能解决的问题。

同时,疫情也带来一个非常重要的课题,之前的城市管理和城市服务更多地是考虑一些特殊人群,比如公安领域,考虑的是刑侦追逃,刑侦追逃可能是一个几万到几十万的小库。

疫情之后,每个人都可能是病毒的携带者或者潜在传播者,这时,不止特殊人群,我们需要对所有的人进行疫情管控,服务人口的体量一下变成千万级甚至亿级规模。

同时,随着生活基础设施越来越便利,在大交通和大出行体系中,出现了城市千万级人流量在封闭场景中流动的应用。比如地铁是一个封闭系统,一个城市每天载客客流量在 1200 万到 1500 万规模,这也属于大库管理体系。

再比如金融支付,对安全性要求很高,同时它的库也很大,支付宝和微信的刷脸金融支付,后台用户数目都是亿级规模。

行业会员领域,尤其是一些连锁店,可能有几十万、百万甚至千万的会员体系,他们也需要对会员进行精准的身份识别和个性化服务。

这些都是千万级甚至亿级大库的场景,且都有急切的需求,但是现有方案无法充分满足需求,主要存在以下几个问题。

多引擎

公安和安防领域一般采用多引擎的方式,比如一家厂商算法不够准,就采用多厂商、多算法同时进行,通过多重比对提高识别准确率。

这样带来一些问题,一是系统重复建设,资源损耗比较大,整体系统造价很高;二是不同厂商之间系统缺乏统一标准,兼容性也比较差,整个系统很复杂,维护很困难;三是可能这种方式还不能完全满足需求,还是要通过人工逐级排查实现进一步的精准识别,推动身份的确认。

多层级

很多地方会采用区级、市级、省级逐级排查的方式,这样会让不同层级信息无法打通,存在信息孤岛,也使得查询效率低,不具备易用性。

分库管理

通过特定标准或标签对库进行拆分,把大库变成小库,然后进行分库管理和识别,从而提高识别准确率。这也会带来一些问题,比如统筹管理难度大,而且对于具备多重身份的人,数据会变得冗余,严重影响用户体验。

总的来说,现有方案会导致系统复杂、软硬件开销大、成本高、效率低。

我们回归到问题本身,理想的大库识别方案应该具备哪些特点?

首先,需要是千万级别底库;准确率要达到千万、万亿分之一的误识别率;鲁棒性要好,快速且安全,有足够的反攻击能力;性能要开放,能够支持多模态数据接入,兼容性要好;要经济实用,方案切实可行且能利旧。

二、标杆案例研读与标准建库方案

的卢深视成立于 2015 年,是最早一批做三维视觉的 AI 企业,专注三维视觉智能感知技术,在高精度深度感知成像、三维实时高精度重建、三维跟踪识别及感知等技术方向上,处于国际领先水平。

当时我们就在想,人脸的三维信息经过了精准重建之后能用来干什么?这些图像信息里有丰富的人脸特征,加上形状信息之后,特征会更丰富,也能支撑更大库的识别。

所以我们当时就聚焦 3D 人脸识别这个方向,也非常荣幸,我们承接了一些国家级项目,在某个标杆省份实现了一个省级 3D 人脸应用,并且在这个基础之上真正实现了千万级大库的精准识别。

这里介绍的是我们在 2015 到 2016 年的一个案例。这是基于的卢深视“哨兵”三维人像多维数据管控通道实现的,通过设备的部署,协助用户实现了全国首个省级规模三维人像应用,后期,我们把它切换成不需要带证件识别的直接刷脸识别安检方式。

这个设备本身具备“一次通行、多维采集、关联碰撞、全面预警”的特性,在实现二维、三维人脸识别的同时还能提供四轨合一的分析,通过集中式管理平台,还可以实现行动轨迹与综合研判分析。

这个案例当时为什么能够做成?大家一般会想,做 3D 人脸识别首先要建库,但是用户会觉得麻烦,成本就会特别高。如何在用户能接受情况下帮助用户把库建设起来,并且实施好整个系统?

上图是我们当时的一个建设思路,的卢当时采用了“边建边用、边用边建”的创新模式。

从 2D 人脸到 3D 人脸都是在拍人脸,只不过前端的传感器不同,相机从 2D 相机换成了 3D 相机,其实 3D 相机本身包含 2D 信息,这在 2015 年、2016 年是比较前瞻性的应用,现在随处可见,高铁站的人脸识别设备、酒店前台的人脸识别终端都在应用。

我们当时主要通过四个步骤:

  1. 通行人员通过三维终端如配合式设备、通道式设备、抓拍式设备或原有二维终端设备时,终端设备采集通行人员的人脸信息后实时向三维人像库查询。

  2. 三维人像库返回比中的人员身份信息。

  3. 三维人像库中暂未录入通行人员的数据,终端设备向客户已有的二维人像库查询,比对通行。

  4. 未在库人员数据自动录入到三维人像库中,通行人员下次通行时即可完成三维比对通行。

它主要是通过对身份证信息中的照片和现场拍的图像做人脸识别比对,准确率可以保证,在这样的前提下,我们把 2D 摄像头换成 3D 摄像头,就可以同时采集到 3D 信息。虽然采集的 3D 信息质量不一定很高,但是只要有足够的应用频次,就可以帮助用户实现一个高质量的 3D 数据库建设,而不需要特地去建一个 3D 人脸数据库。这是我们的建设流程。

只要思路转换后,就会发现帮助用户建库的方式非常多元,可以有很多入口。人脸取号机、人证核验设备、手持式的移动终端等,所有需要做认证核验的终端都可以变成入库设备,当这些终端应用到生活的方方面面时,采集的效率和频次就会足够高,建设速度就将加快且成本低。

这是支撑的卢这一套系统的产品矩阵体系。

三、千万级刷脸系统关键技术点剖析

首先从系统架构来讲,我们把千万级大库的建库以及比对系统分成三个层次:

前端多维智能感知系统

核心是的卢深视高性价比 3D 结构光相机,它深度集成了高


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
哈德智能HUD亮相CES 京东众筹车联神器