小优智能科技有限公司成立于2015年底,是一家专注于高精度3D机器视觉模组研发、生产及销售的高科技企业。
公司自主研发的3D机器视觉模组采用激光/DLP白光编码光栅结构光+双工业相机方案,还原物体三维信息,广泛应用于消费电子领域、工业领域和安防领域,具有精度高、速度快、成本低的优势。
2017年,搭载结构光技术的iPhone X一经问世,便引来了国内各大手机厂商的纷纷效仿,由此三维人脸识别进入大众视野。人脸识别以其非接触、便捷、易采集等优势,在众多生物识别技术中脱颖而出,在门禁、考勤、安检通关等场景广泛应用。但目前应用的主要是基于可见光的二维人脸识别,由于三维立体信息的缺失,二维识别受环境光、遮挡等影响严重,且防伪能力较差,导致在支付等场景无法使用。三维人脸识别较好的弥补了二维识别的弊端,逐渐成为各家旗舰机型的标配。
三维人脸识别的第一步就是要获得三维人脸模型,这里的关键技术是三维重建,在手机、门禁等消费领域主要用到光学重建。主流的重建方案有三种,分别是结构光方案(Structured Light)、TOF方案(Time Of Flight,时差测距技术)、双目立体成像方案(Stereo System)。接下来,我们对这三种方案进行简单介绍。
结构光方案的硬件主要由投射器和相机组成,其基本原理是,通过近红外激光器,将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集。这种具备一定结构的光线,会因被摄物体的不同深度区域,而采集不同的图像相位信息,然后通过运算单元将这种结构的变化换算成深度信息,以此来获得三维结构。
结构光方案可以再细分为散斑结构光和编码结构光,二者基本原理相同,但细节上还是有差异的。采用散斑结构光的有iPhone X系列、微软Kinect等,激光通过一个透明散射体(如毛玻璃)时,在散射表面或附近的光场中可以观察到一种无规分布的亮暗斑点,这种散斑具有高度的随机性,而且随着距离的不同会出现不同的图案,也就是说,在同一空间中任何两个地方的散斑图案都不相同。只要在空间中打上这样的结构光然后加以记忆就让整个空间都像是被做了标记,然后把一个物体放入这个空间后只需要从物体的散斑图案变化就可以知道这个物体的具体位置。
从建模效果以及集成成本来看,结构光这种方案在未来的优势还是很有前景的,可拓展空间会更加广阔。
2、TOF方案
TOF即为飞行时间法,其测距原理是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)时间来得到目标物距离。相对于3D结构光的点阵投射,TOF则是一面均匀的光源,虽然精度上逊色于结构光方案,但是速度更快,距离更远,范围更大,也得到了比较广泛的应用。TOF可细分为iTOF-Indirect TOF(间接测量飞行时间)和DTOF-Direct TOF(直接测量飞行时间)。
所谓间接测量,即通过测量相位偏移来间接测量光的飞行时间,而不是直接测量光飞行时间。iToF模组的核心组件包含VCSEL(垂直腔面发射激光器)和图像传感器,VCSEL发射特定频率的调制红外光,图像传感器在曝光(积分)时间内接收反射光并进行光电转换,计算发射信号和接收信号之间的相位差,从而获取目标物体的深度。iTOF硬件成本低,且集成度较高,目前应用较广,但是其深度精度在cm级,并且随着测量距离的增大,反射光的强度减小,相位测量的信噪比减小,绝对误差也会随之增大。在对精度有高要求的场景无法应用。
dToF,全称是direct Time-of-Flight。顾名思义,dToF直接测量飞行时间。dToF核心组件包含VCSEL、单光子雪崩二极管(SPAD)和时间数字转换器TDC。SinglePhoton Avalanche Diode(SPAD)是一种具有单光子探测能力的光电探测雪崩二极管,只要有微弱的光信号就能产生电流。VCSEL向场景中发射脉冲波,SPAD接收从目标物体反射回来的脉冲波。Time Digital Converter(TDC)能够记录每次接收到的光信号的飞行时间,也就是发射脉冲和接收脉冲之间的时间间隔。dToF会在单帧测量时间内发射和接收N次光信号,然后对记录的N次飞行时间做直方图统计,其中出现频率最高的飞行时间t用来计算待测物体的深度。
dToF的原理看起来很简单,但是实际能达到较高的精度很困难。除了对时钟同步有非常高的精度要求以外,还对脉冲信号的精度有很高的要求。dToF中的核心组件SPAD制作工艺复杂,能胜任生产任务的厂家并不多,并且集成困难。2020年,在最新款iPad Pro中,苹果首次引入激光雷达扫描仪(LiDAR),就是采用了dTOF的技术方案。除此之外,目前还没有其他公司能够商用dTOF方案。dTOF在精度、功耗、抗干扰等方面都具备iTOF不可比拟的优势,相信随着苹果的引入,会有更多厂家推进dTOF的研发与应用,未来可期。
3、双目立体成像方案
基于双目立体视觉的深度相机类似人类的双眼,和基于TOF、结构光原理的深度相机不同,它不对外主动投射光源,完全依靠拍摄的两张图片(彩色RGB或者灰度图),通过三角形原理计算物体距离,因此有时候也被称为被动双目深度相机。该方案作为比较早的三维人脸识别方案,成本最低,建模精度一般,注定只能沦为中端机型的权宜之计,后续发展空间不足。
本文仅做学术分享,如有侵权,请联系删文