触摸控制方式未来将逐渐取代物理按键,但是,我们也都知道触控并非是唯一被选择的交互方式。除了语音、手势这种现在日常生活中常见的方式外,眼球、意念控制等都曾出现在各式各样的概念产品上。

 

今天的主角就是手势控制技术,手势控制是重要未来人机交互的重要发展方向。其实在游戏领域,早就出现了手势交互的产品,比如任天堂 Wii 和微软 Kinnect 等,通过摄像头识别常见的手势和身体动作,用户不必重新学习复杂的命令和控制工具,彻底颠覆了传统游戏的交互方式。

 

手势控制,天下三分

 

手势识别的具体技术大概可以分成三种 —— ToF 技术、结构光技术以及毫米波雷达的技术,下面就分别来说道说道。


No.1
ToF 技术

ToF 的全称为飞行时间(Time of Flight),是一种通过计算光线的传播时间来测量距离的技术。根据距离的不同来判断出不同手指的具体位置,从而判断出具体的手势,再对应到相应的控制命令之上。

 

要通过光线传播来测算距离,那么就需要一个能够发射光线的装置和接收光线的感应装置。大众使用了一个 3D 相机模块来发射脉冲光,再利用内置的感应器接收用户手部反射回的光线。然后,根据二者的时间差,处理芯片就可以构建出手部目前的位置和姿势。

 

大众手势识别技术中藏在换挡杆后方的 ToF 摄像头(红点位置)

 

通过实时采集这些信息,中控系统就可以调用相应的数据库获得用户正在进行的动作。再根据预先定义的功能,就可以实现不同的操作。由于光的传播速度非常快,基于 ToF 技术的感光芯片需要飞秒级的快门来测量光飞行时间。这也是 ToF 技术难以普及的原因之一,这样的感光芯片成本过高。

 

No.2
结构光技术

结构光技术基本原理与 ToF 技术类似,所不同之处在于其采用的是具有点、线或者面等模式图案的光。以英特尔公司的集成式前置实感摄像头为例,其包括了红外激光发射器、红外传感器、色彩传感器以及实感图像处理芯片。

 

英特尔实感技术所用摄像头

 

其基本原理为:首先激光发射器将结构光投射至前方的人体表面,再使用红外传感器接收人体反射的结构光图案。然后,处理芯片根据接收图案在摄像机上的位置和形变程度来计算物体人体的空间信息。结合三角测距原理,再进行深度计算,即可进行三维物体的识别。摄像头把采集到的信息发送到负责实感计算的软件开发包(Software Development Kit,SDK)后,该 SDK 结合加速度计算器,就可以提供手势识别等功能。

 

作为一种快速、便携、高精度的三维测量技术,结构光测量技术在航空、模具、医疗等领域均得到了广泛的应用。手势识别只是其中的一个应用案例。

 

No.3
毫米波雷达

毫米波雷达的原理同样与 ToF 技术基本相同,只不过用于测量的介质从光线变成了无线电波。例如谷歌的 Project Soli 利用内置的毫米波发生器把无线电波(雷达波)发射出去,然后利用接收器接收回波。这时,内置的处理芯片会根据收发之间的时间差实时计算目标的位置数据。

 

谷歌 Project Soli 芯片

 

通过比较不同时间段手指位置的不同,Project Soli 就可以与内置的数据比较,得到手指正在进行的动作。毫米波雷达的缺点在于信号容易被空气阻挡,扫描范围有限,因而对远距离目标探测不清楚,但对近距离目标勘测十分清晰。在主动安全技术中,毫米波雷达的身影已经不可或缺。另外,在近程高分辨力防空系统、导弹制导系统、目标测量系统等均有应用。

 

手势控制是近年来发展起来的全新的交互方式,与一般的按键、语音等交互方式不同,手势控制更容易掌握和应用。但由于目前技术的限制,依旧存在使用成本较高、手势识别正确率较低等问题,因此目前没有得到广泛的应用,相信随着技术的发展革新,手势识别必将在更多的领域发挥功用。

 

The End
手势控制离我们还有多远?

虽然手势控制很容易吸引众人眼球,但离真正的大规模应用还有一定的距离,主要原因不外乎两个,一是技术本身还不够成熟,二是没有切中用户痛点。

 

ToF 技术在应用时具有明显“外部叠加误差”的缺点,所谓外部叠加误差,是相对于由于光线散射导致的内部叠加误差而言的。误差产生的原因在于相机发射的光线在到达手部时没有直接返回相机的感光原件,而是通过几次不规则漫反射才回到相机模块,这样测量出来的距离就与实际距离不匹配。然而,如果相机中的背景是固定的,感应器就可以忽略外部叠加误差引起的测量错误。

 

毫米波雷达来捕捉动作、距离、速度等信息,感应误差精细到毫米。如何把具有如此精度的设备微小化是一件十分苦难的事情,最难的地方在于微小化会影响器件的发射功率和效率、感应灵敏度等。谷歌用了十个月左右才将 Project Soli 从 PC 主机大小缩小到了硬币大小,且为了提高精度与排除干扰,用到了两个发射器与四个接收器。

 

结构光技术从技术本身来说,最需要解决的问题首先是合适的使用场景。另外,从现场体验来看,识别的准确度还有待提升。

 

除了技术研发上的难题之外,用户在使用时的体验也对开发者提出了挑战:与传统操作方式的不同就要求开发团队设计一套新手教程,以此来让用户逐步体感技术的使用方法;用户在使用过程中可能手的一部分会在探测区域之外;在实际的应用中,系统也会需要根据环境进行摄像头的矫正,存在一个学习的过程。这些都是需要开发团队提前想好应对策略。

 

目前的手势控制仅能实现比较简单的功能,即便如此,在真正的用户体验过程中还是会出现一些问题。不管是采用 ToF、结构光还是毫米波雷达识别手势,都要求手势指令必须在特定的区域内操作,与此同时,所有手势还必须要符合系统对动作的标准要求,这样一来,手势指令的正确识别率难免会大打折扣。