×
传感器 > 传感器技术 > 详情

3D体感技术三大核心环节揭秘

发布时间:2024-05-18 发布时间:
|

  3D体感的技术是光学精密仪器与制造、模式识别、图形图像、机器学习和神经网络技术集大成者,跨越多个领域的高精尖技术。所以,在2010年微软Kinect推出以来,鲜有第二家公司和研究机构完全突破体感交互的所有技术环节。3D体感核心技术包括3D拍摄、人物提取和骨架识别。我们来浅析一下3D体感技术每个核心环节的技术特点。

  一、骨架识别技术

  骨架识别的技术解决方案主要由数模逻辑推理和机器学习两种方案。数模逻辑推理是通过有人体的某个关键可识别的关节点,通过人体特征推理出人体每个关节点的位置,这种方法简单易实现,但是人体是柔性、易变形,随机动态变化的,没有一种逻辑推理方案能够把人体的运动给模拟出来,导致识别准确率不高没有实用价值。这就是OMEK(被Intel收购)和Softkinetic(Intel合作伙伴)几年也不能推出商用化产品的原因。机器学习的方法是通过大集群计算机“学习”几千甚至万亿的人体行为样本,来得到基本人体行为模型,就像小孩子成长的过程。但是机器学习和神经网络是近几年来逐步兴起的技术,还不是太成熟,选择什么样的“学习”方法和什么样的特征样本是至关重要的,是需要不断试验的。但是大集群计算机计算本身成本就异常的高,动则千万人民币,没有扎实的研究基础,一般厂商不敢轻易尝试。

  二、人物提取技术

  对于人物提取来说,就是要把复杂的动态的环境去除,把真实的“人”提取出来。这个在工程上也是有较高的难度,比如人与桌子接触,人与人握手和人体被局部遮挡。抽象理解就是人体分割和人物跟踪在现有的基础条件下,不会有完全精确的解决办法,只是相对的解决。

  人体的动作是三维的,当然对人体动作的测量也必须是三维的。3D拍摄或测量技术实际上是相对比较成熟的技术,具有多种解决方案,比如单彩色摄像头,双彩色摄像头,光干涉,超声波、结构光散斑和TOF(测量光的飞行时间)等等。除了TOF,其他的测量方式可以说都是基于三角测距的原理,不同在于对特征点的提取的不同。

  对于人体动作来说最主要的难题就是三维测量的实时性和3D测量数据对骨架识别的适用性,人眼的反应时间一般小于120毫秒,也就是说3D测量到骨架识别最大允许时间必须小于100毫秒,才能够与应用对接,这就要求三维测量的计算量不能太大,要不然成本太高就不适合消费级产品使用。


『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
从格科微启动科创板.看CMOS图像传感器行业