手势识别已被定义为通过计算设备对人类运动的数学解释。手势可以源自任何身体运动或状态,但通常来自脸部或手。
理想情况下,手势识别使人类能够与机器沟通并自然互动而无需任何机械中介机构。通过检测身体运动的传感器,手势识别使得控制电视,计算机和视频游戏等设备,主要是用手或手指运动。借助这项技术,您可以更改电视频道,调整音量并通过电视与他人互动。
将手势识别为输入,可以使计算机更容易易于物理障碍,并使在游戏或3D虚拟世界环境中更自然的互动。使用手势识别,甚至可以将手指指向计算机屏幕,以便光标将相应地移动。这可能会使传统的输入设备(例如鼠标,键盘甚至触摸屏冗余)冗余。
手势识别以及面部识别,语音识别,眼睛跟踪和唇部运动识别是哪些软件和硬件设计师和开发人员称为“感知用户界面”的组成部分。
感知用户界面的目的是提高存储程序的基础逻辑设计的效率和易用性,该计划是一种称为可用性的设计学科。在个人计算中,手势通常用于输入命令。手势和身体手势可以通过包含“加速度计”和陀螺仪的控制器进行扩增,以感知运动的倾斜,旋转和加速度,或者可以将计算设备配备摄像头,以便设备中的软件可以识别和解释特定的手势。例如,一波手可能会终止程序。
可以说,最著名的手势识别应用程序之一是“ Wiimote”,该应用程序用于从Nintendo的Wii Gaming Platform的用户中获取输入运动。该设备是Wii控制台的主要控制器。它在控制器中包含一个“加速度计”,该计量机可以在三个轴上测量加速度。可以将包含陀螺仪的扩展添加到控制器中以改善旋转运动。控制器还包含一个光学传感器,允许确定其指向位置。为此,使用传感器栏突出显示IR LED来跟踪运动。
微软还是手势识别技术的领导者。该公司的Xbox 360和Xbox One视频游戏机和Windows PC的运动线感应输入设备围绕着网络摄像头式的附加外围设备。该设备允许用户通过使用手势的自然用户界面来控制并与其游戏控制台或计算机进行交互,而无需游戏控制器。该技术使用从用户运动得出的同步摄像机输入。
结合手势识别的系统依赖于算法。大多数开发人员在手势识别中区分了两种不同的算法方法:基于3D和基于外观的模型。最受欢迎的方法利用了从关键部位的3D信息,以获取几个重要参数,例如棕榈位置或关节角度。相反,基于外观的系统使用图像或视频进行直接解释。
除了实施手势识别的技术挑战外,还存在社会挑战。手势必须简单,直观且普遍接受。此外,输入系统必须能够区分运动的细微差别。
查找手势识别解决方案这里。