CN1218936A - 手势识别装置 - Google Patents

手势识别装置 Download PDF

Info

Publication number
CN1218936A
CN1218936A CN98120765A CN98120765A CN1218936A CN 1218936 A CN1218936 A CN 1218936A CN 98120765 A CN98120765 A CN 98120765A CN 98120765 A CN98120765 A CN 98120765A CN 1218936 A CN1218936 A CN 1218936A
Authority
CN
China
Prior art keywords
gesture
user
hand
word
feature image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98120765A
Other languages
English (en)
Other versions
CN1139893C (zh
Inventor
松尾英明
高田雄二
手嶋光隆
猪木诚二
吕山
今川和幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Panasonic Holdings Corp
Original Assignee
Comunication Research Lab Institute
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Comunication Research Lab Institute, Matsushita Electric Industrial Co Ltd filed Critical Comunication Research Lab Institute
Publication of CN1218936A publication Critical patent/CN1218936A/zh
Application granted granted Critical
Publication of CN1139893C publication Critical patent/CN1139893C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/243Image signal generators using stereoscopic image cameras using three or more 2D image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Abstract

提供一种手势识别装置。摄影设备1拍摄用户手势并存储在图象存储装置2。特征图象提取装置3根据由颜色变化表生成装置13生成的颜色变化表变换从图象存储装置2读取的立体图象数据的颜色并在信道中分解和输出特征图象。空间位置计算装置4通过运用从特征图象提取装置3输出的特征图象的视差计算用户特征部分的空间位置。区域划分装置5用空间区域代码定义围绕用户的空间。手势检测装置6检测用户的手相对于空间区域代码如何移动。

Description

手势识别装置
本发明涉及手势识别装置,特别是,涉及可以自动识别手势的手势识别装置。
通常,已知识别手势(例如,手语)的一些方法。第一种方法是通过检测附在身上的传感器的移动来测量身体的移动。(例如,参考“手势识别方法和应用”,Yuichi Takahashi等人,电子信息和通讯工程师协会,文件D-2第J73-D-2卷第121990号n.页,和日本专利公开号第8-115408号。)根据第二种方法,由照相机通过戴在手上的多色手套检测手,通过颜色信息提取关于手轮廓的信息来测量手指的移动。(例如,参考“运用颜色信息识别手势“,Kazuyoshi Yoshino等人,电子信息和通讯工程师协会,技术研究文件PRU94-52,第39-43页)此外,在第三种方法中,检测从附在身上的光纤发射的光量的变化来测量手指形状的变化(参考日本专利公开号第8-115408号)。
然而,上述第一至第三种方法都要求用户配有传感器、手套或者光纤,而它们会使用户感到不舒服并限制了用户的行动。此外,由于实际上用户的身材尺寸、在做移动时身体移动等的不同,使得通过预先从一个特定人那儿获得身体部分的绝对坐标值来识别移动的传统方法很容易导致识别误差,建议为大量用户记录身体部分的坐标值。然而,这种方法将遇到必须记录与用户数量成正比的大量数据的问题。此外,在传统方法中,把测得的手迹与记录在字典中的手势词汇相对应的手迹,逐字进行比较,以进行识别。这导致了另一个问题,即,当所要识别的字数增加,那么识别所需的时间将按指数极快速增加。
因此,本发明的目的在于提供一种手势识别装置,它可以识别并翻译手势,而不要求用户备有工具。
本发明的另一个目的在于,提供一种手势识别装置,无论用户之中身体大小的差异、在运动中身体的移动等,它都可以正确地识别和翻译手势而无差错。
本发明的又一个目的在于,提供一种手势识别装置,它可以在短时间内(甚至要识别的字数增加)完成识别和翻译处理。
第一方面是提供用于由用户执行的识别手势的手势识别装置,包括:
至少具有用于立体地拍下用户的两台摄像机的摄影装置;
用于在任意采样间隔内,存储从摄影装置中输出的用户的立体图象数据的图象存储装置;
特征图象提取装置,用于从图象存储装置依次提取立体图象数据、从每个立体图象数据提取显示用户身体特征的特征图象并在多个信道中分解和输出特征图象;
空间位置计算装置,用于根据从特征图象提取装置输出的特征图象的视差计算用户的身体部分的三维空间位置;
区域划分装置,用于根据从特征图象提取装置输出的特征图象的视差,把围绕用户的空间分成与用户的身体相关的多个区域;
手势检测装置,用于检测在空间位置计算装置计算的身体部分的三维空间位置上的与用户的手相对应的三维空间位置如何与对应的区域划分装置划分的区域进行移动;
手势字确定装置,用于根据由手势检测装置检测的手的移动,确定相应的手势字;和
输出装置,用于以由操作者识别的形式输出由手势字确定装置确定的结果。
如上所述,根据第一方面,通过拍摄用户的照片获得的立体图象数据提取身体部分的特征,而且通过运用立体图象数据的视差检测手势的三维移动,并根据检测结果识别手势字。这允许识别手势在不需要用户备有任何工具和不需要接触的情况下被识别。装置还把围绕用户的空间分成与用户身体相对应的多个区域,并检测用户的手的三维空间位置相对于划分区域如何移动。因此,它可以经常根据用户的身体适当地进行识别,而与用户的身体大小及用户的身体移动无关,这大大提高了识别的精确度。
根据第二方面,在第一方面中,特征图象提取装置根据形成立体图象数据的各个画面元素的颜色信息,在相应信道中输出特征图象。
根据第三方面,在第二方面中,
特征图象提取装置根据被提取的颜色和由操作者指定的没有被输出的颜色,对于每个信道设定颜色变换表,
根据颜色变化表,变化形成立体图象数据的各个画面元素的颜色信息;和
把根据颜色变化表变换的值与预定阈值区别开来,在相应信道中输出特征图象。
根据第四方面,在第一方面中,
区域划分装置根据空间位置计算装置计算的身体部分的三维空间位置估计没有出现在特征图象中的身体部分的位置,并根据估计位置把围绕用户的空间分成更小的区域。
如上所述,根据第四方面,估计没有出现的特征图象中的身体部分的位置,而且根据估计位置把围绕用户的空间分成更小区域,这能使识别更精确。
根据第五方面,在第一方面中,区域划分装置计算在时间上邻近的特征图象之间的差值,并只有当差值等于或大于预定阈值时,才执行划分区域的处理。
如上所述,根据第五方面,只有当在时间上邻近的特征图象之间的差值达到或超过预定阈值时,装置才划分区域,它减轻了区域划分的计算负担。
根据第六方面,在第一方面中,
区域划分装置把在用户身体前和后延伸的空间分成多个层,还把每个层分成多个区域。
根据第七方面,在第六方面中,
区域划分装置把层分成不同数量的层。
根据第八方面,在第七方面中,
区域划分装置把层分成当它向前时数量递减的区域,从用户的身体角度看,从最后层到前层。
根据第九方面,在第一方面中,
预先把作为识别对象的多个手势字分成多个种类,
而且手势字确定装置包括:
种类字典,其中对于每个种类,预先记录属于各个种类的手势字共有的移动特征,
字典,其中对过每个种类,存储各个手势字的移动的更加详细的特征,
种类检测装置,用于检测由手势检测装置检测到的手的移动属于种类字典之外的哪个种类,和
字识别装置,用于识别由手势检测装置检测到的手的移动与属于由种类检测装置检测到的种类的哪个手势字相对应。
如上所述,根据第九方面,与计算对于每个单字的类似程度的传统方法,分层检查手势字允许在短时间内完成识别。
根据第十方面,在第九方面中,
字识别装置输出属于由种类检测装置检测到的种类的手势字中,相对于由手势检测装置检测到的手的移动具有最高类似程度的一个手势字,作为识别结果。
根据第十一方面,在第九方面中,
字识别装置输出属于由种类检测装置检测到的种类的手势字中,相对于由手势检测装置检测到的手的移动具有等于或高于给定阈值的一个或多个手势字,作为识别结果。
根据第十二方面,在第一方面中,手势识别装置还包括用于通知用户何时开始手势的手势开始通知装置。
如上所述,根据第十二方面,可以通知用户何时开始手势,从而用户可以进行操作而无需焦虑。
根据第十三方面,在第一方面中,手势检测装置从显示移动的起始点和结束点之间检测到的三维空间位置的采样点中,提取移动方向大幅变化的采样点作为控制点,并通过运用起始点、结束点和控制点表示用户的手移动。
如上所述,根据第十三方面,装置从存在于移动的起始点和结束点之间的多个采样点中提取移动大幅变化的采样点作为控制点,并通过运用这些起始点、结束点和控制点表示用户的手的移动。因此,与通过运用所有采样点表示用户的手移动的方法相比,可以更加简单地表示用户的手移动,作为结果,可以更快地确定手势字。
根据第十四方面,在第十三方面中,
手势检测装置检测,
在起始点和结束点之间的采样点,它具有到连接起始点和结束点的等于或大于预定阈值的直线最大距离,
在起始点和邻近控制点之间的采样点,它具有到连接起始点和邻近控制点的等于或大于预定阈值的直线最大距离,
在结束点和邻近控制点之间的采样点,它具有到连接结束点和邻近控制点的等于或大于预定阈值的直线最大距离,
在两个邻近控制点之间的采样点,它具有到邻近这两个控制点的等于或大于预定阈值的直线最大距离,和
把这些检测采样点定义为控制点。
如上所述,根据第十四方面,由于用预定阀值来提取控制点,可以通过改变阀值来自由地改变显示移动的精确性。
根据第十五方面,在第十四方面中,手势检测装置通过运用多个阈值分层检测控制点,以分层表示用户的手移动,和
手势字确定装置根据由手势检测装置分层表示的用户的手移动,分层指定相应的手势字。
如上所述,根据第十五方面,与对所有字计算类似程度的传统方法相比,分层确定手势字能在短时间内完成识别。
结合附图,从对本发明的以下详细描述中,可以更加清楚地看到本发明的这些和其它目的、特征、方面和优点。
图1是示出根据本发明的第一实施例的手语识别装置的结构的方框图。
图2是示出图1的手语识别装置第一半操作的流程图。
图3是示出图1的手语识别装置后一半操作的流程图。
图4示出存储在图1中的图象存储装置2中的图象帧的例子的框图。
图5示出存储在图1的颜色变换表生成装置中的具有代表性的图象的例子的框图。
图6示出包括在图1的颜色变换表生成装置13中的颜色变换表的框图。
图7a至7c示出在相应信道中从图1的特征图象提取装置3输出的特征图象的例子的框图。
图8示出用于解释计算斑点的重心(the center of gravity position of a blob)的方法的框图。
图9示出三维空间位置表的结构框图,其中记录由图1的空间位置计算装置4计算的斑点的三维空间位置。
图10示出从在第三信道中输出的特征图象提取的身体的轮廓形状的框图。
图11示出显示对于图10的轮廓形状所定义的身体特征的代表线的框图。
图12示出由如图11所示的代表线划分的空间区域的框图。
图13示出由图1的区域划分装置限定的空间区域代码的框图。
图14以外观上示出在三维空间中第一至第三维之间的位置关系的框图。
图15示出在第一至第三维中空间区域代码定义的另一个例子的框图。
图16示出区域跃迁表的框图,它包含与当用户进行与“明信片”相对应的手语手势时所产生的手迹相对应的斑点的空间区域代码在时间上的变化。
图17a和17b示出手形的例子的框图。
图18是示出在本发明的第一实施例中检测移动代码的操作流程图。
图19a至19c是示出用于描述在本发明的第一实施例中的控制点检测操作的手迹的例子的框图。
图20是示出从采样点到直线的距离的示意图。
图21示出当指定移动代码时参考的移动代码表的框图。
图22a至22c示出属于第一类的手语手势的例子的框图。
图23示出记录在图1的字典11中属于第一类的手语特征信息的例子的框图。
图24示出对空间区域代码的相似程度的框图,其中空间区代码在三维上接近于记录在字典11中的“手势开始位置代码”和“手势结束位置代码”。
图25示出用于对于参考记录在字典11中的移动代码存储附近代码列表的移动附近代码表的部分的框图。
图26从外观上示出对于向下指的参考移动代码(由实线表示)的四个附近代码(由虚线表示)的框图。
图27是示出根据本发明的第二实施例的手语识别装置的结构的方框图。
图28是在本发明的第二实施例中,在手势检测装置中执行的检测移动代码的操作过程流程图。
图29a和29b示出移动手迹的例子的框图,其中用手迹来描述通过运用在本发明的第二实施例中的低分辨阈值THC1来检测控制点所进行的操作。
图30a至30c示出移动手迹的例子的框图,其中用手迹来描述通过运用在本发明的第二实施例中的高分辨阈值THC2来检测控制点所进行的操作。
图31是用于描述通过运用在本发明的第二实施例中的分层检测移动代码来执行的分层字识别操作的框图。
图32是示出根据本发明的第三实施例的手势识别装置的结构的方框图。
图33是示出运用计算机设备通过软件控制来实现的根据本发明的第三实施例的手势识别装置的结构的方框图。
(第一实施例)
图1是根据本发明的第一实施例的手语识别装置的结构的方框图。在图1中,本实施例的手语识别装置包括摄影设备1、图象存储装置2、特征图象提取装置3、空间位置计算装置4、区域划分装置5、手势检测装置6、种类检测装置8、字识别装置9、种类字典10、字典11、输出装置12和颜色变换表生成装置13。
摄影设备1包括多个电视摄像机,它拍下用户移动的立体照片。图象存储装置2存储从摄影设备1输出的立体图象数据的多个帧。颜色变换表生成装置13根据操作者从存储在图象存储装置2中的立体图象数据的多个帧中选出的代表图象上指定的画面元素的颜色,生成三色变换表,它们分别与第一至第三信道相对应。特征图象提取装置3从图象存储装置2顺序读取立体图象数据,并根据由颜色变换表生成装置13生成的颜色变化表,变换在读取的立体图象数据中的画面元素的颜色数据,以提取显示在第一至第三信道中分解和输出的显示用户的身体特征的立体特征图象。
空间位置计算装置4通过运用在各个信道中从特征图象提取装置4输出的立体图象的视差,计算包括在各个信道中的斑点的三维空间位置(被看作一块图象的每个图象)。区域划分装置5根据从特征图象提取装置3输出的立体特征图象和在空间位置接收装置4中计算的斑点的三维空间位置,划分包围身体的三维空间,而且生成用于限定被划分区域的空间区域代码。手势识别装置6根据从特征图象提取装置4输出的立体图象、空间位置计算装置4中计算的斑点的三维空间位置和由区域划分装置5产生的空间区域代码,检测与手相对应的斑点如何移到与由区域划分装置5生成的空间区域代码相关的空间中。
种类字典10包含被分成多个种类的手语手势(每组包括类似的手语手势)。种类检测装置8检测由手势检测装置6检测的手语手势的特征属于包括在种类字典10中的哪一类。字典11包括属于单个种类的手语字的手势特征。字识别装置9检测由手势检测装置6检测的手语手势的特征与属于由种类检测装置8检测的种类的哪个手语字相对应。输出装置12以图象、字母、语音等的形式输出由字识别装置9检测的结果。
图2和3是示出如图1所示的实施例的操作过程的流程图。参照图2和3,描述本实施例的操作过程。
首先,摄影设备1开始拍照(步骤S1)。在这个操作过程中,包括在摄影设备1中的左右两侧的两个电视摄像机感觉不同角度下的用户身体的上半部分。以适当的采样周期,把从摄影设备1输出的立体图象数据存储在图象存储设备2中。在标准情况下,根据NTSC标准,图象存储装置2在1/30秒采样间隔内存储立体图象数据。然而,可以通过改变采用周期,在另一个采样间隔内(例如,1/10秒或者1/5秒)存储立体图象数据。如图4所示,以时序方式,给存储在图象存储装置2中的立体图象数据的各个帧按顺序编号(编成IMG1、IMG2…)。
接着,颜色变换表生成装置13确定是否设定(步骤S2)设在其中的表设置标志(未图示)。如下所述,当设定颜色变化表时,设定该设定标志(见步骤S11)。首先,不设定颜色变化表,从而表设置标志处于重设定状态,因此进程进到步骤S3。在步骤S3中,如图5所示,操作者从存储在图象存储装置2中的立体图象数据的多个帧中选择图象数据的任一帧作为用于特征提取的代表图象。虽然从摄影设备1输出的图象数据存储在图象存储装置2中,但还在显示装置(未图示)中显示它。操作者在适当时候给颜色编号表生成装置13选择命令,同时查看在显示装置中的显示内容以指定代表图象。然后,颜色变化表生成装置13从图象存储装置2中读取操作者所迭的代表图象的图象数据。接着,颜色变化表生成装置13执行设定颜色变化表的处理(步骤S4至S11)。下面详细描述在步骤S4至S11中所进行的处理过程。
颜色变化表生成装置13包含用于三个信道的颜色变化表131(如图6所示),在这些颜色变化表131中的设定的是与在RGB颜色空间中的所有颜色位置相对应的变换值。由于在这个实施例中,由8比特(0至255)表示每个R、G、B,所以颜色变化表131可能具有与16777216(=256×256×256)种颜色相对应的变换值。然而,因为这个结构需要大量数据时,所以实际上,把RGB颜色空间粗略地分成网孔。变换值分配给独立的网孔。变换值包括0至255。即,无论赋予RGB何值作为输入信号,颜色变化表131都把RGB值变换成0至255中的一个值。即,颜色变化表131仅把由操作者指定的特定颜色输出到第一至第三信道中。
在下面所述的操作中,假设当在第一信道中输出眼睛和头部的颜色时,颜色接近于黑色、当在第二信道中输出脸和手的颜色时,颜色接近于肤色、而在第三信道中输出衣服的颜色时,颜色遍布整个身体。然而普通的电视摄像机输出RGB信号,这里假设第一信道与R信号相对应、第二信道与G信号相对应,而第三信道与B信号相对应。然而,实际上,第一信道可与G或B信号相对应。
首先,操作者指定第一信道作为输出信道。然后,操作者将取出的颜色指定到第一信道中(步骤S4)。在这种情况下,操作者通过运用指示装置(诸如,鼠标器)指定在显示装置(未图示)中显示的代表图象(图5)中的头发部分“a”和眼睛部分“b”。然后,操作者不仅可以指定一个部分,而且还可以指定多个部分。作为响应,颜色变化表生成装置13确定表示指定部分a和b颜色的RGB值作为从第一信道中取出的颜色,并在颜色变化表131中的相应颜色空间区域中设定对于第一信道的最大值“255”(见图6)。此时所获得的颜色信息可以是HSI系统、YUV、YIQ中的任一个。接着,操作者指定不把颜色输出到第一信道中(步骤S5)。在这种情况下,操作者通过运用鼠标器等,指定在代表图象(图5)中的衣服部分“c”和“e”以及脸部部分“d”。此时,操作者可以指定多个部分。作为响应,颜色变化表生成装置13确定表示指定部分c、d和e的颜色的RGB值是不在第一信道中输出的颜色,并在第一信道颜色变化表131中的相应颜色空间区域中设定最小值“0”。接着,颜色变化表生成装置13确定此时指定的输出信号是第一信道(步骤S6),并在步骤S4中指定的颜色和在步骤S5中指定的颜色之间执行给定的插入操作计算没有在步骤S4和S5中指定的颜色的变换值,并在第一信道颜色变化表131中的相应颜色空间区域中设定经计算的变换值(步骤S7)。
这里,例如,上述在步骤S7中执行的给定的插入操作可以是在“通过运用颜色空间变换校正颜色的方法”(Jun Ikeda等人,图象信息和电视工程师协会,1995年年会,n页)中所述的颜色空间变换操作。现在描述这种变换操作。
现在,假设i=1、2、…、n,由下式表示在RGB坐标系统中校正颜色之前的特定颜色:
Si=(ri,gi,bi)
至于在第一信道中提取的颜色,在校正之后的颜色取为
Si0’=(255,0,0)
至于不在第一信道中提取的颜色,在校正之后颜色取为
Si1’=(0,0,0)
然后,当校正量取为Mi时,下列等式(1)有效:
Mi=Si’-Si
  =S’(Si)-Si
  =M(Si)…(1)
将等式(1)作为边界条件,通过离特定点Si的距离解出下列功能等式(2),来确定对于任一颜色S=(r,g,b)的校正S’=(a,0,0)[a=0至255]后的颜色。
M(s)=f(|S-Si|,…|S-Sn|)…(2)
可以通过多种方法解出等式(2)。例如,在任一颜色和所提取的颜色之间的最小距离取为
Si0=min(|Si0’-S|)
而在任一颜色和不被提取的颜色之间的最小距离取为
Si1=min(|Si1’-S|)
然后,可以获得由下列等式(3)所示的校正S’=(A,0,0)之后的颜色。注意,A=0至255。
A=(255×Si)/(Si0-Si1)…(3)
虽然,上述等式(3)通过线性插入解出等式(2),也可以用非线性插入来解出等式(2)。
接着,操作者指定第二信道作为输出信道,并指定取出颜色,而且不在第二信道中输出(步骤S4和S5)。在这种情况下,操作者用鼠标器等指定在所选代表图象(图5)中的脸部部分“d”是在第二信道中取出的颜色。操作者还用鼠标器等指定脸部以外的其它部位作为不在第二信道中输出的颜色。作为响应,颜色变化表生成装置13在第二信道颜色变化表131(见图6)中的相应颜色空间区域中设置最大值“255”和最小值“0”。接着,颜色变化表生成装置13确定在此时指定的输出信道是第二信道(步骤S8),并在步骤S4中指定的颜色和在步骤S5中指定的颜色之间进行给定的插入操作,以计算不在步骤S4和S5中指定的颜色的变换值,并在第二信道颜色变化表131中的相应颜色空间区域中,设定计算所得的相应变换值(步骤S9)。
接着,操作者指定第三信道作为输出信道,并指定要取出且不在第三信道中输出的颜色(步骤S4和S5)。在这种情况下,操作者运用鼠标器等指定在代表图象(图5)中的衣服中的部分“c”和“e”作为在第三信道中取出的颜色。操作者通过运用鼠标器等,还指定除了衣服之外的其它部分(例如,背景部分)作为不在第三信道中输出的颜色。作为响应,颜色变化表生成装置13在第三信道颜色变化表131(见图6)中的相应颜色空间区域中,设定最大值“255”和最小值“0”。接着,颜色变化表生成装置13确定此时指定的输出信道是第三信道(步骤S8),并在步骤S4中指定的颜色和在步骤S5中指定的颜色之间执行给定的插入操作,以计算不在步骤S4和S5中指定的颜色的变换值,并在第三信道颜色变化表131中的相应颜色空间区域中设定计算值(步骤S10)。
最后,颜色变化表生成装置13设定表设置标志(步骤S11),并结束设定颜色变换表131的处理过程。
接着,特征图象提取装置3通过运用由颜色变化表生成装置13生成三张颜色变化表131,变换包括在从图象存储装置2中读取的立体图象数据中的画面元素。然后,特征图象提取装置3只输出等于或大于预定阈值的变换值的元素。于是,以在第一至第三信道中分解的形式,输出当前用户的身体特征的立体特征图象(见图7a至7c)(步骤S12)。图7a示出在第一信道中输出的特征图象,它包括与头发相对应的斑点71、与眉毛相对应的斑点72和73和与眼睛相对应的斑点74和75,作为斑点(被看作一块图象的图象)。图7b示出在第二信道中输出的特征图象,它包括与脸部相对应的斑点76和与手相对应的斑点77和78。图7c示出在第三信道中输出的特征图象,它包括与身体的所有区域相对应的斑点79。
接着,空间位置计算装置4获得包括在如图7(a)、(b)、(c)所示的第一至第三信道中的在特征图象中的斑点的重力位置的图象上(on-image)中心(步骤13)。参考图8,描述用于获得与右手相对应的斑点的重力位置的中心的方法。首先,获得在目的斑点的周围矩分别取(Xst,Yst),(Xend,Yend)为周围矩形的对角线顶点α和β形的坐标。坐标的原点取为如图7a至7c所示的图象的左上角。现在,当在图8中的图象上的斑点的重力G的中心坐标为(Xq,Yq),然后分别由下式(4)和(5)获得Xq和Yq:
Xg=(Xst+Yend)/2…………(4)
Yg=(Yst+Yend)/2…………(5)
用相同的方法获得其他斑点的重力位置的中心。
接着,空间位置计算装置4计算在第一至第三信道中的各个斑点的三维空间位置(步骤14)。现在,在右左两侧的一对相应斑点中,把由在摄影设备1中的右摄像机感觉的斑点的重力位置的中心取为GR=(XgR,YgR),而把由左摄像机感觉的斑点重力位置的中心取为GL=(XgL,YgL),然后,空间位置计算装置4通过运用下列等式(6)至(8),计算该斑点的三维空间位置(Xw,Yw,Zw):
Xw={XgL+XgR)/2}x{d/(XgL-XgR)}………(6)
Yw={d/(XgL-XgR)}xYgL…………(7)
Zw=fx{d/(XgL-XgR)}………(8)
在等式(6)至(8)中“d”表示在右左摄像机之间的位置,而“f”表示焦距。如从等式(6)至(8)可见,空间位置计算装置4通过利用从特征图象提取装置3输出的特征图象的视差,计算斑点的三维空间位置。空间位置计算装置4把在步骤S14中计算的斑点的三维空间位置记录在如图9所示的三维空间位置表中。
虽然是在假设水平放置右左摄像机的情况下,描述计算方法,但是可以把右左摄像机放置在任一位置上。根据在右左摄像机之间的位置关系,可以更改等式(6)至(8)。
接着,区域划分装置5从如图7c所示的第三信道的特征图象中提取如图10所示的身体轮廓。接着,区域划分装置5根据所提取的轮廓检测表示身体特征的代表线(步骤S16)。在图11中,线HUL是与X轴平行的线并接触到人的轮廓的最上端,它表示身体的头顶。线FRL和线FLL是与Y轴平行的线并接触到身体轮廓的上部分(上部1/3处)的右左两端,它们表示脸部的右、左端。把线FRL的垂直延伸部分与轮廓相交的点取为frlp(Xf,Yf)。把当从左端开始搜索图象所找到的第一交叉点取为tempp(Xt,Yt)。从点frlp到点tempp搜索轮廓时找到的具有最大曲率的点是点shp,它表示右肩。线SUL与X轴平行,而且通过点shp。线SHRL与Y轴平行,并通过点shp。线MCL与Y轴平行,并位于线FRL和线FLL之间的中点,它表示身体的中心轴。线SHLL和线SHRL对称于线MCL。线ERL和线MCL对称于SHRL。线ZLL和线ERL对称于线MCL。线NEL与X轴平行,并位于线SUL和线HUL之间的3/4位置上。线BML与X轴平行,并位于线SUL和图象的底部之间的中点位置上。
接着,区域划分装置5获得各个代表线的交点0至21(见图12),把由右摄像机和左摄像机感觉的图象中带有相同交点数的点认为是相应的右左点,与空间位置计算装置4相类似,区域划分装置5通过利用视差计算关于交点0至21的三维空间位置(步骤S17)。例如,对于交点第0号,当把通过右摄像机感觉的图象上的坐标值取为(XR0,YR0),而把通过左摄像机感觉的图象上的坐标值取为(X10,Y10)时,区域划分装置5把那些坐标值代入上述等式(6)至(8),以计算它的三维空间位置。对于其他交点,用相同的方法计算三维空间位置。接着,区域划分装置5根据在步骤S17中计算所得的结果,定义用于如图13所示第一维的空间区域代码(0至24)。区域划分装置5把在人的前面的线MCL和线SHRL之间的距离的第一维空间延伸的区域定义为(25-49),并把在更前面的区域定义为第三维空间区域代码(50-74)。图14从外观上示出由区域划分装置5定义的第一至第三维之间的位置关系。接着,区域划分装置5把定义空间区域代码和用于限定它们的交点的三维坐标值存储在空间区域代码表(未图示)中(步骤S18)。于是,可与用户的身体部分相对应划分区域(脸、颈、胸、腹、脸颊等),同时空间区域代码表示与用户的身体部分相对应的部分。
更理想的是,区域划分装置5可以接收来自空间位置计算装置4的与头发和眼睛相对应的斑点的三维空间位置。然后,它根据头发和眼睛之间的位置关系,估计构成脸的其他元素(鼻子、嘴巴、耳朵等)的位置,而且根据其他元素的估计位置,把空间区域(即,与图13的与空间区域代码(11)相对应的空间区域)分成更小的部分。在这种情况下,区域划分装置5包括鼻子、嘴巴、耳朵等相对于头发和眼睛的先前记录的一般位置关系。当输入与头发和眼睛相对应的斑点的三维空间位置时,它根据在鼻子、嘴巴、耳朵等之间的先前记录的位置关系,估计鼻子、嘴巴、耳朵等在三维空间中的大约位置。然后,区域划分装置5根据鼻子、嘴巴、耳朵等在三维空间中的估计位置,把空间分成更小区域,并定义用于限定它们的空间区域代码。
区域划分装置5可以设置成以计算在某一信道(例如,第三信道)中时间上邻近的图象之间的差值,从而只有当差值等于或大于阈值时,它才建立空间区域代码(如在步骤S18中所示)。在这种情况下,由于只有当用户移动幅度大的情况下才产生空间区域代码,这就缩小了区域划分装置5的计算负荷。如图15所示,区域划分装置5可以在数值更大的维中更加粗略地定义空间区域代码,如从第一、第二至第三维,即,当它向前移动时,在用户的前头。
接着,手势检测装置6从在第二信道中获得的斑点中,指定具有与手相对应尺寸的斑点为手,并确定记录在图9的三维空间位置表中的相应斑点的三维空间位置属于在步骤S18(见图13)中建立的哪个空间区域代码。(步骤S19)把此时确定的结果记录在如图16所示的区域跃迁表中。如图16所示的区域跃迁表包含当例如进行表示“明信片”的手语手势时记录下来的数据。当把在第二信道中的某个斑点的区域取为La,把用于该区域的最小阈值取为THSM,把最大阈值取为THBG时,手势检测装置6确定满足有下列等式(9)给定的条件的斑点是手,,并确定满足有下列等式(10)给定的条件的斑点是代表其他部分的斑点:
La>THSM和La<THBG………(9)
La<THSM和La>THBG………(10)
从上面的等式(9)和(10)可见,确定如图7b所示的斑点77和78是与手相对应的斑点,然后,指定右手和左手。
接着,手势检测装置6确定与手相对应的斑点的移动是否在预定恒定时间或者更长时间内保持静止(步骤S20)。当那些斑点的移动是连续的,重复在步骤S12至S19中的操作。然后,以时间上连续的方法,把那些斑点所属的空间区域代码记录在如图16所示的区域跃迁表中。因此,通过查看区域跃迁表可以知道手是如何相对于用户的身体移动的。
另一方面,当与手相对应的斑点的移动在大于预定恒定时间内保持静止,即,当已结束与一个字相对应的手语手势,手势检测装置6分析记录在区域跃迁表(见图16)中的空间区域代码,并把手的移动分解成元素,以检测特征(步骤S21)。通过存储在图16的区域跃迁表中的空间区域代码检测下列特征。
右手的特征;
      “移动代码”             右→下→左
      “手势开始位置代码”     36
      “手势结束位置代码”     38
      “手之间的位置关系”     线相对于身体对称
      “指定的特定部分”       X
      “手形”                 第4
左手的特征;
      “移动代码”            左→右下→右
      “手势开始位置代码”    36
      “手势结束位置代码”    13
      “手之间的位置关系”    线相对于身体对称
      “指定的特定部分”      X
      “手形”                第4
这里,“指定特定部分”示出由手在一系列移动中所表示的身体的特定部分。记号“X”示出不指定任何部分。“手形”表示接近于多个预定手形模式中的那个手形。图17a和17b示出预定手形的例子。图17a示出与“υ”(它是音标发音为[hi])相对应的第4号手形。图17b示出与“τ”(它是音标发音为[te])相对应的第2号手形。
现在,参照如图18所示的流程图和如图19a至19c所示的手的移动轨迹,更加详细描述在步骤S21中执行的检测移动代码的操作。
如图19a所示把手势的起始点取为ST(xs,ys,zs),而把手势的结束点取为END(xe,ye,ze)。手势检测装置6首先获得把起始点ST和结束点END连接起来的直线L1(步骤S101)。接着,手势检测装置6获得从各个采样点n1至n9到直线L1的垂直线,并获得垂直线的长度d1至d9(步骤S102)。参照如图20所示的广义模型,通过下列等式(11)可以获得从任一采样点n到直线L的垂直线d的长度。注意,由下列等式(12)给出在等式(11)中的变量“t”。 d = { ( xe - xs ) * t + xs - xn } 2 + { ( ye - ys ) * t + ys - yn } 2 + { ( ze - zs ) * t + zs - zn } 2                                                              …(11) t = ( xe - xs ) ( xs - xn ) + ( ye - ys ) ( ys - yn ) + ( ze - zs ) ( zs - zn ) ( xe - xs ) 2 + ( ye - ys ) 2 + ( ze - zs ) 2 - - - ( 12 )
因此,在步骤S102中,通过运用上述等式(11)可以获得从各个采样点n1至n9到直线L1的垂直线长度。
接着,手势检测装置6把具有最长的垂直线的采样点作为控制候选点(步骤S103)。在这种情况下,把具有到直线L1的最大距离d3的采样点n3看作控制候选点。接着,手势检测装置6确定最大距离d3是否不小于预定阈值THC(步骤S104)。当最大距离d3等于或大于预定阈值THC,手势检测装置6把该点n3定义为控制点(步骤S105)。在这种情况下,最大距离d3等于或大于阈值THC,因此把采样点n3定义为控制点c1。
接着,手势检测装置6检测在起始点ST和结束点END之间的一个新的控制点(步骤S106)。重复执行检测新控制点的操作,直至在起始点ST和结束点END之间不再检测到任何新的控制点(步骤S107)。
更具体地说,如图19b所示,手势检测装置获得把起始点ST和控制点c1线路相连的直线L2以及把控制点c1和结束点END相连的直线L3,然后通过运用上面等式(11),计算直线L2和存在于起始点ST和控制点c1之间的各个采样点n1和n2之间的距离,以及直线L3和存在于控制点c1和结束点END之间的各个采样点n4至n9之间的距离。在起始点ST和控制点c1之间,采样点n2具有到直线L2的最大距离d2,而且把它看作是控制候选点。然而,由于该距离d2小于阈值THC,所以不把采样点n2定义为控制点。因此,在起始点ST和控制点c1之间不存在任何控制点。在控制点c1和结束点END之间,采样点n8具有到直线L3的最大距离d8,而且把它看作是控制候选点。由于该距离d8等于或大于阈值THC,所以把采样点n8定义为控制点c2。
接着,如图19c所示,手势检测装置6获得把控制点c1和控制点c2相连的直线L4,并通过运用上述等式(11)计算存在于它们之间的直线L4和各个采样点n4至n7之间的距离。此时,把具有最大距离d7的采样点n7作为控制候选点。然而,由于距离d7短于阈值THC,所以不把采样点n4定义为控制点。因此,在控制点c1和控制点c2之间不存在任何控制点。于是,如图19c所示,手势检测装置6获得连接控制点c2和结束点END的直线L5,并通过运用等式(11)计算存在于它们之间的在直线L5和采样点n9之间的距离d9。此时,由于距离d9短于阈值THC,所以把采样点n9作为控制候选点而非控制点。因此,在控制点c2和结束点END之间不存在任何控制点。即,在手从起始点ST到结束点END的移动中,有两个控制点c1和c2。
接着,手势检测装置6通过运用起始点、控制点和结束点建立移动代码(步骤S108)。即,在如图19a至19c所述的手的轨迹情况下,可以把它分解成ST→c1,c1→c2,c2→END的移动。参照如图21所示的移动代码表(存储在手势检测装置6中),ST→c1与[1.右]相对应、c1→c2与[4.下]相对应、c2→END与[2.左]相对应。因此,在这种情况下,移动代码是“右→下→左”。
接着,种类检测装置8确定在步骤S19中由手势检测装置6检测的手语手势的特征属于记录在种类字典10中的哪一类(步骤S22)。种类是这样的组,每个组都包含带有类似移动的多个手语手势。把作为由该装置识别的对象的多个手语手势先分成多个种类。种类字典10包含预先记录的各个种类中的手势特征。在该实施例中,例如,假设种类字典10包含在种类1至7中的特征。种类1包括这样的手势,起先双手靠拢,然后在右左两侧对称移动。种类2包括这样的手势,双手独立移动,同时保持一定或更大的间隔。种类3包括这样的手势,手接触在一起相同移动或者手重叠相同移动。种类4包括这样的手势,一只手保持静止,而另一只手在离静止的手的给定区域内移动。种类5包括这样的手势,一只手保持静止,而另一只手从等于或者大于给定区域的间隔开始移近并与静止的手接触。种类6包括由双手进行的除上述手势之外的其它手势。种类7包括只由一只手进行的手势。
当分析记录图16的在区域跃迁表中的空间区域代码的变化和三维坐标位置时,可见双手首先是接触的,然后在右左两侧几乎相对于与身体垂直的中心线对称移动,最后重新靠拢。该移动与记录在种类字典10中的种类1的特征一致。
字典11包括对于在各个种类中手语字的移动的更详细特征。图22a至22c示出属于种类1的手语字的例子。虽然满足上述条件的手语字不仅包括如图22a至22c所示的那些,而且还包括其它字,但是这里为了简化假设满足类似条件(即,“明信片”、“所有”和“几乎”)的手语字属于种类1。如图23所示,字典11包括示出用于属于种类1的三个手语字的移动的特征的信息。即,字典11记录信息,诸如,“移动代码”、“手势起始位置代码”、“手势结束位置代码”、“指定特定部分”、“手之间的位置关系”、“手形”等。
字识别装置9从字典11读取属于由种类检测装置8检测的种类的手语字的移动的特征信息(步骤S23)。接着,字识别装置9把在步骤S21中检测的手语手势的特征与关于在步骤S23中读取的手语字的特征信息相比较,以计算每个手语字的一致性的程度(步骤S24)。
此时,对于如图24所示的“手势起始位置代码”和“手势结束位置代码”,如果在步骤S19中检测到的空间位置代码和记录在字典11中的空间区域代码完全一致,那么类似程度为100%。当它们在三维上都很接近,根据接近程度给予类似程度。例如,如图16所示,当对于在步骤S19中检测到的左手的手势结束位置代码是“13”,对于如图23所示的“明信片”的左手的手势结束位置代码是“38”。在这种情况下,如图24所示,相对于空间位置代码“38”,空间位置代码“13”的类似程度是89%。注意,示出如图24所示的类似程度只作为例子,而可以对其进行任意改变。向没有在图24中示出的空间位置代码(即,与空间位置代码“38”空间分开的空间位置代码)提供较低的类似程度(例如,类似程度为20%)。
对于“移动代码”,当把记录在字典11中的移动代码取为参考移动代码,把与四边形锥体(由参考移动代码作为中心轴围绕形成的)的脊(平面在四边形锥体的侧面上相交形成的线)相对应的四个移动代码作为对于该参考移动代码的附近代码。把给定的类似程度(例如,类似程度为90%)分配给这四个附近代码。把较低的类似程度(例如,类似程度为20%)分配给其它移动代码。图25示出存储对于参考移动代码的附近代码表的移动附近代码表的部分。图26外观上示出对于指向下方的参考移动代码(由实现表示)的四个附近代码(由虚线表示)。字识别装置9参考如图25所示的附近代码表以确定实际检测到的移动代码是否是记录在字典11中的参考移动代码的附近代码。
当空间区域代码如图16所示改变时,把由手势检测装置6在步骤S18中进行的分析结果与记录在字典11中的手语字“明信片”的特征相比较,以显示与除了“左手的手势结束位置代码是13”之外的与其它手语字“明信片”的特征相一致的所有特征,并示出左手的第二“移动代码”是“右下”。因此,在这种情况下的类似程度是80.1%(=89%×90%)。该类似程度高于属于种类1的其它手语字“所有”和“几乎”的类似程度。因此,字识别装置9确定经检测的手语手势与“明信片”相对应(步骤S25)。当其它手语字的类似程度更高时,它指定带有最高类似程度的手语字为识别结果。
接着,输出装置12在话音、字母、图象中或者在它们的任一组合中输出,由字识别装置9指定的手语字“明信片”(步骤S26)。这使得操作者能够知道识别的结果。
接着,特征图象提取装置3确定它是否已接收到来自操作者的结束识别操作的指令(步骤S27)。没有接收指令的情况下,它再执行步骤S12中的操作。然后,重复在步骤S13至S26的操作。如果它接收到来自操作者的结束指令,颜色变化表生成装置13使表设置标志复位(步骤S28)。然后,如图1所示的手语识别装置结束操作。
虽然在上述第一实施例中的字识别装置9输出具有最高一致程度的手语字作为识别结果,也可以将它设置成输出等于或高于预定阈值的类似程度的一个或多个手语字作为识别结果。
(第二实施例)
虽然在上述第一较佳实施例中,唯一检测手势的移动代码,但是下面描述另一个实施例作为第二实施例,其中分层检测移动代码,而且根据分层检测的移动代码,分层识别手语字。
图27是示出根据本发明的第二实施例的手语识别装置的结构的方框图。除了下列方面,该实施例的结构和操作过程与如图1所示的第一实施例的相同,并由相同标号表示相应部分且在这里不再描述。
图28是示出在第二实施例的手势检测装置60中执行的检测移动代码操作的流程图。这里,根据如图29a和29b以及图30a至30c所示的手迹,描述由手势检测装置60执行的移动代码检测操作,作为例子。
首先,手势检测装置60根据低分辨率阈值THC1检测移动代码(步骤S201)。此时,手势检测装置60通过运用如图18所示的算法,检测移动代码。即,手势检测装置60获得如图29所示的连接起始点ST和结束点END的直线L1,然后,通过运用上述等式(11),计算直线L1和各个采样点n1至n4之间的距离d1至d4。这里,把具有到直线L1的最大距离d3的采样点n3作为控制候选点。接着,手势检测装置60比较最大距离d3和低分辨率阈值THC1。在这种情况下,由于低分辨率THC1高于最大距离d3,所以不把采样点n3定义为控制点。因此,如图29b所示,在运用低分辨率阈值THC1时,不存在任何控制点。
接着,手势检测装置60通过运用低分辨率THC1检测到的如图29b所示的手迹将其表示为ST→END,并根据如图21所示的移动代码表把移动代码定义为“下”。
接着,手势检测装置60根据高分辨率THC2检测移动代码(步骤S202)。此时,手势检测装置60通过运用如图18所示的算法检测移动代码。选择的高分辨率阈值THC2的值小于低分辨率THC1的值。即,手势检测装置60获得连接起始点ST和结束点END的直线L1(如图30a所示),而且通过运用等式(11),计算在直线L1和各个采样点n1至n4之间的距离d1至d4。此时,最大距离d3大于阈值THC2的距离,因此检测采样点n3作为控制点c1。类似地,如图30b所示,手势检测装置60在起始点ST和控制点c1之间,然后在控制点c1和结束点END之间检测新控制点。这里,如图30c所示,在起始点ST和控制点c1之间检测新控制点c2。因此,当运用高分辨率阈值THC2时,存在两个控制点c1和c2。
接着,手势检测装置60把通过运用高分辨率THC检测到的如图30c所示的手迹表示为ST→c2,c2→c1,c1→END,而且根据如图21所示的移动代码表把移动代码定义为“右下→左下→右下”。
接着,种类检测装置80通过运用用低分辨率阈值THC1检测到的移动代码“下”选择相应的种类。这里,选择在图31中的“写”和“刷新(refresh)”作为识别对象的候选者。
接着,字识别装置90通过运用用高分辨率阈值THC2检测到的移动代码“右下→左下→右下”选择相应字。这里,选择在图31中的“写”手势字。
通过这种方法,运用对移动检测具有的不同分辨率的多个阈值,可以首先缩小具有大移动的物体,然后指定具有详细移动的手势。
只要关系式THC1>THC2保持,就可以任意选择低分辨率阈值THC1和高分辨率阈值THC2。可以运用三个或多个阈值。
(第三实施例)
图32是示出根据本发明的第三实施例的手语识别装置的结构的方框图。在图32中,该实施例的手语识别装置还具有在摄影设备1和图象存储装置2之间的手势开始通知装置14。在其它方面该结构与如图1手势的第一实施例的相同,而且由相同标号表示相应部分,这里不再描述。这个所示开始通知装置14通常选通从摄影设备1输出的图象帧来禁止向图象存储装置2提供图象帧。当操作者发出开始识别操作的指令,手势开始通知装置14就通过光、话音、图象等,通知用户何时开始识别操作。这允许用户适当地开始手语手势。响应于来自操作者的开始指令,手势开始通知装置14向图象存储装置2提供从摄影设备1输出的图象帧。然后在图象存储装置2中积累图象帧,并且开始识别手语手势的处理。
以功能块方框图的形式描述实施例。然而,如图33所示,可由软件控制运用计算机装置来实现实施例。在图33中,该计算机装置包括摄影设备1、图象存储装置2、CPU21、RAM22、程序存储装置23、输入装置24和显示装置25。程序存储装置23包括用于实现如图2和3中的流程图所示的操作的程序数据。CPU21根据程序数据执行如图2和3所示的操作。RAM22存储在由CPU21进行处理期间生成的工作数据。输入装置24包括键盘、鼠标器等,它响应于操作者的操作,把各种指令和数据输入到CPU21。摄影设备1和图象存储装置2具有与如图1所示的摄影设备1和图象存储装置2相同的结构。
这里,把程序数据存储到程序存储装置23中的方法包括各种方法。在第一种方法中,从包含程序数据的存储媒体(软盘、CD-ROM、DVD等)中读取程序数据,并把它存储在程序存储装置23中。在第二种方法中,接收由联机通讯转递的程序数据,并把它存储在程序存储装置23中。在第三种方法中,在转运装置之前,预先把程序数据存储在程序存储装置23中。
虽然构成上述所有实施例都设置成用于识别手语,本发明还可以应用在不同的方法下,不仅能识别手语,而且还用于识别任何有意义的手势。
虽然详细描述了本发明,但是上述描述在所有方面上只用于说明而非限制。可以理解,在不偏离本发明范围的情况下,设计多种其它变更和变化。

Claims (15)

1.一种用于识别由用户进行的手势的手势识别装置,其特征在于,包括:
至少具有用于拍下用户的立体照的两台摄像机的摄影装置;
用于在任意采样间隔内,存储从所述摄影装置输出的用户的立体图象数据的图象存储装置;
特征图象提取装置,用于从所述图象存储装置依次提取立体图象数据、从每个立体图象数据提取显示用户身体特征的特征图象并在多个信道中分解和输出特征图象;
空间位置计算装置,用于根据从所述特征图象提取装置输出的特征图象的视差检测用户的身体部分的三维空间位置;
区域划分装置,用于根据从所述特征图象提取装置输出的所述特征图象的所述视差,把围绕用户的空间分成与用户的身体相关的多个区域;
手势检测装置,用于检测在由所述空间位置计算装置计算的身体部分的三维空间位置上的与用户的手相对应的三维空间位置如何相对于由所述区域划分装置划分的区域进行移动;
手势字确定装置,用于根据由所述手势检测装置检测的手的移动,确定相应的手势字;和
输出装置,用于以可由操作者识别的形式输出由所述手势字确定装置确定的结果。
2.如权利要求1所述的手势识别装置,其特征在于,所述特征图象提取装置根据形成所述立体特征数据的各个画面元素的颜色信息,在相应的信道中,输出所述特征图象。
3.如权利要求2所述的手势识别装置,其特征在于,所述特征图象提取装置根据被提取的颜色和由操作者指定的没有被输出的颜色,对于每个所述信道设定颜色变换表,
根据所述颜色变化表,变化形成所述立体图象数据的各个画面元素的颜色信息;和
把根据所述颜色变化表变换的值与预定阈值区别开来,以在相应信道中输出所述特征图象。
4.如权利要求1所述的手势识别装置,其特征在于,所述区域划分装置根据由所述空间位置计算装置计算的身体部分的三维空间位置估计没有出现在所述特征图象中的身体部分的位置,并根据估计位置把围绕用户的空间分成更小的区域。
5.如权利要求1所述的手势识别装置,其特征在于,所述区域划分装置计算在时间上邻近的所述特征图象之间的差值,并只有当差值等于或大于预定阈值时,才执行划分区域的处理。
6.如权利要求1所述的手势识别装置,其特征在于,所述区域划分装置把在用户身体前和后延伸的空间分成多个层,还把每个层分成多个区域。
7.如权利要求6所述的手势识别装置,其特征在于,所述区域划分装置把所述层分成不同编号的区域。
8.如权利要求7所的手势识别装置,其特征在于,所述区域划分装置把层分成当它向下时数量递减的区域,从用户的身体角度看,从最后层到前层。
9.如权利要求1所述的手势识别装置,其特征在于,预先把作为识别对象的多个手势字分成多个种类,
而且所述手势字确定装置包括:
种类字典,其中对于每个所述种类,预先记录为属于各个种类的手势字共有的移动特征,
字典,其中对于每个所述种类,存储各个手势字的移动的更加详细特征,
种类检测装置,用于检测由所述手势检测装置检测到的手的移动属于所述种类字典中的哪个种类,和
字识别装置,用于识别由所述手势检测装置检测到的手的移动与属于由所述种类检测装置检测到的种类的哪个手势字相对应。
10.如权利要求9所述的手势识别装置,其特征在于,所述字识别装置输出在属于由所述种类检测装置检测到的种类的手势字中,相对于由所述手势检测装置检测到的手的移动具有最高类似程度的一个手势字,作为识别结果。
11.如权利要求9所述的手势识别装置,其特征在于,所述字识别装置输出在属于由所述种类检测装置检测到的种类的手势字中,相对于由所述手势检测装置检测到的手的移动具有等于或高于给定阈值的一个或多个手势字,作为识别结果。
12.如权利要求1所述的手势识别装置,其特征在于,还包括用于通知用户何时开始手势的手势开始通知装置。
13.如权利要求1所述的手势识别装置,其特征在于,所述手势检测装置从显示移动的起始点和结束点之间检测到的三维空间位置的采样点中,提取移动方向大幅变化的采样点作为控制点,并通过运用起始点、结束点和控制点表示用户的手移动。
14.如权利要求13所述的手势识别装置,其特征在于,所述手势检测装置检测,
在所述起始点和所述结束点之间的采样点,它具有到连接所述起始点和所述结束点的直线的等于或大于预定阈值的最大距离,
在所述起始点和邻近控制点之间的采样点,它具有到连接所述起始点和所述邻近控制点的直线的等于或大于预定阈值的最大距离,
在所述结束点和邻近控制点之间的采样点,它具有到连接所述结束点和所述邻近控制点的直线的等于或大于预定阈值的最大距离,
在两个邻近控制点之间的采样点,它具有到连接这两个控制点的直线的等于或大于预定阈值的最大距离,和
把这些检测采样点定义为所述控制点。
15.如权利要求14所述的手势识别装置,其特征在于,所述手势检测装置通过运用多个阈值分层检测所述控制点,以分层表示用户的手移动,和
所述手势字确定装置根据由所述手势检测装置分层表示的用户的手移动,分层指定相应的手势字。
CNB981207650A 1997-09-26 1998-09-25 手势识别装置 Expired - Fee Related CN1139893C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP26148397 1997-09-26
JP261483/97 1997-09-26
JP261483/1997 1997-09-26

Publications (2)

Publication Number Publication Date
CN1218936A true CN1218936A (zh) 1999-06-09
CN1139893C CN1139893C (zh) 2004-02-25

Family

ID=17362541

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB981207650A Expired - Fee Related CN1139893C (zh) 1997-09-26 1998-09-25 手势识别装置

Country Status (3)

Country Link
US (1) US6215890B1 (zh)
EP (1) EP0905644A3 (zh)
CN (1) CN1139893C (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1304931C (zh) * 2005-01-27 2007-03-14 北京理工大学 一种头戴式立体视觉手势识别装置
CN1313905C (zh) * 2003-08-11 2007-05-02 三菱扶桑卡客车株式会社 手图形转换装置
CN1315024C (zh) * 2005-03-11 2007-05-09 西北工业大学 一种视频识别输入系统的输入方法
CN100426200C (zh) * 2006-10-13 2008-10-15 广东威创视讯科技股份有限公司 基于交互式输入设备的智能输入编码方法
CN101951474A (zh) * 2010-10-12 2011-01-19 冠捷显示科技(厦门)有限公司 基于手势控制的电视技术
CN102096471A (zh) * 2011-02-18 2011-06-15 广东威创视讯科技股份有限公司 一种基于机器视觉的人机交互方法
CN101694692B (zh) * 2009-10-22 2011-09-07 浙江大学 一种基于加速度传感器的手势识别的方法
CN102238350A (zh) * 2010-04-30 2011-11-09 鸿富锦精密工业(深圳)有限公司 电视频道切换遥控系统及方法
CN102483648A (zh) * 2009-05-21 2012-05-30 星克跃尔株式会社 基于手势的用户界面系统和方法
CN102509088A (zh) * 2011-11-28 2012-06-20 Tcl集团股份有限公司 一种手部运动检测的方法、装置及人机交互系统
CN102713798A (zh) * 2010-01-15 2012-10-03 韩国电子通信研究院 情景处理装置及方法
CN102822773A (zh) * 2010-03-24 2012-12-12 惠普开发有限公司 用于显示设备的手势映射
CN102956132A (zh) * 2011-08-25 2013-03-06 鸿富锦精密工业(深圳)有限公司 手语翻译系统、手语翻译装置及手语翻译方法
CN103140862A (zh) * 2010-09-30 2013-06-05 法国电信公司 用户界面系统及其操作方法
US8464160B2 (en) 2008-09-29 2013-06-11 Panasonic Corporation User interface device, user interface method, and recording medium
CN103192398A (zh) * 2012-01-04 2013-07-10 三星电子株式会社 机器人手的控制方法
CN103214824A (zh) * 2013-03-26 2013-07-24 安徽瑞之星电缆集团有限公司 一种等规聚丙烯绝缘辐照交联电缆料及其制备方法
CN103475886A (zh) * 2012-06-05 2013-12-25 纬创资通股份有限公司 立体深度影像建立系统及其方法
CN104317385A (zh) * 2014-06-26 2015-01-28 青岛海信电器股份有限公司 一种手势识别方法和系统
CN104408395A (zh) * 2014-06-26 2015-03-11 青岛海信电器股份有限公司 一种手势识别方法和系统
CN104969145A (zh) * 2012-12-14 2015-10-07 微软技术许可有限责任公司 靶向和按压自然用户输入
CN105874408A (zh) * 2014-01-03 2016-08-17 哈曼国际工业有限公司 用手势交互的可穿戴式空间音频系统
CN106909938A (zh) * 2017-02-16 2017-06-30 青岛科技大学 基于深度学习网络的视角无关性行为识别方法
US9704350B1 (en) 2013-03-14 2017-07-11 Harmonix Music Systems, Inc. Musical combat game
CN107102723A (zh) * 2007-08-20 2017-08-29 高通股份有限公司 超出词汇的词的增强的拒绝

Families Citing this family (420)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US6560281B1 (en) * 1998-02-24 2003-05-06 Xerox Corporation Method and apparatus for generating a condensed version of a video sequence including desired affordances
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
SE0000850D0 (sv) * 2000-03-13 2000-03-13 Pink Solution Ab Recognition arrangement
US7227526B2 (en) 2000-07-24 2007-06-05 Gesturetek, Inc. Video-based image control system
US20020071277A1 (en) * 2000-08-12 2002-06-13 Starner Thad E. System and method for capturing an image
JP2002077661A (ja) * 2000-09-05 2002-03-15 Fujitsu Ltd 色信号値抽出方法および色変換テーブル作成方法
JP3784289B2 (ja) * 2000-09-12 2006-06-07 松下電器産業株式会社 メディア編集方法及びその装置
US7058204B2 (en) 2000-10-03 2006-06-06 Gesturetek, Inc. Multiple camera control system
US7274800B2 (en) * 2001-07-18 2007-09-25 Intel Corporation Dynamic gesture recognition from stereo sequences
US7680295B2 (en) * 2001-09-17 2010-03-16 National Institute Of Advanced Industrial Science And Technology Hand-gesture based interface apparatus
US6564144B1 (en) * 2002-01-10 2003-05-13 Navigation Technologies Corporation Method and system using a hand-gesture responsive device for collecting data for a geographic database
US6990639B2 (en) 2002-02-07 2006-01-24 Microsoft Corporation System and process for controlling electronic components in a ubiquitous computing environment using multimodal integration
US7340077B2 (en) * 2002-02-15 2008-03-04 Canesta, Inc. Gesture recognition system using depth perceptive sensors
TW554293B (en) * 2002-03-29 2003-09-21 Ind Tech Res Inst Method for extracting and matching hand gesture features of image
US7165029B2 (en) 2002-05-09 2007-01-16 Intel Corporation Coupled hidden Markov model for audiovisual speech recognition
US7209883B2 (en) * 2002-05-09 2007-04-24 Intel Corporation Factorial hidden markov model for audiovisual speech recognition
US20030212552A1 (en) * 2002-05-09 2003-11-13 Liang Lu Hong Face recognition procedure useful for audiovisual speech recognition
US20040012643A1 (en) * 2002-07-18 2004-01-22 August Katherine G. Systems and methods for visually communicating the meaning of information to the hearing impaired
US7616784B2 (en) * 2002-07-29 2009-11-10 Robert William Kocher Method and apparatus for contactless hand recognition
JP3996015B2 (ja) * 2002-08-09 2007-10-24 本田技研工業株式会社 姿勢認識装置及び自律ロボット
US7774194B2 (en) * 2002-08-14 2010-08-10 Raanan Liebermann Method and apparatus for seamless transition of voice and/or text into sign language
US7171043B2 (en) 2002-10-11 2007-01-30 Intel Corporation Image recognition using hidden markov models and coupled hidden markov models
FR2847357A1 (fr) * 2002-11-19 2004-05-21 Simag Dev Methode de commande d'une machine au moyen de la position d'un objet mobile
US7472063B2 (en) * 2002-12-19 2008-12-30 Intel Corporation Audio-visual feature fusion and support vector machine useful for continuous speech recognition
US7203368B2 (en) * 2003-01-06 2007-04-10 Intel Corporation Embedded bayesian network for pattern recognition
US7665041B2 (en) * 2003-03-25 2010-02-16 Microsoft Corporation Architecture for controlling a computer using hand gestures
US8745541B2 (en) 2003-03-25 2014-06-03 Microsoft Corporation Architecture for controlling a computer using hand gestures
JP4482690B2 (ja) * 2003-04-11 2010-06-16 独立行政法人情報通信研究機構 画像認識装置及び画像認識プログラム
US7372977B2 (en) * 2003-05-29 2008-05-13 Honda Motor Co., Ltd. Visual tracking using depth data
EP3190546A3 (en) * 2003-06-12 2017-10-04 Honda Motor Co., Ltd. Target orientation estimation using depth sensing
US7565295B1 (en) * 2003-08-28 2009-07-21 The George Washington University Method and apparatus for translating hand gestures
WO2005031552A2 (en) * 2003-09-30 2005-04-07 Koninklijke Philips Electronics, N.V. Gesture to define location, size, and/or content of content window on a display
US7590941B2 (en) * 2003-10-09 2009-09-15 Hewlett-Packard Development Company, L.P. Communication and collaboration system using rich media environments
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
FI117308B (fi) * 2004-02-06 2006-08-31 Nokia Corp Eleohjausjärjestelmä
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
WO2005078558A1 (en) * 2004-02-16 2005-08-25 Simone Soria A process for generating command signals, in particular for disabled users
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8345918B2 (en) * 2004-04-14 2013-01-01 L-3 Communications Corporation Active subject privacy imaging
CN100573548C (zh) * 2004-04-15 2009-12-23 格斯图尔泰克股份有限公司 跟踪双手运动的方法和设备
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US7308112B2 (en) * 2004-05-14 2007-12-11 Honda Motor Co., Ltd. Sign based human-machine interaction
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
JP4792824B2 (ja) * 2004-11-05 2011-10-12 富士ゼロックス株式会社 動作分析装置
US7386150B2 (en) * 2004-11-12 2008-06-10 Safeview, Inc. Active subject imaging with body identification
RU2323475C2 (ru) * 2004-11-12 2008-04-27 Общество с ограниченной ответственностью "Центр Нейросетевых Технологий - Интеллектуальные Системы Безопасности" (ООО "ИСС") Способ (варианты) и устройство (варианты) автоматизированного обнаружения умышленных либо случайных нарушений технологической процедуры оператором
JP5160235B2 (ja) * 2005-01-07 2013-03-13 クアルコム,インコーポレイテッド 画像中の物体の検出及び追跡
JP4689684B2 (ja) 2005-01-21 2011-05-25 ジェスチャー テック,インコーポレイテッド 動作に基づくトラッキング
US7598942B2 (en) * 2005-02-08 2009-10-06 Oblong Industries, Inc. System and method for gesture based control system
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
GB2431787B (en) * 2005-10-31 2009-07-01 Hewlett Packard Development Co A method of tracking an object in a video stream
US8531396B2 (en) 2006-02-08 2013-09-10 Oblong Industries, Inc. Control system for navigating a principal dimension of a data space
US9075441B2 (en) * 2006-02-08 2015-07-07 Oblong Industries, Inc. Gesture based control using three-dimensional information extracted over an extended depth of field
US8537112B2 (en) * 2006-02-08 2013-09-17 Oblong Industries, Inc. Control system for navigating a principal dimension of a data space
US9823747B2 (en) 2006-02-08 2017-11-21 Oblong Industries, Inc. Spatial, multi-modal control device for use with spatial operating system
US8537111B2 (en) 2006-02-08 2013-09-17 Oblong Industries, Inc. Control system for navigating a principal dimension of a data space
US9910497B2 (en) * 2006-02-08 2018-03-06 Oblong Industries, Inc. Gestural control of autonomous and semi-autonomous systems
US8370383B2 (en) 2006-02-08 2013-02-05 Oblong Industries, Inc. Multi-process interactive systems and methods
JP5161435B2 (ja) * 2006-06-26 2013-03-13 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像処理システム、コンピュータの制御方法及びプログラム
US20100023314A1 (en) * 2006-08-13 2010-01-28 Jose Hernandez-Rebollar ASL Glove with 3-Axis Accelerometers
US20080036737A1 (en) * 2006-08-13 2008-02-14 Hernandez-Rebollar Jose L Arm Skeleton for Capturing Arm Position and Movement
US7725547B2 (en) 2006-09-06 2010-05-25 International Business Machines Corporation Informing a user of gestures made by others out of the user's line of sight
EP2067119A2 (en) 2006-09-08 2009-06-10 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US7877706B2 (en) 2007-01-12 2011-01-25 International Business Machines Corporation Controlling a document based on user behavioral signals detected from a 3D captured image stream
US7840031B2 (en) 2007-01-12 2010-11-23 International Business Machines Corporation Tracking a range of body movement based on 3D captured image streams of a user
US7971156B2 (en) 2007-01-12 2011-06-28 International Business Machines Corporation Controlling resource access based on user gesturing in a 3D captured image stream of the user
US8295542B2 (en) * 2007-01-12 2012-10-23 International Business Machines Corporation Adjusting a consumer experience based on a 3D captured image stream of a consumer response
US8588464B2 (en) * 2007-01-12 2013-11-19 International Business Machines Corporation Assisting a vision-impaired user with navigation based on a 3D captured image stream
US7801332B2 (en) 2007-01-12 2010-09-21 International Business Machines Corporation Controlling a system based on user behavioral signals detected from a 3D captured image stream
US8269834B2 (en) 2007-01-12 2012-09-18 International Business Machines Corporation Warning a user about adverse behaviors of others within an environment based on a 3D captured image stream
US7792328B2 (en) 2007-01-12 2010-09-07 International Business Machines Corporation Warning a vehicle operator of unsafe operation behavior based on a 3D captured image stream
US8494234B1 (en) * 2007-03-07 2013-07-23 MotionDSP, Inc. Video hashing system and method
US8005238B2 (en) 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
EP2150893A4 (en) 2007-04-24 2012-08-22 Oblong Ind Inc PROTEINS, POOLS AND SLAWX IN PROCESSING ENVIRONMENTS
US8005237B2 (en) 2007-05-17 2011-08-23 Microsoft Corp. Sensor array beamformer post-processor
US9282377B2 (en) * 2007-05-31 2016-03-08 iCommunicator LLC Apparatuses, methods and systems to provide translations of information into sign language or other formats
US20090012788A1 (en) * 2007-07-03 2009-01-08 Jason Andre Gilbert Sign language translation system
US8230367B2 (en) * 2007-09-14 2012-07-24 Intellectual Ventures Holding 67 Llc Gesture-based user interactions with status indicators for acceptable inputs in volumetric zones
JP4929109B2 (ja) * 2007-09-25 2012-05-09 株式会社東芝 ジェスチャ認識装置及びその方法
US8629976B2 (en) * 2007-10-02 2014-01-14 Microsoft Corporation Methods and systems for hierarchical de-aliasing time-of-flight (TOF) systems
US8005263B2 (en) * 2007-10-26 2011-08-23 Honda Motor Co., Ltd. Hand sign recognition using label assignment
US8159682B2 (en) 2007-11-12 2012-04-17 Intellectual Ventures Holding 67 Llc Lens system
CN101465961B (zh) * 2007-12-19 2013-10-30 神基科技股份有限公司 以特征影像辨识控制快门的摄像装置及方法
US20090166684A1 (en) * 2007-12-26 2009-07-02 3Dv Systems Ltd. Photogate cmos pixel for 3d cameras having reduced intra-pixel cross talk
US9035876B2 (en) 2008-01-14 2015-05-19 Apple Inc. Three-dimensional user interface session control
US8933876B2 (en) 2010-12-13 2015-01-13 Apple Inc. Three dimensional user interface session control
US9772689B2 (en) * 2008-03-04 2017-09-26 Qualcomm Incorporated Enhanced gesture-based image manipulation
US8259163B2 (en) 2008-03-07 2012-09-04 Intellectual Ventures Holding 67 Llc Display with built in 3D sensing
US9495013B2 (en) 2008-04-24 2016-11-15 Oblong Industries, Inc. Multi-modal gestural interface
US9684380B2 (en) 2009-04-02 2017-06-20 Oblong Industries, Inc. Operating environment with gestural control and multiple client devices, displays, and users
US9952673B2 (en) 2009-04-02 2018-04-24 Oblong Industries, Inc. Operating environment comprising multiple client devices, multiple displays, multiple users, and gestural control
US9740922B2 (en) 2008-04-24 2017-08-22 Oblong Industries, Inc. Adaptive tracking system for spatial input devices
US9740293B2 (en) 2009-04-02 2017-08-22 Oblong Industries, Inc. Operating environment with gestural control and multiple client devices, displays, and users
US8723795B2 (en) 2008-04-24 2014-05-13 Oblong Industries, Inc. Detecting, representing, and interpreting three-space input: gestural continuum subsuming freespace, proximal, and surface-contact modes
US10642364B2 (en) 2009-04-02 2020-05-05 Oblong Industries, Inc. Processing tracking and recognition data in gestural recognition systems
EP2304527A4 (en) * 2008-06-18 2013-03-27 Oblong Ind Inc GESTIK BASED CONTROL SYSTEM FOR VEHICLE INTERFACES
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8325909B2 (en) 2008-06-25 2012-12-04 Microsoft Corporation Acoustic echo suppression
US8203699B2 (en) 2008-06-30 2012-06-19 Microsoft Corporation System architecture design for time-of-flight system having reduced differential pixel size, and time-of-flight systems so designed
US8146020B2 (en) * 2008-07-24 2012-03-27 Qualcomm Incorporated Enhanced detection of circular engagement gesture
EP2327005B1 (en) * 2008-07-25 2017-08-23 Qualcomm Incorporated Enhanced detection of waving gesture
US20100142683A1 (en) * 2008-12-09 2010-06-10 Stuart Owen Goldman Method and apparatus for providing video relay service assisted calls with reduced bandwidth
US8270670B2 (en) * 2008-12-25 2012-09-18 Topseed Technology Corp. Method for recognizing and tracing gesture
US8379987B2 (en) * 2008-12-30 2013-02-19 Nokia Corporation Method, apparatus and computer program product for providing hand segmentation for gesture analysis
US8681321B2 (en) 2009-01-04 2014-03-25 Microsoft International Holdings B.V. Gated 3D camera
US8682028B2 (en) * 2009-01-30 2014-03-25 Microsoft Corporation Visual target tracking
US8487938B2 (en) * 2009-01-30 2013-07-16 Microsoft Corporation Standard Gestures
US8588465B2 (en) * 2009-01-30 2013-11-19 Microsoft Corporation Visual target tracking
US20100199231A1 (en) * 2009-01-30 2010-08-05 Microsoft Corporation Predictive determination
US8448094B2 (en) * 2009-01-30 2013-05-21 Microsoft Corporation Mapping a natural input device to a legacy system
US8565476B2 (en) 2009-01-30 2013-10-22 Microsoft Corporation Visual target tracking
US8577084B2 (en) * 2009-01-30 2013-11-05 Microsoft Corporation Visual target tracking
US7996793B2 (en) 2009-01-30 2011-08-09 Microsoft Corporation Gesture recognizer system architecture
US8577085B2 (en) * 2009-01-30 2013-11-05 Microsoft Corporation Visual target tracking
US8294767B2 (en) * 2009-01-30 2012-10-23 Microsoft Corporation Body scan
US8267781B2 (en) 2009-01-30 2012-09-18 Microsoft Corporation Visual target tracking
US8295546B2 (en) 2009-01-30 2012-10-23 Microsoft Corporation Pose tracking pipeline
US8565477B2 (en) 2009-01-30 2013-10-22 Microsoft Corporation Visual target tracking
CN105930311B (zh) 2009-02-18 2018-10-09 谷歌有限责任公司 执行与再现文档关联的动作的方法、移动设备和可读介质
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
WO2010103482A2 (en) * 2009-03-13 2010-09-16 Primesense Ltd. Enhanced 3d interfacing for remote devices
US8773355B2 (en) 2009-03-16 2014-07-08 Microsoft Corporation Adaptive cursor sizing
US8988437B2 (en) 2009-03-20 2015-03-24 Microsoft Technology Licensing, Llc Chaining animations
US9256282B2 (en) * 2009-03-20 2016-02-09 Microsoft Technology Licensing, Llc Virtual object manipulation
US9313376B1 (en) 2009-04-01 2016-04-12 Microsoft Technology Licensing, Llc Dynamic depth power equalization
US10824238B2 (en) 2009-04-02 2020-11-03 Oblong Industries, Inc. Operating environment with gestural control and multiple client devices, displays, and users
US9317128B2 (en) 2009-04-02 2016-04-19 Oblong Industries, Inc. Remote devices used in a markerless installation of a spatial operating environment incorporating gestural control
US8942428B2 (en) 2009-05-01 2015-01-27 Microsoft Corporation Isolate extraneous motions
US9377857B2 (en) 2009-05-01 2016-06-28 Microsoft Technology Licensing, Llc Show body position
US9498718B2 (en) 2009-05-01 2016-11-22 Microsoft Technology Licensing, Llc Altering a view perspective within a display environment
US8649554B2 (en) 2009-05-01 2014-02-11 Microsoft Corporation Method to control perspective for a camera-controlled computer
US8660303B2 (en) * 2009-05-01 2014-02-25 Microsoft Corporation Detection of body and props
US8253746B2 (en) 2009-05-01 2012-08-28 Microsoft Corporation Determine intended motions
US8340432B2 (en) 2009-05-01 2012-12-25 Microsoft Corporation Systems and methods for detecting a tilt angle from a depth image
US8181123B2 (en) 2009-05-01 2012-05-15 Microsoft Corporation Managing virtual port associations to users in a gesture-based computing environment
US8638985B2 (en) 2009-05-01 2014-01-28 Microsoft Corporation Human body pose estimation
US9898675B2 (en) 2009-05-01 2018-02-20 Microsoft Technology Licensing, Llc User movement tracking feedback to improve tracking
US8503720B2 (en) 2009-05-01 2013-08-06 Microsoft Corporation Human body pose estimation
US9015638B2 (en) 2009-05-01 2015-04-21 Microsoft Technology Licensing, Llc Binding users to a gesture based system and providing feedback to the users
US9417700B2 (en) 2009-05-21 2016-08-16 Edge3 Technologies Gesture recognition systems and related methods
US8320619B2 (en) 2009-05-29 2012-11-27 Microsoft Corporation Systems and methods for tracking a model
US9182814B2 (en) 2009-05-29 2015-11-10 Microsoft Technology Licensing, Llc Systems and methods for estimating a non-visible or occluded body part
US8744121B2 (en) 2009-05-29 2014-06-03 Microsoft Corporation Device for identifying and tracking multiple humans over time
US8418085B2 (en) 2009-05-29 2013-04-09 Microsoft Corporation Gesture coach
US8625837B2 (en) 2009-05-29 2014-01-07 Microsoft Corporation Protocol and format for communicating an image from a camera to a computing environment
US8509479B2 (en) * 2009-05-29 2013-08-13 Microsoft Corporation Virtual object
US9400559B2 (en) 2009-05-29 2016-07-26 Microsoft Technology Licensing, Llc Gesture shortcuts
US9383823B2 (en) 2009-05-29 2016-07-05 Microsoft Technology Licensing, Llc Combining gestures beyond skeletal
US20100302365A1 (en) * 2009-05-29 2010-12-02 Microsoft Corporation Depth Image Noise Reduction
US8693724B2 (en) 2009-05-29 2014-04-08 Microsoft Corporation Method and system implementing user-centric gesture control
US8856691B2 (en) 2009-05-29 2014-10-07 Microsoft Corporation Gesture tool
US8542252B2 (en) * 2009-05-29 2013-09-24 Microsoft Corporation Target digitization, extraction, and tracking
US8379101B2 (en) 2009-05-29 2013-02-19 Microsoft Corporation Environment and/or target segmentation
US8487871B2 (en) 2009-06-01 2013-07-16 Microsoft Corporation Virtual desktop coordinate transformation
US8654187B2 (en) * 2009-06-08 2014-02-18 Panasonic Corporation Work recognition system, work recognition device, and work recognition method
WO2010144050A1 (en) * 2009-06-08 2010-12-16 Agency For Science, Technology And Research Method and system for gesture based manipulation of a 3-dimensional image of object
US8390680B2 (en) 2009-07-09 2013-03-05 Microsoft Corporation Visual representation expression based on player expression
US9159151B2 (en) 2009-07-13 2015-10-13 Microsoft Technology Licensing, Llc Bringing a visual representation to life via learned input from the user
US8264536B2 (en) * 2009-08-25 2012-09-11 Microsoft Corporation Depth-sensitive imaging via polarization-state mapping
US9141193B2 (en) 2009-08-31 2015-09-22 Microsoft Technology Licensing, Llc Techniques for using human gestures to control gesture unaware programs
US8330134B2 (en) * 2009-09-14 2012-12-11 Microsoft Corporation Optical fault monitoring
US8508919B2 (en) 2009-09-14 2013-08-13 Microsoft Corporation Separation of electrical and optical components
US8760571B2 (en) 2009-09-21 2014-06-24 Microsoft Corporation Alignment of lens and image sensor
US8976986B2 (en) * 2009-09-21 2015-03-10 Microsoft Technology Licensing, Llc Volume adjustment based on listener position
US8428340B2 (en) * 2009-09-21 2013-04-23 Microsoft Corporation Screen space plane identification
US9014546B2 (en) 2009-09-23 2015-04-21 Rovi Guides, Inc. Systems and methods for automatically detecting users within detection regions of media devices
US8452087B2 (en) * 2009-09-30 2013-05-28 Microsoft Corporation Image selection techniques
US8723118B2 (en) * 2009-10-01 2014-05-13 Microsoft Corporation Imager for constructing color and depth images
US8963829B2 (en) 2009-10-07 2015-02-24 Microsoft Corporation Methods and systems for determining and tracking extremities of a target
US7961910B2 (en) 2009-10-07 2011-06-14 Microsoft Corporation Systems and methods for tracking a model
US8867820B2 (en) * 2009-10-07 2014-10-21 Microsoft Corporation Systems and methods for removing a background of an image
US8564534B2 (en) 2009-10-07 2013-10-22 Microsoft Corporation Human tracking system
US9933852B2 (en) 2009-10-14 2018-04-03 Oblong Industries, Inc. Multi-process interactive systems and methods
US9971807B2 (en) 2009-10-14 2018-05-15 Oblong Industries, Inc. Multi-process interactive systems and methods
US9400548B2 (en) * 2009-10-19 2016-07-26 Microsoft Technology Licensing, Llc Gesture personalization and profile roaming
US20110099476A1 (en) * 2009-10-23 2011-04-28 Microsoft Corporation Decorating a display environment
CN101719015B (zh) * 2009-11-03 2011-08-31 上海大学 指示手势的手指尖定位方法
US8988432B2 (en) * 2009-11-05 2015-03-24 Microsoft Technology Licensing, Llc Systems and methods for processing an image for target tracking
US8843857B2 (en) * 2009-11-19 2014-09-23 Microsoft Corporation Distance scalable no touch computing
KR20110055062A (ko) * 2009-11-19 2011-05-25 삼성전자주식회사 로봇 시스템 및 그 제어 방법
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
TWI476632B (zh) * 2009-12-08 2015-03-11 Micro Star Int Co Ltd 運動物體辨識方法及基於運動物體辨識之指令輸入方法
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US9244533B2 (en) 2009-12-17 2016-01-26 Microsoft Technology Licensing, Llc Camera navigation for presentations
US20110151974A1 (en) * 2009-12-18 2011-06-23 Microsoft Corporation Gesture style recognition and reward
US20110150271A1 (en) 2009-12-18 2011-06-23 Microsoft Corporation Motion detection using depth images
US8320621B2 (en) 2009-12-21 2012-11-27 Microsoft Corporation Depth projector system with integrated VCSEL array
TWI469101B (zh) * 2009-12-23 2015-01-11 Chi Mei Comm Systems Inc 手語識別系統及方法
JP5721233B2 (ja) * 2009-12-28 2015-05-20 サイバーアイ・エンタテインメント株式会社 画像認識システム
US20110164032A1 (en) * 2010-01-07 2011-07-07 Prime Sense Ltd. Three-Dimensional User Interface
US8631355B2 (en) 2010-01-08 2014-01-14 Microsoft Corporation Assigning gesture dictionaries
US9268404B2 (en) * 2010-01-08 2016-02-23 Microsoft Technology Licensing, Llc Application gesture interpretation
US9019201B2 (en) 2010-01-08 2015-04-28 Microsoft Technology Licensing, Llc Evolving universal gesture sets
US8334842B2 (en) 2010-01-15 2012-12-18 Microsoft Corporation Recognizing user intent in motion capture system
US8933884B2 (en) 2010-01-15 2015-01-13 Microsoft Corporation Tracking groups of users in motion capture system
US8676581B2 (en) 2010-01-22 2014-03-18 Microsoft Corporation Speech recognition analysis via identification information
US8265341B2 (en) 2010-01-25 2012-09-11 Microsoft Corporation Voice-body identity correlation
US8864581B2 (en) 2010-01-29 2014-10-21 Microsoft Corporation Visual based identitiy tracking
US8891067B2 (en) * 2010-02-01 2014-11-18 Microsoft Corporation Multiple synchronized optical sources for time-of-flight range finding systems
US8619122B2 (en) 2010-02-02 2013-12-31 Microsoft Corporation Depth camera compatibility
US8687044B2 (en) 2010-02-02 2014-04-01 Microsoft Corporation Depth camera compatibility
US8717469B2 (en) * 2010-02-03 2014-05-06 Microsoft Corporation Fast gating photosurface
US8499257B2 (en) * 2010-02-09 2013-07-30 Microsoft Corporation Handles interactions for human—computer interface
US8659658B2 (en) * 2010-02-09 2014-02-25 Microsoft Corporation Physical interaction zone for gesture-based user interfaces
US20110199302A1 (en) * 2010-02-16 2011-08-18 Microsoft Corporation Capturing screen objects using a collision volume
US8633890B2 (en) * 2010-02-16 2014-01-21 Microsoft Corporation Gesture detection based on joint skipping
US8928579B2 (en) * 2010-02-22 2015-01-06 Andrew David Wilson Interacting with an omni-directionally projected display
US8655069B2 (en) 2010-03-05 2014-02-18 Microsoft Corporation Updating image segmentation following user input
US8422769B2 (en) * 2010-03-05 2013-04-16 Microsoft Corporation Image segmentation using reduced foreground training data
US8411948B2 (en) 2010-03-05 2013-04-02 Microsoft Corporation Up-sampling binary images for segmentation
US20110221755A1 (en) * 2010-03-12 2011-09-15 Kevin Geisner Bionic motion
US20110223995A1 (en) 2010-03-12 2011-09-15 Kevin Geisner Interacting with a computer based application
US8279418B2 (en) 2010-03-17 2012-10-02 Microsoft Corporation Raster scanning for depth detection
US8213680B2 (en) * 2010-03-19 2012-07-03 Microsoft Corporation Proxy training data for human body tracking
US20110234481A1 (en) * 2010-03-26 2011-09-29 Sagi Katz Enhancing presentations using depth sensing cameras
US8514269B2 (en) * 2010-03-26 2013-08-20 Microsoft Corporation De-aliasing depth images
US8523667B2 (en) * 2010-03-29 2013-09-03 Microsoft Corporation Parental control settings based on body dimensions
US8605763B2 (en) 2010-03-31 2013-12-10 Microsoft Corporation Temperature measurement and control for laser and light-emitting diodes
US9098873B2 (en) 2010-04-01 2015-08-04 Microsoft Technology Licensing, Llc Motion-based interactive shopping environment
US9646340B2 (en) 2010-04-01 2017-05-09 Microsoft Technology Licensing, Llc Avatar-based virtual dressing room
US8351651B2 (en) 2010-04-26 2013-01-08 Microsoft Corporation Hand-location post-process refinement in a tracking system
US8379919B2 (en) 2010-04-29 2013-02-19 Microsoft Corporation Multiple centroid condensation of probability distribution clouds
US8284847B2 (en) 2010-05-03 2012-10-09 Microsoft Corporation Detecting motion for a multifunction sensor device
US8498481B2 (en) 2010-05-07 2013-07-30 Microsoft Corporation Image segmentation using star-convexity constraints
US8885890B2 (en) 2010-05-07 2014-11-11 Microsoft Corporation Depth map confidence filtering
US8457353B2 (en) 2010-05-18 2013-06-04 Microsoft Corporation Gestures and gesture modifiers for manipulating a user-interface
US8396252B2 (en) 2010-05-20 2013-03-12 Edge 3 Technologies Systems and related methods for three dimensional gesture recognition in vehicles
US8803888B2 (en) 2010-06-02 2014-08-12 Microsoft Corporation Recognition system for sharing information
US8751215B2 (en) 2010-06-04 2014-06-10 Microsoft Corporation Machine based sign language interpreter
US9008355B2 (en) 2010-06-04 2015-04-14 Microsoft Technology Licensing, Llc Automatic depth camera aiming
US9557574B2 (en) 2010-06-08 2017-01-31 Microsoft Technology Licensing, Llc Depth illumination and detection optics
US8330822B2 (en) 2010-06-09 2012-12-11 Microsoft Corporation Thermally-tuned depth camera light source
US8675981B2 (en) 2010-06-11 2014-03-18 Microsoft Corporation Multi-modal gender recognition including depth data
US9384329B2 (en) 2010-06-11 2016-07-05 Microsoft Technology Licensing, Llc Caloric burn determination from body movement
US8749557B2 (en) 2010-06-11 2014-06-10 Microsoft Corporation Interacting with user interface via avatar
US8982151B2 (en) 2010-06-14 2015-03-17 Microsoft Technology Licensing, Llc Independently processing planes of display data
US8670029B2 (en) 2010-06-16 2014-03-11 Microsoft Corporation Depth camera illuminator with superluminescent light-emitting diode
US8558873B2 (en) 2010-06-16 2013-10-15 Microsoft Corporation Use of wavefront coding to create a depth image
US8296151B2 (en) 2010-06-18 2012-10-23 Microsoft Corporation Compound gesture-speech commands
US8381108B2 (en) 2010-06-21 2013-02-19 Microsoft Corporation Natural user input for driving interactive stories
US8416187B2 (en) 2010-06-22 2013-04-09 Microsoft Corporation Item navigation using motion-capture data
US9075434B2 (en) 2010-08-20 2015-07-07 Microsoft Technology Licensing, Llc Translating user motion into multiple object responses
US8613666B2 (en) 2010-08-31 2013-12-24 Microsoft Corporation User selection and navigation based on looped motions
WO2012030872A1 (en) 2010-09-02 2012-03-08 Edge3 Technologies Inc. Method and apparatus for confusion learning
US8582866B2 (en) 2011-02-10 2013-11-12 Edge 3 Technologies, Inc. Method and apparatus for disparity computation in stereo images
US8655093B2 (en) 2010-09-02 2014-02-18 Edge 3 Technologies, Inc. Method and apparatus for performing segmentation of an image
US8666144B2 (en) 2010-09-02 2014-03-04 Edge 3 Technologies, Inc. Method and apparatus for determining disparity of texture
US8437506B2 (en) 2010-09-07 2013-05-07 Microsoft Corporation System for fast, probabilistic skeletal tracking
US20120058824A1 (en) 2010-09-07 2012-03-08 Microsoft Corporation Scalable real-time motion recognition
KR101708696B1 (ko) * 2010-09-15 2017-02-21 엘지전자 주식회사 휴대 단말기 및 그 동작 제어방법
US8620024B2 (en) * 2010-09-17 2013-12-31 Sony Corporation System and method for dynamic gesture recognition using geometric classification
US8988508B2 (en) 2010-09-24 2015-03-24 Microsoft Technology Licensing, Llc. Wide angle field of view active illumination imaging system
US8681255B2 (en) 2010-09-28 2014-03-25 Microsoft Corporation Integrated low power depth camera and projection device
US8548270B2 (en) 2010-10-04 2013-10-01 Microsoft Corporation Time-of-flight depth imaging
US9484065B2 (en) 2010-10-15 2016-11-01 Microsoft Technology Licensing, Llc Intelligent determination of replays based on event identification
JP2012094060A (ja) * 2010-10-28 2012-05-17 Sharp Corp 電子装置
US8592739B2 (en) 2010-11-02 2013-11-26 Microsoft Corporation Detection of configuration changes of an optical element in an illumination system
US8866889B2 (en) 2010-11-03 2014-10-21 Microsoft Corporation In-home depth camera calibration
US8667519B2 (en) 2010-11-12 2014-03-04 Microsoft Corporation Automatic passive and anonymous feedback system
US10726861B2 (en) 2010-11-15 2020-07-28 Microsoft Technology Licensing, Llc Semi-private communication in open environments
US8730157B2 (en) * 2010-11-15 2014-05-20 Hewlett-Packard Development Company, L.P. Hand pose recognition
US9349040B2 (en) 2010-11-19 2016-05-24 Microsoft Technology Licensing, Llc Bi-modal depth-image analysis
US10234545B2 (en) 2010-12-01 2019-03-19 Microsoft Technology Licensing, Llc Light source module
US8553934B2 (en) 2010-12-08 2013-10-08 Microsoft Corporation Orienting the position of a sensor
US8872762B2 (en) 2010-12-08 2014-10-28 Primesense Ltd. Three dimensional user interface cursor control
US8618405B2 (en) 2010-12-09 2013-12-31 Microsoft Corp. Free-space gesture musical instrument digital interface (MIDI) controller
US8408706B2 (en) 2010-12-13 2013-04-02 Microsoft Corporation 3D gaze tracker
US8884968B2 (en) 2010-12-15 2014-11-11 Microsoft Corporation Modeling an object from image data
US9171264B2 (en) 2010-12-15 2015-10-27 Microsoft Technology Licensing, Llc Parallel processing machine learning decision tree training
US8920241B2 (en) 2010-12-15 2014-12-30 Microsoft Corporation Gesture controlled persistent handles for interface guides
US8448056B2 (en) 2010-12-17 2013-05-21 Microsoft Corporation Validation analysis of human target
US8803952B2 (en) 2010-12-20 2014-08-12 Microsoft Corporation Plural detector time-of-flight depth mapping
US8385596B2 (en) 2010-12-21 2013-02-26 Microsoft Corporation First person shooter control with virtual skeleton
US9821224B2 (en) 2010-12-21 2017-11-21 Microsoft Technology Licensing, Llc Driving simulator control with virtual skeleton
US8994718B2 (en) 2010-12-21 2015-03-31 Microsoft Technology Licensing, Llc Skeletal control of three-dimensional virtual world
US9823339B2 (en) 2010-12-21 2017-11-21 Microsoft Technology Licensing, Llc Plural anode time-of-flight sensor
US9848106B2 (en) 2010-12-21 2017-12-19 Microsoft Technology Licensing, Llc Intelligent gameplay photo capture
US9123316B2 (en) 2010-12-27 2015-09-01 Microsoft Technology Licensing, Llc Interactive content creation
US8488888B2 (en) 2010-12-28 2013-07-16 Microsoft Corporation Classification of posture states
US8401225B2 (en) 2011-01-31 2013-03-19 Microsoft Corporation Moving object segmentation using depth images
US9247238B2 (en) 2011-01-31 2016-01-26 Microsoft Technology Licensing, Llc Reducing interference between multiple infra-red depth cameras
US8401242B2 (en) 2011-01-31 2013-03-19 Microsoft Corporation Real-time camera tracking using depth maps
US8587583B2 (en) 2011-01-31 2013-11-19 Microsoft Corporation Three-dimensional environment reconstruction
US8724887B2 (en) 2011-02-03 2014-05-13 Microsoft Corporation Environmental modifications to mitigate environmental factors
US8970589B2 (en) 2011-02-10 2015-03-03 Edge 3 Technologies, Inc. Near-touch interaction with a stereo camera grid structured tessellations
US8942917B2 (en) 2011-02-14 2015-01-27 Microsoft Corporation Change invariant scene recognition by an agent
US8497838B2 (en) 2011-02-16 2013-07-30 Microsoft Corporation Push actuation of interface controls
EP2678757B1 (en) * 2011-02-21 2017-08-16 Koninklijke Philips N.V. Gesture recognition system
US9551914B2 (en) 2011-03-07 2017-01-24 Microsoft Technology Licensing, Llc Illuminator with refractive optical element
US9067136B2 (en) 2011-03-10 2015-06-30 Microsoft Technology Licensing, Llc Push personalization of interface controls
US9079313B2 (en) * 2011-03-15 2015-07-14 Microsoft Technology Licensing, Llc Natural human to robot remote control
US8571263B2 (en) 2011-03-17 2013-10-29 Microsoft Corporation Predicting joint positions
DE112011104939T5 (de) * 2011-03-21 2014-01-23 Lg Electronics Inc. Anzeigevorrichtung und Verfahren zum Steuern derselben
US9470778B2 (en) 2011-03-29 2016-10-18 Microsoft Technology Licensing, Llc Learning from high quality depth measurements
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US8824749B2 (en) 2011-04-05 2014-09-02 Microsoft Corporation Biometric recognition
US8503494B2 (en) 2011-04-05 2013-08-06 Microsoft Corporation Thermal management system
US8620113B2 (en) 2011-04-25 2013-12-31 Microsoft Corporation Laser diode modes
US8702507B2 (en) 2011-04-28 2014-04-22 Microsoft Corporation Manual and camera-based avatar control
US9259643B2 (en) 2011-04-28 2016-02-16 Microsoft Technology Licensing, Llc Control of separate computer game elements
US8811719B2 (en) 2011-04-29 2014-08-19 Microsoft Corporation Inferring spatial object descriptions from spatial gestures
US10671841B2 (en) 2011-05-02 2020-06-02 Microsoft Technology Licensing, Llc Attribute state classification
US8888331B2 (en) 2011-05-09 2014-11-18 Microsoft Corporation Low inductance light source module
US9137463B2 (en) 2011-05-12 2015-09-15 Microsoft Technology Licensing, Llc Adaptive high dynamic range camera
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
US8788973B2 (en) 2011-05-23 2014-07-22 Microsoft Corporation Three-dimensional gesture controlled avatar configuration interface
US8760395B2 (en) 2011-05-31 2014-06-24 Microsoft Corporation Gesture recognition techniques
US8526734B2 (en) 2011-06-01 2013-09-03 Microsoft Corporation Three-dimensional background removal for vision system
US9594430B2 (en) 2011-06-01 2017-03-14 Microsoft Technology Licensing, Llc Three-dimensional foreground selection for vision system
US8897491B2 (en) 2011-06-06 2014-11-25 Microsoft Corporation System for finger recognition and tracking
US9724600B2 (en) 2011-06-06 2017-08-08 Microsoft Technology Licensing, Llc Controlling objects in a virtual environment
US9013489B2 (en) 2011-06-06 2015-04-21 Microsoft Technology Licensing, Llc Generation of avatar reflecting player appearance
US8597142B2 (en) 2011-06-06 2013-12-03 Microsoft Corporation Dynamic camera based practice mode
US9098110B2 (en) 2011-06-06 2015-08-04 Microsoft Technology Licensing, Llc Head rotation tracking from depth-based center of mass
US10796494B2 (en) 2011-06-06 2020-10-06 Microsoft Technology Licensing, Llc Adding attributes to virtual representations of real-world objects
US9208571B2 (en) 2011-06-06 2015-12-08 Microsoft Technology Licensing, Llc Object digitization
US8929612B2 (en) 2011-06-06 2015-01-06 Microsoft Corporation System for recognizing an open or closed hand
US9597587B2 (en) 2011-06-08 2017-03-21 Microsoft Technology Licensing, Llc Locational node device
US9207767B2 (en) 2011-06-29 2015-12-08 International Business Machines Corporation Guide mode for gesture spaces
US9377865B2 (en) 2011-07-05 2016-06-28 Apple Inc. Zoom-based gesture user interface
US8881051B2 (en) 2011-07-05 2014-11-04 Primesense Ltd Zoom-based gesture user interface
US9459758B2 (en) 2011-07-05 2016-10-04 Apple Inc. Gesture-based interface with enhanced features
US10088924B1 (en) * 2011-08-04 2018-10-02 Amazon Technologies, Inc. Overcoming motion effects in gesture recognition
US8891868B1 (en) 2011-08-04 2014-11-18 Amazon Technologies, Inc. Recognizing gestures captured by video
US9030498B2 (en) 2011-08-15 2015-05-12 Apple Inc. Combining explicit select gestures and timeclick in a non-tactile three dimensional user interface
US8786730B2 (en) 2011-08-18 2014-07-22 Microsoft Corporation Image exposure using exclusion regions
US9218063B2 (en) * 2011-08-24 2015-12-22 Apple Inc. Sessionless pointing user interface
EP3043238B1 (en) * 2011-09-15 2018-11-21 Koninklijke Philips N.V. Gesture-based user-interface with user-feedback
US9557836B2 (en) 2011-11-01 2017-01-31 Microsoft Technology Licensing, Llc Depth image compression
KR20130047890A (ko) * 2011-11-01 2013-05-09 삼성전기주식회사 원격 조정 장치 및 원격 조정 장치의 제스처 인식 방법
US8793118B2 (en) 2011-11-01 2014-07-29 PES School of Engineering Adaptive multimodal communication assist system
US9117281B2 (en) 2011-11-02 2015-08-25 Microsoft Corporation Surface segmentation from RGB and depth images
US8854426B2 (en) 2011-11-07 2014-10-07 Microsoft Corporation Time-of-flight camera with guided light
US9672609B1 (en) 2011-11-11 2017-06-06 Edge 3 Technologies, Inc. Method and apparatus for improved depth-map estimation
US8724906B2 (en) 2011-11-18 2014-05-13 Microsoft Corporation Computing pose and/or shape of modifiable entities
US8509545B2 (en) 2011-11-29 2013-08-13 Microsoft Corporation Foreground subject detection
US8635637B2 (en) 2011-12-02 2014-01-21 Microsoft Corporation User interface presenting an animated avatar performing a media reaction
US8803800B2 (en) 2011-12-02 2014-08-12 Microsoft Corporation User interface control based on head orientation
JP5846662B2 (ja) * 2011-12-06 2016-01-20 トムソン ライセンシングThomson Licensing 3次元で表示されるオブジェクトのユーザの選択ジェスチャに応答する方法およびシステム
US9100685B2 (en) 2011-12-09 2015-08-04 Microsoft Technology Licensing, Llc Determining audience state or interest using passive sensor data
US8630457B2 (en) 2011-12-15 2014-01-14 Microsoft Corporation Problem states for pose tracking pipeline
US8879831B2 (en) 2011-12-15 2014-11-04 Microsoft Corporation Using high-level attributes to guide image processing
US8971612B2 (en) 2011-12-15 2015-03-03 Microsoft Corporation Learning image processing tasks from scene reconstructions
US8811938B2 (en) 2011-12-16 2014-08-19 Microsoft Corporation Providing a user interface experience based on inferred vehicle state
US9342139B2 (en) 2011-12-19 2016-05-17 Microsoft Technology Licensing, Llc Pairing a computing device to a user
US9720089B2 (en) 2012-01-23 2017-08-01 Microsoft Technology Licensing, Llc 3D zoom imager
US9229534B2 (en) 2012-02-28 2016-01-05 Apple Inc. Asymmetric mapping for tactile and non-tactile user interfaces
US8898687B2 (en) 2012-04-04 2014-11-25 Microsoft Corporation Controlling a media program based on a media reaction
US9210401B2 (en) 2012-05-03 2015-12-08 Microsoft Technology Licensing, Llc Projected visual cues for guiding physical movement
CA2775700C (en) 2012-05-04 2013-07-23 Microsoft Corporation Determining a future portion of a currently presented media program
WO2013166513A2 (en) * 2012-05-04 2013-11-07 Oblong Industries, Inc. Cross-user hand tracking and shape recognition user interface
US9349207B2 (en) 2012-05-31 2016-05-24 Samsung Electronics Co., Ltd. Apparatus and method for parsing human body image
KR101911133B1 (ko) 2012-06-21 2018-10-23 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 깊이 카메라를 이용한 아바타 구성
US9836590B2 (en) 2012-06-22 2017-12-05 Microsoft Technology Licensing, Llc Enhanced accuracy of user presence status determination
US9696427B2 (en) 2012-08-14 2017-07-04 Microsoft Technology Licensing, Llc Wide angle depth detection
US9423939B2 (en) * 2012-11-12 2016-08-23 Microsoft Technology Licensing, Llc Dynamic adjustment of user interface
KR20140063272A (ko) * 2012-11-16 2014-05-27 엘지전자 주식회사 영상표시장치, 및 그 동작방법
CN103226692B (zh) * 2012-11-22 2016-01-20 广东科学中心 一种视频流图像帧的识别系统及其方法
US8882310B2 (en) 2012-12-10 2014-11-11 Microsoft Corporation Laser die light source module with low inductance
KR101956073B1 (ko) * 2012-12-20 2019-03-08 삼성전자주식회사 시각적 인디케이터를 이용하여 사용자 인터페이스를 제공하는 3차원 입체 영상 표시 장치 및 그 장치를 이용한 방법
US9857470B2 (en) 2012-12-28 2018-01-02 Microsoft Technology Licensing, Llc Using photometric stereo for 3D environment modeling
US9251590B2 (en) 2013-01-24 2016-02-02 Microsoft Technology Licensing, Llc Camera pose estimation for 3D reconstruction
US9052746B2 (en) 2013-02-15 2015-06-09 Microsoft Technology Licensing, Llc User center-of-mass and mass distribution extraction using depth images
US9940553B2 (en) 2013-02-22 2018-04-10 Microsoft Technology Licensing, Llc Camera/object pose from predicted coordinates
US9135516B2 (en) 2013-03-08 2015-09-15 Microsoft Technology Licensing, Llc User body angle, curvature and average extremity positions extraction using depth images
US9524028B2 (en) 2013-03-08 2016-12-20 Fastvdo Llc Visual language for human computer interfaces
US9092657B2 (en) 2013-03-13 2015-07-28 Microsoft Technology Licensing, Llc Depth image processing
US9274606B2 (en) 2013-03-14 2016-03-01 Microsoft Technology Licensing, Llc NUI video conference controls
US10721448B2 (en) 2013-03-15 2020-07-21 Edge 3 Technologies, Inc. Method and apparatus for adaptive exposure bracketing, segmentation and scene organization
US9953213B2 (en) 2013-03-27 2018-04-24 Microsoft Technology Licensing, Llc Self discovery of autonomous NUI devices
US9442186B2 (en) 2013-05-13 2016-09-13 Microsoft Technology Licensing, Llc Interference reduction for TOF systems
US9829984B2 (en) 2013-05-23 2017-11-28 Fastvdo Llc Motion-assisted visual language for human computer interfaces
US9462253B2 (en) 2013-09-23 2016-10-04 Microsoft Technology Licensing, Llc Optical modules that reduce speckle contrast and diffraction artifacts
US9443310B2 (en) 2013-10-09 2016-09-13 Microsoft Technology Licensing, Llc Illumination modules that emit structured light
US9674563B2 (en) 2013-11-04 2017-06-06 Rovi Guides, Inc. Systems and methods for recommending content
US9769459B2 (en) 2013-11-12 2017-09-19 Microsoft Technology Licensing, Llc Power efficient laser diode driver circuit and method
US9508385B2 (en) 2013-11-21 2016-11-29 Microsoft Technology Licensing, Llc Audio-visual project generator
US9971491B2 (en) 2014-01-09 2018-05-15 Microsoft Technology Licensing, Llc Gesture library for natural user input
US9990046B2 (en) 2014-03-17 2018-06-05 Oblong Industries, Inc. Visual collaboration interface
US10146318B2 (en) 2014-06-13 2018-12-04 Thomas Malzbender Techniques for using gesture recognition to effectuate character selection
TWI501205B (zh) * 2014-07-04 2015-09-21 Sabuz Tech Co Ltd 手語圖像輸入方法及裝置
JP6534011B2 (ja) 2015-02-10 2019-06-26 任天堂株式会社 情報処理装置、情報処理プログラム、情報処理システム、および、情報処理方法
JP6561400B2 (ja) * 2015-02-10 2019-08-21 任天堂株式会社 情報処理装置、情報処理プログラム、情報処理システム、および、情報処理方法
JP6519075B2 (ja) * 2015-02-10 2019-05-29 任天堂株式会社 情報処理装置、情報処理プログラム、情報処理システム、および、情報処理方法
JP6603024B2 (ja) 2015-02-10 2019-11-06 任天堂株式会社 情報処理プログラム、情報処理装置、情報処理システム、および、情報処理方法
US9846808B2 (en) * 2015-12-31 2017-12-19 Adaptive Computation, Llc Image integration search based on human visual pathway model
US10412280B2 (en) 2016-02-10 2019-09-10 Microsoft Technology Licensing, Llc Camera with light valve over sensor array
US10257932B2 (en) 2016-02-16 2019-04-09 Microsoft Technology Licensing, Llc. Laser diode chip on printed circuit board
US10462452B2 (en) 2016-03-16 2019-10-29 Microsoft Technology Licensing, Llc Synchronizing active illumination cameras
US11003345B2 (en) 2016-05-16 2021-05-11 Google Llc Control-article-based control of a user interface
US10529302B2 (en) 2016-07-07 2020-01-07 Oblong Industries, Inc. Spatially mediated augmentations of and interactions among distinct devices and applications via extended pixel manifold
US20180088671A1 (en) * 2016-09-27 2018-03-29 National Kaohsiung University Of Applied Sciences 3D Hand Gesture Image Recognition Method and System Thereof
EP3991067A1 (en) 2019-06-26 2022-05-04 Google LLC Radar-based authentication status feedback
KR20210153695A (ko) 2019-07-26 2021-12-17 구글 엘엘씨 Imu 및 레이더를 통한 인증 관리
EP3966662B1 (en) 2019-07-26 2024-01-10 Google LLC Reducing a state based on imu and radar
US11868537B2 (en) 2019-07-26 2024-01-09 Google Llc Robust radar-based gesture-recognition by user equipment
US11385722B2 (en) 2019-07-26 2022-07-12 Google Llc Robust radar-based gesture-recognition by user equipment
US11080383B2 (en) * 2019-08-09 2021-08-03 BehavioSec Inc Radar-based behaviometric user authentication
KR20230004919A (ko) 2019-08-30 2023-01-06 구글 엘엘씨 일시정지된 레이더 제스처에 대한 시각적 표시자
US11467672B2 (en) 2019-08-30 2022-10-11 Google Llc Context-sensitive control of radar-based gesture-recognition
WO2021040742A1 (en) 2019-08-30 2021-03-04 Google Llc Input-mode notification for a multi-input node
CN112753005B (zh) 2019-08-30 2024-03-01 谷歌有限责任公司 移动设备的输入方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5759044A (en) * 1990-02-22 1998-06-02 Redmond Productions Methods and apparatus for generating and processing synthetic and absolute real time environments
US5887069A (en) * 1992-03-10 1999-03-23 Hitachi, Ltd. Sign recognition apparatus and method and sign translation system using same
US5659764A (en) * 1993-02-25 1997-08-19 Hitachi, Ltd. Sign language generation apparatus and sign language translation apparatus
EP0650301B1 (en) * 1993-10-26 2000-05-31 Matsushita Electric Industrial Co., Ltd. Three-dimensional picture image display apparatus
JP3630712B2 (ja) * 1994-02-03 2005-03-23 キヤノン株式会社 ジェスチャー入力方法及びその装置
US5732227A (en) * 1994-07-05 1998-03-24 Hitachi, Ltd. Interactive information processing system responsive to user manipulation of physical objects and displayed images
JPH08115408A (ja) 1994-10-19 1996-05-07 Hitachi Ltd 手話認識装置
JPH08331473A (ja) * 1995-05-29 1996-12-13 Hitachi Ltd テレビジョン信号の表示装置
EP0774730B1 (en) * 1995-11-01 2005-08-24 Canon Kabushiki Kaisha Object extraction method, and image sensing apparatus using the method
US6002808A (en) * 1996-07-26 1999-12-14 Mitsubishi Electric Information Technology Center America, Inc. Hand gesture control system
US6028960A (en) * 1996-09-20 2000-02-22 Lucent Technologies Inc. Face feature analysis for automatic lipreading and character animation

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313905C (zh) * 2003-08-11 2007-05-02 三菱扶桑卡客车株式会社 手图形转换装置
CN1304931C (zh) * 2005-01-27 2007-03-14 北京理工大学 一种头戴式立体视觉手势识别装置
CN1315024C (zh) * 2005-03-11 2007-05-09 西北工业大学 一种视频识别输入系统的输入方法
CN100426200C (zh) * 2006-10-13 2008-10-15 广东威创视讯科技股份有限公司 基于交互式输入设备的智能输入编码方法
CN107102723A (zh) * 2007-08-20 2017-08-29 高通股份有限公司 超出词汇的词的增强的拒绝
CN107102723B (zh) * 2007-08-20 2019-12-06 高通股份有限公司 用于基于手势的移动交互的方法、装置、设备和非暂时性计算机可读介质
US8464160B2 (en) 2008-09-29 2013-06-11 Panasonic Corporation User interface device, user interface method, and recording medium
CN101874234B (zh) * 2008-09-29 2014-09-24 松下电器产业株式会社 用户接口装置、用户接口方法、以及记录媒体
CN102483648A (zh) * 2009-05-21 2012-05-30 星克跃尔株式会社 基于手势的用户界面系统和方法
CN101694692B (zh) * 2009-10-22 2011-09-07 浙江大学 一种基于加速度传感器的手势识别的方法
CN102713798A (zh) * 2010-01-15 2012-10-03 韩国电子通信研究院 情景处理装置及方法
CN102713798B (zh) * 2010-01-15 2016-01-13 韩国电子通信研究院 情景处理装置及方法
CN102822773A (zh) * 2010-03-24 2012-12-12 惠普开发有限公司 用于显示设备的手势映射
CN102238350A (zh) * 2010-04-30 2011-11-09 鸿富锦精密工业(深圳)有限公司 电视频道切换遥控系统及方法
CN103140862A (zh) * 2010-09-30 2013-06-05 法国电信公司 用户界面系统及其操作方法
CN101951474A (zh) * 2010-10-12 2011-01-19 冠捷显示科技(厦门)有限公司 基于手势控制的电视技术
CN102096471B (zh) * 2011-02-18 2013-04-10 广东威创视讯科技股份有限公司 一种基于机器视觉的人机交互方法
CN102096471A (zh) * 2011-02-18 2011-06-15 广东威创视讯科技股份有限公司 一种基于机器视觉的人机交互方法
CN102956132A (zh) * 2011-08-25 2013-03-06 鸿富锦精密工业(深圳)有限公司 手语翻译系统、手语翻译装置及手语翻译方法
CN102956132B (zh) * 2011-08-25 2015-02-25 赛恩倍吉科技顾问(深圳)有限公司 手语翻译系统、手语翻译装置及手语翻译方法
CN102509088A (zh) * 2011-11-28 2012-06-20 Tcl集团股份有限公司 一种手部运动检测的方法、装置及人机交互系统
CN102509088B (zh) * 2011-11-28 2014-01-08 Tcl集团股份有限公司 一种手部运动检测的方法、装置及人机交互系统
US9545717B2 (en) 2012-01-04 2017-01-17 Samsung Electronics Co., Ltd. Robot hand and humanoid robot having the same
CN103192398A (zh) * 2012-01-04 2013-07-10 三星电子株式会社 机器人手的控制方法
CN103475886A (zh) * 2012-06-05 2013-12-25 纬创资通股份有限公司 立体深度影像建立系统及其方法
CN103475886B (zh) * 2012-06-05 2017-12-08 纬创资通股份有限公司 立体深度影像建立系统及其方法
CN104969145A (zh) * 2012-12-14 2015-10-07 微软技术许可有限责任公司 靶向和按压自然用户输入
US9704350B1 (en) 2013-03-14 2017-07-11 Harmonix Music Systems, Inc. Musical combat game
CN103214824A (zh) * 2013-03-26 2013-07-24 安徽瑞之星电缆集团有限公司 一种等规聚丙烯绝缘辐照交联电缆料及其制备方法
CN105874408A (zh) * 2014-01-03 2016-08-17 哈曼国际工业有限公司 用手势交互的可穿戴式空间音频系统
CN105874408B (zh) * 2014-01-03 2020-01-07 哈曼国际工业有限公司 用手势交互的可穿戴式空间音频系统
US10585486B2 (en) 2014-01-03 2020-03-10 Harman International Industries, Incorporated Gesture interactive wearable spatial audio system
CN104408395A (zh) * 2014-06-26 2015-03-11 青岛海信电器股份有限公司 一种手势识别方法和系统
CN104317385A (zh) * 2014-06-26 2015-01-28 青岛海信电器股份有限公司 一种手势识别方法和系统
CN106909938A (zh) * 2017-02-16 2017-06-30 青岛科技大学 基于深度学习网络的视角无关性行为识别方法
CN106909938B (zh) * 2017-02-16 2020-02-21 青岛科技大学 基于深度学习网络的视角无关性行为识别方法

Also Published As

Publication number Publication date
CN1139893C (zh) 2004-02-25
EP0905644A2 (en) 1999-03-31
US6215890B1 (en) 2001-04-10
EP0905644A3 (en) 2004-02-25

Similar Documents

Publication Publication Date Title
CN1139893C (zh) 手势识别装置
CN109325454B (zh) 一种基于YOLOv3的静态手势实时识别方法
CN1894703A (zh) 模式识别方法、设备以及程序
CN1139039C (zh) 图象中图形的提取和识别以及异常判定的方法和装置
US8879847B2 (en) Image processing device, method of controlling image processing device, and program for enabling computer to execute same method
US20070274704A1 (en) Information processing apparatus, information processing method and program
CN1190205A (zh) 表意字符的递增输入方法
CN1924894A (zh) 多姿态人脸检测与追踪系统及方法
CN1932739A (zh) 字符读取器、字符读取方法和字符读取程序
CN1747559A (zh) 三维几何建模系统和方法
CN1864176A (zh) 用于估计对象状态的估计系统、估计方法和估计程序
CN1871622A (zh) 图像比较系统和图像比较方法
CA2369643A1 (en) System for recognizing damaged part of accident-involved car and computer-readable medium on which program is recorded
WO2006013913A1 (ja) オブジェクト画像検出装置、 顔画像検出プログラムおよび顔画像検出方法
KR20070034966A (ko) 정보 처리 장치 및 그 제어방법
JP2007052575A (ja) メタデータ付与装置およびメタデータ付与方法
CN105912126A (zh) 一种手势运动映射到界面的增益自适应调整方法
CN101398938B (zh) 图像处理装置、图像处理系统及图像处理方法
CN1129331A (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
WO2005041128A1 (ja) 顔画像候補領域検索方法及び顔画像候補領域検索システム並びに顔画像候補領域検索プログラム
JPH11174948A (ja) 手動作認識装置
JP5201184B2 (ja) 画像処理装置及びプログラム
CN111368637B (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
JP2013046374A (ja) 画像処理装置
CN1052320C (zh) 轮廓线形成装置和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: Japan Osaka

Co-patentee after: Nat Inst of Information and Co.

Patentee after: Matsushita Electric Industrial Co., Ltd.

Address before: Japan Osaka

Co-patentee before: Communications Research Laboratory of Ministry of Posts

Patentee before: Matsushita Electric Industrial Co., Ltd.

REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1065027

Country of ref document: HK

C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee